@
yungyu 你说的完全风马牛不相及,你也没点进去我在回复中提到的课程,李宏毅的课 [第八讲:通用模型的终身学习] 你可以先看下。一句话总结,我部署了微调后的小模型进行专门的用户关注点预测,作为一个 function call 来给大模型使用。
我从 1 月份到现在 面试了十多家,拿了三个 offer ,你说的这些框架在面试中完全无人在意,或者说根本不会在意这些框架本身(但是现在大部分的商业级 agent 构建,确实有借鉴最初 langchain 的几大组件)。比如最开始 langchain 最火,你用了,然后 langgraph 又火了,你换不换,autogen 又火了继续换吗?现在 claude / openai 的 SDK 最火 又接着换?那如果后续还有其他框架比这俩 SDK 还火,怎么办呢?
agent 开发的门槛,并不在你说的框架熟练度和前面那个哥们说的 业务适配什么的。给你分享点我常遇到的问题。
你能讲讲 transformer 架构吗? gpt 和 transformer 有啥区别啊?为什么 temperature 会影响输出?
RAG 方面,你怎么做的分块?为什么考虑使用这种分块方式?如何优化召回率?使用 rerank 了吗?能说几个比较有新意的 rerank 方法吗?向量数据库怎么选啊?为啥用 milvus ?稀疏向量和稠密向量啥区别啊? RAG 和微调啥区别啊?你数据集怎么弄的啊?你微调的关键参数都有啥啊?你如何评估微调效果呢? agent 有什么构建模式吗?输出 token 超出了模型限制怎么办呢?
好多好多问题呀,我的感觉是基本围绕着四个方向,基础、RAG 、微调、Agent ,一次正经的面试中,这几个方向是一定一定都会被问到的。