想了很久，普通开发参与/迈向 AI 时代的方法也许就是转型做 Agent 开发。Agent 开发也许就是 AI 时代的 CRUD。

WithoutSugarMiao

6 天前

我就是 Agent 开发啊。原来做 python 后端，23 年末 RAG 刚火，在原公司做了一年 RAG ，之后入职 AI 公司做 Agent 。去年年末离职，刚准备入职下个工作，也是专职 Agent 开发。具体可以看我帖子 https://v2ex.com/t/1182394 。

WithoutSugarMiao

6 天前

@123zouwen #16 我目前专职做了两年以上的 agent 开发了。去年末从上家离职，最近刚确定 offer 准备入职。面试的岗位也全是专职 agent 开发。

“Agent 没有什么高深的技术” 你这句话让我有点绷不住。

WithoutSugarMiao

6 天前

@linxl 教程可以看我历史帖子。

kenshinhu

6 天前

@WithoutSugarMiao 做 Agent 开发的过程中是怎样学习的，主要是先看 Agent 框架还是从需求入手？

123zouwen

6 天前

@WithoutSugarMiao 看了你的贴子
“Agent 没有什么高深的技术” 这句话我的意思是, Agent 是纯工程化的实践方案,没有什么技术壁垒,现有的后端都可以做.

你列举出的 LLM 能力拦截垃圾邮件 / RAG 项目, 说实话没有看到什么亮点功能.
在我司不同的业务部门内部都做的有自己的 Agent,而且是和自己的业务深度结合, 完全都是自己现有员工实现的, 不同技术栈都有: spring AI / didy 二开 / langchain 等等.

WithoutSugarMiao

6 天前

@123zouwen #25 随便给你个场景，上个项目实际中遇到的。甲方是个化工公司，帮他们做老客户激活平台，主线功能就是从个性化唤醒词到聊天获取销售线索。遇到一个情况，LLM 分不清楚化工原料到具体产品的映射怎么办？举个例子化工原料乙烯能生产处聚乙烯使用聚乙烯能做出塑料袋。怎么让 LLM 理解这些？ RAG ？微调？提示词？上下文？模型理解了之后，有没有用 bad case ，有的话要怎么优化？

我在帖子里说的“拦截垃圾邮件 / RAG 项目” ，是 23 年 11 月份到 24 年 11 月这段时间的项目，当时的技术栈处于 RAG 刚兴起，agent 还没怎么热，大家都在提示词工程到上下文工程的转变上。其实在前面我应该表达时间段了，可能我没写清楚，我的问题。（我补充一下，虽然是比较早的项目，但是也遇到些比较有意思的问题，但是评论里我就不展开了，因为能写很多内容。）

当然我不是故意怼你的意思。我是觉得你是对 Agent 开发这个行业了解太少了，这也不怪你，毕竟也是 2025 年才刚兴起的。你如果感兴趣，我推荐你我学习过的几个课程你可以系统性学习一下。

1. 台湾国立大学李宏毅的 2025 年[最新课程]( https://www.youtube.com/playlist?list=PLJV_el3uVTsMMGi5kbnKP5DrDHZpTX0jT)，被誉为中文 AI 圈神课。

2. 看完李宏毅的，可以看斯坦福的[CS336]( https://www.youtube.com/playlist?list=PLoROMvodv4rOY23Y0BoGoBGgQ1zmU_MT_)，从 0 开始构建语言模型。

3. 辅助的论文阅读，可以关注李沐的这个频道( https://www.youtube.com/playlist?list=PLFXJ6jwg0qW-7UM8iUTj3qKqdhbQULP5I)，他的分段精读 transformer ，我看了好多遍。

4. 不喜欢理论只喜欢实践，也可以看看国内写的这个[hello-agents]( https://datawhalechina.github.io/hello-agents/#/)

还有一些比较零碎的资料或者偏实践的，我在之前帖子里有写，就不放了。

总之，agent 开发，我作为从业者的看法是，已经从 2025 年初的探索阶段，过渡到成体系的标准应用了。至于你说的框架，额，怎么说呢？可能你们企业内用的多些，但是商业级的项目一般不会直接用框架。

yungyu

6 天前

@WithoutSugarMiao #26 你说的这些 case ，要么就是一招鲜吃遍天(优化 context)，要么你其实也没有啥招，只是不停调试看效果。

就目前来说，基于 LLM 的 agent 开发，技术门槛主要是开源开套件的熟练度吧，langchain 、langgraph 、dify 这些。

dawnzhu

6 天前

@WithoutSugarMiao 看了你的帖子，目前 Agent 开发会涉及到模型微调吗？

WithoutSugarMiao

6 天前

@yungyu 你说的完全风马牛不相及，你也没点进去我在回复中提到的课程，李宏毅的课 [第八讲：通用模型的终身学习] 你可以先看下。一句话总结，我部署了微调后的小模型进行专门的用户关注点预测，作为一个 function call 来给大模型使用。

我从 1 月份到现在面试了十多家，拿了三个 offer ，你说的这些框架在面试中完全无人在意，或者说根本不会在意这些框架本身（但是现在大部分的商业级 agent 构建，确实有借鉴最初 langchain 的几大组件）。比如最开始 langchain 最火，你用了，然后 langgraph 又火了，你换不换，autogen 又火了继续换吗？现在 claude / openai 的 SDK 最火又接着换？那如果后续还有其他框架比这俩 SDK 还火，怎么办呢？

agent 开发的门槛，并不在你说的框架熟练度和前面那个哥们说的业务适配什么的。给你分享点我常遇到的问题。

你能讲讲 transformer 架构吗？ gpt 和 transformer 有啥区别啊？为什么 temperature 会影响输出？
RAG 方面，你怎么做的分块？为什么考虑使用这种分块方式？如何优化召回率？使用 rerank 了吗？能说几个比较有新意的 rerank 方法吗？向量数据库怎么选啊？为啥用 milvus ？稀疏向量和稠密向量啥区别啊？ RAG 和微调啥区别啊？你数据集怎么弄的啊？你微调的关键参数都有啥啊？你如何评估微调效果呢？ agent 有什么构建模式吗？输出 token 超出了模型限制怎么办呢？

好多好多问题呀，我的感觉是基本围绕着四个方向，基础、RAG 、微调、Agent ，一次正经的面试中，这几个方向是一定一定都会被问到的。

WithoutSugarMiao

6 天前

@dawnzhu 一定会，我建议你看看我在帖子里写的项目，阿里云的那个课程或者 hello-agents 。几乎所有的 agent 课程里必然会设计到微调，涉及到大模型的理解。

dawnzhu

6 天前

@WithoutSugarMiao 对大模型理解认同，如果调外部 API 的话不涉及到微调吧？ hello-agents 最后是讲到了 Agentic RL,目前还没碰到需要微调的场景😊

WithoutSugarMiao

6 天前

@dawnzhu #31 很正常因为 AI 的能力太强，如果是小规模应用，完全没有微调的必要，就像 @123zouwen 回复的一样，如果你想在自己的公司使用，那么你懂公司的业务，用通过的 LLM ，用现成的 MCP 、skill ，完全 cover 的住。

但是这个东西的复杂度曲线就像传统项目一样，你在公司用你不用考虑 QPS 上来了怎么办，并发度高怎么办，分布式同步怎么办。因为公司就那些人。但是你要想做个企业级项目，比如豆包，比如千问，那要考虑的东西就多太多了。微调只是最基础的部分。

还有一点就是，可能很多人觉得微调很难，又要理解模型，又得调整参数。实际上现在微调的门槛很低，LLM 发展这几年，早就有傻瓜式微调框架了。甚至一行代码不用写，你都能调出来一个差不多的模型。

liu731

6 天前

不认同，Agent 能玩的转的只有那些肯付费（订阅 || 本地部署）、肯创新、业务逻辑清晰的公司

NizumaEiji

6 天前

agent 是未来
但是未来的 agent 可不一定需要人来写

dawnzhu

6 天前

@WithoutSugarMiao 之前做过几次微调，微调也有很多框架上手难度不高。26 年明显感觉到 Agent 相关岗位多了起来，基本跟传统开发差不多但是也要了解很多新的概念、知识、方式等。后续觉得还是做 Agent （业务）性价比高一点

dawnzhu

6 天前

@NizumaEiji 未来可能不需要，到达未来的路上目前看是需要的

bianxiuyan1993

6 天前

全栈或者 agent 工程师，做构建？

listenerri

6 天前

一旦有这种想法：转型做某方向开发，那就表示思维逻辑还是不对

放弃古法编程转型做 Viber 还差不多

yungyu

6 天前

@dawnzhu #35 +1

yungyu

6 天前

@WithoutSugarMiao #29 3 个 offer 不能说明啥啊
我也不是说你不厉害，我只是说 agent 开发并不神秘或者门槛很高。
确实也就是结合自身具体业务依赖成熟 infra 做 crud