吐槽下,感觉国产模型/Agent 不靠谱

2025 年 12 月 17 日
 asd999cxcx
我们现在有一个 react 的原型( AI 生成的)想把它转成鸿蒙 APP(目标 API 14 以上),同样的提示词、同一个内容,gpt5.1 ,5.2 已经差不多 2~3 次就解决了编译错误,开始进行其他功能上的开发了。minimax-m2 、kimi 、doubao 还在那里来来回回改编译报错语法的问题,GLM4.6 甚至陷入循环。问题越来越多,本来一开始双方都只有 200+个 ERROR ,改到后面 kimi 、minimax-m2 已经到了 800+个 ERROR 了....
用的 trae 、roo code 、kilo code ,trae 一直这样,roo code 、kilo code 勉强好点,ERROR 数量在下降。
话说国产模型应该对鸿蒙一类的支持更好才对吧,为啥会这样?
4223 次点击
所在节点    程序员
23 条回复
hengxiangbianhua
2025 年 12 月 19 日
相同的模型也是有时候聪明有时候愚蠢
wengjin456123
2025 年 12 月 19 日
我发现现在很多人都在说 GLM4.6 弱智,我本人用的 lite 套餐,基本你如果需要模型帮你理清楚逻辑,GLM4.6 会乱来,你必须说清楚你要什么,逻辑是什么,上下文是哪些,这样的 GLM4.6 执行力目前我用下来算是国产第一,和 claude sonnet 4.5 没区别,因为本人白天用 claude opus/sonnet 4.5 (外企单独的 api ,无限量) 给公司干活,下班了用 gemini3pro 和 自己分析需求解构需求后,给 GLM4.6 ,能省不少时间....,只能说 claude 在你说的不是很清楚的情况下也会乱来但是好很多,但是价格差太大了
lijianmin321
2025 年 12 月 24 日
国产主打性价比,然后拆解小任务做比较适合,鸿蒙没数据吧,难搞哦。当然实打实排名我还是忠实的 opus 用户,不过是接口 AI 的中转,Claude 这个封号太变态了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/1179580

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX