glm5.1, kimi2.6, minimax2.7, mimo v2.5, deepseek v4,编程能力上的排名如何?

4 月 26 日
 junwind

先抛个砖:GLM5.1 > deepseek v4 > minimax2.7 ≥ mimo v2.5 ≈ kimi2.6

10530 次点击
所在节点    程序员
92 条回复
Desiree
4 月 26 日
暂时只用过 Glm 跟 minimax2.7 挺垃圾的,glm 勉强能用,但是比 cc 跟 codex 还是差一大截,minimax2.7 是完全不能用
zzz123456qqq
4 月 26 日
richardwong
4 月 26 日
GLM5.1 不支持多模态挺难受的
owt5008137
4 月 26 日
@richardwong 官方送的视觉识别 mcp 可以勉强顶一顶。
Azmeont
4 月 26 日
GLM5.1 和 DSv4-Pro 体感都比 opus4.6 强,但 DSv4 胜在 1M 上下文
issakchill
4 月 26 日
看到 minimax 不上桌就放心了
Lighfer
4 月 26 日
不测一下 qwen3.6 27b 吗?据说编程能力也也很强?
xiaomushen
4 月 26 日
基本同意,今天高强度用 DeepSeek V4 Pro
xiangqiankan
4 月 26 日
deepseekv4 只是编码方面的后训练不足,架构设计上这是唯一的真神,理论上是开源模型的天花板
mingtdlb
4 月 27 日
GLM 是写代码比较强吗?我感觉他 chat 有点拉
iamzz
4 月 27 日
难兄难弟。
shuiduoduo
4 月 27 日
和 claude4.7 对比一下呢
passion336699
4 月 27 日
minimax 不做评价...
lizhesystem
4 月 27 日
minimax 确实拉,不在一桌,不过周末使用了 DeepSeekV4 Pro 确实超乎预期,如果暂时没有好用的模型我会优先选择用它。
Danswerme
4 月 27 日
@shuiduoduo Claude Opus 4.7 不用对比,现在是全球范围内断崖式领先。
aikilan
4 月 27 日
minimax 确实不行,之前自己写的应用去测试接入第三方 provider 的时候,用这家测试了下我一度怀疑是我自己的接入方式有问题
MagicLi
4 月 27 日
kimi 为啥我感觉非常不耐用呢。100 的尝鲜套餐。
junwind
4 月 27 日
目前国内 glm5.1 ,kimi2.6 ,dsv4 可以选择,哪个能订阅,哪个便宜就用哪个。dsv4 我看好后期上华为卡后,价格再降一大波,并且应该也不会有订阅售罄的烦恼。
goodryb
4 月 27 日
这个测试多少有点敷衍了,网页版都是聊天的,测试编码起码用个 CLI 试一试吧
Adyun
4 月 27 日
minimax 纯拉 29 元送了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/1208616

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX