glm5.1， kimi2.6， minimax2.7， mimo v2.5， deepseek v4，编程能力上的排名如何？

4 月 26 日

junwind

先抛个砖：GLM5.1 > deepseek v4 > minimax2.7 ≥ mimo v2.5 ≈ kimi2.6

10530 次点击

所在节点

程序员

92 条回复

canyue7897

4 月 26 日

我觉得 kimi 还可以哈？
没想到这么拉？

onedge

4 月 26 日

GLM 5.1 > DS v4 = Kimi 2.6 > mimo v2.5 > minimax 2.7

cookii

4 月 26 日

minimax 不配上榜好吧，夸张点说 4B 模型水平

BestEicky

4 月 26 日

@cookii 说是 4B 模型都抬举它了，应该是 SB 模型水平吧

uqf0663

4 月 26 日

kimi 我会继续订阅，但是 minimax 就算了，订阅完用了三天我就放弃了，不会再考虑使用。

onedge

4 月 26 日

@uqf0663 minimax 已经完全龙虾了，m2.5 刚出我还觉得能力可以的，2.7 真的废了

ayasealter570

4 月 26 日

minimax 官方订阅的极速版，智力低到没边了

huaweii

4 月 26 日

@ayasealter570 有没有例子看看，好奇

uqf0663

4 月 26 日

@onedge 我就是用这龙虾的，m2.7 真的是连应付龙虾基本运行都有坑，目前我的龙虾只有 k2.6 勉强马马虎虎能凑合用。

junwind

4 月 26 日

@canyue7897 实测的这个案例，kimi 还行，不过生成是很慢的

junwind

4 月 26 日

@canyue7897 kimi 不拉，是我个人的武断，实测后还不错

drealism

4 月 26 日

可以把 qwen 系列补一个进去么🤜🤛

ebushicao

4 月 26 日

每次有人说跑分能够说明能力，我就会举出 minimax2.7 这个例子，那真是连 skill 和 tool 都不一定会调用，某些时候我本地部署的 qwen3.5 9b 都比它强。

aes114514gcm

4 月 26 日

和我的体感比较接近，glm5.1 略强于 kimi2.6 ，

zenfsharp

4 月 26 日

GLM5.1 > deepseek v4 > 其他，起码到这里是同意的。
我刚开了 opencode 的 Go 订阅，在 opencode-cli 里使用同样的 skill 、MCP 、Agent.md ，问 GLM 我项目里的一个业务逻辑，直接一次性揪出来了，而 DS 没有，反复提示了三次才找到。

zenfsharp

4 月 26 日

不知道各种公众号是有任务还是怎么回事，一个劲的鼓吹 deepseek v4 ，跟实际体验严重背离。

lukaktus6768

4 月 26 日

看到 glm 我就要踩一脚，买谁都不要买他

anmie

4 月 26 日

@zenfsharp 自媒体不这么写没人看啊，但是你看 Deepseek 官方就实在多了，官方在公众号里，明确说了模型在某些方面比 xx 模型要弱，而不是无脑鼓吹遥遥领先。
这么说把，做信息分享类的自媒体，有一个算一个，肯定会夹带私货，在我看来，有一个算一个都是傻逼。而看自媒体说的就深信不疑的人也是傻逼。

我自始至终，从大模型刚能聊天，到现在 agentic ，Deepseek 虽然不是最强的那个，但是一直都是我的主力，不为别的，我坚定的站在这样一个不焦虑，不浮躁的人和公司这边。（而 minimax 我根本试都没试过，不感兴趣。）

metalvest

4 月 26 日

GLM5.1 天气温度假，为什么排第一？

weilongs

4 月 26 日

minimax2.7 排不到那个位置.

第 1 页／共 5 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/1208616

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.