glm5.1, kimi2.6, minimax2.7, mimo v2.5, deepseek v4,编程能力上的排名如何?

4 月 26 日
 junwind

先抛个砖:GLM5.1 > deepseek v4 > minimax2.7 ≥ mimo v2.5 ≈ kimi2.6

10530 次点击
所在节点    程序员
92 条回复
canyue7897
4 月 26 日
我觉得 kimi 还可以哈?
没想到这么拉?
onedge
4 月 26 日
GLM 5.1 > DS v4 = Kimi 2.6 > mimo v2.5 > minimax 2.7
cookii
4 月 26 日
minimax 不配上榜好吧,夸张点说 4B 模型水平
BestEicky
4 月 26 日
@cookii 说是 4B 模型都抬举它了,应该是 SB 模型水平吧
uqf0663
4 月 26 日
kimi 我会继续订阅,但是 minimax 就算了,订阅完用了三天我就放弃了,不会再考虑使用。
onedge
4 月 26 日
@uqf0663 minimax 已经完全龙虾了,m2.5 刚出我还觉得能力可以的,2.7 真的废了
ayasealter570
4 月 26 日
minimax 官方订阅的极速版,智力低到没边了
huaweii
4 月 26 日
@ayasealter570 有没有例子看看,好奇
uqf0663
4 月 26 日
@onedge 我就是用这龙虾的,m2.7 真的是连应付龙虾基本运行都有坑,目前我的龙虾只有 k2.6 勉强马马虎虎能凑合用。
junwind
4 月 26 日
@canyue7897 实测的这个案例,kimi 还行,不过生成是很慢的
junwind
4 月 26 日
@canyue7897 kimi 不拉,是我个人的武断,实测后还不错
drealism
4 月 26 日
可以把 qwen 系列补一个进去么🤜🤛
ebushicao
4 月 26 日
每次有人说跑分能够说明能力,我就会举出 minimax2.7 这个例子,那真是连 skill 和 tool 都不一定会调用,某些时候我本地部署的 qwen3.5 9b 都比它强。
aes114514gcm
4 月 26 日
和我的体感比较接近,glm5.1 略强于 kimi2.6 ,
zenfsharp
4 月 26 日
GLM5.1 > deepseek v4 > 其他,起码到这里是同意的。
我刚开了 opencode 的 Go 订阅,在 opencode-cli 里使用同样的 skill 、MCP 、Agent.md ,问 GLM 我项目里的一个业务逻辑,直接一次性揪出来了,而 DS 没有,反复提示了三次才找到。
zenfsharp
4 月 26 日
不知道各种公众号是有任务还是怎么回事,一个劲的鼓吹 deepseek v4 ,跟实际体验严重背离。
lukaktus6768
4 月 26 日
看到 glm 我就要踩一脚,买谁都不要买他
anmie
4 月 26 日
@zenfsharp 自媒体不这么写没人看啊, 但是你看 Deepseek 官方就实在多了,官方在公众号里,明确说了模型在某些方面比 xx 模型要弱,而不是无脑鼓吹遥遥领先。
这么说把,做信息分享类的自媒体,有一个算一个,肯定会夹带私货,在我看来,有一个算一个都是傻逼。 而看自媒体说的就深信不疑的人也是傻逼。

我自始至终,从大模型刚能聊天,到现在 agentic ,Deepseek 虽然不是最强的那个,但是一直都是我的主力,不为别的,我坚定的站在这样一个不焦虑,不浮躁的人和公司这边。(而 minimax 我根本试都没试过,不感兴趣。)
metalvest
4 月 26 日
GLM5.1 天气温度假,为什么排第一?
weilongs
4 月 26 日
minimax2.7 排不到那个位置.

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/1208616

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX