都在说 glm-5.1 和 claude opus 4.6 写代码水平一样了,吊打 gpt-5.4 是真的假的?

4 月 14 日
 lizhenda

有实际用项目验证过的童鞋吗? 还是说目前的 glm-5.1 和这些天持续降智的 claude opus 4.6 坐一桌了? 但是说它完爆 gpt-5.4 是否言过其实? 我目前使用 gpt-5.4 + xhight + fast 觉得还是蛮吊的。

2875 次点击
所在节点    程序员
18 条回复
MaxwellX
4 月 14 日
假的,我购买的 GLM MAX 套餐,下午的时候不稳定,实际用下来也没有 codex 和 claude 聪明,但是稳定的时候用的很爽,不用在意 token 的使用情况,能干活
lizhenda
4 月 14 日
@MaxwellX 所以只是调用速度快吗?然后量大管饱?
MaxwellX
4 月 14 日
@lizhenda 使用起来也还行呀,接入 cc opencode trae 啥的,反正能出活,就是感觉不是最聪明的那一档罢了,也是国内这几个里面体感最好用得了
codehz
4 月 14 日
国内模型的宣传全都不要信,一个字都不能信,,,opus 降智了也比 glm-5.1 靠谱,而且量大管饱只是暂时的营销手段,国内算力完全不够,训练不够,推理更不够,等宣发阶段过去了之后很快会涨价和增加限制,短期内看不到任何希望
c0xt30a
4 月 14 日
这伙子牛皮大王的话,最好连标点符号都不要相信
ooppstef
4 月 14 日
先不说 glm ,为什么 opus 可以吊打 gpt 啊?真用过的话,5.4+fast ,硬智力明显高啊,当然工程性+黑话,确实感觉稀碎。
Desiree
4 月 14 日
glm 用过了,开发了几个小应用,感觉还不如 codex ,而且价格也不便宜
lscho
4 月 14 日
不是,opus 凭什么吊打 gpt ? GPT5.4 除了前端,别的稳压 opus 。

opus 本身没有想象中那么强,是 claude code 比较强。
Jonchil
4 月 14 日
重型任务区别很大,一点点小活大家没啥大的区别。

重型任务那就是 1 分钟和 10 分钟的差别,搞得定和搞不定的差别。

看着 glm 在那里忙活感觉很努力,但是换 gpt5.4 xhigh 和 opus ,可能很早就搞定了
collvey
4 月 14 日
看财报它这种可以吊打 cc 4.6 的大模型,研发投入才几十亿人民币。连买显卡的零头都不够,如何训练的出来?我感觉这玩意和中转一个原理,可能是“中中转”
dwhh
4 月 14 日
延迟很大, 而且也并不聪明; claude code 开发小项目, sonnet 就能做到 web 云端正常运行不报错; glm 不行, 很容易报错
AutumnVerse
4 月 14 日
假的,我们公司不限量提供,牛逼吹得震天响,一用一个不吱声。慢得跟狗屁一样还改不对。

价格还贵,我一两个小时就能造 100 多块钱的 token ,主要是啥都没干明白,用了几天还是换海外 ai 了
defaw
4 月 14 日
opus 这垃圾玩意打 5.2 都费劲还打 5.4 ,glm5.1 的推理能力和 5.4 一个水平勉强能这么说,但是知识面不如
404www
4 月 14 日
> gpt-5.4 + xhight + fast
怎么订阅的呀?是 plus 还是 pro 呀
ebushicao
4 月 14 日
glm-5.1 是国内最强,但也只是国内最强
lmmlwen
4 月 15 日
gpt5.4 是目前最强,claude code 结合 opus4.6 做推理分析确实比 gpt5.4 强倒是真的
iamzcr
4 月 15 日
扯几把蛋
DeadLion
4 月 15 日
强不强的不重要 重要的是你找个尽可能低成本的把活干完就行了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/1205860

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX