我的使用姿势不对么, 我感觉 ds 很差劲啊, 比 grok3 差远了, 编程相关问题试了几次都表现很差

2025 年 3 月 26 日
 jdz

比如 example.nacos.com 这是我的 nacos 地址, 帮我写个 bash 脚本, 查询 cpp_long_link 命名空间下的所有服务信息, grok 可以一次写对, deepseek 就会忘记 pageSize 这个参数

21251 次点击
所在节点    程序员
164 条回复
Cloud9527
2025 年 3 月 26 日
最近再用 qwq-plus 感觉还可以,主要是吐字快!
evilStart
2025 年 3 月 26 日
deepseek 不行为什么美国人这么害怕?这么讨厌国产的还是 run 吧,在这里苦了你们了
kyor0
2025 年 3 月 26 日
只拿小红分滚出这个论坛
looplj
2025 年 3 月 26 日
llm 都不是很稳,不能因为单一场景,单次使用有点问题,就否定整个模型。。
Donaldo
2025 年 3 月 26 日
@ZSeptember #24 评论区完美体现了你这个观点,大家针对不同使用场景,分别对不同模型进行了赞扬和批判~
iamsad3508
2025 年 3 月 26 日
温度调到 0 ,再试
takanashisakura
2025 年 3 月 26 日
@zbw0414 #14 qwq-plus 也不用翻墙
9ki
2025 年 3 月 26 日
这个月高强度用 ai 学习,claude 3.7 ( Thinking )/ R1/ Gemini(2.0, 2.5 今天刚开始用) 第一梯队,grok3 ,gpt-4.5 o1-mini 纯纯路边

我觉得讨论这种问题最好把你的 System Prompts 和 Prompts 放出来,像二楼那种 claude 都没用过,不知道哪来的自信参与讨论
Stunt4013
2025 年 3 月 26 日
@Donaldo 刚出的 gemini 2.5 pro 也很强
EricYuan1
2025 年 3 月 26 日
别的不说,手机 app ,这几个中 grok 做的最好看
qiaobeier
2025 年 3 月 26 日
通用的 deepseek (翻译,帮小孩写作文,润色文档,甚至还做过 WEB 项目配色方案等等,结果都很优秀)。 写代码只使用 claude 。有买 GTP 但基本不用了。
lscho
2025 年 3 月 26 日
因为 ai 覆盖的场景太广泛,所以看测试就行。只有测试才能尽可能覆盖大部分场景。

单一场景谁都有可能出错
4eympe94CsqJ7Y39
2025 年 3 月 26 日
grok3 确实能打
k9982874
2025 年 3 月 26 日
先不说质量,输出速度 ds 是最慢的。。。
fancy2020
2025 年 3 月 26 日
百度和 Google 的区别
clino
2025 年 3 月 26 日
我其实是从 deepseek v2 开始用的,当时就感觉很好用,切成 v3 以后好像没有明显更好的感觉
当然我没怎么用过 claude 所以没有明显对比,但是 deepseek 一直给我感觉是相当好了
cookii
2025 年 3 月 26 日
体感 grok 确实很好用,比其他都强
zhwguest
2025 年 3 月 26 日
刚开始出来其实感觉很不错,但是后来慢慢觉得越来越不那么惊艳了...
LittleYangYang
2025 年 3 月 26 日
deepseek 我从 v2 开始用它去处理数据,当时主要是相比其他家太便宜了,效果还好,这价格很难让人拒绝(),就是并发非常低
新的 R1 主要强在它的强化学习策略,落在应用上它用的训练语料在写"抽象"文章这种 meme 上是非常强的,说的话非常似人,比其他模型更像贴吧老哥,但是编数据的幻觉倾向也很厉害,也有丢上下文的倾向,很多生成结果基本上义眼就能看出来是 deepseek 写的。
最近我在信息抽取工作上比较了几个模型,在我的 KG 任务上 ds 基本平均落后 qwen 系 5 个点左右,json 格式化约束的稳定度倒是还挺好。
其他的模型实际用起来其实感觉 grok3 幻觉也严重,gemini deepresearch 是真好用啊,谷歌的信息来源还是太猛,开了 gemini advanced ,下个月想把 gpt plus 关掉了,o3 真废物....
wweerrgtc
2025 年 3 月 26 日
@lzgshsj #13 思考 7 分钟也太慢了吧, 有没有问答链接可以看看呀

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/1121273

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX