DeepSeek V4 预览版已发布

1 天前
 EmptyDoc
官方公众号:
DeepSeek-V4 预览版:迈入百万上下文普惠时代
https://mp.weixin.qq.com/s/8bxXqS2R8Fx5-1TLDBiEDg

官网和 API 已经同步更新,有想要尝鲜的可以用起来了
1694 次点击
所在节点    程序员
9 条回复
hushuikun
1 天前
何意味
luckykong
1 天前
光这个价格 和 注释,就很不错啊。

| API 访问模型名 | 输入(缓存命中) | 输入(缓存未命中) | 输出 | 上下文长度 |
|-------------------|--------------|----------------|------|----------|
| deepseek-v4-pro | 1 元 | 12 元 | 24 元 | 1M |
| deepseek-v4-flash | 0.2 元 | 1 元 | 2 元 | |

*受限于高端算力,目前 Pro 的服务吞吐十分有限,预计下半年昇腾 950 超节点批量上市后,Pro 的价格会大幅下调。
mashimaroinfo1
1 天前
很高兴。顺便这里总结张 当前的价格 表供诸位参考。
国内外主流大模型 API 定价对比 (2026 年 4 月) · 单位: 元/百万 tokens · $1 ≈ ¥7.3

┌────────────┬─────────────────────┬
│ 厂商 │ 模型 │输入(未命中)│ 输出 │ 缓存命中 │
├────────────┼─────────────────────┼
│ DeepSeek │ V4 Flash │ ¥1 │ ¥2 │ ¥0.2 │
│ │ V4 Pro │ ¥12 │ ¥24 │ ¥1 │
├────────────┼─────────────────────┼
│ 阿里云 │ Qwen3.5-Plus │ ¥0.8 │ ¥4.8 │ ~¥0.4 │
│ │ Qwen3-Max │ ¥2.5 │ ¥10 │ ~¥1.25 │
├────────────┼─────────────────────┼
│ 腾讯云 │ 混元 HY3.0 Preview │ ¥1.2 │ ¥4 │ ¥0.4 │
├────────────┼─────────────────────┼
│ 百度 │ ERNIE 4.5 │ ¥4 │ ¥16 │ — │
├────────────┼─────────────────────┼
│ 智谱 AI │ GLM-5.1 │ ¥8 │ ¥28 │ ~¥3.4 │
├────────────┼─────────────────────┼
│ 字节跳动 │ 豆包 Seed-1.8 │ ¥0.8 │ ¥8 │ — │
├────────────┼─────────────────────┼
│ 科大讯飞 │ 星火 X2 │ ¥3 │ ¥3 │ — │
├────────────┼─────────────────────┼
│ 月之暗面 │ Kimi K2.5 │ ¥4 │ — │ — │
├────────────┼─────────────────────┼
│ MiniMax │ M2.5 │ ¥2 │ ¥8 │ — │
├────────────┼─────────────────────┼
│ Anthropic │ Claude Sonnet 4.6 │$3(~¥22) │$15(~¥110)│ 含在价内 │
│ │ Claude Opus 4.7 │$5(~¥37) │$25(~¥183)│ 含在价内 │
├────────────┼─────────────────────┼
│ OpenAI │ GPT-5.4 │$2.5(~¥18)│$15(~¥110)│$1.25(~¥9)│
│ │ GPT-5.5 ⚠️NEW │$5(~¥37) │$30(~¥219)│ — │
└────────────┴─────────────────────┴
dingawm
1 天前
@mashimaroinfo1 #3 补充一个 kimi2.6
多模态模型 Kimi K2.6 定价

产品定价
模型 计费单位 输入价格(缓存命中) 输入价格(缓存未命中) 输出价格 上下文窗口
kimi-k2.6 1M tokens ¥1.10 ¥6.50 ¥27.00 262,144 tokens
此处 1M = 1,000,000 ,表格中的价格代表每消耗 1M tokens 的价格。
beimenjun
1 天前
Xiaomi Mimo V2.5

- 0< Token ≤ 256 K:输入 ¥7.00 / 1M tokens ,输入(命中缓存)¥1.40 / 1M tokens ,输出 ¥21.00 / 1M tokens
- 256K < Token ≤ 1 M:输入 ¥14.00 / 1M tokens ,输入(命中缓存)¥2.80 / 1M tokens ,输出 ¥42.00 / 1M tokens
EmptyDoc
1 天前
Pro 现在的价格不算便宜,百万输出 24 元,Flash 是真滴便宜,百万输出两块,很适合那种便宜大碗并且模型智商别太弱智的场景。
xuhengjs
1 天前
现在就等大佬测试结果了,希望 flash 能比肩 glm5 以上
weixiangzhe
3 小时 3 分钟前
flash 可以干 minmax 的活动
weixiangzhe
3 小时 3 分钟前
flash 不知道干 minmax2.7 现在的活

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/1208230

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX