DeepSeek V4 预览版已发布

hushuikun

1 天前

何意味

luckykong

1 天前

光这个价格和注释，就很不错啊。

| API 访问模型名 | 输入（缓存命中） | 输入（缓存未命中） | 输出 | 上下文长度 |
|-------------------|--------------|----------------|------|----------|
| deepseek-v4-pro | 1 元 | 12 元 | 24 元 | 1M |
| deepseek-v4-flash | 0.2 元 | 1 元 | 2 元 | |

*受限于高端算力，目前 Pro 的服务吞吐十分有限，预计下半年昇腾 950 超节点批量上市后，Pro 的价格会大幅下调。

mashimaroinfo1

1 天前

很高兴。顺便这里总结张当前的价格表供诸位参考。
国内外主流大模型 API 定价对比 (2026 年 4 月) · 单位: 元/百万 tokens · $1 ≈ ¥7.3

┌────────────┬─────────────────────┬
│ 厂商 │ 模型 │输入(未命中)│ 输出 │ 缓存命中 │
├────────────┼─────────────────────┼
│ DeepSeek │ V4 Flash │ ¥1 │ ¥2 │ ¥0.2 │
│ │ V4 Pro │ ¥12 │ ¥24 │ ¥1 │
├────────────┼─────────────────────┼
│ 阿里云 │ Qwen3.5-Plus │ ¥0.8 │ ¥4.8 │ ~¥0.4 │
│ │ Qwen3-Max │ ¥2.5 │ ¥10 │ ~¥1.25 │
├────────────┼─────────────────────┼
│ 腾讯云 │ 混元 HY3.0 Preview │ ¥1.2 │ ¥4 │ ¥0.4 │
├────────────┼─────────────────────┼
│ 百度 │ ERNIE 4.5 │ ¥4 │ ¥16 │ — │
├────────────┼─────────────────────┼
│ 智谱 AI │ GLM-5.1 │ ¥8 │ ¥28 │ ~¥3.4 │
├────────────┼─────────────────────┼
│ 字节跳动 │ 豆包 Seed-1.8 │ ¥0.8 │ ¥8 │ — │
├────────────┼─────────────────────┼
│ 科大讯飞 │ 星火 X2 │ ¥3 │ ¥3 │ — │
├────────────┼─────────────────────┼
│ 月之暗面 │ Kimi K2.5 │ ¥4 │ — │ — │
├────────────┼─────────────────────┼
│ MiniMax │ M2.5 │ ¥2 │ ¥8 │ — │
├────────────┼─────────────────────┼
│ Anthropic │ Claude Sonnet 4.6 │$3(~¥22) │$15(~¥110)│ 含在价内 │
│ │ Claude Opus 4.7 │$5(~¥37) │$25(~¥183)│ 含在价内 │
├────────────┼─────────────────────┼
│ OpenAI │ GPT-5.4 │$2.5(~¥18)│$15(~¥110)│$1.25(~¥9)│
│ │ GPT-5.5 ⚠️NEW │$5(~¥37) │$30(~¥219)│ — │
└────────────┴─────────────────────┴

dingawm

1 天前

@mashimaroinfo1 #3 补充一个 kimi2.6
多模态模型 Kimi K2.6 定价

产品定价
模型计费单位输入价格（缓存命中）输入价格（缓存未命中）输出价格上下文窗口
kimi-k2.6 1M tokens ¥1.10 ¥6.50 ¥27.00 262,144 tokens
此处 1M = 1,000,000 ，表格中的价格代表每消耗 1M tokens 的价格。

beimenjun

1 天前

Xiaomi Mimo V2.5

- 0< Token ≤ 256 K：输入 ¥7.00 / 1M tokens ，输入（命中缓存）¥1.40 / 1M tokens ，输出 ¥21.00 / 1M tokens
- 256K < Token ≤ 1 M：输入 ¥14.00 / 1M tokens ，输入（命中缓存）¥2.80 / 1M tokens ，输出 ¥42.00 / 1M tokens

EmptyDoc

1 天前

Pro 现在的价格不算便宜，百万输出 24 元，Flash 是真滴便宜，百万输出两块，很适合那种便宜大碗并且模型智商别太弱智的场景。

xuhengjs

1 天前

现在就等大佬测试结果了，希望 flash 能比肩 glm5 以上

weixiangzhe

3 小时 3 分钟前

flash 可以干 minmax 的活动

weixiangzhe

3 小时 3 分钟前

flash 不知道干 minmax2.7 现在的活