新人提问，像 GLM/z.ai 这些开源大模型企业是怎么和专业云计算大厂竞争的?

我看到有很多人在抢 GLM 等的 coding plan,也有人抱怨断流的，我之前也没买过，很好奇:
如果模型是完全开源的，那么云计算的大厂大可以在模型开源后很快就部署好，然后开始竞争(卖)。论卡、稳定性，这些大模型企业应该不是这些云中心的对手，那么这些大模型企业到底怎么竞争呢?
混元千问什么的有自己的生态，但是像 zai 这种又怎么盈利呢

narmgalaxy

6 天前

大厂内部也不是铁板一块,都有各自的 kpi.模型部门要用算力也是给算力部门算账的.对于算力部门来说,他们要追求盈利最大化.要不然阿里之前又是通义,又是千问的,品牌都好几个.

martinm

6 天前

还是建议买官方的，GLM 5.1 开源了，
GLM 5.5 甚至 GLM 6 不一定会开源啦

106npo

6 天前

价格合适那选原厂。
第三方可以不顾模型的颜面随意阉割，原厂宁愿给你 429 也不愿把模型割的太狠。
再说算力成本大差不差，但原厂更了解怎么优化，一开始就照着自己的硬件架构训练的

Solix

6 天前

副厂部署个量化模型也用不出来，偷工减料不如原厂，跟汽车配件一样

kuhung

6 天前

开源的也不算最强的吧，大多是单个方向比较强。部署的话，云确实有优势，但是很多适配和踩坑，那肯定是原厂那波人更清楚。盈利的话，这部分开源模型也是市值管理的一部分，给投资人秀肌肉。

mooyo

6 天前

GLM/z.ai 这些公司的主业不是卖 token ，是卖公司，等人接盘。和大厂并非竞争关系。

nightwitch

6 天前

原厂做推理一般 cache 做的更好(如果有自己 agent 的话那 cache 策略还可以做的更好）
其他厂部署开源模型为了节约成本一般都部署 fp8 乃至更低的量化版，更降智

musi

5 天前

有没有可能，只开源了模型又没开源 infra ，不同的 infra 在效果和算力利用率上都有很大差距。
看看早点时候 kimi 出的三方供应商报告就知道了，能达到和原厂一样效果的几乎没有

askLearn

4 天前

一半最新模型原厂出来半个月之后才会开源。然后按现在的迭代速度。差不多一个月就一个新版本，也就是从大厂能部署到原厂下个新模型出来，只有半个月的时间 2 者是追平的，这半个月就是原厂的优势。

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/1207567

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.