新人提问,像 GLM/z.ai 这些开源大模型企业是怎么和专业云计算大厂竞争的?

6 天前
 quanzeping7

我看到有很多人在抢 GLM 等的 coding plan,也有人抱怨断流的,我之前也没买过,很好奇:
如果模型是完全开源的,那么云计算的大厂大可以在模型开源后很快就部署好,然后开始竞争(卖)。论卡、稳定性,这些大模型企业应该不是这些云中心的对手,那么这些大模型企业到底怎么竞争呢?
混元千问什么的有自己的生态,但是像 zai 这种又怎么盈利呢

1257 次点击
所在节点    问与答
10 条回复
narmgalaxy
6 天前
大厂内部也不是铁板一块,都有各自的 kpi.模型部门要用算力也是给算力部门算账的.对于算力部门来说,他们要追求盈利最大化.要不然阿里之前又是通义,又是千问的,品牌都好几个.
martinm
6 天前
还是建议买官方的,GLM 5.1 开源了,
GLM 5.5 甚至 GLM 6 不一定会开源啦
106npo
6 天前
价格合适那选原厂。
第三方可以不顾模型的颜面随意阉割,原厂宁愿给你 429 也不愿把模型割的太狠。
再说算力成本大差不差,但原厂更了解怎么优化,一开始就照着自己的硬件架构训练的
Solix
6 天前
副厂部署个量化模型也用不出来,偷工减料不如原厂,跟汽车配件一样
kuhung
6 天前
开源的也不算最强的吧,大多是单个方向比较强。部署的话,云确实有优势,但是很多适配和踩坑,那肯定是原厂那波人更清楚。盈利的话,这部分开源模型也是市值管理的一部分,给投资人秀肌肉。
mooyo
6 天前
GLM/z.ai 这些公司的主业不是卖 token ,是卖公司,等人接盘。和大厂并非竞争关系。
nightwitch
6 天前
原厂做推理一般 cache 做的更好(如果有自己 agent 的话那 cache 策略还可以做的更好)
其他厂部署开源模型为了节约成本一般都部署 fp8 乃至更低的量化版,更降智
musi
5 天前
有没有可能,只开源了模型又没开源 infra ,不同的 infra 在效果和算力利用率上都有很大差距。
看看早点时候 kimi 出的三方供应商报告就知道了,能达到和原厂一样效果的几乎没有
lusi1990
5 天前
原厂没有量化, 调教经验丰富. 方舟的套餐直接量化的不能用了
askLearn
4 天前
一半最新模型 原厂出来半个月之后才会开源。然后按现在的迭代速度。差不多一个月就一个新版本,也就是从大厂能部署到原厂下个新模型出来,只有半个月的时间 2 者是追平的,这半个月就是原厂的优势。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/1207567

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX