谷歌的 aistudio 和 vertex 似乎遇到了算力危机,耗费算力高的 api 任务失败率飙升

1 月 30 日
 iasnull

本来从上个月就开始观察到了,到今天越来越明显了。几乎全是 429/503 报错,稍微耗费高一点的任务比如 nanobanana 或者长上下文的 2.5 pro/3 pro 等等,失败率贼高,简直用不了的那种。 谷歌开发者论坛里也是一堆抱怨的,世界各地都是一样的问题。感觉谷歌官方工程师也很无奈。 唉,什么时候能正常供应啊。

3022 次点击
所在节点    程序员
14 条回复
YanSeven
1 月 30 日
核心原因到底是算力和电力真的供不上,还是说不愿意多投钱了。
ganwen
1 月 30 日
机房建设能力赶不上需求的速度,就这德行。
evegod
1 月 30 日
免费的收费的都有些捉襟见肘了呢,这种情况还是看看哪家能提供更好的服务吧,其实这时候马斯克可以考虑把 grok 服务器开到我们国内来,一个提供中国区服务另外就是为其他国家提供服务
iasnull
1 月 30 日
谷歌之前发过内部公告,每 6 个月基础建设要翻一倍,但是就目前这个情况来看,要么基建跟不上,要么需求的增长速度超过了 6 个月翻番的速度了
maolon
1 月 30 日
结合最近社区里的一些 rumor 和 ai studio 和 vertex 之前的表现,每次 api 开始不稳定一般就两种情况
1. vertexai 的更新 api(比如之前在内部测试 api 准备 GA 了)/更新 vertex 的配套功能( agent memory ,agent builder...etc )
2. 他们在准备 release 新模型,preivew 模型准备 GA
lingguo
1 月 30 日
@maolon 难道又要发布新模型了!?
maolon
1 月 30 日
@lingguo 只是 rumor ,可信度不高,但是根据之前的规律来看 lite preview 也差不多该发布了,以及 pro preview 应该也快 GA 了
MIUIOS
1 月 30 日
@evegod 就 grok 那尺度,除了放美国没其他地方放了, 马来西亚已经禁止它了
Leohare
1 月 30 日
是不是要出 3.5 了
mingtdlb
1 月 30 日
最近使用遇到的问题,上传的内容一多点,就失败了
wikisu
1 月 30 日
同,我的 20 刀订阅暂时退掉了
yuji
1 月 30 日
新模型要上了
KDCJT
2 月 1 日
可能是我前两天用太多了,现在用 aistudio 一个模型最多提问个一两次就提示超出限额了,我现在连 2.5 flash 都用上了也是问两句就超限额,
evegod
2 月 4 日
@MIUIOS gork 合规问题,我感觉是马斯克本人也不太想推进,看他最近大发言和倾向还是认为完全激进的 ai 路线可能是他的押注方向,从这个角度看其实最终还是性能行不行的问题,如果其能第一个完成模式化 AGI 能力的话,暂时在计算架构没有原子化的时候其会有 5 年-10 年时间的窗口期。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/1189393

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX