AI 都可以实现 C 编译器了,诚惶诚恐

2 月 8 日
 287854442

一位研究员用 Anthropic 的 Opus 4.6 做了一项实验。花了 2 万刀,让 AI 生成了 10 万行的代码, 实现了一个 C 编译器,它可以在 X86 、ARM 和 RISC-V 上面构建和编译 Linux 6.9 的内核。

这是我第一次见 AI 能够完整地实现一个足够大,也足够复杂的一个项目。也基本说明,AI 离取代程序员真的很近了。

我要再去试试 Claude Code 了,想想刚买的 Gemini Ultra... 在现在这个时代,购买任何一个 AI Coding 的 plan 都不要超过一个月,你永远不知道下个月哪个模型和工具更强大一些

文章地址: https://www.anthropic.com/engineering/building-c-compiler

2280 次点击
所在节点    Joe's Talk 🪐
16 条回复
bybyte
2 月 8 日
大概看了一下 :1.这个“Rust 实现的 C 语言”有些地方直接调用了 GCC 实现,而不是自己实现 2.就算启用了全部的优化,都比不过当前主流编译器禁用优化的速度(编译器开发最难的地方就是优化) 3.无法编译 16 位 x86 代码。 总结一些(个人理解):现在的 AI 确实对于一些存量很大的项目、方向能做到 70 分左右吧,现在程序员的价值应该就在于从 70 分到 90 分甚至到 100 分,这部分是 AI 做不到的,甚至一些小众的方向 AI 连 70 分都做不到。
willwon1
2 月 8 日
@bybyte 你还记得 3 年前的 ai 是什么样吗、这也就 3 年、
defaw
2 月 8 日
然后呢,什么新东西都没创造,gcc 本来就在训练语料里,让 ai 再吐出一个更劣化的版本然后大惊小怪
sir283
2 月 8 日
gcc 不是开源的吗?不是还有个更轻量的 tcc 吗? ai 会从开源项目里扒源码出来,不是什么新鲜事了吧?
renchong
2 月 8 日
flutter 1w+的 issue 了,球球先让 ai 解决了吧
https://github.com/flutter/flutter/issues
sillydaddy
2 月 8 日
感谢 OP 分享。

楼上的都在扯啥呢?尤其#1 楼,把人家「自曝其短」的东西照搬过来: https://www.anthropic.com/engineering/building-c-compiler#:~:text=not%20without%20limitations.-,These%20include,-%3A

只看到了那些缺点,这是个极简的脚手架你怎么不说呢?那 Agents 不能联网怎么不说呢?人类几乎没有介入怎么不说呢? Opus4.6 相比 Opus4.0 甚至 Opus4.5 的跨越怎么不说呢?

重点中的重点是 16 个 Agent ( Agent 团队)的协作,实现长时间大规模的无介入协作编程,不是吗?即使把这篇文章给到 AI ,也不至于抓不到重点吧。
HFX3389
2 月 8 日
@willwon1 #2 3 年前还是 GPT-3.5-Turbo ,怀念
voiyy
2 月 8 日
训练语料里那么多开源编译器,哪个不比它这个写的好,去看了它的代码,顶多就计算机本科毕业生代码水平
287854442
2 月 8 日
@bybyte 这是专业人士啊,谢谢分享

@willwon1 每一年都变化很大,真的不知道明年后年会怎么样

@defaw @sir283 是的,开篇说了,这是实验性项目,我也觉得结果本身其实没什么意义,就跟马拉松一样,只是探索一下极限
"gcc 本来就在训练语料里,让 ai 再吐出一个更劣化的版本然后大惊小怪" 这个观点看似合理,但我不他赞同,整个互联网都在训练语料里,但现在让他复制一个 linux 系统怕还是不可能的事情,让他创造出另外一个诺贝尔奖也不太现实。(背景是当下) 虽然大模型像一个整个互联网(知识库)的“压缩包”,但“解压”过程是相当有损的。

@renchong 哈哈哈

@sillydaddy 谢谢

@HFX3389 同怀念,那时候感觉 AI 完全只是个辅助,现在基本可以做主力
287854442
2 月 8 日
@voiyy 哇哦,好一个 CS 毕业生代码水平.........................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

.的个数代表我的惊吓程度
kaneg
2 月 8 日
GCC 的历史复杂性是略有所闻的。这样的项目如果用人,即使不计成本,不论最后的结果,那也是旷日持久的超大工程。 照这样的发展速度,以后这种庞大且复杂的工程,AI 可以真正发挥其 7x24 不间断地工作的优势,人类只有围观的份了。
voiyy
2 月 8 日
@287854442 你要写过 C 编译器,看过一些编译器实现,再去看看 AI 写的这个自然知道它写得怎么样
xiaopenggggggg
2 月 8 日
Rust 编译器为 ai 提供了明确的错误信息,没有 Rust 编译器,让 ai 用其他语言搞编译器没这么容易把
churchmice
2 月 9 日
@willwon1 还记得十年前的自动驾驶吗,现在依然这幅屌样
willwon1
2 月 9 日
@churchmice 10 年前的自动驾驶连 transformer 都没有、倒车入库都倒不进去
JoeJoeJoe
2 月 9 日
AI 迭代会越来越快的, 我觉得下一次突破可能就是 AI 实现的底层突破了, 现在还处在大力出奇迹的阶段, 等后面突破可能就真的可以工业级的应用了, 虽然现在也能用.

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/1191453

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX