有大模型领域的哥吗,目前在你们业界看来,大模型有“创造力”吗,还是一种更“高阶的检索”

2025 年 4 月 14 日
 YanSeven
比较好奇。
6966 次点击
所在节点    问与答
74 条回复
shendaowu
2025 年 4 月 14 日
@duanxianze #11

虽然我基本认同你的结论。但是你说的细节我有点不同意,我还是比较相信人脑可能利用了量子力学的机制来实现思考的。我前段时间好像看到一篇报道说大脑可能是通过量子力学的方式实现同步的。我理解可能类似时钟信号吧。据说现代 CPU 也会遇到时钟难以同步的问题,很难处理,GPU 可能也类似吧。想要实现强人工智能,要么人类能够有效利用量子力学,要么设计出一种全新的生命让其自行演化,要么可能是人脑根本就没用多少量子力学的机制。我想不到其他情况了。

还有更玄乎的,所谓连接集体意识。这个我感觉可能只是幻觉,不太可信。可能不是这个名字,大意就是你是一个终端,可以连接盖亚那种服务器的意思。我问了一下 deepseek 也没得到什么确定的答复。

另外神经元之间通信不是纯电的,是混电的。
linofound
2025 年 4 月 14 日
当然有,创造也就是随机、推理、验证、固定。
whp1473
2025 年 4 月 14 日
当然有,创造力就是基于之前的经验做合理推理、验证、总结,所以大模型的幻觉问题不可能解决,这也是创造力的一部分。
neteroster
2025 年 4 月 14 日
非业界,只是对大模型有一定了解。

1. 很显然大模型不是所谓的“更高级”检索。大量例子表明 LLM 具有真正的泛化性,至少也是具有“通用模式匹配”的能力。

2. 很多人刚刚了解一点大模型的原理,就以 LLM 是“学习文本统计意义下的预测”这一点来否决 LLM 具有的泛化能力(他们通常还会辅以“LLM 具有幻觉”这一点作为例证)。LLM 是学习文本的统计学规律没错,但是我见过的任何一个持此类观点的人都无法陈述为什么学习统计学规律就无法产生真正意义下的“智能”(事实上,他们甚至无法准确地定义“智能”,就大谈“LLM 永远不可能有真正的智能”),LLM 会产生幻觉这一点也不蕴含 LLM 不能泛化,无法产生“智能”。

3. 与其关注“真正的智能”这种难以定义虚无缥缈的东西,还不如关注 LLM 能怎么用,缺乏什么能力阻止他变得更有用。我在这里得出的严重乃至本质上的需要克服的缺陷有两个:1. 无衰减的超长上下文 2. 持续学习(更新参数的那种)。只要解决这两点,大模型在实际生活生产中的应用可以大幅拓宽。甚至我觉得就凭现在先进的推理模型(比如 Gemini 2.5 Pro / o3 )加上上述两点就能实现非常接近 AGI 的存在。
shendaowu
2025 年 4 月 14 日
@mumbler #19 你说的这个东西指的是概念还是物理对象?按照我的理解创新需要同时操作这两者,但是大预言模型在操作物理对象的能力上应该几乎为 0 ,或者有可能也被限制了。我前面说了,我认为语言是对现实的有损压缩,不完全等同于现实,没有实践的思考大概率只是空中楼阁。我还是看不懂你是怎么得出大模型比人擅长排列组合这个结论的。我觉得你说的那些东西不能支持你的结论。当然我说的这些东西也不是很能支持我的结论,但是我没说我的结论很可信。我猜人脑的排列组合可能还包括监控的功能,不然可能就是所有组合都发送给意识处理了。当然只是猜的而已。不知道大模型有没有这个能力,至少为感觉它的监控能力不怎么样。不知道你说人脑排列组合的效率低是不是从工作记忆的角度来看的,或者是从神经元传递信息的速度的角度来看?但据估算仅考虑神经突触,人脑的算力应该也是比大模型大的。这个我搜了一下,没搜到什么,不太可靠,不想详细搜了。人的工作记忆只是人脑功能的一小部分,不能代表人的上限。
dcatfly
2025 年 4 月 14 日
要看怎么理解创造力。
比如说当年围棋大战时 AlphaGO 很多棋路都是人类历史上没有出现过的,但确实赢了,这算不算创造力呢?
mumbler
2025 年 4 月 14 日
@shendaowu #25 “操作物理对象的能力上应该几乎为 0”,你这个断言是不成立的,现在那么多 agent,MCP 就是在为大模型提供操作物理对象的能力,自动驾驶,具身智能都是实实在在影响物理世界,后面会越来越强。

创新是思想上的,鱼+炸弹=鱼雷,柜子+空调=冰箱,做出来并不是最难的,能有这个想象力最难,大模型可以自己组合,自己排除理论上不合理的组合,效率非常高,2024 年诺贝尔医学奖颁给了 google 的蛋白质折叠模型 AlphaFold ,AlphaFold 能造出地球上没有的蛋白质结构,这个创新能力,把大量科学家都搞失业了。

人比大模型强的地方是单位效率高,下一盘围棋,李世石只用 2 个馒头,阿尔法狗要用 2 万美金电费,但大模型效率也在不断提升,而且能叠加,人是不能叠加的,不能说 1 亿人一天就能把癌症疫苗研究出来,但大模型加上量子计算机是可能快速创造任何东西
shendaowu
2025 年 4 月 14 日
@mumbler #27 所以你认为思想等同于现实了?那我们应该是没法讨论了。我还是详细搜了一下,人脑的算力有的估计为 2P FLOPS 。好像高于 gpt-4 使用时的算力 3700 TFLOP ,但是好像远低于训练时的算力 2.15e25 。
shendaowu
2025 年 4 月 14 日
@shendaowu 见笑了,看错了,3700 T 时 3.7 P 。
forgottencoast
2025 年 4 月 14 日
@tool2dx
大模型有没有创造力一直都是有争议的话题。
你说的没错,内部目前是有人类无法理解的黑盒。
我说它没有创造力更多的是居于它必须依赖预训练数据的这个事实,就是它给出的所有反馈都是从预训练数据里面来的。
mumbler
2025 年 4 月 14 日
@shendaowu #28
1. 大模型具备操作现实能力,你不要以为 chatbot 就是大模型,那只是大模型的 demo 而已
2. 我没有那么强的算力,我在很多具体事务上打不过大模型,给人类丢脸了
RainySeason
2025 年 4 月 14 日
画出一幅梵高风格的画是创造力,还是创造出一种新的绘画风格是创造力?
shendaowu
2025 年 4 月 14 日
@mumbler #27

第一段的对我的反驳我基本接受了,我之前没想到。但是还有个问题,就是这些大模型好像都局限于特定领域吧?然而很多创新需要跨领域。现在的大模型能自己尝试不同领域的知识吗?

应该是我理解不达标,你好像没有思想等同于现实的意思。我觉得想象难更多是因为大部分人没有专门训练过,或者天生没有那个动力,或者无法忍受那种不确定和瞎想的状态。
jimrok
2025 年 4 月 14 日
以现在的模型的结构,还无法产生创造力,但本质上,seq2seq 的模型,是可以产生创造力的。但目前的 transformer 架构不行,至少记忆能力就不好实现,只能靠弄长上下文。人的意识无非就是一束脑电波,seq2seq 的模型就是脑电波的计算场所,人类的神经元结构是可以适应变化的,能够对特征动态调整。但现在 ai 的架构不行,太固定了。
Shanky
2025 年 4 月 14 日
我觉得大模型已经比很多 B 站,V 站,抖音,网易新闻下的评论的智力/创造力要高了
Rickkkkkkk
2025 年 4 月 14 日
只能说比绝大多数人的创造力强。
mumbler
2025 年 4 月 14 日
@shendaowu #31 目前最强的模型 gemini2.5 pro 智商 130 ,我有一道题,别的模型都老老实实去翻译了,只有 gemini2.5 发现了问题,这不是英语,这是一道语文题,直接给出了杜甫《春夜喜雨》的答案,你说他能不能跨学科?他就是个人

请用最优美的汉语,翻译下面的英文
Joyful rain knows their prime,
It will arrive in spring time.
Breeze and raindrops whisper at night,
Creatures are nourished and brought to life
shendaowu
2025 年 4 月 14 日
@mumbler #31

1. 我之前还真基本上将大语言模型和大模型等同了,我的错。但是大预言模型应该是唯一整合了不同领域知识的大模型吧?而其他的能操作现实的大模型都是具体领域的吧?如果是的话这是否能说明什么?比如大模型无法整合不同领域的知识进行创造之类的。这算是我的“垂死挣扎"吧,我已经没有能说服你的希望了,我的信念也基本被改变了。我的信念基本等同于观点,但是我不喜欢观点这个词。

2. 你是在阴阳我还是真那么想的?
mumbler
2025 年 4 月 14 日
@shendaowu #38 你想表达的意思术语叫 AGI ,通用人工智能,就是不需要我们用 prompt 去驱动,可以像人一样交流,完成各种工作,chatgpt 诞生后,业界普遍认为 AGI 不存在障碍了,奥特曼和李开复都表达过,预计最早 2027 年能实现 AGI ,但 AGI 早期可能非常贵,我们目前的电力水平可能还不配拥有 AGI ,需要可控核聚变做出来才行
Muniesa
2025 年 4 月 14 日
我认为强化学习有效就证明了本身具有创造性

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/1125197

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX