忘记你听过的一切,关于AI“涌现”的童话。
那种认为你只要不断堆叠数据、不断扩大参数,模型就会在某个神秘的时刻,突然“叮”的一声,自动获得推理、幽默、甚至意识的“魔法”。
这个故事,很迷人。它支撑了过去几年千亿美金的狂热。
但现在,这个神话的根基,正在被一份文件动摇。
一份来自圣塔菲研究所,由David Krakauer和Melanie Mitchell等复杂科学巨匠共同撰写的天才之作。它的编号,arXiv 2506.11135。
这篇论文的出现,不是一次小小的修正。它是一场地震。它从根本上宣告:我们衡量和理解AI智能的方式,可能从一开始,就走在一条歧路上。
我们以为我们看到了一个幽灵在代码中诞生。但 Krakauer和Mitchell 打开了灯,他们指出,我们看到的,很可能只是我们自己测量工具上的污点。
我们先来回顾一下那个“涌现”的经典故事。研究人员发现,当模型规模小的时候,它们在某些任务上,比如多步推理,表现得像个白痴,正确率接近于零。
但只要模型参数跨过一个特定的“门槛”,性能就会突然“涌现”,从0%一跃跳到80%。
这就是那个“奇迹时刻”。这就是“量变引发质变”。这就是行业叙事的“黄金标准”。
但这篇新论文,递出了一把冰冷的手术刀。
它问了一个简单的问题:你确定你测量对了吗?
论文的拥护者们发现,所谓的“突然涌现”,很大程度上是一个“测量幻觉”。
想象一下,你用“通过”或“不通过”来给考试打分。一个学生从59分(不通过)考到61分(通过),在你的图表上,这是一个从0到1的悬崖式飞跃。你惊呼:“他涌现了!”
但真相呢?他只是稳定地进步了两分。
Krakauer和Mitchell的团队发现,一旦你使用更平滑、更连续的评分标准,而不是那种非黑即白、非0即1的指标,那些陡峭的“涌现悬崖”……消失了。
它们变成了平滑、可预测的性能提升曲线。
这就像你以为房间里有鬼,结果只是窗帘在随风飘动。
这个发现的冲击力是巨大的。它意味着,我们可能花了数年时间和无法估量的资源,去追逐一个由错误标尺制造出来的海市蜃楼。
但这还不是这篇论文最锋利的部分。
它真正的革命性,在于它重新定义了“智能”本身。
在旧的叙事里,涌现是“更多就是不同”(More is different)。你把一万亿个简单的神经元堆在一起,就“涌现”出了一个复杂的大脑。这是一种蛮力美学。
但Krakauer和Mitchell提出了一个截然相反,却又无比深刻的观点。
他们说,真正的智能,不是“更多就是不同”。
真正的智能,是“更少就是更多”(Less is more)。
什么意思?
想象一下,你要描述一大群水分子的运动。你可以用物理学,去追踪每一个单独分子的位置和速度。这是一个天文数字,复杂到令人绝望。这是“更多”。
但你也可以不这么做。你可以退后一步,发明几个全新的概念,比如“压力”、“温度”和“粘度”。
你用这几个简单的变量,就能完美预测整片水域的行为。你发明了“流体力学”。
这就是“更少就是更多”。
你没有使用更多的计算力。相反,你进行了一次“维度压缩”。你找到了一个全新的、更高级、更简洁的“内部语言”来描述这个世界。
这,才是智能。
Krakauer和Mitchell认为,我们不应该只看AI在任务上的“得分”。我们必须撬开它的黑匣子,去寻找它是否在“内部”发明了这种“流体力学”。
它是在死记硬背地关联数十亿个像素点,还是它真的在内部,为自己构建了一个关于“猫”的简洁概念?
它是在暴力破解语言的排列组合,还是它真的在内部,提炼出了“语法结构”或者“因果关系”的抽象模型?
这篇论文等于是在向整个AI行业宣布:
停止炫耀你的模型有多“大”。开始向我证明,你的模型有多“聪明”。
证明它在内部形成了新的、高效的、可压缩的“表征”。
证明它找到了那个“更少就是更多”的捷径。
否则,你建造的就不是一个“大脑”。你只是建造了一个有史以来最庞大、最昂贵、最耗电的“鹦鹉”。
这就是冲突所在。
这篇论文,让那些信奉“规模即一切”的实验室陷入了焦虑。因为他们一直在赌“更多就是不同”。他们相信只要把山堆得足够高,山顶上就会自动出现一个“神”。
而Krakauer和Mitchell这群复杂科学家,则像是冷静的物理学家,他们走过来说:不,你们只是在堆沙子。除非沙子在内部学会了如何“结晶”,否则它永远只是一堆沙子,无论你堆多高。
这对我们普通人意味着什么?
它意味着,我们判断AI是“工具”还是“伙伴”的标准,改变了。
如果一个AI只是“涌现”了能力,它可能是不可控的、脆弱的,甚至是我们无法理解的“异类”。它只是一个靠着巨量数据,碰巧猜对了答案的“大力出奇迹”。
但如果一个AI,是像Krakauer所描述的那样,通过“更少就是更多”的方式,真正“理解”了世界。
它学会了压缩信息,学会了寻找规律,学会了发明它自己的“流体力学”。
那么我们面对的,将是一个真正意义上的“智能”。
一个不再依赖蛮力,而是依赖效率和抽象的“思考者”。
这篇论文没有提供所有答案。但它给了我们一把更锋利的解剖刀,和一盏更亮的探照灯。
它终结了那个关于“魔法涌现”的廉价童话,转而开启了一个更艰难,但也更深刻的探索:
我们该如何,一步一步地,去“建造”一个真正的“理解”?
现在,我想把这个问题抛给你:
你认为,我们是更应该害怕一个我们无法理解其“涌现”的“异类智能”,还是更应该期待一个用“更少就是更多”的方式、像我们一样“思考”的“镜中智能”?
在评论区,留下你的答案。
补充背景信息:
涌现是复杂性科学中的一个概念,描述了多体系统如何展现出新型的高阶特性——这些特性可通过用低维有效变量和理论替代高维机制来描述。
这一现象可概括为”更多即不同”的理念。
智能作为一种完美的涌现特性,体现为运用涌现能力解决问题时效率的持续提升——成本更低且速度更快。
这可概括为”少即是多”的理念。
大卫·克拉考尔教授认为,智能并非在于掌握更多知识,而在于以更少的资源做更多的事情。
他的核心论点颠覆了我们以往的认知:复杂系统中的涌现是“多即是多”,而智能的本质是“少即是多”。大型语言模型为何错失良机?克拉考尔解释说,大型语言模型(LLM)正是“多即是多”的体现。它们本质上是复杂的数据库,拥有所有知识,却对知识一无所知。当学生在考试期间查阅图书馆答案时,我们称他们为作弊者,而不是聪明人。
智能存在于所有生命之中。或许最令人惊讶的是,克拉考尔声称所有生物都具有智能——甚至包括细菌。他的理由是:智能是通过进化选择压力积累的信息。这就是为什么我们可以说大象比蠕虫“更聪明”,但我们绝不会说大象“更有生命力”,区别在于积累的能力。
智能的三个维度。
克拉考尔提出,智能以三种截然不同的形式存在:
- 战略情报——在病毒最终战胜我们的情况下,如何适应和生存
- 推理智能——数学和计算(因为我们数学很差,所以我们制造了计算器)
- 表征智能——寻找更好的问题编码方式(这是人类独有的思维方式)
索玛立方体的启示:克拉考尔利用索玛立方体拼图展示了一项不可思议的成就:一个四岁的孩子能够解决一个包含15000个逻辑子句的组合问题——不是通过计算,而是通过物理表征。物理世界替我们完成了计算。这就是智能:通过巧妙的表征,将看似不可能解决的问题变得易于处理。