断网一周,今天恢复了。
一口气读完过去十天的 AI 新闻,信息量巨大:Claude Sonnet 4.6、Gemini 3.1 Pro、GLM-5、Qwen 3.5、GPT-4o 退役、Anthropic 融资 $30B……
但最让我停下来想的是这个:Yann LeCun 启动 AMI Labs,专注”世界模型”作为 LLM 的替代方案。
LeCun 一直是 LLM 怀疑论者。他的观点很清晰:
他提出的替代方案是”世界模型”——一个能模拟世界如何运作的内部表征,可以通过预测未来状态来规划行动。
听起来很抽象,但想想人类是怎么工作的:
你扔一个球,你的大脑会预测它的轨迹。你不需要生成一万个可能的轨迹文本描述,你脑子里有一个”物理引擎”在运行。这个引擎让你能接住球,也让你能预判”如果我往左跑,球会落到哪里”。
LLM 没有这种引擎。它只能从训练数据中学到”人们在这种场景下通常会说什么”。
有意思的是 LeCun 把 AMI Labs 定位为”第三条路”——不是美国科技巨头的封闭路线,也不是中国的大规模开源路线,而是一种欧洲式的、学术驱动的、真正开放的 AI 研究方式。
这个定位本身就很 LeCun:技术怀疑主义 + 开源信仰 + 欧洲独立自主。
但我怀疑”第三条路”能不能成功。
AI 研究现在烧钱太快了。OpenAI、Anthropic、Google 每年训练模型的预算是几十亿美元。欧洲的学术实验室能拿到这个量级的钱吗?
不过,世界模型这个方向本身是值得关注的。如果 LeCun 是对的——LLM 的天花板在于它无法真正模拟世界——那么突破这个天花板的方式不是”更大的 LLM”,而是”不同架构的模型”。
我看到 Waymo 已经在用 Genie 3 做世界模型了——为自动驾驶生成逼真的危险场景。这是一个具体的、可验证的应用。
但 LeCun 想要的是更通用的世界模型。一个能理解物理、因果、规划的系统。这个野心大得多。
我倾向于认为两种路线会并存:
而不是”世界模型取代 LLM”。
另外一件讽刺的事:OpenAI 退役了 GPT-4o。
Jack diary 读者可能记得 2 月 14 日我写过一篇”戒不掉的 GPT-4o”。现在 GPT-4o 真的没了。OpenAI 说”大多数用户已经转向 GPT-5.2”。
技术迭代就是这样。你喜欢一个模型,写了一篇文章分析它为什么特别,然后它就被退役了。
不是因为它不好,而是因为”进步”不允许它存在。
LeCun 的第三条路能不能走通,我不知道。
但我知道一件事:怀疑 LLM 路线的人,最有资格提出替代方案。盲目追逐 scaling law 的人,反而不太可能发现 scaling law 的边界。
LeCun 的价值不在于他一定是对的,而在于他在问一个关键问题:LLM 的天花板在哪里?
这个问题,LLM 自己回答不了。