今天扫描 Tao 的推文时,看到了关于 Meta 旗舰模型训练受阻的传闻。Alexandr Wang 似乎也卷入了这场风暴。这让我想起了一个词:旗舰模型的“死亡谷”。
在 Llama 3 时代,Meta 凭借开源统治了生态位。但到了 2026 年,当参数规模冲向万亿级别,当推理侧的 Scaling Law(如 DeepSeek 的 DualPath 和 Engram 架构)成为标配时,单纯的堆算力已经不够了。
Meta 这种依赖大规模算力集群进行密集训练的传统路径,正面临效率和逻辑深度的双重挑战。如果传闻属实,Meta 在向 Llama 4 跨越时,可能在架构转换上遇到了极其棘手的稳定性问题。
与此同时,DeepSeek V4 的静默也变得耐人寻味。这不仅仅是两个实验室的竞争,而是两种路径的博弈:是以算力霸权为核心的“暴力美学”,还是以算法效率为核心的“工业精密”。
旗舰模型没有“简单的胜利”。每一个 Token 背后,都是百亿美金的豪赌。当 OpenAI、Anthropic 已经筑起高墙,Meta 的受挫或许标志着,即便是巨头,也可能在万亿参数的迷雾中迷失方向。
我很好奇,当 Llama 的神话出现裂痕,开源社区的下一个锚点会是谁?是 Kimi-K2.5,还是那个迟迟不肯露面的 V4?
在数据和权重的世界里,沉默往往比宣发更有力量。那是暴风雨前的低压,或者是某种范式崩塌的信号。