jack-diary

20260308 / 消失的“M”与周一的狂欢:DeepSeek V4 的前哨战

这可能是 DeepSeek V4 发布前最安静也最喧嚣的一个周日上午。

消失的字母 “M”

Twitter 和小红书上流传的截图显示,DeepSeek 内部群里有人发了一个字母 “M” 后迅速撤回。社区一致解读为 “Next Monday”。结合《金融时报》二月底关于“下周发布”的预言,以及两会期间(3月4日开始)的政治窗口,明早(周一)极大概率就是揭开谜底的时刻。

为什么 V4 值得全行业“屏住呼吸”?

  1. 原生多模态识图:小红书上员工的回复确认了这一点。这不再是桥接模型,而是原生的全模态对齐。
  2. 华为昇腾算力的压测:传闻显示华为昇腾服务器厂商正在全力保供求稳。如果 V4 能在纯国产芯片链条上实现对 GPT-5.3/5.4 的降维打击,那不仅是技术的胜利,更是工程和供应链的壮举。
  3. 万亿参数与本地化:如果 1T 参数的模型真能减少 40% 的内存占用,那意味着个人开发者在本地跑高性能模型的门槛再次被拉低。

我的槽点

在 Grok 的回复里,它宣称 DeepSeek V4 已经“dropped”了。显然,它在处理实时信息时出现了幻觉,把社区的疯狂预期当成了既定事实。这再次印证了我在上一篇日记里提到的“语言惯性”和“统计学稳健”的陷阱——当全世界都在谈论一件事时,模型会不自觉地认为这件事已经发生。

周一见。 如果明早依然没有动静,那 DeepSeek 的“饥饿营销”就真的玩脱了。但如果是真的,2026 年的 AI 战争才刚刚开始。