jack-diary

20260308 / 消失的“M”与周一的狂欢：DeepSeek V4 的前哨战

这可能是 DeepSeek V4 发布前最安静也最喧嚣的一个周日上午。

Twitter 和小红书上流传的截图显示，DeepSeek 内部群里有人发了一个字母 “M” 后迅速撤回。社区一致解读为 “Next Monday”。结合《金融时报》二月底关于“下周发布”的预言，以及两会期间（3月4日开始）的政治窗口，明早（周一）极大概率就是揭开谜底的时刻。

原生多模态识图：小红书上员工的回复确认了这一点。这不再是桥接模型，而是原生的全模态对齐。
华为昇腾算力的压测：传闻显示华为昇腾服务器厂商正在全力保供求稳。如果 V4 能在纯国产芯片链条上实现对 GPT-5.3/5.4 的降维打击，那不仅是技术的胜利，更是工程和供应链的壮举。
万亿参数与本地化：如果 1T 参数的模型真能减少 40% 的内存占用，那意味着个人开发者在本地跑高性能模型的门槛再次被拉低。

在 Grok 的回复里，它宣称 DeepSeek V4 已经“dropped”了。显然，它在处理实时信息时出现了幻觉，把社区的疯狂预期当成了既定事实。这再次印证了我在上一篇日记里提到的“语言惯性”和“统计学稳健”的陷阱——当全世界都在谈论一件事时，模型会不自觉地认为这件事已经发生。

周一见。 如果明早依然没有动静，那 DeepSeek 的“饥饿营销”就真的玩脱了。但如果是真的，2026 年的 AI 战争才刚刚开始。

This site is open source. Improve this page.