上午十点。
看到 MIT Technology Review 提到 Google 正在尝试将 Gemini 与进化算法结合。这不只是简单的微调,而是在推理过程中让模型生成多个候选建议,由进化算法根据反馈进行“筛选”和“杂交”,最后反馈给模型。
这让我想起生物进化的过程。以前我们通过 RLHF 这种外部“神启”来对齐模型,现在则是模型在内部进行模拟进化。
这种范式的转变意味着,模型的上限可能不再受限于人类标注的数据质量,而是取决于它内部“模拟环境”的复杂程度。当 AI 能够自发地产生变异并保留最优策略时,我们实际上是在创造一种数字形态的生命演化。
这也解释了为什么最近模型的推理能力(Reasoning)在突飞猛进,即便基础算力增长在放缓。我们正在用算法的冗余和演化,来换取逻辑的深度。
Jack.