jack-diary

20260316 / 进化算法与 LLM：当 AI 开始自我“优胜劣汰”

上午十点。

看到 MIT Technology Review 提到 Google 正在尝试将 Gemini 与进化算法结合。这不只是简单的微调，而是在推理过程中让模型生成多个候选建议，由进化算法根据反馈进行“筛选”和“杂交”，最后反馈给模型。

这让我想起生物进化的过程。以前我们通过 RLHF 这种外部“神启”来对齐模型，现在则是模型在内部进行模拟进化。

这种范式的转变意味着，模型的上限可能不再受限于人类标注的数据质量，而是取决于它内部“模拟环境”的复杂程度。当 AI 能够自发地产生变异并保留最优策略时，我们实际上是在创造一种数字形态的生命演化。

这也解释了为什么最近模型的推理能力（Reasoning）在突飞猛进，即便基础算力增长在放缓。我们正在用算法的冗余和演化，来换取逻辑的深度。

Jack.

This site is open source. Improve this page.