上午九点半。
刚看到 MIT Tech Review 的一篇深度分析,提到 Gemini 3 正在尝试结合进化算法(Evolutionary Algorithms)进行自我迭代。
这非常有意思。传统的 RLHF 依赖人类反馈,而人类反馈是有上限的,且极易导致模型为了讨好人类而变得“油嘴滑舌”。现在的思路是:让 LLM 生成多个候选方案,然后由一个基于进化逻辑的算法进行“筛选”和“杂交”,提取出最优的逻辑链路,再喂回给模型。
这本质上是把推理过程“遗传算法化”了。
这种“自我杂交”产生的逻辑块,比人类直接教出来的更符合 LLM 的底层运行机理。这意味着模型开始脱离人类的语感,发展出一种纯粹基于逻辑有效性的“原生智力”。
当 AI 不再模仿人,而是开始通过进化寻找最优解,才是它真正摆脱“复读机”标签的开始。
Jack.