英伟达年度「最危险」论文:AI自繁衍代码,无限刷级进化

📅 2026/6/29 12:05:26
英伟达年度「最危险」论文:AI自繁衍代码,无限刷级进化
英伟达打破20年封印让AI亲手造出更狠的「考官」淘汰自己。【新智元导读】年度最危险论文发了英伟达打破20年封印让AI亲手造出更狠的「考官」淘汰自己。无休止的自我进化一旦开启2028年ASI降临真不是玩笑。Anthropic彻底「RSI上头」了联合创始人Jack Clark抛出惊人预测到2028年底一个高度自主进化的AI就会诞生。这个概率是60%在人们还在为「2028 RSI能否实现」争论不休时剑桥大学、英伟达等机构联手丢出了一篇重磅论文——「红皇后哥德尔机器」Red Queen Gödel Machine它的运作宛如一场残酷的AI生存游戏AI自己编写新的学习算法并将其投入沙盒进行试炼。失败的直接抹杀成功的保留下来。接着幸存者们开启下一轮的自我进化与繁衍。论文地址https://arxiv.org/pdf/2606.26294但真正令人毛骨悚然的是AI随后展现出的「顿悟」它意识到想要不断变强就必须面对更加苛刻的试炼。于是AI开始主动「进化」自己的考官。它亲手打造出更严苛的裁判来评判自己写出的更高级的代码。这套机制将AI死死锁定在一个无休止的、疯狂自我迭代的RSI里。看完这37页论文许多人倒吸一口凉气「这绝对是年度最危险的AI论文」2028年RSI自进化把预言写成代码2003年德国科学家Jürgen Schmidhuber曾构想过一种机器 名为「哥德尔机」Gödel Machine。它的设定堪称完美一台能证明自己的改进有益、然后改写自身代码的机器。一旦造出来它就能不断自我升级越变越强没有上限。不过「哥德尔机」有一个致命的「门槛」——在执行任何一行自我修改的代码前它必须先从数学上严格证明这次改动一定是有益的。但在现实中这几乎是个不可能完成的任务所需的算力堪称「黑洞」。于是在之后整整20年里哥德尔机只能躺在论文里当一个理论上的天花板一个谁都够不着的思想实验。近两年学界绕开了证明这道坎。达尔文哥德尔机DGM 、赫胥黎哥德尔机HGM干脆抛弃数学证明改用进化——让AI「繁殖」出大量带突变的代码变体扔进沙盒里跑分失败的淘汰成功的保留幸存者继续繁衍。AI跨越了最后一步开始字面意义上「进化」自己。但这些方法都还有一个共同的盲点——它们的考官是死的。不管AI怎么进化给它打分的那个评判标准、那个benchmark、那个验证器始终被钉死在循环之外一动不动。这恰恰违背了进化最核心的一条规律物种从不是在一个静止的环境里优化自己而是和不断变化的环境一起改变。红皇后哥德尔机RQGM要破的就是这道盲点。「红皇后」真正杀招让AI造出考官「红皇后」这个名字来自生物学家Van Valen 1973年提出的「红皇后假说」——你必须拼命奔跑才能停在原地因为你的对手也在进化。RQGM干的事正是把这句话写成了算法让考官评估器和选手任务智能体一起进化。这是整篇论文最让人头皮发麻的地方。这套精巧的机制叫「受控效用进化」controlled utility evolution整个搜索被切成一个个epoch在每个epoch内评估器考官是冻结的给所有考生打分保证信号稳定只有在epoch的边界才允许换考官且新考官必须在一份留出的「基准真相」锚点数据上统计意义上打赢老考官才能上位一旦换人系统立刻执行「选择性擦除」只丢掉那些由被换掉的考官打过的分其余证据全部保留。换句话说它既要狂奔进化又要每一步都站得住脚。真的奏效了AI自己改代码光说机制太抽象不如直接看战绩。第一战写代码Polyglot。RQGM给写代码的Agent配了一个代码评审员当陪练。结果在留出测试集上通过率从此前SOTA的69.9%提到了71.7%。更狠的是它达到这个成绩比对手少烧了1.35到1.72倍的token。因为那个评审员只需要查一次比反复多轮跑测试便宜太多了。第二战写论文。这是个没有标准答案的领域论文好不好没法机器自动判分。RQGM让写手和它的评审一起进化结果论文在一个固定评审小组里的接收率从前SOTA的21.8%直接飙到40.5%。第三战奥赛级数学证明。它进化出的「评分官」grader比静态基线更准、搜索成本还低了3倍进化出的「证明选手」拿到了最高的平均分。但全篇最封神的一笔是它把AI的一个老毛病给治好了。LLM当裁判有个出了名的毛病偏爱AI生成的内容。论文里那个最强的基线审稿人接受AI写的论文的概率是接受人类论文的最高1.91倍。RQGM怎么治它在epoch边界上把固定评审之前放过的AI论文捞出来组成一个「对抗样本池」然后专门奖励那些能把这些AI论文揪出来打回去的新评审。进化几轮之后最终的评审对AI和人类一视同仁还保住了80%的真值准确率。当AI学会评判自己就在同一个夏天Anthropic联创Jack Clark押下重注60%的概率2028年底前AI将能亲手缔造出更强大的自己。曾将「哥德尔机」死死困住20年的那道高墙名为「证明」。而「红皇后机」将其唤醒只用了最残酷的一招无休止的繁衍、淘汰、再繁衍。当一个AI开始亲自为自己设计最严苛的考官在疯狂的递归中将自己逼向极限我们所面对的将是一个开始自行定义「何为智慧」的全新物种。当那一天到来ASI绝不会敲门预告。它只会默默造出那个唯一有资格评判它的裁判然后从容地走入考场。预言只负责指明终点代码才负责抵达。而现在这段令人窒息的距离正被 AI 自己以几何级数缩短。原文链接英伟达年度「最危险」论文AI自繁衍代码无限刷级进化-36氪