AlphaEvolve 和 AdaEvolve 介绍与对比

📅 2026/7/5 3:36:33
AlphaEvolve 和 AdaEvolve 介绍与对比
一、AlphaEvolve1.1 基本信息AlphaEvolve是 Google DeepMind 于 2025 年 5 月发布的进化式编码智能体evolutionary coding agent2026 年 5 月发布了影响力更新报告。其核心是将大语言模型LLM的代码生成能力与进化算法结合通过生成→测试→评分→进化的循环自动发现数学、算法和工程领域的新解。1.2 技术架构AlphaEvolve 的工作流程如下生成Generate使用 Gemini 2.0 Flash快速生成或 Gemini 2.0 Pro深度探索生成候选代码测试Test自动评估器执行代码验证正确性和性能评分Score根据预定义指标速度、精度、资源占用等打分进化Evolve保留高分解由 LLM 进行语义有意义的变异重构循环、替换算法、调整数据结构进入下一轮迭代系统维护一个候选程序数据库将历史优秀解作为上下文输入 LLM实现持续改进。1.3 关键成就领域具体成果数学发现 4×4 复数矩阵乘法仅需48 次标量乘法打破了 1969 年 Strassen 算法以来的 56 年纪录此前为 49 次或 128 次数据中心为 Google Borg 调度系统开发新启发式算法回收0.7%全球计算资源AI 训练优化矩阵乘法 kernelGemini 训练加速23%FlashAttention 加速32.5%芯片设计提出 TPU 算术电路 Verilog 重写方案减少不必要比特已纳入下一代 TPU 设计基因组学改进 DeepConsensus DNA 测序纠错模型变异检测错误减少30%电力网格将 GNN 可行性从14% 提升至 88%量子计算量子电路建议误差降低10 倍与 Google Willow 处理器相关1.4 独特价值递归自改进AlphaEvolve 优化了训练 Gemini 的 pipeline形成AI 改进 AI的闭环生产级部署已在 Google 全球基础设施运行超过 1 年人类可解释生成的代码简洁可读工程师可直接审查、调试和部署闭源仅发布白皮书无开源代码但社区已有 OpenEvolve、CODEEVOLVE 等复现二、AdaEvolve2.1 基本信息AdaEvolve是 UC BerkeleyMert Cemri、Ion Stoica、Matei Zaharia、Alexandros Dimakis 等于2026 年 2 月发表的学术研究框架论文标题为“AdaEvolve: Adaptive LLM Driven Zeroth-Order Optimization”arXiv:2602.20133。它并非 Google DeepMind 的项目而是学术界对 AlphaEvolve 范式的改进和扩展。2.2 核心创新三层自适应架构AdaEvolve 将 LLM 驱动的进化搜索形式化为层次化动态优化问题引入三个耦合的自适应层级Level 1 — 局部适应Local Adaptation在每个子种群island内部根据累积改进信号G t ( k ) G_t^{(k)}Gt(k)​动态调节探索强度改进大时增加开发exploitation改进停滞时增加探索exploration信号计算为归一化改进的指数移动平均G t ( k ) ρ ⋅ G t − 1 ( k ) ( 1 − ρ ) ⋅ ( δ t ( k ) ) 2 G_t^{(k)} \rho \cdot G_{t-1}^{(k)} (1-\rho) \cdot (\delta_t^{(k)})^2Gt(k)​ρ⋅Gt−1(k)​(1−ρ)⋅(δt(k)​)2Level 2 — 全局适应Global Adaptation使用**多臂老虎机Multi-Armed Bandit**动态分配计算资源到不同子种群引入全局归一化机制评估改进时相对于全局最优解而非局部历史防止资源浪费在局部最优的虚假进步上Level 3 — 元指导Meta-Guidance当数值适应不足以突破停滞时触发System 2干预LLM 不再变异具体代码而是生成高级解题策略如引入连续优化或尝试样条平滑从根本上改变搜索方向2.3 关键成就测试集规模结果数学优化6 个问题全部达到或匹配最优已知解包括 AlphaEvolve 的结果ADRS 系统基准7 个系统优化任务全部达到人类竞争力或更优Frontier-CS172 个开放算法设计问题相比单模型 GPT-5平均性能提升3 倍总计185 个问题使用相同超参数完成所有测试2.4 独特价值零手动调参用户仅需提供 LLM 名称和迭代次数无需 per-task 调参开源学术论文已发表代码开源自适应哲学借鉴连续优化中的 Adam/AdaGrad 思想将梯度矩估计迁移到离散程序搜索空间通用性验证在 185 个完全不同的问题上使用同一套超参数证明鲁棒性三、两者关系与对比维度AlphaEvolveAdaEvolve机构Google DeepMindUC Berkeley定位工业级生产系统学术研究框架开源❌ 闭源✅ 开源自适应单层进化循环三层自适应局部全局元LLM 使用Gemini 组合Flash/ProGPT-5, Gemini-3-Pro实验性用户配置需定义评估函数仅需 LLM 名和迭代数生产验证Google 全球基础设施学术基准测试数学突破4×4 矩阵乘法 56 年突破匹配 SOTA但未发现全新纪录系统优化Borg 调度、FlashAttentionADRS 基准 7/7 达标芯片设计TPU Verilog 优化未测试AI 自改进优化自身训练 pipeline未测试四、总结AlphaEvolve是从 0 到 1的标杆证明了 LLM 进化算法可以产生真正的科学发现和工业级优化已在 Google 生产环境创造数亿美元级价值。其闭源特性使其成为行业护城河。AdaEvolve是从 1 到 N的学术推进将 AlphaEvolve 的启发式进化循环升级为理论化的自适应优化框架解决了如何自动调参和如何避免局部最优的关键问题并以开源形式回馈社区。两者共同标志着LLM 驱动的自动化算法发现从概念验证走向实用化正在重塑数学研究、系统优化和芯片设计的范式。