谷歌DeepMind发布AlphaProof Nexus,一口气解决9道埃尔德什数学难题

2026/05/26 16:20阅读量 3

谷歌DeepMind推出由Gemini驱动的智能体框架AlphaProof Nexus,成功解决9道埃尔德什开放问题,其中包括一道卡了人类56年的难题。系统还证明了OEIS整数序列百科中的44个猜想、解决了一道搁置15年的代数几何难题并改进了凸优化理论边界。每道题推理成本仅几百美元,全部代码已开源。

事件概述

谷歌DeepMind最新发布AlphaProof Nexus——一套由Gemini 3.1 Pro驱动的智能体框架,采用大语言模型+Lean编译器反馈循环的架构,一次性解决了9道埃尔德什开放问题。此外,该框架还证明了OEIS整数序列百科中的44个猜想、解决了一道搁置15年的代数几何难题(希尔伯特函数对数凹性),并改进了凸优化中锚定梯度下降法的理论边界。每道题的推理成本约为几百美元,全部证明代码已开源在GitHub上。论文共有20位作者,包括2016年AlphaGo核心研究员Aja Huang。

核心信息

三道代表性埃尔德什问题

  • Erdős #12(1970年提出,悬置56年):寻找一个无限大的整数集合,满足任意三个不同数字a、b、c,a不能整除b+c,且集合在自然数中保持一定密度。AI使用中国剩余定理将大问题拆分为独立区块,每个区块利用三项等差数列的回避集满足约束,再整体拼接为无限集。
  • Erdős #125(1996年提出,30年未定论):考虑两个集合——三进制下仅由0和1组成的整数,以及四进制下仅由0和1组成的整数。将两集合所有数字两两相加得到新集合,问该集合在自然数中的下密度是否为正。AI证明密度为零,关键思路是利用log₄/log₃为无理数,构造归纳性稀疏化论证使密度以0.99比率衰减至零。
  • Erdős #846(1992年提出,卡了34年):平面几何问题。AI证明存在一个无限扩展的平面点集,其任意有限子集中大部分点不共线,但整个集合无法拆分为有限个“没有三点共线”的子集。证明将完全图每条边映射到平面点,用二次多项式编码坐标,并引入无穷Ramsey定理。

系统架构:四个Agent,从简到繁

框架设计了四种Agent,能力逐级增强:

  • Agent A:同时启动多个独立子Agent,由Gemini 3.1 Pro编写Lean证明代码,编译器逐行检查并反馈错误,模型据此修改,循环直至通过。
  • Agent B:在Agent A基础上增加AlphaProof(此前为奥数级别训练的强化学习证明工具),用于攻克局部难点。
  • Agent C:引入进化算法思想,子Agent共享证明草图种群,由模型从合理性、清晰度、新颖性三维度评分(Elo系统),高分草稿交叉组合,低分淘汰。
  • Agent D:全功能完全体,融合进化筛选、专项工具(AlphaProof)和LLM推理。

值得注意的是,最简单的Agent A同样能解出全部9道题,只是成本稍高。研究团队认为这归因于Gemini 3.1 Pro强大的底层能力以及Lean编译器提供的严格纠错反馈。

值得关注

  • 成本效益显著:每道题仅需数百美元,远低于人类数学家解决同类问题所需的长期人力投入。
  • 开源与可复现:所有证明代码已公开,其他研究者可基于此框架继续挑战未解的埃尔德什问题。
  • 简化趋势:Agent A的表现暗示,未来随着大模型持续升级,复杂的多工具组合系统可能不再是必需,“LLM+专业校验工具”的简单循环即可解决大量数学难题。
  • 菲尔兹奖得主陶哲轩曾估计AI解决埃尔德什问题的成功率约1-2%,本次系统挑战353道题、解出9道的比例与之吻合。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。