AI攻克数学猜想:从乌龙到首个真正突破,普通人参与前沿研究的时代开启
2026年初,剑桥本科生Kevin Barreto与伙伴Liam Price借助AI首次独立解决有严肃学术背景的埃尔德什问题#728,陶哲轩称之为里程碑。随后更多AI辅助成果涌现,包括17岁高中生用GPT-5.5在80分钟内解答开放问题。尽管成功率有限,但AI大幅降低了数学前沿研究的门槛,普通人已可尝试探索。
背景:埃尔德什问题与OpenAI的乌龙
埃尔德什问题是20世纪传奇数学家保罗·埃尔德什生前提出的一大批数学猜想,涵盖数论、组合学等多个领域。2023年,数学家Thomas Bloom创建了网站 erdosproblems.com 收录这些未解问题,目前已有超过1200个条目,约44%被解决。
2025年10月,OpenAI研究员高调宣称借助GPT-5解决了10个埃尔德什问题,但实际只是找到了早已存在的论文。Google DeepMind CEO Demis Hassabis评论“太尴尬了”。这一乌龙事件暴露了文献检索的困难,也让该网站成为AI检验真实数学能力的试金石。
首个真正的突破:AI自主证明#728
2026年1月7日,剑桥大学21岁本科生Kevin Barreto与合作伙伴Liam Price,使用GPT-5.2 Pro和AI工具Aristotle,成功解决了埃尔德什问题#728。证明过程自动转为Lean语言并通过校验。菲尔兹奖得主陶哲轩称此为“里程碑式的成就”。这是第一个由AI独立完成的、具有严肃学术背景的埃尔德什问题证明。
此前,已有初创公司声称解决#124和#481,但被证实要么是简化版本,要么问题早已有解。
更多进展:高中生、新方法与Move 37时刻
此后,大量研究者涌入该网站。到2026年2月,又有近50个问题被标记为已解决,其中绝大多数来自AI或人机协作。
- 17岁高中生Enrique Barschkis 先正确解答了#347,后又用AI自主解决#1197。
- 17岁Sky Yang 未使用AI证明了#369。
- 研究员Przemek Chojecki 解决了#258和#1148,并公开了使用AI研究数学的方法论。
- Liam Price 随后用AI解决了#1196。证明过程中,AI出乎意料地使用了马尔可夫链和冯·曼戈尔特函数,这一创新思路被解析数论领域学者Jared Duker Lichtman称为AI在数学领域的“Move 37时刻”(类比AlphaGo的创造性一步)。
2026年5月,GPT-5.5发布不到48小时,就有20个埃尔德什问题的新答案提交。前述高中生将一个新的开放问题交给GPT-5.5,散步80分钟后,AI给出了完整证明,且可直接转为LaTeX并验证。
使用AI做数学的方法论(总结自实践者)
- 具备判断问题难易的直觉。
- 使用最前沿的AI模型(如GPT-5系列)。
- 禁止AI检索,强迫其进入“思考”模式。
- 明确要求严谨证明或反驳。
- 分配不同模型实例分别承担头脑风暴、撰写证明、交叉审查。
- 鼓励模型承认“未能证明”,避免编造。
- 分步验证逻辑,最终转为LaTeX并可用Lean等工具形式化。
- 保持人类监督,检查证明是否合理。
现状与展望
AI自主解决真正的数学开放问题已不再是科幻。虽然成功率仍只有1-2%,但面对600多个未解决问题,依然带来了可观的实际贡献。陶哲轩的评价依然适用:“现在的AI大体上相当于聪明的博士研究生”。
普通人——包括本科生、高中生——如今已能用AI探索前沿数学。正如Thomas Bloom所言:“AI新闻头条是次要的,它们背后蕴含的优美数学才是真正的主角。”
