AI攻克数学猜想：从乌龙到首个真正突破，普通人参与前沿研究的时代开启

2026/05/06 08:31阅读量 2

2026年初，剑桥本科生Kevin Barreto与伙伴Liam Price借助AI首次独立解决有严肃学术背景的埃尔德什问题#728，陶哲轩称之为里程碑。随后更多AI辅助成果涌现，包括17岁高中生用GPT-5.5在80分钟内解答开放问题。尽管成功率有限，但AI大幅降低了数学前沿研究的门槛，普通人已可尝试探索。

背景：埃尔德什问题与OpenAI的乌龙

埃尔德什问题是20世纪传奇数学家保罗·埃尔德什生前提出的一大批数学猜想，涵盖数论、组合学等多个领域。2023年，数学家Thomas Bloom创建了网站 erdosproblems.com 收录这些未解问题，目前已有超过1200个条目，约44%被解决。

2025年10月，OpenAI研究员高调宣称借助GPT-5解决了10个埃尔德什问题，但实际只是找到了早已存在的论文。Google DeepMind CEO Demis Hassabis评论“太尴尬了”。这一乌龙事件暴露了文献检索的困难，也让该网站成为AI检验真实数学能力的试金石。

首个真正的突破：AI自主证明#728

2026年1月7日，剑桥大学21岁本科生Kevin Barreto与合作伙伴Liam Price，使用GPT-5.2 Pro和AI工具Aristotle，成功解决了埃尔德什问题#728。证明过程自动转为Lean语言并通过校验。菲尔兹奖得主陶哲轩称此为“里程碑式的成就”。这是第一个由AI独立完成的、具有严肃学术背景的埃尔德什问题证明。

此前，已有初创公司声称解决#124和#481，但被证实要么是简化版本，要么问题早已有解。

更多进展：高中生、新方法与Move 37时刻

此后，大量研究者涌入该网站。到2026年2月，又有近50个问题被标记为已解决，其中绝大多数来自AI或人机协作。

17岁高中生Enrique Barschkis 先正确解答了#347，后又用AI自主解决#1197。
17岁Sky Yang 未使用AI证明了#369。
研究员Przemek Chojecki 解决了#258和#1148，并公开了使用AI研究数学的方法论。
Liam Price 随后用AI解决了#1196。证明过程中，AI出乎意料地使用了马尔可夫链和冯·曼戈尔特函数，这一创新思路被解析数论领域学者Jared Duker Lichtman称为AI在数学领域的“Move 37时刻”（类比AlphaGo的创造性一步）。

2026年5月，GPT-5.5发布不到48小时，就有20个埃尔德什问题的新答案提交。前述高中生将一个新的开放问题交给GPT-5.5，散步80分钟后，AI给出了完整证明，且可直接转为LaTeX并验证。

使用AI做数学的方法论（总结自实践者）

具备判断问题难易的直觉。
使用最前沿的AI模型（如GPT-5系列）。
禁止AI检索，强迫其进入“思考”模式。
明确要求严谨证明或反驳。
分配不同模型实例分别承担头脑风暴、撰写证明、交叉审查。
鼓励模型承认“未能证明”，避免编造。
分步验证逻辑，最终转为LaTeX并可用Lean等工具形式化。
保持人类监督，检查证明是否合理。

现状与展望

AI自主解决真正的数学开放问题已不再是科幻。虽然成功率仍只有1-2%，但面对600多个未解决问题，依然带来了可观的实际贡献。陶哲轩的评价依然适用：“现在的AI大体上相当于聪明的博士研究生”。

普通人——包括本科生、高中生——如今已能用AI探索前沿数学。正如Thomas Bloom所言：“AI新闻头条是次要的，它们背后蕴含的优美数学才是真正的主角。”

阅读原文详情

背景：埃尔德什问题与OpenAI的乌龙

首个真正的突破：AI自主证明#728

更多进展：高中生、新方法与Move 37时刻

使用AI做数学的方法论（总结自实践者）

现状与展望

准备好启动您的定制项目了吗？