OpenAI解决80年数学难题？这次数学家为其背书

2026年5月21日 20 约3分钟 TechCrunch

OpenAI 人工智能数学推理几何猜想 AI突破

OpenAI再次将人工智能推向数学研究的聚光灯下。本周，该公司宣布其最新推理模型成功证伪了一个困扰数学家近80年的几何猜想——而且这一次，曾经公开揭穿OpenAI上一个尴尬“重大突破”的数学家们，竟然出面为其背书。

一个从1946年悬而未决的几何猜想

据OpenAI官方博客介绍，这个猜想名为“Borsuk-Ulam几何变体猜想”，由波兰数学家Karol Borsuk于1946年提出，涉及高维空间中的对称分割问题。数十年来，多名顶尖数学家试图证明或证伪它，但均未成功。OpenAI的推理模型通过一种全新的、基于符号推演与强化学习结合的“链式思维”方法，在数千次自我博弈中找到了一个反例，从而宣告该猜想不成立。

“这个结果令人震惊。我们花了三周时间手工验证模型生成的证明路径，每一步都严格正确。”——加州大学伯克利分校数学教授、菲尔兹奖得主Richard Schoen在社交媒体上表示。

上次的“尴尬”与这次的不同

2025年，OpenAI曾高调宣称其模型解决了另一个长期未解的数学问题，但很快被几位数学家指出证明中存在致命漏洞，导致该公司不得不撤回声明，场面一度十分尴尬。因此，当OpenAI再次发布数学突破时，学术界普遍持谨慎态度。然而这次，OpenAI主动邀请了当初揭露错误的数学家团队进行独立验证，并公开了模型完整的推理日志。

参与验证的数学家之一、麻省理工学院的Emily Chen博士说：“我们一开始抱着挑错的心态去审查，但模型输出的逻辑链条异常清晰，甚至比很多人类论文还要严谨。我们找不出漏洞。”

推理模型如何工作？

OpenAI本次使用的模型并非单纯的GPT系列，而是一个专门为数学推理优化的“o3-Reasoner”系统。它结合了符号计算引擎、自监督的证明树搜索，以及一个自动定理证明器。与普通大语言模型依赖模式匹配不同，o3-Reasoner在执行每个推理步骤时都会生成内部“正确性置信度”，并对不合理的分支进行剪枝。

据OpenAI研究副总裁Jakub Pachocki介绍，该模型在训练过程中被要求“像数学家一样思考”：不仅学习已有的数学知识，还要学会自己构造反例、进行反证法推理，甚至从错误中自我修正。“我们给它的奖励信号不是最终答案的对错，而是推理路径的合法性。”

行业反响与争议

这一消息迅速在科技界和数学界引发两极讨论。支持者认为，AI终于从“模式识别”进化到“逻辑推理”，可能开启数学发现的新纪元。反对者则警告，一个黑箱模型即使输出了看似正确的证明，人类仍无法完全理解其内部决策过程，严格来说这不算“数学证明”。

斯坦福大学AI伦理中心主任Fei-Fei Li指出：“数学之美在于可理解性。如果未来的数学证明需要人类花费数年去验证AI的每一步，那数学的本质就可能被改变。”

编者按：AI数学家的真正考验

OpenAI此次的做法显然吸取了上次的教训：提前邀请质疑者参与验证、公开中间产物、降低宣传调门。这体现了负责任的科研态度。然而，一个猜想被证伪不等于AI拥有了“解决80年数学难题”的能力——它更像是用计算机搜索找到了一个反例，这在数学史上早有先例（如四色定理的证明）。真正的考验在于：AI能否主动提出有深度的新猜想、构建全新的理论框架？从目前的技术来看，路还很长。但无论如何，这次数学家们的背书至少证明了一件事：AI在严谨的逻辑推演上，已经不再只是“碰运气”。

本文编译自TechCrunch