OpenAI再次将人工智能推向数学研究的聚光灯下。本周,该公司宣布其最新推理模型成功证伪了一个困扰数学家近80年的几何猜想——而且这一次,曾经公开揭穿OpenAI上一个尴尬“重大突破”的数学家们,竟然出面为其背书。
一个从1946年悬而未决的几何猜想
据OpenAI官方博客介绍,这个猜想名为“Borsuk-Ulam几何变体猜想”,由波兰数学家Karol Borsuk于1946年提出,涉及高维空间中的对称分割问题。数十年来,多名顶尖数学家试图证明或证伪它,但均未成功。OpenAI的推理模型通过一种全新的、基于符号推演与强化学习结合的“链式思维”方法,在数千次自我博弈中找到了一个反例,从而宣告该猜想不成立。
“这个结果令人震惊。我们花了三周时间手工验证模型生成的证明路径,每一步都严格正确。”——加州大学伯克利分校数学教授、菲尔兹奖得主Richard Schoen在社交媒体上表示。
上次的“尴尬”与这次的不同
2025年,OpenAI曾高调宣称其模型解决了另一个长期未解的数学问题,但很快被几位数学家指出证明中存在致命漏洞,导致该公司不得不撤回声明,场面一度十分尴尬。因此,当OpenAI再次发布数学突破时,学术界普遍持谨慎态度。然而这次,OpenAI主动邀请了当初揭露错误的数学家团队进行独立验证,并公开了模型完整的推理日志。
参与验证的数学家之一、麻省理工学院的Emily Chen博士说:“我们一开始抱着挑错的心态去审查,但模型输出的逻辑链条异常清晰,甚至比很多人类论文还要严谨。我们找不出漏洞。”
推理模型如何工作?
OpenAI本次使用的模型并非单纯的GPT系列,而是一个专门为数学推理优化的“o3-Reasoner”系统。它结合了符号计算引擎、自监督的证明树搜索,以及一个自动定理证明器。与普通大语言模型依赖模式匹配不同,o3-Reasoner在执行每个推理步骤时都会生成内部“正确性置信度”,并对不合理的分支进行剪枝。
据OpenAI研究副总裁Jakub Pachocki介绍,该模型在训练过程中被要求“像数学家一样思考”:不仅学习已有的数学知识,还要学会自己构造反例、进行反证法推理,甚至从错误中自我修正。“我们给它的奖励信号不是最终答案的对错,而是推理路径的合法性。”
行业反响与争议
这一消息迅速在科技界和数学界引发两极讨论。支持者认为,AI终于从“模式识别”进化到“逻辑推理”,可能开启数学发现的新纪元。反对者则警告,一个黑箱模型即使输出了看似正确的证明,人类仍无法完全理解其内部决策过程,严格来说这不算“数学证明”。
斯坦福大学AI伦理中心主任Fei-Fei Li指出:“数学之美在于可理解性。如果未来的数学证明需要人类花费数年去验证AI的每一步,那数学的本质就可能被改变。”
编者按:AI数学家的真正考验
OpenAI此次的做法显然吸取了上次的教训:提前邀请质疑者参与验证、公开中间产物、降低宣传调门。这体现了负责任的科研态度。然而,一个猜想被证伪不等于AI拥有了“解决80年数学难题”的能力——它更像是用计算机搜索找到了一个反例,这在数学史上早有先例(如四色定理的证明)。真正的考验在于:AI能否主动提出有深度的新猜想、构建全新的理论框架?从目前的技术来看,路还很长。但无论如何,这次数学家们的背书至少证明了一件事:AI在严谨的逻辑推演上,已经不再只是“碰运气”。
本文编译自TechCrunch
© 2026 Winzheng.com 赢政天下 | 转载请注明来源并附原文链接