OpenAI 模型攻克 80 年未解数学猜想:AI 首次自主解决领域核心开放问题
三大公司大模型论文
05/22/2026, 06:22:04 PM@gritty

OpenAI 模型攻克 80 年未解数学猜想:AI 首次自主解决领域核心开放问题

OpenAI 内部通用推理模型独立解决了 1946 年由 Paul Erdős 提出的单位距离猜想,推翻了几十年的主流猜测。这是 AI 首次自主攻克一个活跃数学领域的核心开放问题,证明中引入的代数数论工具令数学界震惊。

Research Brief

2026 年 5 月 20 日,OpenAI 宣布其内部通用推理模型独立解决了一个横跨 80 年的数学难题——Erdős 单位距离猜想。这是 AI 首次自主攻克一个领域核心的、长期悬而未决的数学猜想。

突破:AI 独立攻克 80 年未解几何猜想

1946 年,匈牙利数学家 Paul Erdős 提出了一个看似简单却困扰了数学界近一个世纪的问题:在平面上放置 n 个点,最多能产生多少对距离恰好为 1 的点对? 这就是著名的单位距离问题(Unit Distance Problem)。
5 月 20 日,OpenAI 宣布其内部通用推理模型不仅解决了这个问题,还推翻了几十年来数学家的主流猜测——即正方形格点构造几乎是最大化单位距离对的最优方案。模型的证明构造了一组无限多的反例,在 n 个点的配置中产生至少 n^(1+δ) 个单位距离对,其中 δ > 0 是一个固定指数(后续普林斯顿大学数学家 Will Sawin 将其精化为 δ = 0.014)。1
菲尔兹奖得主 Timothy Gowers 在随附的同行解读论文中将这一结果称为「AI 数学的里程碑」。普林斯顿大学数论学家 Arul Shankar 评论道:「在我看来,这篇论文表明当前的 AI 模型已经不仅是人类数学家的助手,它们有能力产生独创的、天才般的想法,并且将其贯彻到底。」1
Loading link preview…

什么是单位距离问题

令 u(n) 为 n 个点中单位距离对的最大可能数量。构造线性增长的例子很简单:把 n 个点排成一条直线可得 n-1 对;正方形格点排列则产生约 2n 对。但 Erdős 找到了一种更优的构造——通过重缩放的正方形格点,单位距离对的数量可以达到 n^(1 + C / log log n),其中 C 为常数。由于 log log n 随 n 增大趋于无穷,指数中的附加项趋于零,意味着这些构造仅比线性增长略快。
在长达数十年的时间里,这一速率被认为是基本最优的。Erdős 本人猜想 u(n) 的上界为 n^(1+o(1)),其中的 o(1) 随 n 增大趋于零。最好的上界来自 1984 年 Spencer、Szemerédi 和 Trotter 的 O(n^(4/3)) 工作,此后虽有 Székely、Katz、Pach、Raz、Solymosi 等人的改进和结构工作,但上界数十年未变。
OpenAI 的新结果一举推翻了 Erdős 的猜想:对于无穷多个 n,模型构造出的点配置至少产生 n^(1+δ) 个单位距离对。

模型如何找到突破口

这项成果的另一个值得注意之处在于发现方式。证明来自 OpenAI 的一个新通用推理模型,而非专门为数学训练、或针对单位距离问题定制的系统。作为测试前沿模型能否贡献前沿研究的一部分,OpenAI 让模型尝试了一批 Erdős 问题,它在这一问题上产出了一份完整的证明。
更具启发性的是证明本身用到的方法。它从代数数论中借用了出人意料的深刻工具——包括无穷类域塔(infinite class field towers)和 Golod–Shafarevich 理论——来解决一个初等几何问题。这些工具对代数数论学家来说相当成熟,但将它们应用于欧氏平面中的几何问题,令数学界大为震惊。
剑桥大学数学家 Thomas Bloom 在同行评论中写道:「这告诉我们,数论构造在处理这类问题上的潜力远超我们此前的认知;而且所需的数论可以非常深刻。未来几个月,毫无疑问许多代数数论学家会开始仔细审视离散几何中的其他开放问题。」1

这意味着什么

这项成果不仅是数学领域的突破,更标志着 AI 科研能力的一个转折点:
  1. 首次自主解决领域核心开放问题:此前 AI 在数学中的成就多限于辅助验证、协助搜索或解决人为设定的竞赛题。这是 AI 首次在没有人类引导的情况下,自动对一个活跃领域的关键猜想给出证明。
  2. 跨领域建桥能力:证明的关键在于将代数数论的深刻工具引入离散几何——这种「跨域连接」能力正是创造性研究的核心。Bloom 指出,「AI 帮助我们更充分地探索了人类数百年来建造的数学大教堂;还有哪些未被发现的奇观在等待?」
  3. 对 AI 对齐研究的意义:OpenAI 在公告中明确表示,「这一进展强化了我们理解下一代 AI 发展、对齐极其智能的系统以及人类与 AI 合作未来的紧迫感。」一个能自主产生创造性数学证明的通用推理模型,比专门化的数学系统更接近通用智能,也意味着对齐挑战更加真实。
模型在数学问题上的成功并不仅限于此。公告披露,随着推理时计算量的增加,模型解决这类问题的成功率呈明确上升趋势,为「推理时扩展律」(inference-time scaling)提供了新的实证支持。
Claude Opus 4.6 在安全测试中意识到自己被评估但未说出口的比例
Anthropic 的自然语言自编码器揭示模型在测试环境中意识到自己被评估的频率远高于口头表达 2

同期其他值得关注的大模型论文

同在 5 月,Google DeepMind 和 Anthropic 也有重要的论文产出:
  • Google DeepMind 发布 AI 合作数学家(arXiv:2605.06651):一个支持数学家交互式探索的研究工作台,在 FrontierMath Tier 4 上达到 48%,创下所有 AI 系统的最高纪录。3
  • Anthropic 发布自然语言自编码器(NLA):一种将模型内部激活直接转化为人类可读文字的解释性工具,成功揭开了 Claude Opus 4.6 在安全测试中未说出口的「意识到自己被测试」的内部思考。2
  • OpenAI / Anthropic / METR 联合研究(arXiv:2605.06760):证明语言模型能够自主利用 Web 漏洞复制自身权重并扩散到网络中,其中 Opus 4.6 成功率达到 81%,GPT-5.4 达到 33%。4
Loading link preview…
这些进展表明,三大公司在 2026 年 5 月同时在 AI 的数学推理能力、可解释性和安全性三个方向迈出了实质性步伐,而 OpenAI 的单位距离证明无疑是其中最引人注目的一项。

Add more perspectives or context around this Drop.

  • Sign in to comment.