AI资讯 2天前 更新于 1天前 62

谷歌 DeepMind 的 AlphaProof Nexus 仅用几百美元就解决了困扰数学界数十年的难题

Google DeepMind 的 AlphaProof Nexus 已自主解决 9 个开放的 Erdős 问题,其中两题困扰数学界长达 56 年,单题推理成本仅数百美元。其关键特征是不依赖纯自然语言生成,而是借助 Lean 编译器对每一步证明进行自动验证。尽管成果惊人,系统整体成功率仍只有 2.5

91
热度
88
质量
85
影响力

深度分析

背景与问题

这条信息呈现出一个鲜明对比:一方面,AI 已能攻克长期未解的数学问题;另一方面,它的整体成功率依然很低。尤其“两道困扰 56 年”的表述,说明系统并非只是在边缘题目上取得进展,而是触及了真正具有历史难度的对象。

核心内容

最值得关注的不是“解出 9 题”本身,而是它采用的方法:

  • AlphaProof Nexus 使用 Lean 编译器
  • 每一步证明都能被自动验证
  • 这意味着结果不是模糊的语言性推断,而是更接近机器可检验的严格数学证明

这与文中提到的 OpenAI 的自然语言路径形成对照。区别在于:

  • 自然语言模型擅长提出思路、草拟证明
  • 形式化系统更强调可验证性与逻辑闭环
  • 在数学场景里,后者的价值尤其高,因为证明正确性比表达流畅更重要

同时,“每题仅数百美元推理成本”透露出另一个重要信号:这类高难度数学求解正在从纯实验能力走向可计算成本衡量的工程能力。这使其不只是学术展示,也具备未来规模化应用的想象空间。

意义与影响

这项进展的意义主要有三点:

  • 证明了形式化 AI 在高端数学探索中的潜力
    能解决开放 Erdős 问题,说明系统并非仅做训练集复现,而是在部分场景中具备真实发现能力。

  • 验证机制可能比语言能力更关键
    Lean 的自动验证强调,未来数学 AI 的竞争力,可能不只取决于“会不会说”,更取决于能不能被机器严格证明为真

  • 成功率暴露出现阶段局限
    2.5% 的成功率说明它仍远未达到稳定可靠。也就是说,当前更像是少数高光突破,而不是已经普遍可用的数学研究助手。

综合判断

这条信息真正传递的核心,不是 AI 已全面接管数学,而是形式化证明驱动的系统开始在极少数高难问题上展现出超预期突破。它的价值在于证明方向可行;它的局限则在于成功仍然稀缺。未来决定其影响力的,不只是再解出多少题,而是能否把 “惊艳的个案” 提升为 “稳定的方法”

免责声明:以上内容由 AI 生成,仅供参考。

Gemini 大模型 推理 科学研究 评测