5月26日,Anthropic 工程师 Sholto Douglas 在 X 平台宣布,其最新模型 Claude Mythos 成功通过一个“巧妙而简洁的证明”解决了组合几何领域的百年历史难题——Erdős 单位距离猜想。这一突破紧随 OpenAI 日前利用 GPT-5.5攻克该里程碑式数学难题之后,标志着头部 AI 厂商在纯数学发现领域的竞争已进入白热化阶段。

QQ20260527-091235.jpg

这次技术突破,展示了一种与过去单个模型工作方式截然不同的智能体协作新范式。据了解,研究团队搭建了一套由多个独立 Claude Code 实例组成的自动化测试流程。在这个系统里,拥有 Mythos 访问权限的智能体实例专门接收问题,并探索出不同的解决路径;之后,这些路径会被汇集起来,交给另一个实例进行统一分发,再由其他独立运行的实例共同进行交叉验证。

尽管数学家 Daniel Litt 评价 Mythos 的初始结果在绝对表现上“略逊于” OpenAI 的解法,但该模型最终成功找到了与 OpenAI 相同的解题路径,并且独立推导出了更具独创性的精简证明。目前,Anthropic 已正式发布由 Opus4.7整理完成的证明版本。

这一新成果,再次点燃了业界关于‘纯大语言模型’和‘符号推理辅助系统’两条技术路线孰优孰劣的讨论。此前,谷歌 DeepMind 公布其 AlphaProof Nexus 系统成功破解了9个 Erdős 难题,但由于该系统深度依赖 Lean 这种形式化证明语言,在纯粹的生成式 AI 圈子内,关于其‘自主推理’到底含金量有多高,一直存在不同看法。

相比之下,Claude Code 作为一种智能体(Agent)框架,正通过多智能体协同攻克人类顶级科学难题。当前 AI 领域正经历剧烈的范式变革,菲尔兹奖得主近日亦证实 ChatGPT5.5Pro 已能在两小时内自主完成博士级数学研究。随着 Claude Mythos 与 GPT-5.5在算法发现和系统漏洞利用等前沿领域展现出自主演进能力,AI 正在从早期的“提示词工程”阶段全面迈向具备深度逻辑推理与科学探索能力的自主智能体时代。