菲尔兹奖得主实测ChatGPT 5.5 Pro：两小时内完成博士级数学研究

2026-05-10

菲尔兹奖得主Timothy Gowers在其博客上发表了一篇引发广泛讨论的文章，记录了他使用ChatGPT 5.5 Pro进行数学研究的经历。结果令人震撼：在近零数学输入的情况下，模型在一个多小时内生成了博士级别的原创数学成果。

实验细节

Gowers选择了Mel Nathanson论文中的一组加法数论开放问题作为测试集。这些问题的核心是：给定集合大小k，其h重和集可能有哪些大小？

ChatGPT 5.5 Pro在17分钟思考后，给出了一个将指数上界改进为二次上界的构造。Gowers随后让它将结果写成LaTeX预印本格式，又花了2分钟23秒。更令人印象深刻的是，当Gowers要求模型改进MIT本科生Isaac Rajagopal此前的工作时，ChatGPT提出了一种“原创而巧妙”的新思路——Rajagopal本人评价说，这是他需要花一到两周思考才能想出的点子。

这意味着什么

Gowers在文中提出了几个值得深思的问题：

博士训练的底线被重新划定。 如果LLM能解决“温和”的问题，那么初入研究领域的学生不再能通过解决简单开放问题来起步。新的最低标准是：做出LLM做不出的成果，或者与LLM协作做出成果。

数学成果的归属问题。 ChatGPT生成的证明如果由人类完成，完全够格发表。但谁应该得到“功劳”？Gowers本人数学输入为零，模型做了所有技术工作。他建议或许应该建立一个独立的AI生成成果仓库，但需要有验证机制。

AI能力正在加速。 Gowers强调，他描述的一切都是基于当前的模型能力，而发展速度如此之快，这些评论“几个月内就会过时”。

对AI行业的启示

这篇博客不仅是一个数学故事。它展示了前沿LLM正在跨越从“辅助工具”到“独立研究者”的边界。对于依赖AI进行知识工作的行业，这意味着工作流程、质量评估和信任机制都需要重新设计——当AI不仅能执行任务，还能发现新知识时，人类在知识产业链中的角色将发生根本性变化。

阅读原文