菲尔兹奖得主实测ChatGPT 5.5 Pro:两小时内完成博士级数学研究
菲尔兹奖得主Timothy Gowers在其博客上发表了一篇引发广泛讨论的文章,记录了他使用ChatGPT 5.5 Pro进行数学研究的经历。结果令人震撼:在近零数学输入的情况下,模型在一个多小时内生成了博士级别的原创数学成果。
实验细节
Gowers选择了Mel Nathanson论文中的一组加法数论开放问题作为测试集。这些问题的核心是:给定集合大小k,其h重和集可能有哪些大小?
ChatGPT 5.5 Pro在17分钟思考后,给出了一个将指数上界改进为二次上界的构造。Gowers随后让它将结果写成LaTeX预印本格式,又花了2分钟23秒。更令人印象深刻的是,当Gowers要求模型改进MIT本科生Isaac Rajagopal此前的工作时,ChatGPT提出了一种”原创而巧妙”的新思路——Rajagopal本人评价说,这是他需要花一到两周思考才能想出的点子。
这意味着什么
Gowers在文中提出了几个值得深思的问题:
博士训练的底线被重新划定。 如果LLM能解决”温和”的问题,那么初入研究领域的学生不再能通过解决简单开放问题来起步。新的最低标准是:做出LLM做不出的成果,或者与LLM协作做出成果。
数学成果的归属问题。 ChatGPT生成的证明如果由人类完成,完全够格发表。但谁应该得到”功劳”?Gowers本人数学输入为零,模型做了所有技术工作。他建议或许应该建立一个独立的AI生成成果仓库,但需要有验证机制。
AI能力正在加速。 Gowers强调,他描述的一切都是基于当前的模型能力,而发展速度如此之快,这些评论”几个月内就会过时”。
对AI行业的启示
这篇博客不仅是一个数学故事。它展示了前沿LLM正在跨越从”辅助工具”到”独立研究者”的边界。对于依赖AI进行知识工作的行业,这意味着工作流程、质量评估和信任机制都需要重新设计——当AI不仅能执行任务,还能发现新知识时,人类在知识产业链中的角色将发生根本性变化。