数码之家

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

搜索
查看: 58|回复: 1

[科技] AI解题王炸!GPT5.2两周啃下11道数学世纪难题,数学家都坐不住了

[复制链接]
发表于 4 天前 | 显示全部楼层 |阅读模式
本帖最后由 麻薯滑芝士 于 2026-1-15 20:09 编辑

各位数学爱好者、科技吃瓜群众,注意了!最近数学圈和AI圈可是炸了锅,不是小打小闹,是真有大事发生!咱们天天聊的大模型,这回真支棱起来了,开始往人类知识的硬骨头上啃了——它们正儿八经地开始解那些顶尖数学家都挠头的高难度数学题了!

这事儿咋发现的?得从上周末说起。一位叫尼尔·索马尼(Neel Somani)的老兄,这人可不简单,软件工程师、搞过量化研究、还创过业,妥妥的跨界高手。他当时正闲着没事(也可能是职业病犯了),想测测OpenAI家刚出炉的新模型GPT 5.2,看它在数学上到底有几斤几两。他就随手丢了个数学难题进去,让模型自个儿琢磨去。

您猜怎么着?过了大概一刻钟,他回来一瞧——嚯!好家伙!模型不光给出了答案,还附带了一份完整的解题过程!索马尼自己也是个懂行的,他仔仔细细检查了一遍,还用了个叫Harmonic(和声)的专业工具来验证这道证明题。结果呢?严丝合缝,完全正确!

“我当时就想摸摸底,看看大模型到底在啥水平上能真正搞定那些开放的数学难题,而不是在简单问题上扑腾。”索马尼事后说。让他没想到的是,用了这最新的GPT 5.2,这条能力边界线“唰”地一下往前挪了一大截!

更让人拍案叫绝的是,GPT 5.2解题那思路,清晰得跟剥洋葱似的。它噼里啪啦地甩出一堆数学界响当当的名词定理,什么勒让德公式(Legendre’s formula)、伯特兰假设(Bertrand’s postulate)、大卫之星定理(Star of David theorem),用得那叫一个溜。最后,它甚至翻出了一个2013年挂在Math Overflow(一个知名数学问答网站)上的老帖子。那帖子里,哈佛的数学大牛诺姆·埃尔基斯(Noam Elkies)曾经给一个类似的问题提供过一个非常漂亮的解法。

但是!​ GPT 5.2给出的最终证明,跟埃尔基斯当年的解法可不一样,有它自己独到的地方。而且,它解决的还是数学界传奇人物保罗·埃尔德什(Paul Erdős)提出的一个难题的变种版本!这位埃大爷,一辈子攒下了上千个悬而未决的数学猜想,这些难题现在都挂在网上,成了检验数学新方法(包括AI)的“试金石”。

对于那些一直怀疑机器智能水平的人来说,这结果够震撼吧?而且,这还不是孤例!AI工具在数学圈里早就不是新鲜东西儿了,从专门搞数学形式化证明的大模型(比如Harmonic家的Aristotle),到OpenAI自家搞文献综述的“深度研究”工具,都用得飞起。但自从GPT 5.2出来以后——索马尼形容它“在数学推理上明显比前几代强了一大截”——AI真正解决的难题数量像坐火箭一样往上蹿,多到让人没法忽视。这不禁让人琢磨:这些大语言模型,是不是真能帮人类把知识边界再往外推一推?

索马尼当时盯上的,正是埃尔德什留下的那批难题(统称Erdős problems)。这批难题有上千个,由匈牙利数学家埃尔德什提出,现在由后人维护着放在网上。这些题目五花八门,难度也天差地别,自然就成了AI搞数学研究的“香饽饽”。头一拨由AI自主解决的难题,是去年11月由一个叫AlphaEvolve的模型(背后是谷歌的Gemini技术)搞定的。但最近,索马尼和其他研究者发现,GPT 5.2在处理高等数学问题上,那叫一个得心应手!

重点来了:​ 从去年圣诞节(2025年12月25日)到现在(2026年1月15日),短短三周左右,埃尔德什难题网站上,已经有15个问题的状态从“未解”改成了“已解”!更关键的是,这15个解法里,有11个明确标注了AI模型参与了解决过程!

数学界泰斗级人物陶哲轩(Terence Tao)在他的GitHub页面上,对这事儿有个更细致的分析。他数了数,目前至少有8个不同的埃尔德什难题,AI模型在其中做出了实质性的、自主性的突破进展。另外还有6个案例,AI的贡献在于找到了前人已有的研究并在此基础上进行了拓展。

补充说明:​ 陶哲轩提到的这个GitHub页面,是他个人维护的一个项目,专门追踪和记录AI在数学研究,特别是解决埃尔德什难题方面的进展,信息非常权威和及时。

当然,要说AI现在就能完全甩开人类自己搞数学,那还早得很。但大模型在数学研究里扮演一个重要角色,这已经是板上钉钉的事了。陶哲轩本人在社交平台Mastodon上就推测过:AI系统那种可大规模复制的特性,让它们特别适合被“系统地”应用到埃尔德什难题里那堆“长尾”问题上——也就是那些比较冷门、关注度低的难题。他点出关键:“实际上,这些相对容易的埃尔德什难题,很多解法本身并不复杂。”

陶哲轩接着分析:“正因如此,现在这些相对容易的埃尔德什难题,更有可能被纯AI的方法解决掉,而不是靠人类或者人机合作的方式。” 这话分量可不轻!

推动这股AI数学热的另一个力量,是数学界最近刮起的一股“形式化”(Formalization)风潮。简单说,就是把数学证明过程,用一套极其严格、计算机也能理解的逻辑语言重新写一遍。这活儿巨费劲,但好处大大的:证明更容易被验证,也更容易被后续研究扩展。

补充说明:​ 形式化证明有点像给数学证明做“编程”,确保每一步都逻辑严密,没有跳步或模糊地带。虽然形式化本身不一定非得用电脑或AI,但新冒出来的一批自动化工具,让这苦差事轻松了不少。

比如那个开源的“证明助手”叫Lean(2013年由微软研究院开发),现在在数学圈里用得可广了,专门干形式化证明的活儿。而像Harmonic家的Aristotle这类AI工具,更是放话要自动化搞定形式化工作中大部分繁琐的步骤。

对于Harmonic的创始人图多尔·阿希姆(Tudor Achim)来说,埃尔德什难题被AI接二连三地解决,这事儿本身挺震撼,但更让他看重的是另一个变化:“我更在意的是,世界上最顶尖的那些数学家们,开始认真对待这些工具了。” 阿希姆点出了关键,“这些人都有金字招牌要维护,所以当他们公开说自己在用Aristotle或者ChatGPT时,这就是实打实的证据,证明这些工具真有用!”

唠到这儿,咱得掰扯清楚几点:

AI不是要取代数学家:​ 现在AI干的,更多是帮数学家处理那些繁琐的、需要大量计算的、或者相对模式化的工作(比如翻文献、验证证明、处理形式化),把数学家宝贵的脑力解放出来,去攻克真正需要创造力和深刻洞察的核心难题。陶哲轩说的“长尾问题”,就是典型例子。

工具进化太快:​ GPT 5.2在数学推理上的显著提升,加上专门为数学研发的AI工具(如Aristotle)和形式化平台(如Lean)的成熟,三者结合产生了“化学反应”,才催生了这波解题小高潮。

大佬背书是关键:​ 像陶哲轩这样的顶级数学家公开使用并讨论AI工具,对推动整个领域接受AI至关重要。大佬们的信誉就是最好的广告。

未来可期:​ 虽然现在还是“辅助为主”,但AI在数学研究上的潜力已经显露无疑。它处理海量信息和模式的能力,是人类大脑难以比拟的。未来人机协作,很可能成为数学突破的新常态。

所以啊,各位看官,别再把AI当个只会写情诗、画美女的玩具了。它现在可是正儿八经地搬着小板凳,坐到了人类知识殿堂的最前排,开始跟着最聪明的大脑一起,啃那些最硬的骨头了!数学这片江湖,以后怕是要越来越热闹了!


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录

x
发表于 4 天前 | 显示全部楼层
游客请登录后查看回复内容
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 微信登录

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2026-1-19 16:18 , Processed in 0.124800 second(s), 11 queries , Gzip On, Redis On.

Powered by Discuz!

© 2006-2026 MyDigit.Net

快速回复 返回顶部 返回列表