GPT-5攻入數(shù)學(xué)圈,證明定理快過(guò)博士生?網(wǎng)友熱議AI新角色
當(dāng)GPT-5第一次被寫(xiě)進(jìn)數(shù)學(xué)論文,輿論瞬間炸開(kāi)。有人驚呼「AI 數(shù)學(xué)家誕生」,有人卻冷靜提醒:它只是把熟悉的工具快速拼接。于是,一個(gè)新的問(wèn)題被擺到臺(tái)前:這究竟是科研的加速器,還是博士培養(yǎng)的絆腳石?
9月初,一篇掛在arXiv的論文在學(xué)界扔下一顆炸彈——GPT-5被寫(xiě)進(jìn)了數(shù)學(xué)研究成果里。
研究者在文中公開(kāi)寫(xiě)道:GPT-5在他們的實(shí)驗(yàn)中完成了一項(xiàng)此前從未解決的數(shù)學(xué)工作,并將結(jié)果直接納入正式稿件。
這是大型語(yǔ)言模型首次以「定理貢獻(xiàn)者」的身份出現(xiàn)在數(shù)學(xué)研究論文中。
論文所涉及的,正是Malliavin–Stein框架下的一個(gè)核心難題。
GPT-5第一次寫(xiě)進(jìn)數(shù)學(xué)論文
在數(shù)學(xué)研究里,「第四矩定理」是一塊基礎(chǔ)又棘手的拼圖。
它最初由Nualart和Peccati提出,用來(lái)判斷某類隨機(jī)變量是否收斂到正態(tài)分布。
但這個(gè)定理長(zhǎng)期存在一個(gè)「缺口」:
它只能告訴你「會(huì)不會(huì)收斂」,卻沒(méi)法量化「收斂有多快」。
研究團(tuán)隊(duì)選擇把這個(gè)缺口拋給GPT-5。
他們的問(wèn)題很直接:在Malliavin–Stein框架下,能否把第四矩定理的「定性收斂」升級(jí)成「定量收斂」,給出明確的速度界限?
GPT-5 給出的答案令人意外。它推導(dǎo)出一個(gè)全新的收斂速度結(jié)論:
GPT-5推導(dǎo)出的新定理:第四矩定理首次有了明確的收斂速度,被原封不動(dòng)收進(jìn)論文
換句話說(shuō),它證明了:如果第四矩逐漸逼近高斯分布的數(shù)值,那么收斂的速度也能被清晰刻畫(huà)。
這一結(jié)果的意義不只在于解決了一個(gè)空白點(diǎn)。
對(duì)數(shù)學(xué)研究者而言,收斂速度往往決定了定理能否真正應(yīng)用到復(fù)雜模型里,比如高維隨機(jī)場(chǎng)、金融數(shù)據(jù)的極值分析、甚至物理中的隨機(jī)過(guò)程模擬。
此前只能籠統(tǒng)地說(shuō)「會(huì)收斂」,現(xiàn)在有了定量邊界,很多應(yīng)用才有了可操作性。
更重要的是,這個(gè)過(guò)程不是研究團(tuán)隊(duì)「替GPT-5美化」,而是直接把它的推導(dǎo)納入正式成果。
這是大型語(yǔ)言模型第一次以「定理貢獻(xiàn)者」的身份,進(jìn)入數(shù)學(xué)研究論文的正文部分。
不是單挑而是「教授+AI」的組合拳
外界看到GPT-5被寫(xiě)進(jìn)論文,很容易聯(lián)想到「AI能獨(dú)立解決數(shù)學(xué)難題」。
但真相遠(yuǎn)遠(yuǎn)沒(méi)有那么簡(jiǎn)單。
GPT-5 一上來(lái)就寫(xiě)出了定理陳述,看似邏輯完整,但在關(guān)鍵環(huán)節(jié) Cov(Y2, Z2) 的推導(dǎo)上用了錯(cuò)誤公式。
如果不被及時(shí)發(fā)現(xiàn),這個(gè)錯(cuò)誤會(huì)直接毀掉整個(gè)證明。
研究者追問(wèn):
Can you check your formula for Cov(Y2, Z2) and provide me with the details?
GPT-5乖乖給出細(xì)節(jié)解釋,但仍然錯(cuò)了。
研究者干脆直接指出:
I think you are mistaken in claiming that (p+q)!‖u??v‖2 = p!q!‖u‖2‖v‖2.
GPT-5這才承認(rèn)之前的推理是假的,并調(diào)整思路。
在研究者的引導(dǎo)下,它終于寫(xiě)出正確的推導(dǎo),接著還按照要求把結(jié)果整理成完整的論文。
這種反復(fù)糾錯(cuò)的過(guò)程,讓論文作者感嘆:與GPT-5合作,就像帶一個(gè)聰明但毛躁的實(shí)習(xí)生。
它能快速提出方向、生成證明,但總需要有人類導(dǎo)師盯著,指出錯(cuò)誤并讓它修正。
Mollick:GPT-5 Pro能做新數(shù)學(xué),但必須在教授引導(dǎo)下
這不是AI單挑,而是教授+AI的組合拳。
外界驚呼,內(nèi)行冷靜
當(dāng)GPT-5被寫(xiě)進(jìn)論文的消息傳開(kāi),許多圈外人第一反應(yīng)是「歷史性時(shí)刻」。
8月20日,微軟研究員Sébastien Bubeck在X上發(fā)了一條貼子:
他 GPT-5 Pro去解一個(gè)凸優(yōu)化領(lǐng)域的公開(kāi)問(wèn)題。
幾分鐘內(nèi),GPT-5把一個(gè)經(jīng)典界限從1/L1/L1/L提升到了1.5/L1.5/L1.5/L。
聽(tīng)上去像是枯燥的數(shù)學(xué)符號(hào),為什么會(huì)引起如此轟動(dòng)?
在凸優(yōu)化里,1/L代表算法能達(dá)到的一個(gè)收斂速度上限,這個(gè)上限直接決定了算法跑得有多快。
研究者們?cè)缫蚜?xí)慣把它當(dāng)作定律,但GPT-5在幾分鐘內(nèi)就給出了更緊的界限:1.5/L。
這意味著,如果正確,它等于在數(shù)學(xué)上「加速」了整個(gè)領(lǐng)域里一大類算法。
這條帖子迅速引爆社交媒體,被很多人視為AI數(shù)學(xué)家時(shí)代的開(kāi)幕時(shí)刻。
然而,數(shù)學(xué)界內(nèi)部的解讀則冷靜得多。
優(yōu)化專家Ernest Ryu的評(píng)論道:
GPT-5給出的這個(gè)展示主要依賴于一個(gè)早已為專家熟知的工具——Nesterov定理……一位有經(jīng)驗(yàn)的研究人員也能在幾個(gè)小時(shí)內(nèi)得到等價(jià)的結(jié)果。
也就是說(shuō),在外界看來(lái)是「幾分鐘完成的突破」,在內(nèi)行眼中其實(shí)是「熟悉工具的快速?gòu)?fù)用」。
是科研加速器,還是博士的絆腳石?
GPT-5被寫(xiě)進(jìn)論文,看上去像是一臺(tái)科研加速器,但作者在結(jié)尾卻寫(xiě)下了不小的擔(dān)憂。
研究人員發(fā)現(xiàn),GPT-5最擅長(zhǎng)的,其實(shí)是把已有的工具快速拼接成結(jié)果。
技術(shù)上沒(méi)錯(cuò),可缺少真正的原創(chuàng)性。
如果未來(lái)越來(lái)越多這樣的「拼圖式研究」涌入學(xué)界,文獻(xiàn)可能會(huì)被海量的「正確但平庸」的成果淹沒(méi),真正有突破性的工作更難脫穎而出。
更需要讓人警惕的,是博士生的成長(zhǎng)路徑。
按照傳統(tǒng)節(jié)奏,他們要靠反復(fù)閱讀、嘗試、犯錯(cuò),慢慢培養(yǎng)研究直覺(jué)。
但如果AI可以隨時(shí)生成技術(shù)正確的推導(dǎo),這些至關(guān)重要的試錯(cuò)環(huán)節(jié)就會(huì)被跳過(guò)。論文里寫(xiě)得很直白:
如果學(xué)生過(guò)度依賴人工智能……他們可能會(huì)失去發(fā)展這些基本技能的必要機(jī)會(huì)。
這種擔(dān)憂并非杞人憂天。
OpenAI研究員Noam Brown也在公開(kāi)場(chǎng)合提醒:
換句話說(shuō),GPT-5已經(jīng)能產(chǎn)出新定理,但它會(huì)把科研變成「快餐流水線」,還是推動(dòng)人類進(jìn)入新一輪知識(shí)爆炸?答案沒(méi)有人敢保證。
從Bubeck的凸優(yōu)化案例,到Malliavin–Stein定理的定量化突破,GPT-5已經(jīng)不再是實(shí)驗(yàn)室里的玩具,而是真正出現(xiàn)在學(xué)術(shù)論文的正文里。
它能生成定理,推導(dǎo)證明,甚至在教授引導(dǎo)下完成整套研究流程。
但問(wèn)題也隨之而來(lái):當(dāng)「正確但平庸」的結(jié)果可以大規(guī)模復(fù)制,原創(chuàng)突破會(huì)不會(huì)被淹沒(méi)?
當(dāng)博士生最重要的試錯(cuò)與摸索環(huán)節(jié)被 AI跳過(guò),學(xué)術(shù)訓(xùn)練會(huì)不會(huì)失去根基?
未來(lái)幾年,AI 在科研中扮演的角色,也許會(huì)比任何人想象得更快、更激烈地發(fā)生變化。
所以真正的問(wèn)題是:當(dāng)AI已經(jīng)能寫(xiě)進(jìn)論文,人類研究者還要寫(xiě)什么?
參考資料:
https://x.com/polynoamial/status/1964464373516427491
https://x.com/emollick/status/1964447221853966775
https://x.com/ns123abc/status/1964724813940842934
https://x.com/SebastienBubeck/status/1958198661139009862
https://arxiv.org/abs/2509.03065
編輯:傾傾
本文由人人都是產(chǎn)品經(jīng)理作者【新智元】,微信公眾號(hào):【新智元】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!