Demis Hassabis:當(dāng) AI 開始解釋和操作世界,就不再是工具,而是真實(shí)世界參與者
在人工智能領(lǐng)域,DeepMind的聯(lián)合創(chuàng)始人兼CEO Demis Hassabis一直以其前瞻性的研究和創(chuàng)新成果引領(lǐng)著行業(yè)的發(fā)展。他不僅在游戲、神經(jīng)科學(xué)和AI研究之間架起了橋梁,還通過AlphaGo、AlphaFold等項(xiàng)目展示了AI在解決復(fù)雜問題上的巨大潛力。
作為一位跨越游戲、神經(jīng)科學(xué)與 AI 研究的科學(xué)家,Google DeepMind 聯(lián)合創(chuàng)始人&CEO、2024 年諾貝爾化學(xué)獎(jiǎng)得主 Demis Hassabis 在美國(guó)高級(jí)研究院(IAS)的分享中,多次強(qiáng)調(diào)他對(duì)“智能系統(tǒng)的建構(gòu)過程”本身的關(guān)注,以及他所提出的猜想:“自然界中一切可被發(fā)現(xiàn)的模式,理論上都應(yīng)能被經(jīng)典學(xué)習(xí)算法所建模?!?/p>
Hassabis 告訴 IAS 院長(zhǎng) David Nirenberg, 游戲、科學(xué)與數(shù)學(xué)并非應(yīng)用終點(diǎn),而是構(gòu)建世界模型能力的核心訓(xùn)練場(chǎng)。
無論是 AlphaGo、AlphaFold,還是最新的 Gemini 模型與 Project Astra,DeepMind 的路線始終圍繞“模型主導(dǎo)的決策與規(guī)劃能力”,而非僅止于語言生成;在 AGI 尚不成熟的當(dāng)下,他將 DeepMind 定位為“科學(xué)工具的開發(fā)者”,而非產(chǎn)品制造者。
AI 的最重要任務(wù),不是替代人類,而是作為“協(xié)作型智能系統(tǒng)”,幫助人類提出新問題、建立更復(fù)雜的世界模型、拓展認(rèn)知邊界。而研究院的角色,也許正如他所言,是構(gòu)建這一進(jìn)程所需的“制度新范式”的最早試驗(yàn)場(chǎng)。
I/O 到 iO,Jony Ive 將推動(dòng)一場(chǎng)新的設(shè)計(jì)運(yùn)動(dòng) —— AI 正在改寫計(jì)算范式與硬件定義,也是大模型后的新戰(zhàn)場(chǎng)
從游戲,到 AI 科學(xué)家
對(duì) Demis Hassabis 而言,游戲遠(yuǎn)不止是一種個(gè)人興趣,而是一扇通往智能本質(zhì)的窗口。他從象棋啟蒙,逐步深入圍棋、撲克等復(fù)雜博弈,并由此建立起一種長(zhǎng)期認(rèn)知直覺:游戲不僅是策略與技巧的集合體,更是現(xiàn)實(shí)世界結(jié)構(gòu)的壓縮映射。
在游戲中,決策路徑清晰、反饋回路緊密、變量可控,正是構(gòu)建與驗(yàn)證智能模型的理想場(chǎng)景。Hassabis 并非孤立地提出這一觀點(diǎn)。
圖靈、香農(nóng)、馮·諾伊曼等計(jì)算理論奠基者,早在 20 世紀(jì)中葉便開始以博弈為切入點(diǎn),嘗試?yán)斫馊祟惱硇耘c機(jī)器決策的邊界。
回顧《博弈論與經(jīng)濟(jì)行為》《游戲中的人》等經(jīng)典著作,他強(qiáng)調(diào)游戲在現(xiàn)代科學(xué)與社會(huì)科學(xué)建模中的基礎(chǔ)地位。游戲的價(jià)值不僅在于規(guī)則的清晰與目標(biāo)的可量化,更在于它們能生成大量結(jié)構(gòu)化數(shù)據(jù),為 AI 提供極具操作性的訓(xùn)練素材。
DeepMind 在開發(fā) AlphaGo、AlphaZero、MuZero 的過程中,始終沿用從規(guī)則設(shè)定、策略建模到反饋調(diào)優(yōu)的閉環(huán)流程。在他看來,這種建模方式就像語言或符號(hào)系統(tǒng),是 AI 理解世界的一種基礎(chǔ)能力。
亞洲文化中的圍棋,則是這種博弈思維的極致體現(xiàn)——它蘊(yùn)含極深的空間直覺、戰(zhàn)略規(guī)劃與哲學(xué)思辨,這些特性也逐漸轉(zhuǎn)化為 AI 理解復(fù)雜情境的基礎(chǔ)結(jié)構(gòu)。
完全信息博弈如象棋、圍棋,為模型提供了規(guī)則完整、觀測(cè)充分的訓(xùn)練基礎(chǔ),適合作為算法的起步階段。而像德州撲克這樣的不完全信息博弈,則引入了隱藏變量與博弈策略的多層次推演,使模型能更貼近現(xiàn)實(shí)中復(fù)雜、不確定的信息環(huán)境。
DeepMind 的研究從前者起步,逐漸向后者拓展,并延伸至更具開放性的任務(wù),如語言、多模態(tài)理解與現(xiàn)實(shí)場(chǎng)景推理。這一演進(jìn)軌跡在最新系統(tǒng) Gemini 與 Project Astra 中得到體現(xiàn),這些模型已具備多模態(tài)輸入處理能力,在圖像識(shí)別、語言理解與直覺物理之間建立跨域映射。
在某些看似輕松的游戲場(chǎng)景中,如“你比劃我猜”這類含有動(dòng)作、語言與語境推理的交互任務(wù)中,這些系統(tǒng)已經(jīng)表現(xiàn)出顯著的情境感知與響應(yīng)能力,顯示出模型內(nèi)部對(duì)規(guī)則、目標(biāo)與變化關(guān)系的綜合建模能力。
Hassabis 坦言,DeepMind 并不將博弈本身視為終點(diǎn)。AlphaGo 勝出后的一次重大轉(zhuǎn)向——那場(chǎng)比賽結(jié)束后,他幾乎立刻著手籌建一個(gè)跨學(xué)科團(tuán)隊(duì),轉(zhuǎn)向攻克蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)問題。
在他看來, AGI 的理想系統(tǒng),必須能夠在多個(gè)任務(wù)之間遷移、在不同領(lǐng)域表現(xiàn)穩(wěn)定,博弈只是這個(gè)過程中極好的訓(xùn)練平臺(tái),而不是目標(biāo)本身。真正值得投入的,是那些科學(xué)價(jià)值高、結(jié)構(gòu)復(fù)雜且擁有可驗(yàn)證反饋的問題。
他回憶,少年時(shí)期便熱衷于思考“意識(shí)從何而來”“宇宙為何存在”這類宏大命題。物理學(xué)大師如費(fèi)曼、Steven Weinberg 的著作曾一度吸引他走向理論物理,但物理理論在當(dāng)時(shí)陷入發(fā)展停滯的現(xiàn)狀,也令他意識(shí)到,僅靠個(gè)體智識(shí)已難以推動(dòng)終極問題的突破。
因此,他轉(zhuǎn)而追問:能否構(gòu)建一個(gè)人工系統(tǒng),使其幫助人類從另一個(gè)角度理解智能本身?如果構(gòu)建智能系統(tǒng)就是一項(xiàng)科學(xué)實(shí)驗(yàn),那么我們是否可以通過“造出智能”來反過來解釋人類的思維過程?
在與 Nirenberg 的對(duì)話中,一個(gè)關(guān)鍵問題被提出:AlphaFold 的突破,是建立在超過十萬條蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)的訓(xùn)練集之上,而這些數(shù)據(jù)正是數(shù)十年科研積累、成千上萬位生物學(xué)家逐步解析的結(jié)果。那么,當(dāng) AI 要處理更復(fù)雜、數(shù)據(jù)稀缺的問題時(shí),如何保證類似的訓(xùn)練基礎(chǔ)?
Hassabis 坦言,AlphaFold 確實(shí)站在結(jié)構(gòu)生物學(xué)半個(gè)世紀(jì)積累的肩膀之上。但他也補(bǔ)充,團(tuán)隊(duì)在開發(fā)早期版本時(shí),采用了“自舉訓(xùn)練”的策略:先利用一個(gè)不完善的模型預(yù)測(cè)出一百萬個(gè)新蛋白質(zhì)結(jié)構(gòu),再?gòu)闹刑暨x三十萬個(gè)最可信的結(jié)果加入訓(xùn)練集,從而用合成數(shù)據(jù)反向擴(kuò)展訓(xùn)練基礎(chǔ)。這種數(shù)據(jù)生成策略不僅提升了模型的泛化能力,也驗(yàn)證了模型本身的科學(xué)合理性。
他解釋,選擇蛋白質(zhì)結(jié)構(gòu)作為攻堅(jiān)對(duì)象,正是因?yàn)檫@個(gè)問題滿足了幾個(gè)關(guān)鍵條件:有明確的目標(biāo)函數(shù)、有結(jié)構(gòu)化數(shù)據(jù)支持、有科學(xué)界認(rèn)可的驗(yàn)證方法,而且其本質(zhì)為一個(gè)建模問題——這是 AI 表現(xiàn)出最大潛力的領(lǐng)域。
因此,DeepMind 在其他方向的項(xiàng)目選擇中,也始終遵循這一原則:尋找那些問題定義清晰、難度高、可驗(yàn)證的科學(xué)任務(wù)。而他本人也長(zhǎng)期關(guān)注各類跨學(xué)科環(huán)境中的潛在研究對(duì)象,尤其是在 IAS 等研究機(jī)構(gòu)駐留期間,習(xí)慣性地尋找“下一個(gè) AlphaFold”。
Alpha 系列系統(tǒng)的方法論本質(zhì)也承襲了這一思想:首先從真實(shí)世界中提取結(jié)構(gòu)化問題,在神經(jīng)網(wǎng)絡(luò)模型中構(gòu)建預(yù)測(cè)與表達(dá)框架;再通過大規(guī)模搜索與反饋機(jī)制優(yōu)化策略路徑;最后在精度反饋中不斷調(diào)整權(quán)重,實(shí)現(xiàn)建模、驗(yàn)證與遷移的完整閉環(huán)。
這一通用邏輯,不僅適用于游戲與生物學(xué),還正在拓展至數(shù)學(xué)、物理與經(jīng)濟(jì)等復(fù)雜系統(tǒng)中,顯示出 AI 不再是工具角色,而是成為“科學(xué)探索參與者”的可能路徑。
漸漸成為世界的參與者
在 DeepMind 的構(gòu)想中,一個(gè)理想的 Agent 應(yīng)該能夠感知環(huán)境、模擬未來、理解因果,并對(duì)新情境做出合理反應(yīng)。它不僅是對(duì) LLM 階段的延展,更是對(duì)“理解”能力本身的一次技術(shù)實(shí)現(xiàn)。
Project Astra 和 Gemini 的協(xié)同,正試圖在技術(shù)架構(gòu)層面實(shí)現(xiàn)這一智能藍(lán)圖。Astra 更強(qiáng)調(diào)持續(xù)感知與任務(wù)執(zhí)行,關(guān)注系統(tǒng)如何在現(xiàn)實(shí)世界中長(zhǎng)期運(yùn)作、獲取信息、調(diào)整策略;而 Gemini 則著力于構(gòu)建通用的多模態(tài)理解引擎,在語言、視覺、音頻、代碼等領(lǐng)域同時(shí)訓(xùn)練與融合,構(gòu)成 AI 的“認(rèn)知中樞”。
Demis Hassabis 特別強(qiáng)調(diào)了一點(diǎn):Astra 并非“升級(jí)版 ChatGPT”,而是一次認(rèn)知架構(gòu)的重構(gòu)嘗試。它不是從“語言出發(fā)”的生成系統(tǒng),而是從“世界建?!背霭l(fā),目標(biāo)是讓 AI 能夠解釋與推演現(xiàn)實(shí)中的復(fù)雜現(xiàn)象。
他希望未來的 AI 能像人類一樣,用一套穩(wěn)定但可擴(kuò)展的認(rèn)知框架,在不同情境中靈活應(yīng)對(duì)、多輪互動(dòng)并主動(dòng)發(fā)現(xiàn)問題。
為了測(cè)試這些能力的上限,DeepMind 正在設(shè)計(jì)一系列更具挑戰(zhàn)性的世界建模任務(wù)。這些任務(wù)既包括對(duì)自然語言和物理環(huán)境的組合理解,也涵蓋了復(fù)雜因果結(jié)構(gòu)、多步推理鏈路與跨模態(tài)行為規(guī)劃。
例如:生成一個(gè)“廚房日?!眻?chǎng)景,要求模型理解角色意圖、物體屬性、事件先后順序與多種突發(fā)狀況的應(yīng)對(duì)策略。只有在此類任務(wù)中取得突破,AI 才可能真正具備作為“世界代理人”的能力。
與此同時(shí),Hassabis 也強(qiáng)調(diào)技術(shù)之外的維度。一旦 AI 擁有解釋世界與操作世界的能力,它就不再只是工具,而是參與者。此時(shí)的問題將不再局限于“技術(shù)做得到什么”,而是“技術(shù)應(yīng)該做什么”,以及“由誰來決定它做什么”。
他反復(fù)提及制度建設(shè)的重要性。未來的 AI 需要被納入一個(gè)類似“科學(xué)共同體”的社會(huì)機(jī)制中,由不同學(xué)科背景的專家共同審議其發(fā)展方向與邊界。不能只由工程師來決定 AI 的能力上線,也不能讓單一公司掌控模型的價(jià)值排序機(jī)制。
對(duì)此,他建議設(shè)立一個(gè)全球性、去中心化的協(xié)調(diào)機(jī)制,覆蓋從模型訓(xùn)練到部署再到治理的全鏈條流程,并具備倫理判斷力與政策協(xié)調(diào)力。
這也引申出 DeepMind 多年來一貫的價(jià)值觀:技術(shù)突破不應(yīng)脫離社會(huì)語境,科學(xué)探索必須與制度倫理并行。在 Project Astra 的開發(fā)過程中,他們便引入了倫理顧問、語言學(xué)家與政策專家的參與,試圖在系統(tǒng)構(gòu)建初期就嵌入價(jià)值討論。這種做法并非為了規(guī)避風(fēng)險(xiǎn),而是出于深層理解:智能系統(tǒng)一旦真正具備自主性,后設(shè)規(guī)則的構(gòu)建本身就是一項(xiàng)前置工程。
Hassabis 將當(dāng)前的階段視為“智能系統(tǒng)的結(jié)構(gòu)重塑期”,而非應(yīng)用產(chǎn)品的爆發(fā)窗口。真正的飛躍,將來自我們是否能成功建立起能映射世界結(jié)構(gòu)、具備推理更新能力、能持續(xù)運(yùn)行于現(xiàn)實(shí)環(huán)境的系統(tǒng)。正如他所說:“我們所構(gòu)建的,不應(yīng)只是更快的語言模型,而是更強(qiáng)的思維引擎?!?/p>
或許未來十年,衡量一個(gè) AI 系統(tǒng)是否“先進(jìn)”的標(biāo)準(zhǔn),將不再是它生成了多長(zhǎng)的回答、多快的圖片、多準(zhǔn)的語義匹配,而是它能否理解一個(gè)看似簡(jiǎn)單卻富含結(jié)構(gòu)的場(chǎng)景:一個(gè)人站在廚房里,切下一片番茄,然后順手放進(jìn)鍋里。
這其中涉及的不只是動(dòng)作,更有時(shí)間的連續(xù)性、空間的協(xié)調(diào)性、工具與目標(biāo)的關(guān)聯(lián),以及背后的計(jì)劃邏輯與行為意圖。這一能力的實(shí)現(xiàn),標(biāo)志著 AI 從“表面智能”向“結(jié)構(gòu)智能”的躍遷,也標(biāo)志著 DeepMind 從算法優(yōu)越向認(rèn)知系統(tǒng)建構(gòu)的路徑切換。
這場(chǎng)轉(zhuǎn)變不會(huì)一蹴而就,也不會(huì)只有一家公司完成。Hassabis 認(rèn)為,重要的不是誰第一個(gè)做到,而是誰能在每一個(gè)關(guān)鍵節(jié)點(diǎn)上,保持對(duì)“什么是智能”的真實(shí)追問;在 AGI 真正落地前,必須先建立一個(gè)透明、負(fù)責(zé)任且能夠承載公共討論的平臺(tái)。否則,無論技術(shù)多先進(jìn),它也只是另一個(gè)無法理解自身的系統(tǒng)。
數(shù)學(xué),走向 AGI 核心
在 DeepMind 的最新研究中,一條看似冷門的路徑正逐步走向 AGI 的核心——數(shù)學(xué)。DeepMind 的數(shù)學(xué)團(tuán)隊(duì)近年來頻繁出現(xiàn)在各大研究機(jī)構(gòu),與數(shù)理邏輯、代數(shù)幾何等基礎(chǔ)學(xué)科的學(xué)者共同探討一些最抽象的問題。
其中最具代表性的成果之一,是一個(gè)名為 AlphaProof 的系統(tǒng),它嘗試把數(shù)學(xué)定理的證明過程轉(zhuǎn)化為一種類似棋局的策略搜索。團(tuán)隊(duì)的基本設(shè)想是,證明就像下棋,每一步都在向目標(biāo)命題靠近。系統(tǒng)基于 Lean 這樣的形式語言,在嚴(yán)格的邏輯規(guī)則中進(jìn)行推理,尋找可行的解題路徑。
與傳統(tǒng)符號(hào)邏輯不同,AlphaProof 展現(xiàn)出一定的生成能力——不僅能自己生成訓(xùn)練樣本,還能自主完成驗(yàn)證。這一過程擺脫了對(duì)人工標(biāo)注的依賴,顯示出更強(qiáng)的自適應(yīng)能力。
對(duì)于“如何選擇 AI 研究方向”,Hassabis 給出了自己的判斷標(biāo)準(zhǔn):這個(gè)問題是否有清晰的目標(biāo)函數(shù),是否能夠自動(dòng)或大規(guī)模生成高質(zhì)量數(shù)據(jù),是否足夠復(fù)雜到可以測(cè)試 AGI 的邊界。
他認(rèn)為,數(shù)學(xué)正好滿足所有這些條件。特別是驗(yàn)證環(huán)節(jié),數(shù)學(xué)問題具備天然的“自動(dòng)判定”屬性,是構(gòu)建高效閉環(huán)系統(tǒng)的理想場(chǎng)景。
在諸多數(shù)學(xué)議題中,Hassabis 尤其關(guān)注 P vs NP 問題。他稱這一千禧年難題為 AGI 時(shí)代的“靈魂追問”,它不僅關(guān)乎計(jì)算復(fù)雜性的邊界,也關(guān)系到推理系統(tǒng)能否在有效時(shí)間內(nèi)解決復(fù)雜問題。
他坦言,如果能在某個(gè)夏天專心鉆研,他會(huì)將全部精力投入這個(gè)問題。在他看來,從 AlphaGo 到 AlphaFold,每一次技術(shù)飛躍都是對(duì)“可計(jì)算性”邊界的挑戰(zhàn)。
從數(shù)學(xué)推理走向更廣義的世界建模,Hassabis 強(qiáng)調(diào) DeepMind 多年來始終堅(jiān)持的一條主線:構(gòu)建“世界模型”。無論是早期的 Atari 游戲、圍棋系統(tǒng),還是后來的分子結(jié)構(gòu)預(yù)測(cè),其核心目標(biāo)都不是單純給出答案,而是幫助 AI 理解世界的運(yùn)作方式。
所謂世界模型,指的是 AI 能夠模擬空間結(jié)構(gòu)、物理規(guī)律、因果關(guān)系與動(dòng)態(tài)場(chǎng)景變化的能力。這一概念與 Hassabis 早年的神經(jīng)科學(xué)研究密切相關(guān)。他在劍橋時(shí)期曾研究大腦中“記憶”與“想象”機(jī)制,并發(fā)現(xiàn)人類回憶過去和設(shè)想未來時(shí),腦區(qū)高度重疊。
這意味著,人類之所以能規(guī)劃未來,是因?yàn)榇竽X本質(zhì)上具備一種基于過往經(jīng)驗(yàn)的“內(nèi)部模擬器”。這也成為他構(gòu)想 AI 時(shí)的重要參考——讓系統(tǒng)擁有類似的模擬能力,而不僅僅是輸出語言。
這個(gè)理念正在 DeepMind 的兩個(gè)核心項(xiàng)目中逐步實(shí)現(xiàn)。Project Astra 是其中之一,它正在嘗試打造一種“持續(xù)感知+推理+行動(dòng)”的 agent 原型,而 Gemini 模型家族則承擔(dān)了多模態(tài)理解的基礎(chǔ)工作,支持文本、圖像、代碼、音頻乃至視頻的統(tǒng)一處理框架,并具備一定程度的因果建模與語義一致性能力。
Gemini 因此被設(shè)計(jì)為一種具備通用認(rèn)知能力的系統(tǒng),它融合了語言生成的靈活性、視覺識(shí)別的準(zhǔn)確性、物理推理的嚴(yán)密性和代碼邏輯的結(jié)構(gòu)性。而 Astra 則更貼近應(yīng)用場(chǎng)景,目標(biāo)是構(gòu)建一個(gè)能夠長(zhǎng)期交互、主動(dòng)理解環(huán)境、完成實(shí)際任務(wù)的“數(shù)字伙伴”。
在 Hassabis 的構(gòu)想中,AI 不應(yīng)僅僅是預(yù)測(cè)工具,而應(yīng)是具備內(nèi)在建模能力的系統(tǒng),能夠通過理解世界而不是僅僅復(fù)制語言,去完成復(fù)雜任務(wù)。
DeepMind 的技術(shù)演進(jìn)路線——從博弈、分子、數(shù)學(xué)再到多模態(tài)世界建?!獙?shí)際上一直在錨定同一個(gè)方向:通過建構(gòu)對(duì)世界因果結(jié)構(gòu)的抽象模型,建立具備推理能力的 agent。
當(dāng)一個(gè)模型可以以“切番茄”這種日常而復(fù)雜的任務(wù)為入口,展現(xiàn)出對(duì)空間、力學(xué)與行為邏輯的連貫理解時(shí),某種全新的智能形態(tài),已經(jīng)悄然浮現(xiàn)。這不只是模型能力的展示,更像是對(duì) AGI 可能形態(tài)的一次原型驗(yàn)證。
理解世界,具身是否必要?
在 DeepMind 最近的實(shí)驗(yàn)中,一個(gè) Demis Hassabis 長(zhǎng)期堅(jiān)持的假設(shè)正被挑戰(zhàn):要讓 AI 理解世界,是否真的必須賦予它“身體”?
過去,Hassabis 深信智能必須具身,認(rèn)為理解物理規(guī)律和發(fā)展直覺認(rèn)知需要通過身體與環(huán)境的交互。
但這次的實(shí)驗(yàn)結(jié)果顯示,僅通過圖像數(shù)據(jù),AI 就能在沒有傳感器或觸覺的情況下模擬出高度復(fù)雜的物理過程。它不僅能重現(xiàn)刀切番茄的過程、水珠飛濺的細(xì)節(jié),甚至連光線反射的變化都捕捉得真實(shí)而穩(wěn)定。這種能力展現(xiàn)了系統(tǒng)對(duì)時(shí)間因果結(jié)構(gòu)的理解,令人意外。
Hassabis 承認(rèn),這超出了他對(duì)“感知”邊界的原有理解,也表明 AGI 的發(fā)展可能不再依賴身體經(jīng)驗(yàn)。
當(dāng) Nirenberg 提問為何大學(xué)和基礎(chǔ)研究機(jī)構(gòu)在 AI 演化中正逐漸邊緣化?Hassabis 表示,DeepMind 之所以在企業(yè)內(nèi)部開展基礎(chǔ)研究,是出于現(xiàn)實(shí)考量。相比學(xué)術(shù)界,企業(yè)在算力、工程資源和資金效率上有著顯著優(yōu)勢(shì),而初創(chuàng)企業(yè)的快速節(jié)奏也推動(dòng)了技術(shù)的發(fā)展。
本文由人人都是產(chǎn)品經(jīng)理作者【江天 Tim】,微信公眾號(hào):【有新Newin】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評(píng)論,等你發(fā)揮!