黃仁勛最新演講:人形機(jī)器人,將成為最大的產(chǎn)業(yè)之一
在人工智能飛速發(fā)展的今天,英偉達(dá)創(chuàng)始人兼CEO黃仁勛在法國(guó)巴黎VivaTech大會(huì)上發(fā)表了一場(chǎng)具有里程碑意義的演講。他不僅闡述了AI技術(shù)的最新進(jìn)展,還提出了人形機(jī)器人將成為未來(lái)最大產(chǎn)業(yè)之一的前瞻性觀點(diǎn)。
內(nèi)容來(lái)源:6?月?11 日,英偉達(dá)創(chuàng)始人兼 CEO 黃仁勛法國(guó)巴黎 VivaTech 大會(huì),「GTC」?的主題演講。
6月11日,英偉達(dá)創(chuàng)始人兼 CEO 黃仁勛出現(xiàn)在法國(guó)巴黎的 VivaTech 大會(huì),帶來(lái)他標(biāo)志性的 GTC 主題演講。
黃仁勛再次以一場(chǎng)橫跨AI、計(jì)算架構(gòu)、人形機(jī)器人與工業(yè)未來(lái)的長(zhǎng)篇演講,宣告“AI驅(qū)動(dòng)的新工業(yè)革命已經(jīng)到來(lái)”。
演講中,黃仁勛用一臺(tái)價(jià)值300萬(wàn)美元、重達(dá)兩噸的GB200串聯(lián)起AI工廠、Agent智能體、人形機(jī)器人、數(shù)字孿生和量子計(jì)算等關(guān)鍵概念,提出AI不僅是工具,更是新的生產(chǎn)力核心。
相較以往,這場(chǎng)演講更具工程實(shí)感與系統(tǒng)性構(gòu)想,將軟硬件、生態(tài)與國(guó)家基礎(chǔ)設(shè)施整合成一個(gè)宏大的產(chǎn)業(yè)圖景,不僅展示英偉達(dá)技術(shù)棧的野心,也揭示未來(lái)十年AI社會(huì)化部署的路徑。
以下為黃仁勛演講,正文有所刪減。
一、AI 已進(jìn)入Agent時(shí)代
Agent智能體是一個(gè)非常重要的事情。
正如你所知,起初,使用預(yù)訓(xùn)練模型時(shí),人們說(shuō),“它會(huì)產(chǎn)生幻覺(jué)?!薄八鼤?huì)編造內(nèi)容。”“它無(wú)法獲取最新的新聞和數(shù)據(jù)信息。”
所有這些事情,你知道的,為什么它要試圖弄清楚如何加法或者計(jì)算計(jì)數(shù)數(shù)字并相加?為什么它不直接用計(jì)算器?
因此,所有與智能相關(guān)的能力——每個(gè)人都能提出批評(píng),但這完全正確,因?yàn)榇蠹掖笾铝私庵悄苁侨绾芜\(yùn)作的。
但這些技術(shù)正在全球范圍內(nèi)被開(kāi)發(fā)建設(shè):它們?nèi)繀R聚在一起,從增強(qiáng)檢索生成到網(wǎng)絡(luò)搜索,再到多模態(tài)理解,這樣你就可以閱讀PDF文件、訪問(wèn)網(wǎng)站,查看圖片和文字、聽(tīng)視頻,觀看視頻,然后將所有這些理解融入你的語(yǔ)境中。
你現(xiàn)在當(dāng)然也可以理解幾乎任何事物的提示。
你甚至可以說(shuō),“我要問(wèn)你一個(gè)問(wèn)題,但從這張圖片開(kāi)始?!蔽铱梢哉f(shuō):“從這個(gè)開(kāi)始,先從這段文字開(kāi)始再回答”,回答問(wèn)題或執(zhí)行我要求你做的事?!比缓笏鼤?huì)自行推理、計(jì)劃和自我評(píng)估。
所有這些能力現(xiàn)在都已整合,你可以看到它們?cè)谑袌?chǎng)上隨處可見(jiàn)。具代理性的人工智能是真實(shí)存在的。自主智能是從一次性人工智能邁出的巨大飛躍。一次性人工智能是必要的基礎(chǔ),它讓我們能夠教會(huì)智能體如何成為智能體。
你需要具備一定的知識(shí)基礎(chǔ)和推理能力,才能具備可教性。預(yù)訓(xùn)練關(guān)乎人工智能的可教性。后訓(xùn)練、強(qiáng)化學(xué)習(xí)、監(jiān)督學(xué)習(xí)、人類(lèi)示范、上下文提供、生成式人工智能,所有這些正在融合,形成如今的智能代理人工智能。
讓我們來(lái)看一個(gè)例子。它基于Perplexity(人工智能搜索引擎)構(gòu)建。
人工智能代理是數(shù)字助理。
基于提示,它們進(jìn)行推理并將問(wèn)題分解為多步驟計(jì)劃。它們使用合適的工具,與其他代理協(xié)作,并利用記憶中的上下文在NVIDIA 加速系統(tǒng)上正確執(zhí)行任務(wù)。
一切從一個(gè)簡(jiǎn)單的提示開(kāi)始。讓我們請(qǐng) Perplexity 幫忙在巴黎開(kāi)一家餐車(chē)。
首先,Perplexity 代理通過(guò)提示進(jìn)行推理并制定計(jì)劃,然后調(diào)用其他代理使用多種工具幫助解決每個(gè)步驟。
市場(chǎng)研究員閱讀評(píng)論和報(bào)告,以發(fā)現(xiàn)趨勢(shì)并分析競(jìng)爭(zhēng)市場(chǎng)。
基于這項(xiàng)研究,概念設(shè)計(jì)師探索當(dāng)?shù)厥巢牟⑻岢霭瑴?zhǔn)備時(shí)間估算的菜單,并研究調(diào)色板,生成品牌識(shí)別。然后,財(cái)務(wù)規(guī)劃師使用蒙特卡洛模擬來(lái)預(yù)測(cè)盈利能力和增長(zhǎng)軌跡。
一名運(yùn)營(yíng)策劃人員制定了包含每個(gè)細(xì)節(jié)的發(fā)射時(shí)間表:從購(gòu)買(mǎi)設(shè)備到獲取正確的許可。
市場(chǎng)專(zhuān)員制定了包含社交媒體活動(dòng)的發(fā)射計(jì)劃,甚至編寫(xiě)了一個(gè)包含地圖的互動(dòng)網(wǎng)站、菜單和在線(xiàn)訂購(gòu)。
每個(gè)代理的工作匯集成最終的方案提案。
一切都始于一個(gè)簡(jiǎn)單的提示。一個(gè)提示,就像那樣的一個(gè)提示,在原始聊天機(jī)器人中,可能只會(huì)生成幾百個(gè)標(biāo)記。
但現(xiàn)在只需一個(gè)提示,交給代理去解決問(wèn)題,它生成的標(biāo)記數(shù)量必定多出一萬(wàn)倍。
這就是為什么需要Grace-Blackwell系統(tǒng) (它將普通計(jì)算機(jī)轉(zhuǎn)變?yōu)閺?qiáng)大的超級(jí)計(jì)算機(jī))的原因:這就是為什么我們需要性能以及系統(tǒng)在代際之間有更大提升的原因。這就是 Perplexity 構(gòu)建他們的智能代理的方式。每家公司都必須構(gòu)建自己的智能代理。
這太棒了,你將會(huì)從OpenAI、Gemini(谷歌母公司Alphabet下設(shè)立的人工智能實(shí)驗(yàn)室)、微軟 Copilot、Perplexity、Mistral (由前DeepMind和Meta Platforms(META.US)的研究人員組建的致力于構(gòu)建大型通用人工智能(AGI)模型的初創(chuàng)公司)等平臺(tái)招聘代理。也會(huì)有為你量身打造的代理。他們可能會(huì)幫助你規(guī)劃一次假期,或者你知道,去做一些研究,諸如此類(lèi)。
然而,如果你想創(chuàng)辦一家公司,你將需要專(zhuān)用的代理和專(zhuān)用的工具,以及使用專(zhuān)用的工具和專(zhuān)用的技能。那么問(wèn)題是,你如何構(gòu)建這些代理?
因此,我們?yōu)槟銊?chuàng)建了一個(gè)平臺(tái)。我們創(chuàng)建了一個(gè)框架和一套工具供您使用,還有一大批合作伙伴幫助您實(shí)現(xiàn)目標(biāo)。
這一切從最底層開(kāi)始,最底層:我之前提到的推理模型能力。NVIDIA 的 NeMo、NeMotron推理大型語(yǔ)言模型是世界一流的。
我們有 NeMo Retriever,這是一款多模態(tài)搜索引擎。語(yǔ)義搜索引擎。令人難以置信。我們構(gòu)建了一個(gè)藍(lán)圖,一個(gè)可運(yùn)行的演示,基本上是一個(gè)通用智能體。我們稱(chēng)之為 IQ,AI,AIQ。
最上層,我們有一套工具,允許你引入一個(gè)代理:
一個(gè)通用代理,整理數(shù)據(jù)來(lái)教它;
評(píng)估它,設(shè)定安全邊界,監(jiān)督訓(xùn)練它,使用強(qiáng)化學(xué)習(xí)直到部署;
保持安全,確保保障。
這套工具包已經(jīng)集成,這些庫(kù)也已集成到 AIOps (智能運(yùn)維)生態(tài)系統(tǒng)中。你也可以直接從我們的網(wǎng)站下載。但它主要集成在 AIOps 生態(tài)系統(tǒng)中。基于此,你可以創(chuàng)建自己的專(zhuān)屬代理。
現(xiàn)在的問(wèn)題是,如何部署這個(gè)?因?yàn)檎缥抑疤岬降?,NVIDIA 的計(jì)算資源存在于公共云中。有區(qū)域云,我們稱(chēng)之為 NCP。這里,比如說(shuō) Mistral。
你可能因?yàn)榘踩枨蠛蛿?shù)據(jù)原因擁有私有云。
那么問(wèn)題是,你如何運(yùn)行所有這些?有時(shí)它們位于不同的地方,因?yàn)檫@些都是微服務(wù):這些是能夠相互交流的人工智能,它們顯然可以通過(guò)網(wǎng)絡(luò)相互通信。
那么,如何部署所有這些微服務(wù)呢?現(xiàn)在,我們有了一個(gè)很棒的系統(tǒng)。
我很高興能為大家宣布這一消息。這就是我們的DGX Lepton。DGX Lepton,你現(xiàn)在看到的是各種不同的云。
這里是Lambda云(由亞馬遜云科技提供的一項(xiàng)無(wú)服務(wù)器計(jì)算服務(wù)),AWS 云(是亞馬遜提供的是全球最全面、應(yīng)用最廣泛的云平臺(tái),從全球數(shù)據(jù)中心提供超過(guò) 200 項(xiàng)功能齊全的服務(wù)),你知道的。這是你自己的開(kāi)發(fā)者機(jī)器,你自己的系統(tǒng):可以是一臺(tái) DGX 工作站。NeBS(網(wǎng)絡(luò)設(shè)備構(gòu)建系統(tǒng))、Yotta(一家提供數(shù)據(jù)基礎(chǔ)設(shè)施的公司)、Nscale(英國(guó)AI云服務(wù)提供商)。可能是 AWS,也可能是GCP(通用計(jì)算機(jī)程序)。NVIDIA 的架構(gòu)無(wú)處不在。
因此,您可以決定在哪里運(yùn)行您的模型。
你通過(guò)一個(gè)超級(jí)云來(lái)部署它,所以它是一個(gè)云中之云。
一旦你讓它運(yùn)行起來(lái),一旦你將這些NIMs 部署到 Lepton 中,它就會(huì)在你選擇的各種云上托管和運(yùn)行。一種模型架構(gòu),一次部署,隨處運(yùn)行。你甚至可以在這臺(tái)小小的機(jī)器上運(yùn)行它。
這是我最喜歡的小機(jī)器。
我們?cè)?2016 年建造了一臺(tái)人工智能超級(jí)計(jì)算機(jī)。它被稱(chēng)為 DGX-1。
它是我剛才提到的所有技術(shù)的第一個(gè)版本。八個(gè) Volta GPU 通過(guò) NVLink(NVLink是英偉達(dá)開(kāi)發(fā)并推出的一種總線(xiàn)及其通信協(xié)議)互聯(lián)。我們花費(fèi)了數(shù)十億美元來(lái)建造它,而在我們宣布它的那一天:DGX-1,沒(méi)有客戶(hù)。沒(méi)有興趣,沒(méi)有掌聲。
所以我們還是造了它。謝天謝地,是一家年輕的公司,一家初創(chuàng)企業(yè):舊金山的一家非營(yíng)利初創(chuàng)公司看到這臺(tái)電腦時(shí)非常高興,他們說(shuō):“我們能要一臺(tái)嗎?”我當(dāng)時(shí)想:“天哪,我們賣(mài)出一臺(tái)了?!?/p>
但后來(lái)我發(fā)現(xiàn)那是一家非營(yíng)利組織。然后我把一臺(tái) DGX-1 放進(jìn)了我的車(chē)?yán)?,帶到了舊金山。那家公司的名字叫 OpenAI。
想象一下你擁有Lepton。它就在你的瀏覽器中,你開(kāi)發(fā)了一個(gè)人工智能代理,想在這里運(yùn)行它:其中一部分你想在 AWS 上運(yùn)行,還有一部分你想在其他地方運(yùn)行,知道嗎?在某個(gè)區(qū)域云中。
你使用Lepton,部署你的 Helm Chart,它就神奇地出現(xiàn)在這里。
所以我們正在為 Lepton 做這件事,但接下來(lái):Hugging Face 和 NVIDIA 已經(jīng)將 Lepton 連接在一起。
因此,每當(dāng)你在 Hugging Face 上訓(xùn)練模型時(shí),如果你想將其部署到 Lepton:并直接部署到 Spark,也沒(méi)問(wèn)題。
只需輕輕一擊。無(wú)論你是在訓(xùn)練還是推理,我們現(xiàn)在都已接入Hugging Face,Lepton 將幫助你決定部署位置。
二、AI工業(yè)革命與數(shù)字孿生
這是梅賽德斯-奔馳及其在 Omniverse (NVIDIA Omniverse是NVIDIA旗下基于NVIDIA RTX和皮克斯Universal Scene Description(USD)的圖形和仿真模擬產(chǎn)品)中構(gòu)建的工廠數(shù)字孿生。
這是舍弗勒及其在 Omniverse 中構(gòu)建的倉(cāng)庫(kù)數(shù)字孿生。
這是你們?cè)诜▏?guó)的火車(chē)站:在 Omniverse 中構(gòu)建他們火車(chē)站的數(shù)字孿生。
這是豐田在 Omniverse 中構(gòu)建他們倉(cāng)庫(kù)的數(shù)字孿生。
當(dāng)你在 Omniverse 中構(gòu)建這些倉(cāng)庫(kù)和工廠時(shí),你可以設(shè)計(jì)它,你可以規(guī)劃它,你可以改變它。
在綠地環(huán)境中它很棒,在棕地環(huán)境中也很棒。你可以在實(shí)際搬動(dòng)和調(diào)整之前模擬其效果,避免發(fā)現(xiàn)它并非最優(yōu)。
因此,在數(shù)字孿生中實(shí)現(xiàn)一切數(shù)字化的能力是令人難以置信的。但問(wèn)題是,為什么數(shù)字孿生必須看起來(lái)像照片一樣真實(shí)?為什么它必須遵守物理定律?
原因是我們最終希望成為一個(gè)數(shù)字孿生體,讓機(jī)器人能夠?qū)W習(xí)如何作為機(jī)器人操作。而機(jī)器人依賴(lài)光子來(lái)實(shí)現(xiàn)其感知系統(tǒng)。這些光子是通過(guò)Omniverse 生成的。
機(jī)器人需要與物理世界互動(dòng),這樣它才能知道自己是否在做正確的事情,并且能夠……
學(xué)會(huì)如何正確地去做,因此這些數(shù)字孿生必須看起來(lái)真實(shí),行為也要逼真。明白了嗎?這就是構(gòu)建 Omniverse 的原因。
這是一個(gè)聚變反應(yīng)堆的數(shù)字孿生。這是一件極其復(fù)雜的儀器,正如你所知:沒(méi)有人工智能,下一代聚變反應(yīng)堆是不可能實(shí)現(xiàn)的。
我們今天宣布,我們將在歐洲這里建設(shè)世界上第一個(gè)工業(yè)人工智能云。我要宣布——是的。
這些工業(yè)人工智能云,確實(shí)是大量的計(jì)算資源……云端有大量的計(jì)算機(jī)。然而,它在性能和安全性方面的要求根本不同。所以我將在周五向大家詳細(xì)介紹。
今天我只是先賣(mài)個(gè)關(guān)子。但這個(gè)工業(yè)云將用于設(shè)計(jì)和仿真。虛擬風(fēng)洞,你只需把車(chē)開(kāi)進(jìn)去,就能看到它的表現(xiàn)。
開(kāi)門(mén)、開(kāi)窗、改變?cè)O(shè)計(jì),所有操作完全實(shí)時(shí)進(jìn)行。
正如你所知,我們已經(jīng)在這里待了很長(zhǎng)時(shí)間。NVIDIA 已有 33 年歷史。我們第一次來(lái)到歐洲,是在工作站和產(chǎn)品數(shù)字化興起的時(shí)候。
現(xiàn)在正處于數(shù)字孿生革命時(shí)期,歐洲有大約兩萬(wàn)億美元的生態(tài)系統(tǒng),我們與之合作……并且有幸為其提供支持。
由此產(chǎn)生的是一場(chǎng)正在發(fā)生的新革命。
正如你所知,所有會(huì)動(dòng)的東西都將是機(jī)器人。所有會(huì)動(dòng)的東西都將由人工智能驅(qū)動(dòng)。而汽車(chē)是最明顯的下一個(gè)領(lǐng)域。
英偉達(dá)打造用于訓(xùn)練模型的人工智能超級(jí)計(jì)算機(jī):用于Omniverse 數(shù)字孿生的人工智能超級(jí)計(jì)算機(jī)。我們還為機(jī)器人本身打造人工智能超級(jí)計(jì)算機(jī)。
無(wú)論是在云端:用于 Omniverse,還是在汽車(chē)中,我們都提供完整的技術(shù)棧,包括計(jì)算機(jī)本身,以及運(yùn)行在這臺(tái)計(jì)算機(jī)上的操作系統(tǒng)。
這臺(tái)計(jì)算機(jī)高速且傳感器豐富,必須具備功能安全性。在任何情況下都絕不能完全失效。因此,安全要求極高。
現(xiàn)在我們有了一個(gè)令人難以置信的模型,運(yùn)行在其之上。這個(gè)運(yùn)行在其之上的模型是一個(gè)變換器模型。
它是一個(gè)推理模型,能夠接收傳感器輸入:你告訴它你想做什么,它就會(huì)帶你去那里。接收像素輸入并生成路徑規(guī)劃輸出。所以它是一個(gè)基于變換器的生成式人工智能模型。
十億輛汽車(chē)上路,平均每年行駛一萬(wàn)英里,一萬(wàn)億英里。自動(dòng)駕駛的未來(lái)顯然是巨大的,它將由人工智能驅(qū)動(dòng)和支持。
這是下一個(gè)巨大的機(jī)遇,我們正在與全球眾多大型且卓越的公司合作,使這一切成為可能。在我們所有與自動(dòng)駕駛相關(guān)的工作中,安全始終是核心。
我們對(duì)我們的HALOS系統(tǒng)感到非常自豪。它始于芯片的架構(gòu),然后是芯片設(shè)計(jì)和系統(tǒng)設(shè)計(jì),操作系統(tǒng)、人工智能模型以及軟件開(kāi)發(fā)的方法論,我們測(cè)試的方式,從訓(xùn)練模型的方法到為模型提供的數(shù)據(jù),再到評(píng)估模型的方式。
NVIDIA 的 HALOS 系統(tǒng)以及我們的自動(dòng)駕駛安全團(tuán)隊(duì)和能力在全球享有盛譽(yù)。這臺(tái)計(jì)算機(jī)是第一臺(tái)軟件定義的計(jì)算機(jī)。
全球首個(gè)完全 100%軟件定義的、由人工智能驅(qū)動(dòng)的軟件,面向自動(dòng)駕駛汽車(chē)的增強(qiáng)現(xiàn)實(shí)人工智能驅(qū)動(dòng)堆棧。我們已經(jīng)從事這項(xiàng)工作將近十年了,這一能力享譽(yù)全球,我對(duì)此感到非常自豪。
汽車(chē)行業(yè)正在發(fā)生的變化,同樣也正在一個(gè)新興產(chǎn)業(yè)中上演。
正如我之前提到的,如果你能根據(jù)提示生成視頻,如果人工智能能夠感知,它就能推理,還能生成視頻、文字和圖像,剛才提到的汽車(chē)、路徑、方向盤(pán)路徑,為什么它不能同時(shí)產(chǎn)生局部運(yùn)動(dòng)能力和關(guān)節(jié)活動(dòng)能力?
因此,人工智能徹底改變機(jī)器人領(lǐng)域最難問(wèn)題之一的基本能力即將到來(lái)。
類(lèi)人機(jī)器人將成為現(xiàn)實(shí)。我們現(xiàn)在知道如何構(gòu)建這些東西,訓(xùn)練這些東西,以及操作這些東西。
人形機(jī)器人可能將成為有史以來(lái)最大的產(chǎn)業(yè)之一,這需要那些懂得制造東西的公司,制造具有非凡能力的東西。這指的是歐洲國(guó)家。世界上許多產(chǎn)業(yè)都基于這里。我認(rèn)為這將是一個(gè)巨大的機(jī)遇。
假設(shè)全球有十億臺(tái)機(jī)器人。擁有十億機(jī)器人是一個(gè)非常合理的想法。那么,為什么這還沒(méi)有發(fā)生呢?原因很簡(jiǎn)單。
如今的機(jī)器人編程太復(fù)雜。只有最大的公司才能負(fù)擔(dān)得起安裝機(jī)器人。讓機(jī)器人學(xué)習(xí),編程使其執(zhí)行完全正確的操作。保持足夠的包圍以確保安全。這就是為什么世界上最大的汽車(chē)公司都配備了機(jī)器人。
它們體積足夠大,工作足夠重復(fù)。確實(shí),行業(yè)已經(jīng)達(dá)到足夠的規(guī)模,可以在這些工廠部署機(jī)器人。幾乎所有中小型企業(yè)都是如此,無(wú)論是夫妻店、餐館、商店還是倉(cāng)庫(kù)。
正當(dāng)我們?cè)谟懻撟灾髦悄軙r(shí),我們現(xiàn)在擁有能夠通過(guò)教學(xué)學(xué)習(xí)的人形智能,使用的工具包與Nemo 工具包。
NVIDIA HERE同樣是建立在三層堆棧之上。我們打造了這臺(tái)計(jì)算機(jī),名為 Thor 計(jì)算機(jī)。開(kāi)發(fā)套件看起來(lái)大致是這樣的。這是一臺(tái)完全自給自足的機(jī)器人電腦。
開(kāi)發(fā)套件放在你的桌面上。這些都是傳感器,內(nèi)部是一顆小型超級(jí)計(jì)算機(jī) Thor 芯片。
這就是 Thor 處理器。上面是為機(jī)器人設(shè)計(jì)的操作系統(tǒng)。此外,變換器模型接收傳感器數(shù)據(jù)和指令并進(jìn)行轉(zhuǎn)換,生成飛行路徑或軌跡,以及手臂關(guān)節(jié)的運(yùn)動(dòng)控制,當(dāng)然還有你的腿部關(guān)節(jié)運(yùn)動(dòng)控制。
現(xiàn)在,人形機(jī)器人面臨的最大挑戰(zhàn)是訓(xùn)練所需的數(shù)據(jù)量非常、非常難以獲取。
那么問(wèn)題是你如何做到這一點(diǎn)?解決這個(gè)問(wèn)題的方法是回到Omniverse,一個(gè)遵循物理定律的數(shù)字孿生世界。
這是我們正在做的一項(xiàng)令人難以置信的工作。我們開(kāi)發(fā)了計(jì)算機(jī)來(lái)模擬,來(lái)訓(xùn)練它們。
全球正在建立大量的人形機(jī)器人公司。他們都看到了徹底變革這一新領(lǐng)域的巨大機(jī)遇??梢哉f(shuō)是一種新設(shè)備,進(jìn)展非常迅速。它們學(xué)習(xí)的方式是在一個(gè)虛擬世界中學(xué)習(xí),而這個(gè)虛擬世界必須遵守物理定律。
一場(chǎng)工業(yè)革命已經(jīng)開(kāi)始。
下一波人工智能浪潮已經(jīng)開(kāi)始。
Grek 是機(jī)器人技術(shù)現(xiàn)階段可能實(shí)現(xiàn)的完美范例。教機(jī)器人操作所需的技術(shù),進(jìn)行模擬,當(dāng)然,一個(gè)令人難以置信的機(jī)器人現(xiàn)在就展現(xiàn)在我們面前。我們有實(shí)體機(jī)器人,也有信息機(jī)器人——我們稱(chēng)它們?yōu)榇怼?/p>
下一波人工智能已經(jīng)開(kāi)始。推理工作負(fù)載的爆炸式增長(zhǎng)。它基本上將呈指數(shù)增長(zhǎng)。使用推理的人數(shù)已經(jīng)從八百萬(wàn)增加到八億。僅僅幾年時(shí)間就增長(zhǎng)了一百倍。
Token(令牌)生成的提示數(shù)量,正如我之前提到的,從幾百個(gè)標(biāo)記到幾千個(gè)標(biāo)記,當(dāng)然,我們現(xiàn)在比以往任何時(shí)候都更多地使用人工智能,比以往任何時(shí)候都更多。
所以,我們需要一臺(tái)專(zhuān)門(mén)為思考設(shè)計(jì)的計(jì)算機(jī),專(zhuān)為推理設(shè)計(jì),這就是 Blackwell,一臺(tái)思考機(jī)器。
這些Blackwells 將被用于新型數(shù)據(jù)中心,本質(zhì)上是人工智能工廠,專(zhuān)為一件事而設(shè)計(jì),這些人工智能工廠將生成Token,這些Token將成為你的食物。
真正令人難以置信的是,我很高興看到歐洲正在全力投入人工智能。這里建設(shè)的人工智能基礎(chǔ)設(shè)施將在未來(lái)幾年內(nèi)增加一個(gè)數(shù)量級(jí)。
三、量子計(jì)算的拐點(diǎn)與CUDA-Q
量子計(jì)算正處于一個(gè)轉(zhuǎn)折點(diǎn)。
1995 年發(fā)明了糾錯(cuò)算法。2023 年,近 30 年后,谷歌展示了世界上第一個(gè)邏輯量子比特(“邏輯量子比特”(Logical Qubit)是量子計(jì)算領(lǐng)域的核心概念,其設(shè)計(jì)目的是解決量子比特在實(shí)際應(yīng)用中面臨的噪聲、退相干等問(wèn)題)。
從那以后,幾年過(guò)去了,邏輯量子比特(由大量帶有糾錯(cuò)的物理量子比特組成)的數(shù)量也有所增加。
然后,邏輯量子比特的數(shù)量開(kāi)始增長(zhǎng),就像摩爾定律一樣,我完全可以預(yù)期每五年邏輯量子比特?cái)?shù)量增加十倍。每十年邏輯量子比特?cái)?shù)量增加一百倍。
這些邏輯量子比特將具備更好的錯(cuò)誤糾正能力:更加穩(wěn)健,性能更高,更具彈性,當(dāng)然將繼續(xù)具備可擴(kuò)展性。量子計(jì)算正達(dá)到一個(gè)拐點(diǎn)。
在未來(lái)幾年內(nèi),或者至少在下一代超級(jí)計(jì)算機(jī)中,每一個(gè)都會(huì)分配一個(gè)量子處理單元(QPU),并且 QPU 會(huì)連接到 GPU。
量子處理單元當(dāng)然會(huì)執(zhí)行量子計(jì)算,而 GPU 則用于預(yù)處理:用于控制和糾錯(cuò),這里計(jì)算極其密集,包括后期處理等。
在這兩種架構(gòu)之間,就像我們加速了CPU 一樣,現(xiàn)在有了 QPU 與 GPU 協(xié)同工作,推動(dòng)下一代計(jì)算的發(fā)展。
今天我們宣布,我們的整個(gè)量子算法堆?,F(xiàn)已在 Grace Blackwell 200 上實(shí)現(xiàn)加速。加速效果令人難以置信。
我們以多種方式與計(jì)算、通信和量子計(jì)算行業(yè)合作。
其中一種方式是使用cuQuantum(加速量子計(jì)算的軟件開(kāi)發(fā)工具包)來(lái)模擬量子比特,或模擬運(yùn)行在這些量子計(jì)算機(jī)上的算法?;旧鲜鞘褂媒?jīng)典計(jì)算機(jī)來(lái)模擬或仿真量子計(jì)算機(jī)。
在另一個(gè)極端,極其重要的是 CUDA-Q:基本上是發(fā)明了一種新的 CUDA(CUDA是英偉達(dá)公司設(shè)計(jì)研發(fā)一種并行計(jì)算平臺(tái)和編程模型),將 CUDA 擴(kuò)展到量子經(jīng)典領(lǐng)域。
這樣,在量子計(jì)算機(jī)到來(lái)之前,基于 CUDA-Q 開(kāi)發(fā)的應(yīng)用可以以模擬方式運(yùn)行,或者在量子計(jì)算機(jī)到來(lái)后以協(xié)作方式運(yùn)行:一種量子經(jīng)典加速計(jì)算方法。
今天我們宣布CUDA-Q 已可用于 Grace Blackwell。
這里的生態(tài)系統(tǒng)極為豐富,當(dāng)然歐洲在科學(xué)領(lǐng)域深厚,在超級(jí)計(jì)算專(zhuān)業(yè)知識(shí)方面深厚,在這一領(lǐng)域有著深厚的傳承。
在這里看到量子計(jì)算的進(jìn)展并不令人驚訝。在未來(lái)幾年,我們將看到一個(gè)真正精彩的轉(zhuǎn)折點(diǎn)。
2012 年,我們與開(kāi)發(fā)者合作,研究一種稱(chēng)為深度學(xué)習(xí)的新型算法。它促成了AI的AlexNet(深度卷積神經(jīng)網(wǎng)絡(luò))大爆炸:2012年。在過(guò)去大約 15 年里,人工智能取得了令人難以置信的快速進(jìn)展。
第一波人工智能是感知,讓計(jì)算機(jī)識(shí)別信息、理解信息。
第二波人工智能,是過(guò)去五年左右我們大多數(shù)人都在討論的生成式人工智能。它是多模態(tài)的,意味著人工智能能夠同時(shí)學(xué)習(xí)圖像和語(yǔ)言。
因此,你可以用語(yǔ)言提示它,它就能生成圖像。人工智能具備多模態(tài)能力以及翻譯和生成內(nèi)容的能力,推動(dòng)了生成式人工智能的革命。生成式人工智能,即生成內(nèi)容的能力,對(duì)我們的生產(chǎn)力至關(guān)重要。
我們正在開(kāi)啟新一波的人工智能浪潮。在過(guò)去的幾年里,我們見(jiàn)證了人工智能能力的巨大進(jìn)步。從根本上說(shuō),智能就是理解、感知、推理和規(guī)劃任務(wù):
如何解決問(wèn)題,然后執(zhí)行任務(wù)。感知、推理、規(guī)劃,智能的基本循環(huán)。它使我們能夠應(yīng)用一些先前學(xué)到的規(guī)則來(lái)解決我們從未見(jiàn)過(guò)的問(wèn)題。
這就是為什么聰明人被認(rèn)為聰明,因?yàn)樗麄兡軌驅(qū)⒁粋€(gè)復(fù)雜的問(wèn)題一步步拆解,推理如何解決問(wèn)題,或許還會(huì)進(jìn)行研究:
也許去學(xué)習(xí)一些新知識(shí),尋求幫助;
使用工具,逐步解決問(wèn)題。
我剛才描述的這些話(huà),基本上今天通過(guò)所謂的代理型人工智能是可能實(shí)現(xiàn)的。我馬上會(huì)給你展示更多內(nèi)容。
現(xiàn)在,生成能力正在生成運(yùn)動(dòng),不是生成視頻,也不是生成圖像或生成文本;這項(xiàng)人工智能生成了運(yùn)動(dòng)能力,即行走能力或者伸手抓取某物,使用工具。
讓人工智能具備實(shí)體形態(tài)的能力,基本上就是機(jī)器人技術(shù)。這些能力,是實(shí)現(xiàn)智能體的基礎(chǔ)技術(shù)。它們基本上是信息機(jī)器人和具身人工智能:物理機(jī)器人,這兩項(xiàng)基本能力現(xiàn)在已經(jīng)到來(lái)。
人工智能的時(shí)代真是令人非常興奮。但這一切,都是從GeForce開(kāi)始的。而 GeForce 帶來(lái)了計(jì)算機(jī)圖形技術(shù)。這是我們?cè)?jīng)開(kāi)發(fā)的第一個(gè)加速計(jì)算應(yīng)用。
計(jì)算機(jī)圖形技術(shù)的發(fā)展令人難以置信。GeForce 將 CUDA 推向世界,使火星機(jī)器學(xué)習(xí)研究人員和人工智能研究人員能夠推動(dòng)深度學(xué)習(xí)的發(fā)展。
隨后,深度學(xué)習(xí)徹底改變了計(jì)算機(jī)圖形技術(shù),使我們能夠?qū)⒂?jì)算機(jī)圖形提升到一個(gè)全新的高度。
這是全新的 GeForce。重達(dá)兩噸,甚至兩噸半。由 120 萬(wàn)個(gè)零件組成。大約 300 萬(wàn)美元。在 150 家工廠制造。200家技術(shù)合作伙伴與我們共同努力實(shí)現(xiàn)這一目標(biāo)。
可能是大約 400 億美元的研發(fā)預(yù)算,現(xiàn)在正在向 GB300 邁進(jìn)。它已經(jīng)完全投入生產(chǎn)。
這臺(tái)機(jī)器被設(shè)計(jì)成一臺(tái)思考機(jī)器。所謂思考機(jī)器,是指它能夠進(jìn)行推理。它有計(jì)劃。它花很多時(shí)間自言自語(yǔ),就像你一樣。
我們大部分時(shí)間都在為自己的思維生成文字,在我們表達(dá)之前,為自己的思維生成圖像。因此,思考機(jī)器實(shí)際上就是 Grace Blackwell 設(shè)計(jì)的架構(gòu)目標(biāo)。它被設(shè)計(jì)成一個(gè)巨大的 GPU。
我之所以這樣比喻,是有充分理由的。GeForce 是一塊 GPU,GB200 也是,它是一個(gè)巨大的虛擬 GPU。
摩爾定律,半導(dǎo)體物理每三到五年只能帶來(lái)大約兩倍的性能提升。而我們需要的是 30 到 40 倍的性能提升,因?yàn)橥评砟P驮谧匝宰哉Z(yǔ)。我們?nèi)绾文茉谝淮a(chǎn)品中實(shí)現(xiàn) 30 到 40 倍的性能提升?
它不再是一次性完成的 ChatGPT,而是一個(gè)推理模型。
當(dāng)你自我思考時(shí),它會(huì)生成更多的標(biāo)記。你正在一步步地分解問(wèn)題。你在推理,嘗試各種不同的路徑。也許是思維鏈,也許是思維樹(shù)。它正在反思自己的答案。
看到這些研究模型,反思答案時(shí)會(huì)說(shuō)“這是個(gè)好答案嗎?你能做得更好嗎?”然后他們“哦,是的,我能做得更好。”
然后回去再多想想。因此,那些思考模型、推理模型達(dá)到了驚人的性能,但這需要更多的計(jì)算能力。
我們現(xiàn)在確鑿無(wú)疑地知道,人工智能是一種可能帶來(lái)革命性變革的軟件:改變每一個(gè)行業(yè)。
它能做到這些驚人的事情。這是我們所知道的。我們也知道,處理人工智能的方式與我們過(guò)去處理手寫(xiě)軟件的方式根本不同。
機(jī)器學(xué)習(xí)軟件的開(kāi)發(fā)方式不同,運(yùn)行方式也不同。系統(tǒng)的架構(gòu),軟件的架構(gòu):完全不同。網(wǎng)絡(luò)的工作方式,完全不同。訪問(wèn)存儲(chǔ)的方式,完全不同。
所以我們知道這項(xiàng)技術(shù)可以做不同的事情:令人難以置信的事情,它是智能的。我們也知道它的開(kāi)發(fā)方式根本不同:它需要新的計(jì)算機(jī)。
真正有趣的是,這對(duì)各國(guó)意味著什么?對(duì)企業(yè)、對(duì)社會(huì)又意味著什么?這是我們近十年前就注意到的一個(gè)現(xiàn)象,而現(xiàn)在每個(gè)人都開(kāi)始意識(shí)到這一點(diǎn)了:
事實(shí)上,這些人工智能數(shù)據(jù)中心根本就不是數(shù)據(jù)中心。它們不是傳統(tǒng)意義上的數(shù)據(jù)中心,用來(lái)存儲(chǔ)你可以檢索的文件。
這些數(shù)據(jù)中心并不存儲(chǔ)我們的文件。它只有一個(gè)任務(wù),且僅此一個(gè)任務(wù):那就是生成智能標(biāo)記,即人工智能的生成。
這些人工智能工廠,看起來(lái)像數(shù)據(jù)中心,因?yàn)槔锩嬗写罅坑?jì)算機(jī)。
沒(méi)有人真正把他們的數(shù)據(jù)中心當(dāng)作一個(gè)創(chuàng)收設(shè)施來(lái)考慮。我說(shuō)了一句話(huà),大家都說(shuō),“是的,我覺(jué)得你說(shuō)得對(duì)?!睕](méi)人會(huì)把數(shù)據(jù)中心當(dāng)作一個(gè)創(chuàng)收設(shè)施來(lái)考慮。
但他們把自己的工廠,汽車(chē)工廠,看作是創(chuàng)收設(shè)施:他們迫不及待地想建另一座工廠,因?yàn)槊慨?dāng)你建一座工廠,收入很快就會(huì)增長(zhǎng)。你可以為更多人創(chuàng)造更多東西。
這些人工智能工廠是創(chuàng)收設(shè)施,旨在制造Token。這些 Token可以被重新構(gòu)造成多種行業(yè)的生產(chǎn)性智能,因此人工智能工廠現(xiàn)在已成為一個(gè)國(guó)家基礎(chǔ)設(shè)施的一部分。
這就是為什么你看到我奔走于世界各地,與各國(guó)元首會(huì)談的原因:因?yàn)樗麄兌枷M麚碛腥斯ぶ悄芄S。他們都希望人工智能成為他們基礎(chǔ)設(shè)施的一部分。他們希望人工智能成為他們的一個(gè)增長(zhǎng)型制造業(yè)。
這確實(shí)意義深遠(yuǎn),我認(rèn)為我們正在討論的是:因此,催生了一場(chǎng)新的工業(yè)革命,因?yàn)槊恳粋€(gè)行業(yè)都受到了影響,同時(shí)也誕生了一個(gè)新興產(chǎn)業(yè)。
正如電力最初被描述和展示為一項(xiàng)技術(shù)時(shí),后來(lái)發(fā)展成為一個(gè)新興產(chǎn)業(yè)一樣:它被理解為一項(xiàng)技術(shù),但后來(lái)我們意識(shí)到它也是一個(gè)龐大的產(chǎn)業(yè)。然后是信息產(chǎn)業(yè),我們現(xiàn)在稱(chēng)之為互聯(lián)網(wǎng)。
這兩者都影響了許多行業(yè),成為基礎(chǔ)設(shè)施的一部分。我們現(xiàn)在有了一個(gè)新的產(chǎn)業(yè)——人工智能產(chǎn)業(yè):它現(xiàn)在成為了被稱(chēng)為智能基礎(chǔ)設(shè)施的新基礎(chǔ)設(shè)施的一部分。每個(gè)國(guó)家、每個(gè)社會(huì)、每家公司都將依賴(lài)它。
分享嘉賓:黃仁勛,英偉達(dá)創(chuàng)始人兼 CEO。?責(zé)編?| 金木研
本文由人人都是產(chǎn)品經(jīng)理作者【筆記俠】,微信公眾號(hào):【筆記俠】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!