吳恩達(dá)談 Agent 現(xiàn)狀:MCP、Agent 通信還太早期
吳恩達(dá)指出,MCP 處于早期,身份驗(yàn)證等不成熟;Agent 通信更是早期,大多還在努力讓單個(gè) Agent 正常運(yùn)行。他分享了對(duì) Agent 構(gòu)建路徑、工具組合等的判斷,強(qiáng)調(diào)構(gòu)建系統(tǒng)性評(píng)估機(jī)制的重要性,并探討了語(yǔ)音交互、AI 編程等話題。
吳恩達(dá)教授關(guān)于 Agent 的理解非常深刻,此前做過(guò)的幾次分享和教學(xué)都非常有啟發(fā)性。
最近吳恩達(dá)與 LangChain 聯(lián)合創(chuàng)始人 Harrison Chase 又展開了一場(chǎng)對(duì)話,交流 Agent 的發(fā)展現(xiàn)狀。
鏈接:https://www.youtube.com/watch?v=4pYzYmSdSH4&t=68s
InfoQ 已經(jīng)對(duì)對(duì)話內(nèi)容進(jìn)行了很好的編譯,因此我們基于吳恩達(dá)評(píng)Agent現(xiàn)狀:MCP尚處“蠻荒”,單Agent跑通已是“奇跡”,A2A協(xié)作堪稱“雙重奇跡”做了一些潤(rùn)改,內(nèi)容如下:
過(guò)去幾年,AI 工具公司構(gòu)建出一套功能強(qiáng)大、模塊豐富的工具體系。LangGraph、RAG 等組件就像樂(lè)高積木,讓開發(fā)者可以靈活拼裝、快速搭建系統(tǒng)。
但在真實(shí)場(chǎng)景中,往往會(huì)卡在某個(gè)細(xì)節(jié)模塊,比如上下文管理或評(píng)估。有經(jīng)驗(yàn)的人能迅速換個(gè)解法幾天解決,沒(méi)經(jīng)驗(yàn)的可能要多繞幾個(gè)月的彎路。
AI 開發(fā)的“殘酷”之處也在于此——沒(méi)有哪一個(gè)工具能包打天下,關(guān)鍵在于是否熟練掌握并高效組合整套工具鏈。
另一方面,工具之間的變化也很快。例如,隨著 LLM 的上下文長(zhǎng)度持續(xù)增加,一年半前的很多 RAG 最佳實(shí)踐,今天可能就不適用了。而 MCP 的出現(xiàn)則補(bǔ)上了另一個(gè)明顯的市場(chǎng)空缺,讓工具、API、數(shù)據(jù)源之間的集成變得更容易。
但正如吳恩達(dá)所言,MCP 仍處在“蠻荒階段”——網(wǎng)上有很多服務(wù)端實(shí)現(xiàn),但“很多其實(shí)跑不起來(lái)”,身份驗(yàn)證和 token 管理也尚不成熟。而且, 在 Agent 與 Agent 通信方面,吳恩達(dá)坦言,如今大多數(shù)人(包括他本人)仍在努力讓一個(gè) Agent 正常運(yùn)行;而要讓兩個(gè)不同人的 Agent 成功協(xié)作,則幾乎像是完成了兩個(gè)奇跡。
我們翻譯了這場(chǎng)對(duì)話,讓大家了解吳恩達(dá)對(duì) Agent 構(gòu)建路徑、MCP 現(xiàn)狀、工具組合能力等核心問(wèn)題的最新判斷與實(shí)踐思路。
01 架構(gòu)核心在任務(wù)分解與流程編排
Harrison Chase:你提議我們不去糾結(jié)一個(gè)應(yīng)用是不是 Agent,而是去關(guān)注它有多“Agentic”,能不能再解釋一下這個(gè)觀點(diǎn)?
吳恩達(dá):我之所以提出這個(gè)觀點(diǎn),是因?yàn)槲野l(fā)現(xiàn)大家在不停地爭(zhēng)論:“這個(gè)是 Agent 嗎?”“這個(gè)不算吧?”——各種不同的定義爭(zhēng)議:它夠不夠自主?是不是符合某個(gè)標(biāo)準(zhǔn)?
我當(dāng)時(shí)的感覺(jué)是,與其花那么多時(shí)間爭(zhēng)論這個(gè)是不是 Agent,不如我們整個(gè)社區(qū)換個(gè)方式思考:把“Agenticness(自主性)”看作一個(gè)光譜——有些系統(tǒng) Agentic 能力強(qiáng),有些弱。
你想做一個(gè)稍微具備一點(diǎn)自主性的 Agentic 系統(tǒng),或者一個(gè)非常自主的系統(tǒng),都是可以的,沒(méi)必要非得爭(zhēng)論“這算不算 Agent”。
所以我提議,我們就叫這些系統(tǒng)“Agentic systems”,然后專注于怎么構(gòu)建它們。這種思維方式,其實(shí)幫我們節(jié)省了大量爭(zhēng)論時(shí)間,讓我們能更快進(jìn)入實(shí)操階段。
Harrison Chase:你怎么看這個(gè)光譜——從“低自主性”到“高自主性”?現(xiàn)在大家在構(gòu)建系統(tǒng)時(shí),大多處在哪個(gè)位置?
吳恩達(dá):很多企業(yè)里的實(shí)際工作,是讓員工在網(wǎng)頁(yè)上填寫表單、搜索信息、查數(shù)據(jù)庫(kù)有沒(méi)有合規(guī)風(fēng)險(xiǎn)、判斷是否可以向某些客戶銷售某類產(chǎn)品;或者是復(fù)制粘貼一些數(shù)據(jù),再做個(gè)搜索,再粘貼到另一個(gè)表單中。這些業(yè)務(wù)流程,往往是非常線性的,偶爾出現(xiàn)一點(diǎn)小循環(huán)或小分支,通常意味著流程失敗,比如因?yàn)槟硞€(gè)條件不滿足被拒絕。所以,我看到大量的機(jī)會(huì),都來(lái)自這些簡(jiǎn)單流程。
而我也注意到,企業(yè)在把已有流程轉(zhuǎn)變?yōu)椤癆gentic workflow”時(shí),仍面臨很大挑戰(zhàn):比如,你應(yīng)該把流程拆分到什么樣的粒度?任務(wù)要分成哪些微步驟?當(dāng)你構(gòu)建了一個(gè)原型,但效果不夠好時(shí),你要改進(jìn)哪一個(gè)步驟才能提升整體效果?這種“從復(fù)雜任務(wù)中拆解出可執(zhí)行的微步驟”、設(shè)計(jì)工作流結(jié)構(gòu)、評(píng)估機(jī)制等能力,其實(shí)現(xiàn)在還比較稀缺。
當(dāng)然,更復(fù)雜的 Agentic 工作流也非常有價(jià)值,尤其是包含大量循環(huán)的那些。但就“數(shù)量”來(lái)說(shuō),現(xiàn)在的機(jī)會(huì),還是主要集中在這些更簡(jiǎn)單的線性流程里,大家正在一步步把它們系統(tǒng)化、自動(dòng)化。
Harrison Chase:你做了很多深度學(xué)習(xí)相關(guān)的教學(xué),也有很多課程是為了幫助大家理解和構(gòu)建 Agent。那么你覺(jué)得對(duì)于 Agent 構(gòu)建者來(lái)說(shuō),哪些技能是最應(yīng)該掌握的?
吳恩達(dá):我覺(jué)得最大的挑戰(zhàn)在于:很多業(yè)務(wù)流程里,牽涉到的是合規(guī)、法務(wù)、人力等團(tuán)隊(duì)的具體操作。那你要怎么構(gòu)建一個(gè)“管道”把這些流程數(shù)字化?是用 LangGraph 做集成?還是看看 MCP 是否也能幫助實(shí)現(xiàn)?
一個(gè)很重要但常被忽略的點(diǎn)是:要搭建一個(gè)正確的 Eval(評(píng)估)體系,不只是評(píng)估整個(gè)系統(tǒng)的效果,還要能追蹤每一步驟,這樣你才能快速定位“是哪一步壞了”,“是哪個(gè) Prompt 沒(méi)有發(fā)揮作用”。很多團(tuán)隊(duì)在這個(gè)過(guò)程中可能進(jìn)展比應(yīng)有的慢——他們一直靠人手評(píng)估,每次改完 Prompt,就一個(gè)個(gè)看輸出,人工判斷,這會(huì)極大影響效率。
我認(rèn)為,構(gòu)建系統(tǒng)性評(píng)估機(jī)制是最理想的方式。但問(wèn)題是,很多團(tuán)隊(duì)還沒(méi)有這種“下一步該做什么”的直覺(jué)。技能不足的團(tuán)隊(duì)經(jīng)常會(huì)走進(jìn)“死胡同”——比如花幾個(gè)月去優(yōu)化一個(gè)永遠(yuǎn)也做不好的組件。而經(jīng)驗(yàn)豐富的團(tuán)隊(duì)會(huì)說(shuō):“這個(gè)方案我們放棄吧,換一條路線?!?/p>
我希望我能總結(jié)出更高效的方式,教會(huì)大家這種“經(jīng)驗(yàn)性判斷”,因?yàn)楹芏鄷r(shí)候你必須在幾分鐘甚至幾小時(shí)內(nèi),看著 LangChain 的 Trace 輸出、判斷當(dāng)前狀態(tài),然后迅速做出決策,而這仍然是非常困難的。
02 從工具到體系:AI 系統(tǒng)構(gòu)建進(jìn)入模塊化時(shí)代
Harrison Chase:你認(rèn)為這種“經(jīng)驗(yàn)性判斷”,更多是和 LLM(大模型)本身的限制有關(guān),還是更偏向產(chǎn)品結(jié)構(gòu)、任務(wù)拆解這些“構(gòu)建能力”?
吳恩達(dá):我覺(jué)得兩者都有。過(guò)去幾年,AI 工具公司構(gòu)建了一套非常強(qiáng)大的工具體系,包括 LangGraph 在內(nèi)。你可以思考如何實(shí)現(xiàn) RAG,如何構(gòu)建聊天機(jī)器人,如何做記憶系統(tǒng)、構(gòu)建 Eval、加上 Guardrails 等等。
我經(jīng)常會(huì)用一個(gè)類比:如果你手上只有一種顏色的樂(lè)高積木,比如只有紫色的,你其實(shí)很難拼出復(fù)雜的結(jié)構(gòu)。但現(xiàn)在我們有了更多類型的“積木”工具:紅的、黑的、黃的、綠的,各種形狀和功能。你擁有的積木越豐富,組裝成復(fù)雜結(jié)構(gòu)的能力就越強(qiáng)。
我們提到的那些 AI 工具,它們其實(shí)是不同形狀的“樂(lè)高積木”。在構(gòu)建系統(tǒng)時(shí),你可能就正好需要那個(gè)“彎曲奇怪形狀的那一塊”,有經(jīng)驗(yàn)的人知道用哪一塊,能迅速完成任務(wù)。但如果你從沒(méi)做過(guò)某種類型的 Eval,可能會(huì)因此多花三個(gè)月時(shí)間,走彎路。而有經(jīng)驗(yàn)的人會(huì)直接說(shuō):“我們用 LLM 做 Judge,評(píng)估方式換成這個(gè),三天就能搞定。”
這也是 AI 比較“殘酷”的地方之一——它不是一個(gè)工具能解決所有問(wèn)題。寫代碼時(shí),我自己也會(huì)用一堆不同的工具。我不能說(shuō)自己精通每一個(gè),但我熟悉足夠多,可以快速組合。而且,工具之間的變化也很快。例如,隨著 LLM 的上下文長(zhǎng)度持續(xù)增加,一年半前的很多 RAG 最佳實(shí)踐,今天可能就不適用了。
我記得 Harrison 在這方面很早就開始探索了,比如早期的 LangChain RAG 框架、遞歸摘要等。而現(xiàn)在,由于上下文窗口擴(kuò)大了,我們可以往里面直接塞入更多信息。RAG 并沒(méi)有消失,但調(diào)參難度已經(jīng)大大降低——現(xiàn)在有一大段“都還行”的參數(shù)區(qū)間。
所以,隨著 LLM 的持續(xù)進(jìn)化,我們兩年前的一些直覺(jué),有些可能就已經(jīng)不再適用了。
Harrison Chase:有哪些“樂(lè)高積木”組件是現(xiàn)在被低估了,但你會(huì)推薦大家去關(guān)注的?
吳恩達(dá):雖然大家現(xiàn)在都在談?wù)撛u(píng)估這件事,但很多人其實(shí)并沒(méi)有真正去做。我不太明白為什么不做,可能是因?yàn)榇蠹彝ǔUJ(rèn)為寫一個(gè)評(píng)估系統(tǒng)是一項(xiàng)巨大而嚴(yán)謹(jǐn)?shù)娜蝿?wù)。
經(jīng)常會(huì)發(fā)生這樣的事:我構(gòu)建了一個(gè)系統(tǒng),然后某個(gè)問(wèn)題不斷出現(xiàn)。我以為修好了,它又壞了,再修好,又壞了。這時(shí)候我就會(huì)寫一個(gè)非常簡(jiǎn)單的評(píng)估,可能只包含五個(gè)輸入樣例,用一些非?;A(chǔ)的 LLM 作為評(píng)審,只針對(duì)這個(gè)特定的回歸問(wèn)題做檢測(cè)——比如“這個(gè)地方是不是又壞了”。
我并不會(huì)完全用自動(dòng)化評(píng)估取代人工評(píng)估,還是會(huì)親自看輸出。但這個(gè)簡(jiǎn)單的評(píng)估可以幫我減輕一點(diǎn)負(fù)擔(dān),自動(dòng)跑一下,讓我不用每次都手動(dòng)去檢查。
然后會(huì)發(fā)生什么呢?就像我們寫論文一樣,一開始只是搭一個(gè)非常簡(jiǎn)陋、明顯有缺陷的評(píng)估系統(tǒng)。但等你有了初版,你會(huì)想“其實(shí)我可以改進(jìn)它”,然后就開始迭代優(yōu)化。
很多時(shí)候我就是從一些糟糕透頂、幾乎沒(méi)什么幫助的評(píng)估開始做起的。然后隨著你查看它的輸出,你會(huì)發(fā)現(xiàn)“這個(gè)評(píng)估系統(tǒng)是壞的,但我可以修好它”,就慢慢讓它變得更好。
另一個(gè)我想提的點(diǎn)是,雖然大家也討論得挺多,但我覺(jué)得還遠(yuǎn)遠(yuǎn)被低估的,是 Voice stack(語(yǔ)音技術(shù)棧)。這是我非常感興趣的領(lǐng)域,我身邊很多朋友也很看好語(yǔ)音應(yīng)用。我們也看到不少大型企業(yè)對(duì)語(yǔ)音技術(shù)極其感興趣,而且是規(guī)模很大的企業(yè)、使用場(chǎng)景也很大。
雖然這個(gè)社區(qū)里也有一些開發(fā)者在做語(yǔ)音,但開發(fā)者的關(guān)注度相比這些企業(yè)的關(guān)注度還是小得多。而且我們說(shuō)的也不僅僅是實(shí)時(shí)語(yǔ)音 API,也不只是 Speech-to-text 那類原生音頻模型——因?yàn)槟欠N模型往往很難控制。我更喜歡一種基于 Agentic 工作流的語(yǔ)音技術(shù)棧,它更容易控制。我最近在和很多團(tuán)隊(duì)一起做語(yǔ)音棧相關(guān)的項(xiàng)目,有些希望很快能對(duì)外公布。
還有一個(gè)可能不算“被低估”,但我認(rèn)為更多企業(yè)應(yīng)該去做的事情是——讓開發(fā)者使用 AI 輔助編程。
很多人應(yīng)該都見過(guò),使用 AI 輔助的開發(fā)者效率遠(yuǎn)遠(yuǎn)高于不使用的開發(fā)者。但我還是看到很多公司,尤其是 CIO、CTO 們,還制定了一些政策,不允許工程師用 AI 編程工具。我知道有時(shí)也許是出于合理原因,但我覺(jué)得我們需要盡快突破這個(gè)限制。坦白講,我和我的團(tuán)隊(duì),已經(jīng)完全無(wú)法想象在沒(méi)有 AI 幫助的情況下寫代碼了。但現(xiàn)在還有很多企業(yè)需要接受和適應(yīng)這一點(diǎn)。
還有一個(gè)被低估的觀點(diǎn)是,我覺(jué)得“每個(gè)人都應(yīng)該學(xué)一點(diǎn)編程”。
我們 AI Fund 的一個(gè)有趣事實(shí)是:我們公司每個(gè)人都會(huì)寫代碼,包括前臺(tái)接待、CFO、法務(wù)總顧問(wèn)……所有人都會(huì)寫。不是說(shuō)我希望他們成為軟件工程師,但在自己的崗位上,他們通過(guò)學(xué)一點(diǎn)點(diǎn)代碼,能夠更清晰地告訴計(jì)算機(jī)他們想做什么。這帶來(lái)了各個(gè)非工程崗位的顯著生產(chǎn)力提升,這個(gè)現(xiàn)象我也覺(jué)得挺令人激動(dòng)。
03 語(yǔ)音交互關(guān)鍵是對(duì)“延遲”的要求
Harrison Chase:如果現(xiàn)在有人想進(jìn)入語(yǔ)音這個(gè)方向,而他們之前已經(jīng)熟悉了用 LLM 構(gòu)建 Agent,那你覺(jué)得他們的知識(shí)遷移性有多強(qiáng)?有哪些是相通的?又有哪些是全新的需要學(xué)習(xí)的?
吳恩達(dá):我覺(jué)得有很多場(chǎng)景語(yǔ)音其實(shí)是非常關(guān)鍵的,它帶來(lái)了某些新的交互方式。
從應(yīng)用層面看,文本輸入其實(shí)是一個(gè)“令人畏懼”的交互方式。你去跟用戶說(shuō),“告訴我你的想法,這是一個(gè)輸入框,寫點(diǎn)文字吧”,很多人會(huì)覺(jué)得壓力很大。而且文字輸入還能退格,用戶回復(fù)速度就更慢。
但語(yǔ)音就不一樣了:時(shí)間是往前推進(jìn)的,你說(shuō)了就說(shuō)了,也可以臨時(shí)改變主意,比如說(shuō)“我改主意了,忘了我前面說(shuō)的”,模型其實(shí)處理這些的效果還不錯(cuò)。所以很多時(shí)候,語(yǔ)音可以降低用戶使用門檻。我們說(shuō)“說(shuō)說(shuō)你的想法”,用戶就自然地開口了。
語(yǔ)音系統(tǒng)和文本系統(tǒng)最大的區(qū)別在于對(duì)“延遲”的要求。如果用戶說(shuō)話了,系統(tǒng)理想中需要在一秒內(nèi)做出回應(yīng)(最好是 500 毫秒以內(nèi),但至少不能超過(guò)一秒),但傳統(tǒng) Agentic 工作流可能需要幾秒鐘甚至更久的處理時(shí)間。比如我們?cè)谧鲆粋€(gè)“我的虛擬分身”項(xiàng)目,你可以在網(wǎng)頁(yè)上和自己的虛擬形象對(duì)話。我們最初版本有 5~9 秒的延遲——你說(shuō)完話,沉默九秒鐘,然后分身才回答,這是非常糟糕的體驗(yàn)。
后來(lái)我們做了一些“預(yù)回應(yīng)”的設(shè)計(jì)。比如你問(wèn)我一個(gè)問(wèn)題,我可能會(huì)先說(shuō):“嗯,這是個(gè)有意思的問(wèn)題”或者“讓我想想”。我們就讓模型去做類似這樣的回應(yīng),用來(lái)掩蓋延遲,這招效果很好。
還有一些其他小技巧,比如說(shuō),如果你做的是語(yǔ)音客服機(jī)器人,在等待期間播放背景音,而不是完全的靜音,用戶就會(huì)更容易接受系統(tǒng)的“遲鈍”。
而且在很多應(yīng)用中,語(yǔ)音讓用戶更容易進(jìn)入狀態(tài),降低了“自我審查”的門檻。人們說(shuō)話的時(shí)候,不會(huì)像寫字那樣追求完美。他們可以隨便說(shuō)說(shuō),改口、反復(fù)、自由表達(dá)——這讓我們更容易從他們那里獲取有用信息,也能更好地幫助他們推進(jìn)任務(wù)。
04 如果說(shuō) MCP 還早期,那 Agent 通信就更早期了
Harrison Chase:你認(rèn)為 MCP 在應(yīng)用構(gòu)建方式、類型上,帶來(lái)了哪些變化?你怎么看它對(duì)整個(gè)生態(tài)的影響?
吳恩達(dá):我覺(jué)得 MCP 非常令人興奮。
我個(gè)人非常喜歡 MCP,它補(bǔ)上了一個(gè)明顯的市場(chǎng)空缺,而 OpenAI 的快速跟進(jìn)也說(shuō)明了這個(gè)標(biāo)準(zhǔn)的重要性。我覺(jué)得 MCP 標(biāo)準(zhǔn)未來(lái)還會(huì)不斷演進(jìn),目前它主要讓 Agent 更容易接入各種數(shù)據(jù),但其實(shí)不只是 Agent,很多其他軟件也可以受益。
我們?cè)谟?LLM 的時(shí)候,尤其在構(gòu)建應(yīng)用時(shí),往往會(huì)花很多時(shí)間在構(gòu)建 Pipeline 上——也就是各種數(shù)據(jù)接入工作上。尤其是在大企業(yè)環(huán)境下,AI 模型其實(shí)已經(jīng)很聰明了,只要給它正確的上下文,它就能做出合理的事情。
但我們往往要花大量時(shí)間處理接入工作,搞清楚怎么把數(shù)據(jù)喂給模型,才能讓它輸出你想要的東西。MCP 正是在這方面起到了很大的標(biāo)準(zhǔn)化作用,它讓工具、API、數(shù)據(jù)源之間的集成變得更容易。
當(dāng)然,現(xiàn)在 MCP 還是有些“蠻荒”。你在網(wǎng)上能找到很多 MCP 服務(wù)端,但很多其實(shí)跑不起來(lái)。身份驗(yàn)證系統(tǒng)也很混亂,就算是一些大公司,MCP 服務(wù)也存在 token 是否有效、是否過(guò)期等問(wèn)題。
此外,我覺(jué)得 MCP 協(xié)議本身也還很早期?,F(xiàn)在的 MCP 會(huì)返回一個(gè)很長(zhǎng)的資源列表,未來(lái)我們可能需要某種分層發(fā)現(xiàn)(hierarchical discovery)機(jī)制。比如你要構(gòu)建一個(gè)系統(tǒng)——我不知道將來(lái)會(huì)不會(huì)有 LangGraph 的 MCP 接口——但像 LangGraph 這樣的系統(tǒng),有成百上千個(gè) API 調(diào)用,你總不能把所有調(diào)用都塞進(jìn)一個(gè)扁平列表里讓 Agent 去自己篩選。
所以我們可能需要一種層級(jí)式的資源發(fā)現(xiàn)機(jī)制。我覺(jué)得 MCP 是個(gè)非常棒的第一步。我非常鼓勵(lì)大家去了解它,它可能真的會(huì)讓你的開發(fā)更輕松,尤其是如果你能找到一個(gè)穩(wěn)定好用的 MCP 服務(wù)端實(shí)現(xiàn)來(lái)幫你做數(shù)據(jù)整合的話。
我也認(rèn)為,從長(zhǎng)遠(yuǎn)看這點(diǎn)非常重要——如果你有 n 個(gè)模型或 Agent,要接入 m 個(gè)數(shù)據(jù)源,那你不該為了每一個(gè)組合都單獨(dú)寫接入邏輯,工作量不應(yīng)該是 n × m,而應(yīng)該是 n + m。而我覺(jué)得 MCP 就是朝著這個(gè)方向邁出的非常棒的第一步。它還需要繼續(xù)演化,但的確是個(gè)好起點(diǎn)。
Harrison Chase:還有另一種協(xié)議,雖然不像 MCP 那么熱,但也值得關(guān)注,就是 Agent 與 Agent 之間的通信。那么你怎么看 Agent 與 Agent 通信的發(fā)展?
吳恩達(dá):現(xiàn)在的 Agent 通信依然非常早期。我們大多數(shù)人,包括我自己,在讓自己的代碼正常運(yùn)行這件事上都還在掙扎。所以要讓我的 Agent 和另一個(gè)人的 Agent 正常協(xié)作,就像是實(shí)現(xiàn)了兩個(gè)奇跡。
目前我看到的情況是:一個(gè)團(tuán)隊(duì)內(nèi)部自己構(gòu)建的多 Agent 系統(tǒng),是可以運(yùn)轉(zhuǎn)起來(lái)的。因?yàn)榇蠹叶荚谕粋€(gè)團(tuán)隊(duì),知道協(xié)議、約定、接口是什么,也知道怎么打配合——這樣就能跑起來(lái)。但要讓一個(gè)團(tuán)隊(duì)構(gòu)建的 Agent 能和另一個(gè)完全不同團(tuán)隊(duì)的 Agent 協(xié)同,現(xiàn)在來(lái)看,還太早。 我相信我們終究會(huì)實(shí)現(xiàn)這一點(diǎn),但就我自己目前觀察到的,還沒(méi)有看到太多真正成功、規(guī)模化運(yùn)行的案例。不知道你們是不是有類似的觀察?
Harrison Chase:沒(méi)錯(cuò),我同意你的看法。如果說(shuō) MCP 還早期,那 Agent 間通信就更早期了。
05 用“vibe coding”編程累死我了
Harrison Chase:你怎么看待 vibe coding(氛圍編程)?它和傳統(tǒng)編程相比是否是一種新的技能?它在當(dāng)今世界中起到什么作用?
吳恩達(dá):我覺(jué)得我們很多人現(xiàn)在編程的時(shí)候幾乎不再看代碼了,這其實(shí)是一種非常棒的進(jìn)展。不過(guò)我覺(jué)得“vibe coding”這個(gè)名字挺不幸的,因?yàn)樗鼤?huì)讓很多人誤解,以為這件事只是“靠感覺(jué)”——比如這個(gè)建議我接受,那個(gè)我拒絕,僅憑直覺(jué)判斷。
但說(shuō)實(shí)話,當(dāng)我花一天時(shí)間用這種“vibe coding”方式,也就是借助 AI 編碼助手工作后,我通常會(huì)感到非常疲憊。這其實(shí)是一種非常需要智力投入的活動(dòng)。所以我認(rèn)為雖然這個(gè)名字不好,但這個(gè)現(xiàn)象是真實(shí)存在的,而且它的確在發(fā)展,而且是件好事。
過(guò)去一年里,有一些人在建議別人“不要學(xué)編程”,理由是 AI 會(huì)自動(dòng)幫你寫代碼。我認(rèn)為未來(lái)回頭看這將會(huì)是史上最糟糕的職業(yè)建議之一。如果你回顧過(guò)去幾十年的編程發(fā)展歷史,每一次編程門檻降低,都會(huì)讓更多人開始學(xué)習(xí)編程。比如從穿孔卡片轉(zhuǎn)向鍵盤和終端,或者從匯編語(yǔ)言過(guò)渡到 COBOL,我甚至找到了一些非常古老的文章,當(dāng)時(shí)就有人聲稱,“我們有了 COBOL,就不再需要程序員了”。
但事實(shí)是,每次編程變得更簡(jiǎn)單,學(xué)習(xí)編程的人反而變多了。
所以我認(rèn)為,AI 編碼助手也將推動(dòng)更多人學(xué)習(xí)編程。而且,未來(lái)最重要的技能之一,無(wú)論是對(duì)開發(fā)者還是非開發(fā)者來(lái)說(shuō),都是“清晰準(zhǔn)確地告訴計(jì)算機(jī)你想做什么,讓它替你完成”這件事。
想要做到這一點(diǎn),了解一些計(jì)算機(jī)的基本工作原理其實(shí)非常有幫助。我知道你們?cè)谧暮芏嗳艘呀?jīng)理解了這一點(diǎn)。但這也是我為什么一直建議大家至少學(xué)會(huì)一門編程語(yǔ)言,比如 Python。
也許你們有人知道,我自己是一個(gè) Python 能力比 JavaScript 更強(qiáng)的人。但在使用 AI 編程助手之后,我寫了比以往更多的 JavaScript 和 TypeScript 代碼。即使是調(diào)試那些 AI 幫我生成、而不是我親手寫的 JavaScript 代碼時(shí),理解其中的錯(cuò)誤類型和含義,對(duì)我來(lái)說(shuō)仍然非常重要,幫助我去修復(fù)它們。
本文由人人都是產(chǎn)品經(jīng)理作者【特工宇宙】,微信公眾號(hào):【特工宇宙】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!