AI Agent 是人類生產(chǎn)關系的一次巨變
AI Agent不僅僅是對現(xiàn)有技術的升級;它們代表了一種組織運作、競爭和創(chuàng)新方式的轉變。
谷歌發(fā)布的一份名為《Agent》的白皮書,展望了人工智能在商業(yè)中扮演更加積極和獨立的角色的未來。這份42頁的文件在9月發(fā)布時并未引起太大轟動,但如今在X.com(前身為推特)和LinkedIn上引起了廣泛關注。
這份報告提出了“AI Agent”的概念,一種超越現(xiàn)有AI模型的軟件系統(tǒng),能夠進行推理、規(guī)劃并采取行動,以實現(xiàn)特定目標。與傳統(tǒng)的AI系統(tǒng)不同,后者僅根據(jù)預先存在的訓練數(shù)據(jù)生成響應,AI Agent可以與外部系統(tǒng)互動,做出決策,并獨立完成復雜任務。
白皮書解釋道:“Agent是自主的,可以在沒有人類干預的情況下獨立行動?!彼鼈儽幻枋鰹榻Y合了推理、邏輯和實時數(shù)據(jù)訪問的系統(tǒng)。AI Agent的背后理念十分雄心勃勃:它們可以幫助企業(yè)自動化任務、解決問題,并做出曾經(jīng)完全由人類處理的決策。
白皮書的作者——朱莉亞·維辛格(Julia Wiesinger)、帕特里克·馬洛(Patrick Marlow)和弗拉基米爾·武斯科維奇(Vladimir Vuskovic),詳細闡述了AI Agent如何運作以及它們所需的功能。
然而,更廣泛的影響同樣重要。AI Agent不僅僅是對現(xiàn)有技術的升級;它們代表了一種組織運作、競爭和創(chuàng)新方式的轉變。那些采納這些系統(tǒng)的企業(yè)可能會在效率和生產(chǎn)力上獲得巨大的提升,而那些猶豫不決的企業(yè)則可能發(fā)現(xiàn)自己在競爭中逐漸落后。
以下是谷歌白皮書中的五大關鍵見解,以及它們對未來商業(yè)中AI應用的潛在影響。
一、AI Agent不僅僅是更聰明的模型
谷歌認為,AI Agent代表了對傳統(tǒng)語言模型的根本性突破。像GPT-4和谷歌的Gemini這樣的模型,在生成單輪響應方面表現(xiàn)優(yōu)異,但它們僅限于從訓練數(shù)據(jù)中學習到的內(nèi)容。相比之下,AI Agent設計的初衷是與外部系統(tǒng)互動,基于實時數(shù)據(jù)進行學習,并執(zhí)行多步驟任務。
白皮書指出:“傳統(tǒng)模型中的知識僅限于它們訓練數(shù)據(jù)中已有的內(nèi)容。AI Agent通過與外部系統(tǒng)的連接擴展了這些知識?!?/p>
這種差異不僅僅是理論上的。設想一個傳統(tǒng)的語言模型被要求推薦旅游行程。它可能會基于一般知識提出一些建議,但缺乏預訂機票、檢查酒店可用性或根據(jù)用戶反饋調(diào)整建議的能力。然而,AI Agent則能做到這一切,它可以結合實時信息并做出自主決策。
這一轉變使AI Agent成為一種新的數(shù)字工作者,能夠處理復雜的工作流。對于企業(yè)來說,這意味著能夠自動化那些曾經(jīng)需要多個人力角色來完成的任務。通過整合推理與執(zhí)行,AI Agent可能成為從物流到客戶服務等多個行業(yè)中不可或缺的工具。
人工智能Agent如何使用擴展訪問外部API以執(zhí)行任務的細分。(圖片來源:谷歌)
二、認知架構驅(qū)動它們的決策過程
AI Agent能力的核心是其認知架構,谷歌將其描述為一個用于推理、規(guī)劃和決策的框架。這一架構被稱為協(xié)調(diào)層,使Agent能夠以循環(huán)的方式處理信息,結合新數(shù)據(jù)來優(yōu)化其行動和決策。
谷歌將這一過程比作一位大廚在繁忙廚房中的工作。大廚會收集食材,考慮顧客的口味需求,并根據(jù)反饋或食材的可用性調(diào)整食譜。類似地,AI Agent會收集數(shù)據(jù),推理下一步行動,并根據(jù)目標調(diào)整自己的行為。
協(xié)調(diào)層依賴于先進的推理技術來引導決策過程。諸如推理與行動(ReAct)、思維鏈(CoT)和思維樹(ToT)等框架,為拆解復雜任務提供了結構化的方法。例如,ReAct允許Agent在實時中結合推理和行動,而ToT則使Agent能夠同時探索多個可能的解決方案。
這些技術賦予Agent不僅僅是反應性的決策能力,還能做出積極主動的決策。白皮書指出,這使得AI Agent具有高度的適應性,能夠以傳統(tǒng)模型無法做到的方式應對不確定性和復雜性。對于企業(yè)來說,這意味著AI Agent可以承擔一些任務,例如故障排除供應鏈問題或分析財務數(shù)據(jù),且在較少人工監(jiān)督的情況下實現(xiàn)高度的自主性。
AI Agent決策過程的流程,從用戶輸入到工具執(zhí)行和最終響應。(圖片來源:谷歌)
三、工具拓展了Agent的能力,超越了訓練數(shù)據(jù)的限制
傳統(tǒng)的AI模型常被描述為“靜態(tài)知識庫”,僅限于其訓練數(shù)據(jù)所涵蓋的內(nèi)容。而AI Agent則不同,它們能夠通過工具訪問實時信息,并與外部系統(tǒng)進行互動。這一能力使得它們在現(xiàn)實應用中具有實際價值。
白皮書解釋道:“工具彌合了Agent內(nèi)部能力與外部世界之間的差距?!边@些工具包括API、擴展程序和數(shù)據(jù)存儲,它們使Agent能夠獲取信息、執(zhí)行操作,并檢索隨著時間變化的知識。
例如,一位負責規(guī)劃商務旅行的Agent可以通過API擴展程序檢查航班時刻表,通過數(shù)據(jù)存儲檢索旅行政策,或者使用地圖工具查找附近的酒店。AI Agent能夠動態(tài)與外部系統(tǒng)互動,這使得它們不再是靜態(tài)的響應者,而是商業(yè)流程中的活躍參與者。
谷歌還強調(diào)了這些工具的靈活性。例如,函數(shù)允許開發(fā)者將某些任務卸載到客戶端系統(tǒng),企業(yè)因此能更好地控制Agent如何訪問敏感數(shù)據(jù)或執(zhí)行特定操作。這種靈活性對于金融、醫(yī)療等行業(yè)至關重要,因為這些行業(yè)對合規(guī)性和安全性有嚴格的要求。
代理端和客戶端控制的比較,說明人工智能Agent如何與Google Flights API等外部工具交互。(圖片來源:谷歌)
四、檢索增強生成(RAG),讓Agent變得更智能
AI Agent設計中的一項最具前景的進展是檢索增強生成(RAG)的整合。這項技術使Agent能夠在其訓練數(shù)據(jù)不足時,查詢外部數(shù)據(jù)源——如向量數(shù)據(jù)庫或結構化文檔。
白皮書解釋道:“數(shù)據(jù)存儲通過提供訪問更動態(tài)和最新信息的途徑,解決了[靜態(tài)模型]的限制。”Agent可以實時檢索相關數(shù)據(jù),從而將其響應基于事實信息。
基于RAG的Agent在信息變化迅速的領域尤其有價值。例如,在金融行業(yè),Agent可以在做出投資建議之前拉取實時市場數(shù)據(jù)。在醫(yī)療領域,Agent則可以檢索最新的研究成果,來為診斷建議提供支持。
這一方法還解決了AI中一個長期存在的問題:幻覺(hallucinations),即生成不正確或虛假的信息。通過將響應建立在現(xiàn)實世界數(shù)據(jù)的基礎上,Agent能夠提高準確性和可靠性,從而更適用于那些高風險的應用場景。
檢索增強生成(RAG)如何使Agent能夠查詢向量數(shù)據(jù)庫并提供精確的上下文感知響應。(圖片來源:谷歌)
五、谷歌提供工具加速Agent部署
盡管這份白皮書充滿了技術細節(jié),但它同樣為希望實施AI Agent的企業(yè)提供了實用的指導。谷歌重點介紹了兩個關鍵平臺:LangChain,一個開源的Agent開發(fā)框架,以及Vertex AI,一個用于大規(guī)模部署Agent的托管平臺。
LangChain通過允許開發(fā)者將推理步驟和工具調(diào)用串聯(lián)在一起,簡化了構建Agent的過程。而Vertex AI則提供了測試、調(diào)試和性能評估等功能,使得部署生產(chǎn)級Agent變得更加容易。
白皮書指出:“Vertex AI使得開發(fā)者能夠?qū)W⒂跇嫿ê屯晟扑麄兊腁gent,而平臺本身則管理了基礎設施、部署和維護的復雜性?!?/p>
這些工具降低了那些想嘗試AI Agent但缺乏深入技術專長的企業(yè)的門檻。然而,它們也引發(fā)了關于廣泛采用Agent的長期后果的思考。隨著這些系統(tǒng)變得越來越強大,企業(yè)將需要考慮如何平衡效率提升與潛在風險,如對自動化的過度依賴或決策透明度方面的倫理問題。
推理循環(huán)、工具和API的集成,使AI Agent能夠處理旅行計劃或天氣檢查等復雜任務。(圖片來源:谷歌)
六、這意味著什么
谷歌關于AI Agent的白皮書呈現(xiàn)了一個詳細且雄心勃勃的AI發(fā)展藍圖。對于企業(yè)而言,信息非常明確:AI Agent不僅僅是一個理論概念,它們是能夠重塑企業(yè)運營方式的實際工具。
然而,這一轉型不會一蹴而就。部署AI Agent需要精心的規(guī)劃、實驗和重新思考傳統(tǒng)工作流程的勇氣。正如白皮書所指出的:“由于基礎模型的生成特性,沒有兩個Agent是完全相同的?!?/p>
目前,AI Agent既是一個機遇,也是一項挑戰(zhàn)。那些投資于理解和實施這一技術的企業(yè)將能夠獲得顯著的競爭優(yōu)勢。而那些選擇觀望的企業(yè),可能會在智能化、自動化系統(tǒng)日益主導一切的世界中,陷入追趕的困境。(Venture Beat)
本文由人人都是產(chǎn)品經(jīng)理作者【AI新智能】,微信公眾號:【AI新智能】,原創(chuàng)/授權 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評論,等你發(fā)揮!