MCP+A2A引爆Agent生態(tài)?
探索MCP與A2A協(xié)議如何共同塑造Agent生態(tài)的未來,本文深入分析了這兩種技術(shù)如何使AI智能體從單一工具演變?yōu)槟軌蚩鐝S商協(xié)作的“同事”,并預(yù)示著軟件工程領(lǐng)域的一場新變革。
還沒來得及消化MCP(《5000字詳解科技圈爆火的MCP》)帶來的沖擊,谷歌又放出了更震撼的技術(shù)拼圖。昨天Agent-to-Agent協(xié)議(A2A)宣布開源,這項讓不同AI智能體實現(xiàn)「跨廠商組隊」的技術(shù),與MCP可以互補協(xié)同,滿足大家對Agent的究極想象。
至此,AI不再只是執(zhí)行命令的「工具人」——它們開始像真正的同事般組建項目組:財務(wù)Agent自動聯(lián)動法務(wù)Agent審核合同,營銷Agent實時協(xié)調(diào)設(shè)計Agent迭代方案,底層MCP服務(wù)則如同專業(yè)工具箱被精準(zhǔn)調(diào)用……
更重要的是,這會不會開啟任務(wù)委托給智能而非軟件的變化?
一、A2A :會“加微信”的智能體
A2A通過一套標(biāo)準(zhǔn)協(xié)議讓不同出身(研發(fā)公司)和背景(技術(shù)框架)的Agent能互相溝通、協(xié)作,共同完成復(fù)雜任務(wù),從“工具”進化成“同事”。
不同的Agent之間怎么干活呢?這里還涉及到Agent之間的身份區(qū)別。Clien Agent和 Remote Agent。終端用戶只面對Clien Agent,剩下的活,Clien Agent會找擅長各個技能的Remote Agent完成。就像甲方發(fā)標(biāo)給總集成,總集成招募每個模塊的分包服務(wù)商一起做個大項目。
具體而言,A2A通過4大機制和模塊設(shè)計保障不同Agent一起和諧的干活。
能力發(fā)現(xiàn):技能說明書
Agent Card。該協(xié)議通過能力發(fā)現(xiàn)機制實現(xiàn)代理間的智能匹配,每個代理均可通過JSON格式的“Agent Card”公開自身技能,例如“財務(wù)數(shù)據(jù)分析”“物流時效預(yù)測”或“多模態(tài)內(nèi)容生成”,如同數(shù)字名片般展示其擅長的任務(wù)類型、接口地址和權(quán)限要求。
在A2A協(xié)議下, 每個Agent都會生成一張“能力說明書”,用JSON格式寫成,里面寫著它能做什么、擅長什么。比如:
- “我叫財務(wù)助手,能處理稅務(wù)問題,支持文本和表格輸入,需要API密鑰認證。”
- “我叫設(shè)計師助手,能生成圖片和視頻,支持用戶上傳素材?!?/li>
當(dāng)你問自己的Agent一個復(fù)雜問題,比如“幫我找適合的房源并裝修設(shè)計”,Agent會查看其他Agent的“代理卡”,找到擅長找房源的“房產(chǎn)助手”和擅長設(shè)計的“裝修助手”,然后聯(lián)系它們。//任務(wù)管理:件件有著落,事事有回響
任務(wù)管理模塊是A2A區(qū)別于傳統(tǒng)API的核心創(chuàng)新。協(xié)議將“任務(wù)”定義為具有完整生命周期的對象,從創(chuàng)建、執(zhí)行到終結(jié)均納入統(tǒng)一管理框架。
具體包含兩個部分:
1)任務(wù)生命周期。每個任務(wù)都有從“創(chuàng)建”到“完成”的階段,比如:
(1)即時任務(wù):比如問“今天天氣如何?”,遠程Agent立刻返回結(jié)果。
(2)長期任務(wù):比如“幫我分析季度財報”,可能需要幾個小時,期間會不斷同步進度:
- “數(shù)據(jù)已加載,正在計算……”
- “圖表生成完成,需要人工審核?!?/li>
- “任務(wù)完成,生成報告附件。”
2)工件(Artifact)。任務(wù)完成后產(chǎn)生的結(jié)果,可能是文本、圖片、表格等。比如分析財報后生成的PDF報告。就像你在公司發(fā)起一個項目,項目經(jīng)理(客戶端Agent)分配任務(wù)給各部門(遠程Agent),實時跟蹤進度,最后匯總成果。//協(xié)作:Agent之間互相“發(fā)微信”
Agent之間先互相認識,加個好友。當(dāng)要一起干活的時候,agent之間可以互相“發(fā)微信”商討怎么干活。Agent之間可以傳遞:
- 上下文:比如“用戶需要的房源在市中心,預(yù)算200萬”。
- 中間結(jié)果:比如“房產(chǎn)助手找到了5套房,已標(biāo)注在地圖上”。
- 指令:比如“請根據(jù)用戶喜好調(diào)整裝修風(fēng)格為現(xiàn)代簡約”。
就像團隊開會時,項目經(jīng)理(客戶端Agent)協(xié)調(diào)設(shè)計師、程序員等(遠程Agent),大家互相傳遞信息,共同完成項目。//用戶體驗協(xié)商:自動“適配”你的設(shè)備和需求
Agent之間傳遞的消息,允許客戶端和遠程代理協(xié)商所需的正確格式協(xié)商。假設(shè)消息是一個“智能快遞箱”:每個箱子里裝著不同類型的包裹(文字、圖片、視頻等),并且貼了明確的標(biāo)簽(比如“4K視頻包裹”“醫(yī)療CT掃描件”)。當(dāng)快遞員(遠程代理)送貨時,會和收件人(客戶端代理)商量:“您家門口的智能快遞柜有高清屏幕嗎?我?guī)У倪@個3D模型包裹需要AR眼鏡才能拆封,如果沒有我就轉(zhuǎn)換成2D平面圖”。
這種對話機制讓雙方能根據(jù)用戶設(shè)備自動調(diào)整內(nèi)容,比如:
- 如果用戶用手機訪問,可能優(yōu)先顯示簡潔的圖文;
- 如果用電腦,可以展示復(fù)雜的表格或視頻。
- 如果用戶設(shè)備支持iframe(嵌入網(wǎng)頁),就用它展示動態(tài)內(nèi)容,否則換成靜態(tài)圖片。
就像你點外賣,App會根據(jù)你的手機屏幕自動調(diào)整圖片大小,或根據(jù)你的偏好推薦“少辣”選項。
整體的運轉(zhuǎn)邏輯,谷歌還在官網(wǎng)放出了一個通過 A2A 協(xié)作,招聘軟件工程師的案例。
在 Agentspace 這樣的統(tǒng)一界面中,用戶(例如招聘經(jīng)理)可以委托其代理尋找符合職位列表、工作地點和技能要求的候選人。然后,代理會與其他專業(yè)代理互動,以尋找潛在候選人。用戶收到這些建議后,可以指示其代理安排進一步的面試,從而簡化候選人尋找流程。面試流程完成后,可以聯(lián)系另一位代理協(xié)助進行背景調(diào)查。
目前有50多家企業(yè)都支持了A2A,都是各個領(lǐng)域如雷貫耳的存在。不過OpenAI和Anthropic不在其中。
二、A2A+MCP
縱橫交錯構(gòu)成完整Agent生態(tài)不可避免地會將A2A與MCP聯(lián)想,兩者是競爭替代還是不同的技術(shù)路徑?谷歌自己回答是互補,“智能體應(yīng)用需要 A2A 和 MCP。我們建議工具使用 MCP,代理使用 A2A”。
事實上,兩者的確各有側(cè)重。如果解決一個問題需要一個團隊,MCP解決的是縱向上的單個Agent知識深度和工具豐富度,提升員工能力上限;A2A解決的是橫向上多Agent協(xié)同辦公,讓不同工種協(xié)同作戰(zhàn)。
可以說MCP是賦予智能體“生存技能”,A2A則是教會它們“社會化生存”。兩者交叉,極大程度上完整了大家對Agent運轉(zhuǎn)邏輯的想象,不少人甚至把今年稱為Agent的元年。
具體來看??
MCP的核心價值在于消除工具使用的認知壁壘 。傳統(tǒng)AI系統(tǒng)需要開發(fā)者明確告知“遇到Excel文件時調(diào)用表格處理函數(shù)”,而MCP讓智能體通過圖標(biāo)、界面布局等上下文信息自主關(guān)聯(lián)工具——就像人類看到螺絲刀自然聯(lián)想到擰螺絲。這種能力使得單個智能體能夠快速適應(yīng)新環(huán)境,例如在從未接觸過的企業(yè)系統(tǒng)中,依然能通過觀察界面元素推測出“提交按鈕”的功能。
而A2A的突破在于構(gòu)建智能體間的協(xié)作網(wǎng)絡(luò) 。它不關(guān)心單個智能體如何完成任務(wù),而是定義了一套群體協(xié)作的規(guī)則:如何發(fā)現(xiàn)隊友、如何分配任務(wù)、如何同步進度。這類似于人類職場中的分工體系——設(shè)計師不需要懂代碼,只需向工程師說明需求;法務(wù)專員不必理解算法,但能快速審核合同條款。當(dāng)MCP讓每個智能體成為“多面手”,A2A則讓它們學(xué)會在群體中找準(zhǔn)定位,通過互補形成超個體能力。
不過。這里產(chǎn)生一個問題——為什么不能一個Agent調(diào)用所有server?就像把所有人的技能都加在一個人身上一樣?
試圖讓單一Agent直接調(diào)用海量MCP服務(wù)是不現(xiàn)實。如同要求一名工程師同時精通芯片設(shè)計、建筑力學(xué)和分子生物學(xué)——看似全能實則低效臃腫。A2A通過引入專業(yè)Agent層實現(xiàn)能力解耦:每個專業(yè)Agent如同垂直領(lǐng)域的“技能膠囊”,封裝特定領(lǐng)域的MCP調(diào)用邏輯(如稅務(wù)計算Agent內(nèi)置全球稅法數(shù)據(jù)庫接口)。
當(dāng)用戶需要跨國財報分析時,綜合Agent只需向“財務(wù)專家Agent”發(fā)起請求,后者自動調(diào)度底層的匯率轉(zhuǎn)換、稅法解析等MCP服務(wù),最終返回精煉結(jié)論。這種分層設(shè)計既避免了綜合Agent陷入API調(diào)用的泥潭,又讓專業(yè)Agent能持續(xù)優(yōu)化垂直場景的效能(如緩存高頻數(shù)據(jù)、預(yù)加載行業(yè)模型),本質(zhì)上是用軟件工程的模塊化思維,將“萬物互聯(lián)”的愿景轉(zhuǎn)化為可落地的協(xié)作拼圖。
但兩者之間有交叉的地帶,A2A 和 MCP 在一起采用的時候,Remote Agent 同時扮演還MCP 的 Host/Client,如果把所有的 Agent 都當(dāng)做是 MCP 的 Host/Client,是否MCP一種協(xié)議也能完成所有的協(xié)同?
對于相對簡單的任務(wù)的確如此,但谷歌在官網(wǎng)中也有介紹,A2A更擅長長期復(fù)雜任務(wù),沒個兩三天搞不定的那種,這種就依賴于Agent之間的相互通信。
API:別爭了,我覺得你倆都是我的子集
三、當(dāng)軟件“活”過來:從工具到同事
MCP+A2A的意義遠不止于此。以一家跨國電商為例,當(dāng)銷售部門的智能體發(fā)現(xiàn)某個爆款商品庫存告急時,它能通過A2A自動調(diào)用倉儲系統(tǒng)的物流智能體計算補貨周期,同時聯(lián)動人力資源智能體調(diào)整客服排班。整個過程無需預(yù)先設(shè)計接口,而是基于動態(tài)的任務(wù)協(xié)商。
這本質(zhì)上帶來的想象是,A2A與MCP的疊加效應(yīng),或許引發(fā)整個軟件工程的體系化變革——功能不僅僅是調(diào)用,現(xiàn)在需要協(xié)商——任務(wù)委托給智能而非軟件。
在傳統(tǒng)開發(fā)中,功能實現(xiàn)依賴預(yù)先編寫的邏輯鏈條——如果用戶點擊A,則觸發(fā)B,再跳轉(zhuǎn)到C。但智能體生態(tài)下,軟件的行為由實時協(xié)商決定。以客服系統(tǒng)為例,當(dāng)用戶抱怨物流延遲時,智能體可能自主組合“情感分析→運單追蹤→賠償政策查詢→工單生成”的流程,甚至調(diào)用外部法律顧問智能體評估風(fēng)險。這種動態(tài)工作流的背后,是MCP提供的工具泛化能力與A2A支持的資源調(diào)度能力的深度融合。
這種轉(zhuǎn)變對開發(fā)者提出了全新要求。過去我們編寫代碼,現(xiàn)在我們需要定義智能體的能力邊界與協(xié)作規(guī)則 。例如物流智能體只需聲明“我能預(yù)測運輸時效(誤差率<3%)”,而無需暴露路徑優(yōu)化算法;設(shè)計智能體可以公開“支持3D建模渲染”,但隱藏GPU資源占用的細節(jié)。這類似于人類社會的專業(yè)分工——我們不需要知道廚師如何控制火候,只需相信他能端出美味菜肴。
這不僅是技術(shù)的迭代,更是認知的升級。開發(fā)者需要學(xué)會像“團隊管理者”一樣思考——不是事無巨細地控制每一步操作,而是設(shè)定目標(biāo)、建立規(guī)則、培育協(xié)作文化。未來的軟件系統(tǒng)或許不再有“最終版本”,而是像生物體一樣持續(xù)進化。當(dāng)某天,你的智能體同事主動建議優(yōu)化代碼架構(gòu)時,請不要驚訝——那只是這個新時代的日常。
當(dāng)然,狀態(tài)管理、推理開銷導(dǎo)致的資源消耗以及授權(quán)和可審計性等等復(fù)雜問題,都要重新看待了。
不過,這能阻擋一個完美Agent生態(tài)建成嗎?
本文由人人都是產(chǎn)品經(jīng)理作者【鵝廠技術(shù)派】,微信公眾號:【鵝廠技術(shù)派】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
感覺到了,MCP與A2A協(xié)議結(jié)合,使AI從工具進化為協(xié)作“同事”,推動軟件工程變革,未來Agent生態(tài)令人期待。