硅基生命的思考——聊天機(jī)器人+AutoGLM是否可能成為AI落地的方向?

0 評(píng)論 670 瀏覽 1 收藏 14 分鐘

AI落地,不只是模型能力的堆疊,更是產(chǎn)品形態(tài)的重構(gòu)。本文以“聊天機(jī)器人+AutoGLM”為案例,拆解AI從工具到系統(tǒng)的躍遷邏輯,探討產(chǎn)品經(jīng)理如何在新一輪智能浪潮中找到真正的落地方向。

導(dǎo)語(yǔ):超越聊天,迎接“行動(dòng)AI”時(shí)代

昨天在抖音看到”第四種黑猩猩“的視頻,他將小智(聊天機(jī)器人)通過(guò)ai撰寫的mcp將Auto GLM連接在一起,實(shí)現(xiàn)了一句話就能夠下單咖啡,雖然付款依舊是需要上手操作。

我們正處在一個(gè)根本性的范式轉(zhuǎn)換之中,核心是從我們熟知的、被動(dòng)的“聊天機(jī)器人”式AI,邁向一個(gè)由主動(dòng)、自主的“AI智能體”(AI Agent)主導(dǎo)的新時(shí)代。這場(chǎng)變革的本質(zhì),是AI從“回答問(wèn)題”的工具,轉(zhuǎn)變?yōu)椤爸鲃?dòng)行動(dòng)”的伙伴。它不再僅僅是對(duì)話者,而是能自主執(zhí)行復(fù)雜任務(wù),以實(shí)現(xiàn)用戶目標(biāo)的“數(shù)字協(xié)作者”。

我們正從一個(gè)需要向計(jì)算機(jī)下達(dá)精確、逐步“指令”(Instruction)的世界,遷移到一個(gè)只需“委托”(Delegation)高層目標(biāo),并信任智能體自行規(guī)劃和執(zhí)行的世界。這堪比從“命令行界面”到“圖形用戶界面”(GUI)的飛躍,它將復(fù)雜的“如何做”抽象出來(lái),讓用戶能專注于“做什么”。這種賦能使用戶獲得了麥肯錫所說(shuō)的“超級(jí)代理能力”(Superagency)——以最小的努力實(shí)現(xiàn)復(fù)雜成果的能力。

文章將圍繞這一變革的兩個(gè)核心組件展開(kāi):

  1. “大腦”-智譜AI的AutoGLM:作為一個(gè)先進(jìn)的具體案例,它展示了現(xiàn)代AI智能體如何在手機(jī)、瀏覽器和個(gè)人電腦上執(zhí)行有形的任務(wù)。
  2. “神經(jīng)”-模型上下文協(xié)議(MCP):作為變革背后關(guān)鍵的“基礎(chǔ)設(shè)施”,它被譽(yù)為“AI領(lǐng)域的USB-C接口”,為不同智能體之間的通信和互操作提供了開(kāi)放標(biāo)準(zhǔn),是構(gòu)建統(tǒng)一、繁榮生態(tài)的基石。

第一節(jié):“大腦”在行動(dòng)——深入解析智譜AI的AutoGLM

AutoGLM的核心身份是“為通過(guò)圖形用戶界面(GUI)控制數(shù)字設(shè)備而設(shè)計(jì)的基礎(chǔ)智能體”。這意味著它的根本目標(biāo),就是像人類一樣“看懂”和“操作”我們的數(shù)字環(huán)境,覆蓋網(wǎng)頁(yè)瀏覽器、安卓手機(jī)和個(gè)人電腦。

核心能力:

  • 復(fù)雜任務(wù)執(zhí)行:它能夠理解并執(zhí)行包含多個(gè)步驟的“超長(zhǎng)指令”。例如,用戶僅需用自然語(yǔ)言下達(dá)指令,如“幫我預(yù)訂Megan’sKitchen餐廳三人位,時(shí)間是10月23日晚上7:30”,AutoGLM便能自主在網(wǎng)站上完成所有預(yù)訂步驟。
  • 跨應(yīng)用協(xié)同:它能夠在不同App間無(wú)縫切換以完成一個(gè)完整任務(wù)流。例如,在旅游App中規(guī)劃行程,在訂票App中購(gòu)買機(jī)票,最后在日歷App中創(chuàng)建提醒。
  • 多模態(tài)理解:其背后的大型多模態(tài)模型(LMM)能精準(zhǔn)理解GUI的視覺(jué)布局,識(shí)別按鈕和輸入框,從而克服了傳統(tǒng)自動(dòng)化工具的局限性。

為了應(yīng)對(duì)需要深度研究的更復(fù)雜任務(wù),智譜AI還推出了進(jìn)階形態(tài)——AutoGLM“沉思”(Rumination),它體現(xiàn)了“邊想邊干”的理念,集成了“深度研究”與“實(shí)際操作”的能力,能夠綜合多個(gè)數(shù)據(jù)源信息,完成撰寫萬(wàn)字研究報(bào)告等高難度任務(wù)。

架構(gòu)的精髓:規(guī)劃與執(zhí)行的分離

AutoGLM的成功不僅源自其強(qiáng)大的模型,更在于一個(gè)關(guān)鍵的架構(gòu)設(shè)計(jì):將高層次的“規(guī)劃”(Planning)與低層次的“執(zhí)行”(Grounding)分離。

  • 規(guī)劃器(Planner):負(fù)責(zé)將用戶模糊的請(qǐng)求(如“為我的家庭度假尋找航班”)分解為一系列邏輯子任務(wù)。
  • 執(zhí)行器(Executor):負(fù)責(zé)精確的GUI操作(如找到“搜索航班”按鈕的像素坐標(biāo)并模擬點(diǎn)擊)。

這種分離式設(shè)計(jì)允許對(duì)不同能力的模型進(jìn)行專項(xiàng)優(yōu)化,從而獲得比單一“萬(wàn)能”模型更高的成功率和可擴(kuò)展性。

性能與現(xiàn)實(shí)

數(shù)據(jù)顯示,AutoGLM在特定任務(wù)(如OpenTable預(yù)訂)中成功率高達(dá)96.2%,在中國(guó)主流手機(jī)App的日常任務(wù)測(cè)試中成功率為89.7%。這些數(shù)據(jù)在展示其強(qiáng)大能力的同時(shí),也揭示了在更泛化的場(chǎng)景中,其性能仍有顯著的提升空間。

第二節(jié):“數(shù)字握手”——MCP協(xié)議如何釋放智能體生態(tài)

AI智能體若要發(fā)揮最大潛力,就不能孤立存在。它們需要一個(gè)標(biāo)準(zhǔn)化的“通用語(yǔ)言”,這就是模型上下文協(xié)議(MCP)所扮演的角色。

MCP是由AI公司Anthropic發(fā)起并開(kāi)源的一個(gè)開(kāi)放標(biāo)準(zhǔn),為AI智能體與外部工具、數(shù)據(jù)源和服務(wù)之間的交互提供統(tǒng)一接口,被形象地稱為“AI應(yīng)用的USB-C接口”。它基于客戶端-服務(wù)器架構(gòu),采用JSON-RPC 2.0消息格式。

驚人的行業(yè)共識(shí)

自2024年底推出以來(lái),幾乎所有行業(yè)巨頭,包括Anthropic、OpenAI、谷歌和微軟等激烈競(jìng)爭(zhēng)的對(duì)手,都迅速表示支持并采用了該標(biāo)準(zhǔn)。這種跨公司的廣泛共識(shí),凸顯了MCP作為AI智能體時(shí)代基礎(chǔ)協(xié)議的重要性。

這一罕見(jiàn)的“競(jìng)合”行為,其內(nèi)在邏輯是:在AI智能體這個(gè)高速發(fā)展的新興市場(chǎng),沒(méi)有任何一家公司擁有絕對(duì)優(yōu)勢(shì)。此時(shí)發(fā)起一場(chǎng)“協(xié)議戰(zhàn)爭(zhēng)”將極大地抑制整個(gè)市場(chǎng)的增長(zhǎng)。因此,巨頭們選擇在基礎(chǔ)協(xié)議層合作,確保整個(gè)“蛋糕”能迅速做大,然后再憑借各自的優(yōu)勢(shì)(如模型質(zhì)量、服務(wù)價(jià)值)去爭(zhēng)奪屬于自己的份額。

安全性的重要說(shuō)明

盡管MCP在功能上至關(guān)重要,但它本身并未內(nèi)置安全模型,不包含標(biāo)準(zhǔn)的身份驗(yàn)證、授權(quán)或加密機(jī)制。這意味著,實(shí)現(xiàn)這些關(guān)鍵安全層的責(zé)任完全落在了開(kāi)發(fā)者身上。

第三節(jié):下一個(gè)前沿——經(jīng)濟(jì)與工作場(chǎng)所的生產(chǎn)力革命

AI智能體的崛起將對(duì)經(jīng)濟(jì)與社會(huì)產(chǎn)生深遠(yuǎn)影響。

量化經(jīng)濟(jì)影響

麥肯錫公司的研究報(bào)告預(yù)測(cè),作為生成式AI最活躍的應(yīng)用形式,AI智能體每年有望創(chuàng)造相當(dāng)于2.6萬(wàn)億至4.4萬(wàn)億美元的經(jīng)濟(jì)價(jià)值。約75%的價(jià)值高度集中在客戶運(yùn)營(yíng)、市場(chǎng)營(yíng)銷與銷售、軟件工程以及研發(fā)這四個(gè)領(lǐng)域。

工作模式的根本性轉(zhuǎn)變

麥肯錫估計(jì),當(dāng)前技術(shù)已有潛力將員工日常工作中**60%到70%**的活動(dòng)自動(dòng)化。這并不完全意味著崗位流失,而是一場(chǎng)深刻的工作性質(zhì)重塑。大量重復(fù)性的認(rèn)知任務(wù)將被AI智能體接管,推動(dòng)人類工作者向監(jiān)督協(xié)調(diào)和高度專業(yè)化的角色轉(zhuǎn)型。

一個(gè)關(guān)鍵趨勢(shì)是**“增強(qiáng)的精英論”**:AI的最大價(jià)值在于賦能專家。研究明確指出,“知識(shí)最淵博的人……總是能從人工智能中受益”。AI將成為放大頂尖專家能力的強(qiáng)大工具,可能導(dǎo)致專家與普通水平員工之間在績(jī)效和薪酬上的差距進(jìn)一步擴(kuò)大。

第四節(jié):現(xiàn)實(shí)的鴻溝——駕馭AI智能體的技術(shù)與實(shí)踐障礙

在擁抱其潛力的同時(shí),必須正視AI智能體在宣傳與實(shí)際表現(xiàn)之間的巨大鴻溝。

令人警醒的成功率

當(dāng)前AI智能體最突出的問(wèn)題是其高失敗率??▋?nèi)基梅隆大學(xué)的一項(xiàng)研究顯示,即便是最頂尖的模型(如Gemini 1.5 Pro),在處理常見(jiàn)的知識(shí)工作任務(wù)時(shí),也只能自主完成30.3%。在更復(fù)雜的多輪交互中,成功率會(huì)驟降至“35%”左右。

這一嚴(yán)峻現(xiàn)實(shí)也得到了行業(yè)分析的印證。高德納預(yù)測(cè),到2027年底,超過(guò)“40%的AI智能體項(xiàng)目將被取消。麻省理工學(xué)院的一份報(bào)告甚至指出,企業(yè)中高達(dá)95%“的生成式AI試點(diǎn)項(xiàng)目未能產(chǎn)生可衡量的商業(yè)影響。

核心技術(shù)瓶頸與實(shí)踐困境

這些失敗的背后,是當(dāng)前AI智能體技術(shù)固有的幾大瓶頸:

  • 記憶與上下文:在長(zhǎng)流程任務(wù)中難以保持長(zhǎng)期記憶,時(shí)常“忘記”關(guān)鍵信息。
  • 推理與幻覺(jué):存在“復(fù)合幻覺(jué)”問(wèn)題,單步95%的準(zhǔn)確率在經(jīng)過(guò)10步?jīng)Q策后,整體準(zhǔn)確率可能降至60%。
  • 脆弱的集成:AI智能體雖比傳統(tǒng)自動(dòng)化工具更能適應(yīng)UI變化,但當(dāng)軟件界面更新時(shí),仍會(huì)因“心智模型”失效而導(dǎo)致任務(wù)失敗。這種“環(huán)境失配”是其高失敗率的深層原因。
  • 安全與隱私:當(dāng)前的AI智能體“幾乎沒(méi)有隱私意識(shí)”,這在企業(yè)環(huán)境中是重大阻礙。

第五節(jié):新的權(quán)力游戲——壟斷、責(zé)任與智能體世界的規(guī)則

隨著AI智能體日益強(qiáng)大和自主,一系列深刻的社會(huì)治理挑戰(zhàn)也隨之浮現(xiàn)。

新壟斷的風(fēng)險(xiǎn)

AI智能體正準(zhǔn)備成為互聯(lián)網(wǎng)“下一個(gè)主導(dǎo)性的守門人”。一個(gè)占據(jù)主導(dǎo)地位的智能體平臺(tái),可能控制用戶數(shù)據(jù)、服務(wù)訪問(wèn)權(quán)限及市場(chǎng)議價(jià)能力,帶來(lái)形成新型超級(jí)壟斷的巨大風(fēng)險(xiǎn)。開(kāi)放性協(xié)議(如MCP)和數(shù)據(jù)可移植性被認(rèn)為是反制這種壟斷的關(guān)鍵力量。

責(zé)任的“黑箱”

當(dāng)一個(gè)自主AI智能體造成損害時(shí),法律責(zé)任應(yīng)該由誰(shuí)來(lái)承擔(dān)?這是其最核心的倫理和法律挑戰(zhàn)。傳統(tǒng)責(zé)任法建立在“可預(yù)見(jiàn)性”和“意圖”之上,而這兩點(diǎn)在自主智能體上都難以適用,從而產(chǎn)生了一個(gè)“責(zé)任空白”。

全球的法律體系正在探索解決方案,可能路徑包括:

  • 產(chǎn)品責(zé)任:將有缺陷的AI系統(tǒng)視為有缺陷的“產(chǎn)品”。
  • 過(guò)失責(zé)任:如果開(kāi)發(fā)者或使用者未能盡到“合理的注意義務(wù)”。
  • 嚴(yán)格責(zé)任:在高風(fēng)險(xiǎn)領(lǐng)域,無(wú)論是否存在過(guò)失,運(yùn)營(yíng)者都應(yīng)承擔(dān)責(zé)任。

為自治系統(tǒng)建立新的法律框架,不是一個(gè)“事后”問(wèn)題,而是這項(xiàng)技術(shù)能否在金融、醫(yī)療等高風(fēng)險(xiǎn)領(lǐng)域被社會(huì)廣泛接納的關(guān)鍵“賦能者”。

結(jié)論:通向“超級(jí)代理能力”之路——規(guī)劃人機(jī)協(xié)作的未來(lái)

AI智能體的崛起,其變革規(guī)??膳c個(gè)人電腦或智能手機(jī)的出現(xiàn)相提并論。它并非技術(shù)本身的終點(diǎn),而是走向一個(gè)全新人機(jī)協(xié)作時(shí)代的起點(diǎn)。

在醫(yī)療健康領(lǐng)域,我們已能看到未來(lái)的縮影:AI智能體不僅能輔助診斷,更能管理從影像分析、報(bào)告撰寫到后續(xù)預(yù)約的整個(gè)診療流程,將醫(yī)療模式從“被動(dòng)治療”轉(zhuǎn)向“主動(dòng)預(yù)防”。

盡管AI智能體將變得高度自治,但其最終目標(biāo)并非取代人類,而是增強(qiáng)人類的能力。它旨在將我們從繁重的認(rèn)知?jiǎng)趧?dòng)中解放出來(lái),讓我們能更專注于那些在可預(yù)見(jiàn)的未來(lái)仍為人類獨(dú)有的領(lǐng)域:創(chuàng)造力、戰(zhàn)略性思維、同理心和智慧。前方的道路充滿挑戰(zhàn),但如果我們能成功駕馭這場(chǎng)變革,就有希望構(gòu)建一個(gè)更高效、也更人性化的未來(lái)。

本文由 @托馬斯.轟炸機(jī) 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來(lái)自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!