AI Agent“虛火”過旺,或淪為“假Agent”?
本文深入探討了 AI Agent 領(lǐng)域的喧鬧與泡沫,分析了當(dāng)前市場中存在的過度炒作現(xiàn)象。文章指出,許多廠商將現(xiàn)有技術(shù)重新包裝成 AI Agent,導(dǎo)致市場混亂。盡管生成式 AI 處于期望膨脹期,但真正成功的部署案例較少。作者建議企業(yè)在探索 AI Agent 時應(yīng)保持謹(jǐn)慎,關(guān)注技術(shù)的實際業(yè)務(wù)價值,并通過效率、質(zhì)量、財務(wù)和安全等維度來衡量 AI 投入的 ROI。
如何定義 AI Agent?如何看待 AI Agent 領(lǐng)域存在的過度炒作現(xiàn)象?如何找到 AI Agent的最佳切入點?哪些關(guān)鍵 KPI 可以驗證 AI Agent 項目的實際業(yè)務(wù)價值?
在崔牛會策劃的“DeepTalk|DeepSeek猜想系列”對話中,由崔牛會創(chuàng)始人&CEO 崔強(qiáng)主持,邀請了 Gartner 公司副總裁孫鑫(Julian Sun),圍繞“真假 AI Agent:貼牌陷阱vs技術(shù)泡沫”的主題,展開了深入探討。
孫鑫提到,目前國內(nèi)的AI Agent正處于一個頂峰點,未來兩到五年,AI Agent可能進(jìn)入生產(chǎn)的成熟期,但目前企業(yè)對于AI Agent 的探索還應(yīng)保持相對謹(jǐn)慎的態(tài)度,技術(shù)瓶頸、可靠性、成本、場景適用性仍是重要的制約;Deep Seek 拉平了很多企業(yè)在應(yīng)用大模型技術(shù)上的差距,但企業(yè)更應(yīng)考慮的是讓自身數(shù)據(jù)與大模型產(chǎn)生協(xié)同效應(yīng),讓大模型為自己所用;在談及如何衡量 AI 投入的 ROI 時,孫鑫提到了效率、質(zhì)量、財務(wù)和安全四個維度。
閱讀目錄
1. “Agent Washing” :熱鬧背后的理性思考
2. 回歸客戶期待:如何定義AI ?Agent?
3. AI重力+用戶使用:大模型時代的“護(hù)城河”
4. AI 投入的衡量指標(biāo)和落地“三步走”以下是經(jīng)牛透社編輯整理的對話內(nèi)容:(有刪減)Tips:觀看對話原視頻,可通過【牛透社視頻號-直播回放-4月9日】獲取
01“Agent Washing” :熱鬧背后的理性思考
崔強(qiáng):今天聊一個大家比較關(guān)注的話題:真假 AI Agent,到底是貼牌陷阱,還是一個技術(shù)泡沫?今晚的嘉賓是Gartner公司副總裁孫鑫。今晚的話題,也源于Gartner 的一篇文章,文章題目是「Gartner: 警惕 “Agent Washing” ,辨別炒作與實質(zhì)」。
Agent到底是不是新瓶裝舊酒?這在國內(nèi)外都是一個很常見的問題。針對這一問題,Gartner給出了一個非常嚴(yán)苛的AI Agent定義標(biāo)準(zhǔn)。在Gartner眼中,到底什么才是真正的AI ?Agent?怎樣定義企業(yè)級的 AI Agent?目前 Salesforce以及國內(nèi)很多廠商也都推出了 AI Agent 產(chǎn)品,這些產(chǎn)品到底算不算AI Agent?今天晚上我們就聊一下這個話題。請孫總先介紹一下自己,然后介紹一下寫這篇文章的背景。
孫鑫:好的,謝謝崔老師。我叫孫鑫,大家可能更熟悉我另外一個名字Julian。我就職于Gartner,Gartner是一家美國研究型咨詢機(jī)構(gòu),專門服務(wù)于全球的首席信息官,即 CIO 以及他們的團(tuán)隊,包括大數(shù)據(jù)主管,以及企業(yè)的 AI 一號位等人群。我主要負(fù)責(zé)Gartner中國區(qū)的研究團(tuán)隊,主要研究方向是人工智能和數(shù)據(jù)分析。
這篇文章來源于美國人常說的一個詞: “FOMO”(錯失恐懼癥,F(xiàn)ear of Missing Out),意思是企業(yè)或者個人害怕忘記了(錯過了)什么事情,實際上這樣的事經(jīng)常發(fā)生。比如很多年以來,國內(nèi)非常多的廠商都稱自己為某某云(Cloud),再往前幾年是某某中臺,十幾個月之前是某某GPT,到了今天可能就是某某 Agent。
我們覺得 “Agent Washing” ,是指這樣一種現(xiàn)象:在供應(yīng)商側(cè),將它們現(xiàn)有的技術(shù)重新包裝成Agent,而這些“現(xiàn)有的技術(shù)”,實際上是缺乏一些產(chǎn)品的自主性和復(fù)雜決策能力的,這樣就導(dǎo)致了甲方企業(yè)市場的混亂,或者出現(xiàn)誤導(dǎo)性投資。
我們看到很多組織或者企業(yè)過度支出,并且大大低估了現(xiàn)在部署AI Agent 的成本和復(fù)雜性,最終可能無法達(dá)到過度炒作所帶來的期望,這就是我們寫這篇文章的一個初衷。
崔強(qiáng):在當(dāng)前背景之下,廠商肯定愿意去占AI Agent這個概念。以往大數(shù)據(jù)出來,大家都是大數(shù)據(jù)公司?,F(xiàn)在 AI 出來,大家都是 AI 公司。 “Agent Washing”,在當(dāng)前市場主要表現(xiàn)為哪些特征呢?
孫鑫:這些特征很明顯:一種是比較簡單粗暴的,比如改名字。原來的 RPA 公司,或者應(yīng)用公司,直接變成AI Agent 公司,這屬于一種營銷側(cè)的“極簡敘事”,它可能對產(chǎn)品的邏輯性上并沒有過多追求,卻極具煽動性,能夠?qū)⒁话阌脩粑^去。
AI 產(chǎn)品比較有意思,它服務(wù)的更多是 Prosumer用戶(參與生產(chǎn)的消費(fèi)者),而不是一般的 Consumer 用戶(消費(fèi)者用戶),它相對于專業(yè)型消費(fèi)者用戶是有觸達(dá)力的。所以一旦廠商把名字改成Agent,就會極大地吸引一些 to C 端比較喜歡鉆研新產(chǎn)品的用戶嘗試。很多廠商的產(chǎn)品,在幾個月前叫某某Copilot,之后又改成某某 Agent。
分享一個Gartner數(shù)據(jù):我們 2024 年 Q2 到 Q4 關(guān)于 Agent 的咨詢量增長了750%,這是一個非常驚人的數(shù)字。但據(jù)我們關(guān)于甲方 Agent 部署的調(diào)研來看,成功率不到 30% 。看起來非常熱鬧,但真正做出成果,部署成功的比例其實非常低。
所以,這一場 “Washing”,對于很多乙方也許有一定的成功意義,但對于甲方來說還遠(yuǎn)談不上成功。
崔強(qiáng):剛才你提到兩個數(shù)據(jù), 關(guān)于 Agent 的咨詢量增長了750% ,但只有 30% 的客戶成功部署了 AI Agent。成功部署的場景主要集中在哪些方面?
孫鑫:其實這 30% 的客戶,很多可能并不一定是 AI Agent,更多可能是一個Wo(hù)rkflow(工作流技術(shù))。我們看到的客服,知識庫的 Agentic RAG (智能體增強(qiáng)檢索生成)模式,Coding(軟件研發(fā))模塊,都是一些比較成功的場景類別。
崔強(qiáng):國內(nèi)外的整體趨勢相似嗎,還是有區(qū)別?
孫鑫:國外的選擇可能會更多一些。無論是什么技術(shù)型產(chǎn)品,都存在一個“buy or build”(購買或自建)的選擇。
在 ChatGPT 的初始階段,我們看到國內(nèi)外市場的一個明顯區(qū)別:國內(nèi)企業(yè)是 build (自建)的模式,而國外企業(yè)則是 buy (購買)的模式,這和 SaaS 的部署非常類似。但在自建過程中,中國的企業(yè)客戶可能會面臨非常多的技術(shù)局限性。
然而自今年 1 月份開始,尤其是 DeepSeek 的崛起,在推理模型對于 Agent 的助力之下,這種情況出現(xiàn)了一個非常大的變化。據(jù)我們?nèi)ツ?6 月份的一項調(diào)研,中國企業(yè)客戶生成式 AI 的部署成功率是8%,當(dāng)時全球的成功率在23~24%左右;今年這個數(shù)字雖然還沒有發(fā)布,但國內(nèi)企業(yè)已經(jīng)非常接近全球化水平了。所以,DeepSeek對于這件事是有推動性的。
崔強(qiáng):是的,原來和 IT 行業(yè)不相干的人都在談?wù)撊绾问褂肈eepSeek。剛才你提到兩個數(shù)據(jù),包括Gartner技術(shù)曲線,現(xiàn)在看來這波生成式 AI 處于技術(shù)曲線的哪個位置?
孫鑫:我可以簡單地介紹一下Gartner技術(shù)曲線。Gartner覺得所有技術(shù)趨勢基本上都會遵循一個技術(shù)成熟度曲線(The Hype Cycle,炒作曲線),一開始會進(jìn)入技術(shù)萌芽期:當(dāng)一項新技術(shù)取得突破進(jìn)展,或者進(jìn)行大規(guī)模傳播時,會引起媒體和行業(yè)的極大興趣,我們稱之為技術(shù)萌芽期;然后會進(jìn)入期望膨脹期。當(dāng)外界對于一項技術(shù)趨勢給予過高熱情和不切實際的期待時,一些領(lǐng)軍企業(yè)可能會大力宣傳,但往往只有一小部分取得成功。
我認(rèn)為,目前生成式 AI 正處于期望膨脹期,國內(nèi)的Agent正處于一個頂峰點,大家期望非常高,甚至有些廠商宣稱做出了通用的 AI Agent,但實際上這件事是不太可能的;之后有些技術(shù)會進(jìn)入到泡沫破裂的低谷期,從最高點跌落到最低點,再逐漸進(jìn)入一個穩(wěn)步爬升的復(fù)蘇期。隨著新技術(shù)的融入,以及更多商業(yè)化方法論和工具的實現(xiàn),最終達(dá)到成熟期。
(圖源Gartner網(wǎng)站)
每一個階段,我們都會給予客戶一定指導(dǎo),評估技術(shù)投入策略。在我們對 AI Agent的技術(shù)成熟度曲線中,對它有一個benefit(有益性)評級是非常高的。
另外,我們預(yù)測在兩到五年內(nèi),AI Agent可能進(jìn)入生產(chǎn)成熟期,AGI 實現(xiàn)要更早到來。從某種程度來講,Agent 為很多企業(yè)實現(xiàn)愿望提供了一個很好的渠道,包括 MCP 等輔助技術(shù)的出現(xiàn),很多企業(yè)覺得過去不能干活的大模型現(xiàn)在可以幫我們干活了,這也是一些甲方側(cè)的期待被廠商實現(xiàn)的例子。
崔強(qiáng):我們看到,當(dāng)年SaaS被資本追捧的情形在 AI 端重現(xiàn)了。我感覺 AI 可能比SaaS更快地進(jìn)入Gartner技術(shù)曲線的周期里面。在AI技術(shù)的投入上,結(jié)合當(dāng)下中國 AI 的狀態(tài),你會給廠商什么樣的建議?
孫鑫:我建議現(xiàn)在對于AI Agent 的探索相對謹(jǐn)慎一點比較合適。首先,現(xiàn)在的AI Agent 還存在非常多的瓶頸或者技術(shù)局限性,還沒辦法做出一個非常好的Agent。
其次,最常見的問題還是它的可靠性?,F(xiàn)在的 AI Agent 是依賴一些不可靠的組件構(gòu)成的,最常見的組件就是大語言模型。假設(shè)一個AI Agent工作流包括 10 個步驟,每個步驟都基于大模型推理,大概有 10% 的出錯概率,整體下來一個Agent真正的正確率可能只有1/3左右,這種錯誤的累積其實對于企業(yè)是不太可以接受的。
第三,成本問題 。如果不計成本地使用token,讓 AI Agent 去實現(xiàn)一些任務(wù),對企業(yè)未必是一個合適的選擇。所以,更多企業(yè)面對的問題是:是否真的有必要去建一個Agent ,或者是否一定要把項目做成Agent?因為 Agent 的復(fù)雜性和它的價值都是同比例增長的。
此外,Agent 也不是適用所有應(yīng)用場景。不是所有場景、所有公司現(xiàn)在都需要去做 Agent 這件事情。
崔強(qiáng):剛才你提到 AI Agent 只適合某一些場景,現(xiàn)在國內(nèi)還有哪些場景,用 AI Agent 是能夠在低成本并且相對可靠的狀態(tài)下實現(xiàn)的?
孫鑫:分成四個維度看這個問題會比較合適。第一,復(fù)雜度。是不是足夠復(fù)雜,需要足夠多的步驟,需要在一個足夠不可控的外界環(huán)境下實現(xiàn),這可能是比較適合AI Agent的場景;第二,收益。能不能帶來足夠多的收益;第三,現(xiàn)有技術(shù)的可行性;第四,這件事的出錯率。
結(jié)合這幾個維度,你會發(fā)現(xiàn)寫代碼是非常適合做成 Agent 的。首先,寫代碼這件事足夠復(fù)雜;第二,請一個程序員成本很高,尤其在北美地區(qū);第三,現(xiàn)在 AI 寫代碼已經(jīng)比較靠譜了,比如Claude 3.7 Sonnet 已經(jīng)可以做到非常好了;此外,寫代碼可以通過一個非常嚴(yán)苛的測試去檢測。
結(jié)合以上四個維度,可以很好地判斷一件事值不值得通過 Agent 來實現(xiàn)。
崔強(qiáng):一個網(wǎng)友問,有哪些比較好的,已經(jīng)走通的智能體商業(yè)化例子?
孫鑫:現(xiàn)在市面上比較認(rèn)可的幾個 Agent 大家可能都聽過,比如 OpenAI 的 Deep Research,是一個研究型的智能體;寫代碼的有Cursor、Devin,它們都是非常好的智能體,可以在統(tǒng)一的平臺下,端到端地解決某一類問題。
崔強(qiáng):它們都是國外的產(chǎn)品,國內(nèi)有沒有一些比較成功的例子?
孫鑫:現(xiàn)在國內(nèi)我還沒有明確地看到哪一家 Agent 公司是比較好的,即可以提供現(xiàn)成的、比較好的Agent產(chǎn)品的公司,但確實有非常多好的 Agent Builder(智能體平臺) 公司,可以提供工具集,讓企業(yè)自建 Agent,這種公司是有不少的。
02 回歸客戶期待:如何定義AI ?Agent?
崔強(qiáng):我讀完那篇關(guān)于 “Agent Washing”的文章之后,第一感受是這個標(biāo)準(zhǔn)非常苛刻。根據(jù)這個標(biāo)準(zhǔn),現(xiàn)在國內(nèi)幾乎找不到一家產(chǎn)品,或者只有為數(shù)不多的幾個產(chǎn)品能被稱為 AI Agent 的。為什么會用這樣嚴(yán)苛的標(biāo)準(zhǔn)來定義呢?能否再向大家介紹一下這個標(biāo)準(zhǔn)。
孫鑫:首先是一個大的市場趨勢。AI Agent之所以能夠吸引大量資金投入,一定是構(gòu)建了一個非常龐大的愿景,能力也一定要匹配得上。Gartner對于AI Agent 的定義是:一個自主或半自主的軟件實體,它利用了人工智能的技術(shù)去感知、做出決策、采取行動,并且在數(shù)字和物理環(huán)境中實現(xiàn)企業(yè)或者個人的業(yè)務(wù)目標(biāo)。
我把這些關(guān)鍵詞再梳理一下:首先是一個自主或半自主的軟件實體。如果它是一個半自主的形態(tài),也不能說它不是Agent,在某些關(guān)鍵節(jié)點,它是可以把人類的角色納入進(jìn)來的,但最重要的一點是,它必須擁有自主決策的能力。
第二,它是一個軟件實體,而非一個大模型。這個軟件實體將 AI 組件放入其中,但最終的執(zhí)行仍然是在軟件層進(jìn)行協(xié)調(diào)的,也就是說最終干活的仍然是該軟件實體。
第三,提到使用 AI 技術(shù),AI Agent,并不是必須且只有大語言模型才能被稱為 AI Agent。大模型出現(xiàn)以前,已經(jīng)有非常多的企業(yè)嘗試用 Agent 方式去做一些工作,比如用更傳統(tǒng)的機(jī)器學(xué)習(xí),或者用符號 AI (symbolic AI) 的方式去做 Agent,使結(jié)果更可預(yù)知、更穩(wěn)定,甚至通過代碼來實現(xiàn)一些工作,這仍然是可以被稱為 AI Agent。
AI Agent要用人工智能技術(shù)進(jìn)行感知,獲取外界信息,這種感知能力可能是目前技術(shù)上一個較大的瓶頸,因為外界環(huán)境很可能必須在統(tǒng)一的流程中,甚至在統(tǒng)一的云平臺、大廠環(huán)境中,才能更好地協(xié)調(diào)。
第四,要做出決策, AI Agent 可能會調(diào)用不一樣的功能制定行動計劃,做出一些決策。 第五,采取行動,要把活給干了。我們要用 Agent 把一些工具、接口、技能和功能調(diào)用起來,對目標(biāo)環(huán)境產(chǎn)生影響。
上面提到了一系列我們在定義AI Agent時的關(guān)鍵詞,都是基于我們現(xiàn)在客戶所提到的,或者說是客戶對于AI Agent 的一個期待。目前的市場環(huán)境中,的確充斥著非常多炒作的聲音,是很難實現(xiàn)這樣一個愿景的。
目前國內(nèi)市場能夠被稱為Agent 的軟件實體是非常少的。企業(yè)可能更應(yīng)當(dāng)關(guān)注如何通過 Agent Builder Platform,構(gòu)建符合自身需要的 Agent 。
崔強(qiáng):剛才你提到,國內(nèi)還是比較喜歡用自建的方式,而不是購買成熟的商業(yè)產(chǎn)品。而且國內(nèi)成熟的 Agent 產(chǎn)品幾乎也看不到。DeepSeek 這波AI 浪潮之后,是不是也為很多 CIO 或者企業(yè)提供了一種快速構(gòu)建AI Agent的可能性?
孫鑫:DeepSeek 的出現(xiàn),或者說很多國外大廠推出的開源模型,拉平了很多企業(yè)的差距,但對于一些頭部甲方企業(yè)影響并不大,對于Tier Two(二級供應(yīng)商),或者原來獲得大模型非常困難的企業(yè)帶來了新的可能性,但很多時候這也是需要企業(yè)自己去把握的。
企業(yè)可能更需要考慮的是如何讓自己的數(shù)據(jù)能夠與大模型真正產(chǎn)生協(xié)同效應(yīng),讓大模型為自己所用。如果大家都是用同樣的大模型,怎么才能凸顯自身的差異性?作為一個供應(yīng)商,如何通過大模型來實現(xiàn)自己的愿景,構(gòu)筑自己的護(hù)城河,這是真正值得去思考的。
另外,現(xiàn)在我們非常巧奪天工地設(shè)計一些Workflow,通過 AI 工程搭建一些 Agent,在未來某一個時間點可能也會有問題。因為大模型的能力會向越來越多的豐富場景延伸,一方面它可以處理多模態(tài)數(shù)據(jù)了,另一方面它自己可能就會是一個工具,或者從一個大語言模型變成一個大行動模型。
這意味著,今天你可能做了非常多的Agent,但以后大模型稍微發(fā)力,就把這樣一個能力直接取代了。
所以,我們要做的不是要等待一個新的大模型出現(xiàn),而是應(yīng)當(dāng)考慮怎樣結(jié)合自己的數(shù)據(jù)、企業(yè)的 Know-how,通過Reinforce learning(強(qiáng)化學(xué)習(xí))實現(xiàn)一些新的功能,構(gòu)筑屬于自己的護(hù)城河,這一點非常重要。
崔強(qiáng):確實是這樣。這里有一個評論,好的 Agent 一定是有數(shù)據(jù)邊界的,數(shù)據(jù)質(zhì)量高度就是 Agent 的高度。這個觀點你怎么看?
孫鑫:好的數(shù)據(jù)質(zhì)量高度可能決定這個大模型本身的高度,因為現(xiàn)在企業(yè)已經(jīng)基本上認(rèn)識到:要做一個通用型 Agent 不太可能,更重要的是如何把 Agent 的邊界劃分清楚。比如做文檔處理、數(shù)據(jù)獲取、可視化等。邊界的劃分,以及如何在一個predefine(預(yù)定義)好的工作流下順利完成工作,高效地實現(xiàn)企業(yè)的一些愿望,這才是一個 Agent 的邊界感。
大多數(shù)企業(yè)要做的,很可能就是Multi-Agent(多智能體協(xié)同),單個Agent很難讓客戶產(chǎn)生一個很好的預(yù)期。當(dāng)然你的數(shù)據(jù)越好,質(zhì)量越高,這是一個非常好的底座。
崔強(qiáng):剛才你提到DeepSeek的出現(xiàn),為一些無法擁有頭部企業(yè)預(yù)算的中小型企業(yè),提供了一種構(gòu)建 AI Agent的可能性,它們?nèi)绾握业阶罴训那腥敕绞?,你有什么樣的建議呢?
孫鑫:雖然國內(nèi)可以直接購買的、好的、現(xiàn)成的 Agent 產(chǎn)品非常少,但我們的建議是如果想要涉獵這一領(lǐng)域,可以先借鑒一些AI先行者們buy to build( 先購買再自建)的歷程,或者嘗試兩條路并行的方式。
我們看到的最成功的試點項目,應(yīng)該是著重展現(xiàn)業(yè)務(wù)潛力,而不是一種技術(shù)的可行性。企業(yè)在進(jìn)行一些技術(shù)試點時,如果僅僅為了驗證現(xiàn)有智能體的方式,在我們的系統(tǒng)或者說工作流中是可行的話,它為企業(yè)帶來的只是微小的改進(jìn),反而會忽略這項技術(shù)可能帶來的真正變革能力。
所以,我們不會建議企業(yè)現(xiàn)在一定要去做一個通用型的Agent,而是要先將一個你覺得可以讓企業(yè)受益的,可以讓業(yè)務(wù)潛力得以實現(xiàn)的點先做好,然后再去考慮多Agent的模式。
03 AI重力+用戶使用:大模型時代的“護(hù)城河”
崔強(qiáng):DeepSeek 為大家?guī)淼慕箲]是巨大的,幾乎每個行業(yè)都要被 AI 重塑、改造了,聚焦企業(yè)軟件或者 SaaS 領(lǐng)域,Agent 與 SaaS 或企業(yè)軟件接下來的關(guān)系會是什么樣子?我想聽聽你的看法,或者Gartner觀察到的一些觀點。
孫鑫:這個問題非常有意思。我們也經(jīng)常討論到,大模型和 Agent 廠商未來將是一種什么樣的“相愛相殺”的關(guān)系。因為Agent 需要調(diào)用一些工具能力,這些工具能力可能是來自 SaaS 、傳統(tǒng)軟件。
從 SaaS 廠商角度,只要能把 SaaS 工具更好地用起來,能夠產(chǎn)生用量,它也愿意被調(diào)用。但另一方面,大模型廠商也想干這個活,而且它們也是有能力構(gòu)建這些工具的,這樣就不需要通過MCP的方式去連接外界工具,相當(dāng)于把原來 SaaS 廠商的工作都在大模型中實現(xiàn),這就類似于大型云廠商跟 ISV 之間的關(guān)系了。
在國外,我們已經(jīng)看到了類似的端倪,比如 OpenAI 的 Deep Research 并沒有開放 API ,它希望用戶打開 ChatGPT的界面,把大模型當(dāng)做一個 Agent 來使用,而它將來就成為一個能夠?qū)崿F(xiàn)各種業(yè)務(wù)能力的平臺。
對于前端 SaaS 廠商、工具型廠商來說,短期的做法可能會像 Salesforce 一樣,結(jié)合自己的Know-how,在自己的平臺中構(gòu)建各種Agent。但未來,它們一定會考慮如何構(gòu)建自己的大模型,讓自己擁有一個“中樞大腦”,保持對客戶有一個 AI 重力的吸引,這一點對于 SaaS 廠商也是非常重要的。
長期來看,SaaS 廠商、工具型廠商也會投入自己的模型建設(shè),比如 Perplexity 在建自己的大模型。大家都會向用戶側(cè)更多發(fā)力,將過去的數(shù)據(jù)重力、平臺重力逐漸向 AI 重力轉(zhuǎn)移。
為什么要提“AI 重力”?我們過去經(jīng)常講數(shù)據(jù)重力,是指如果我能夠把握企業(yè)數(shù)據(jù),就有更多機(jī)會吸引企業(yè)在我的數(shù)據(jù)平臺之上構(gòu)建各種應(yīng)用能力。比如企業(yè)買了一個廠商的數(shù)據(jù)庫,就很可能在這個廠商的數(shù)據(jù)庫上去買它的數(shù)據(jù)分析產(chǎn)品,包括搭建應(yīng)用能力等。
AI 重力的吸引力,源于它帶來了一個獨(dú)特的 Agentic 體驗,也會讓很多的企業(yè),由于 AI 能力,愿意購買更多平臺上的工具和能力,所以,未來的爭奪一定是在 AI 重力上。
在 AI 的技術(shù)發(fā)展上,東西方其實有非常不一樣的評估標(biāo)準(zhǔn)。西方包括美國一些主流媒體,可能更關(guān)注大模型本身能力好不好,國內(nèi)可能更注重的是日活、月活這樣一些比較基本的指標(biāo)。
在OpenAI CEO奧特曼的一些近期采訪中,他也提到建最好的模型未必是最重要的,最有效的方式是有 10 億日活在我的平臺上。
最近,GPT 4o推出了一個圖形渲染能力,可以讓更多用戶在平臺上使用,就是利用了 AI 重力,讓更多的用戶使用,從而構(gòu)建最堅固的護(hù)城河。AI 重力+用戶使用,無疑是一個非常好的配套。
崔強(qiáng):剛才你提到了大廠和 SaaS 之間的相愛相殺。這種相愛相殺的狀態(tài)早期在大廠和 ISV 之間已經(jīng)走過一輪了,現(xiàn)在可能會重現(xiàn)第二輪。未來,Salesforce等廠商和通用大模型廠商的關(guān)系會有什么變化?是不是也要自建 AI 生態(tài)圈,和生態(tài)中的 ISV 們一起成長。這一點到了 SaaS 或者 ISV 端會變成什么樣子?
孫鑫:Salesforce、ServiceNow,它們對于自身領(lǐng)域都有著非常獨(dú)到的經(jīng)驗,有自己獨(dú)特的護(hù)城河。短期內(nèi),它們會推出各種GPT,今天是各種Agent。它們可能是在邊界感上維持得最好的,現(xiàn)在只不過用一個更好的Agentic的界面,讓用戶有更好的體驗。
對于這些廠商來講,接下來一定會優(yōu)先在數(shù)據(jù)層發(fā)力。比如 Salesforce 在最近的財報或電話財報會議中,都會反復(fù)強(qiáng)調(diào)自己 Data Cloud 的重要性。
這表明,數(shù)據(jù)才是Salesforce覺得真正重要的一個環(huán)節(jié),它也一定會在自己的數(shù)據(jù)之上更好地訓(xùn)練出符合自己企業(yè)情境的模型。
Salesforce之所以能夠做成這種平臺式的 Agent 協(xié)同的方式,一方面是為了給用戶提供更好的體驗;另一方面,是為了讓客戶有更好的黏性,并且可以讓客戶看見未來使用 Salesforce 的一個場景或者一種可能性。
相比較而言,中國企業(yè)可能比較實在一些,不會在乎背后用的是什么模型,更注重實際價值,而不是在跑分上能夠贏過你。
崔強(qiáng):就是更務(wù)實、更落地一些。一個網(wǎng)友在問,Agent 怎么能夠更好地處理端到端的問題?
孫鑫:以往的Agent ,更像一個全棧自研的過程,MCP 全新協(xié)議的出現(xiàn),帶來一個從全棧自研到協(xié)議組裝的轉(zhuǎn)變。很多中小企業(yè)可以通過MCP,將一些標(biāo)準(zhǔn)化零件進(jìn)行Agent 的組裝式搭建,雖然不能稱之為端到端,但卻是一種更省時、更合理,而且是在一個管理流程中搭建 Agent的過程。
此外,還有一種方式就是像ServiceNow、Salesforce 這類大廠推出的Agent,所有應(yīng)用都是長在自身平臺上的。
崔強(qiáng):未來,很多 SaaS 公司,比如Salesforce這樣的大平臺,有沒有可能也通過 MCP 調(diào)用平臺外的能力。假設(shè) ?ServiceNow 需要一個銷售模塊,是否也可以通過 MCP 協(xié)議來調(diào)用。而從客戶側(cè)來看,在解決某一個具體場景的過程中可能調(diào)用了很多來自不同平臺、廠家的產(chǎn)品,有沒有這種可能性?
孫鑫:這依賴于 MCP 協(xié)議的進(jìn)一步發(fā)展。一方面要看這些大廠、 SaaS 廠商是不是會開放自己MCP 的服務(wù);另一方面也要看客戶是否真的需要。
假如一個中國客戶從來沒有使用過 Salesforce 的服務(wù),他會選擇去連接 Salesforce 的 Agent 嗎?
此外,成本也是一個重要的因素。本來 10 塊錢就能干的事,如果現(xiàn)在要花 15 塊錢,要看客戶愿不愿意花這個錢,這是個很現(xiàn)實的問題。對于很多企業(yè)來說,是否真的要通過搭建一個 Agent Swarm (多Agent框架)的形式來實現(xiàn)你的數(shù)字化野心?其實是沒有必要的。
崔強(qiáng):你講得非常務(wù)實,不要追逐技術(shù),花最少錢解決企業(yè)最核心的問題,才是最重要的。
說到連接和開放問題的,前兩天我去了國內(nèi)一家RPA + Agent 的公司,他們也提到MCP可以讓大家連接起來,但問題是大家都不開放接口,所以只能用原來 RPA的那種方式,反而可能更切合實際一些。所以,又不能不考慮國內(nèi)現(xiàn)有的情況。
另外,在客戶側(cè),在自研和采購之間,國內(nèi)客戶對商業(yè)化產(chǎn)品接受度也不夠,雖然這些年有改變,但本質(zhì)上還沒有變很多,你覺得最核心問題在哪里呢?
孫鑫:其實自研跟采購的討論是持續(xù)存在的,國內(nèi)的生態(tài)相對而言比較封閉。我們在國外會看到所謂的 Data Ecosystem(數(shù)據(jù)生態(tài)系統(tǒng)),或者Cloud Ecosystem(云生態(tài)系統(tǒng)),廠商與廠商之間各自賺各自的錢,由客戶來選擇,只要使用了你的產(chǎn)品,你就可以獲得收益。
但國內(nèi)廠商可能更愿意封閉地自我開發(fā),而不是與別人對接,以至于很多廠商都說自己是做端到端生意。當(dāng)然,這也是甲方的一個訴求,無可厚非。
從甲方視角來看,可以通過場景判斷自研和采購的比例。如果是一個核心差異化的業(yè)務(wù),自研的比例可能要高一點;如果是通用高頻的需求,比如文檔分類,完全可以通過采購的方式,自研比例可以非常低;這需要企業(yè)有一個頭腦比較清醒的 AI 一號位,判斷自己的場景適合自研還是采購。
04 AI 投入的衡量指標(biāo)和落地“三步走”
崔強(qiáng):前兩天我們還開玩笑,有的老板說了要制定出未來三年的 AI 規(guī)劃,但 AI 幾乎是一周一個變化,規(guī)劃一個月也許都顯得有點長。在這方面,你可以給 CEO 哪些建議,比如說通過哪些KPI,來衡量CIO在這波 AI 里邊貢獻(xiàn)?
孫鑫:這方面我們一直有非常多的研究報告,這里我簡單講一個四層評估模型。第一層是效率層,即有 AI 和沒 AI,到底會讓企業(yè)的任務(wù)耗時降低多少?這是一種防御性的 KPI。
第二層,是質(zhì)量層,這是一種比較進(jìn)取型的 KPI ?。以往我們總覺得大模型是會有幻覺的,或者不太能夠符合企業(yè)的訴求,比如 Chat BI,它的決策準(zhǔn)確率就非常值得審視。如何利用大模型,讓它在做決策時能夠符合企業(yè)預(yù)期,或者讓準(zhǔn)確率可被接受,質(zhì)量層就非常重要。
第三層,是財務(wù)層,這是相對比較進(jìn)取型的指標(biāo)。比如過去做不到的事,現(xiàn)在因為DeepSeek和各種開源模型,我們可以開發(fā)出 AI 賦能的產(chǎn)品,從而為企業(yè)帶來新的收益增長點,這是財務(wù)層的一個指標(biāo)。
第四層,是安全指標(biāo),這是一個底線。可能過去很多企業(yè)沒那么在意,但現(xiàn)在有非常多的 MCP 協(xié)議,由于還處于萌芽期,可能會存在非常多的安全隱患,如何能把潛在風(fēng)險降到最低?或者說如何既能夠保護(hù)企業(yè)最重要的數(shù)據(jù)資產(chǎn),同時又能夠利用好 AI 能力,這也是 CIO 需要關(guān)注的。
簡單來講就是效率、質(zhì)量、財務(wù)和安全。
崔強(qiáng):你們還寫了一個構(gòu)建 Agent 能力的“三步走”路線圖。在這方面,會給大家一些什么建議呢?
孫鑫:我們確實有一個 AI Roadmap 的設(shè)計,但它并不是三個階段那么簡單。這里也可以簡單說下這三個步驟:第一,先要去做一些能力試點,在試點的選擇上,有些能力要放棄,有些事情不能做;如果一些試點成功的話,可以嘗試在多個業(yè)務(wù)中做一些拓展。
第二,能力拓展。一些過去企業(yè)可能并不是很在乎的能力,現(xiàn)在可以附加到用戶身上。企業(yè)中能不能構(gòu)建出更多的 Prosumer ,開發(fā)出一些自己想要的應(yīng)用,甚至是一些 Agent 的能力。
第三,是生態(tài)整合,怎樣把我們 AI 賦能的產(chǎn)品融入大的業(yè)態(tài)當(dāng)中,能夠在一個大環(huán)境中為企業(yè)創(chuàng)造新的業(yè)務(wù)增收點。主要是這三個階段的智能化躍升。
本文由人人都是產(chǎn)品經(jīng)理作者【牛透社】,微信公眾號:【牛透社】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評論,等你發(fā)揮!