企業(yè)級AI落地的10條經(jīng)驗:Contextual AI CEO的深度洞察

0 評論 609 瀏覽 4 收藏 9 分鐘

在 AI 代理熱潮下,企業(yè) AI 雖蘊含 4.4 萬億美元價值的巨大機遇,然而僅四分之一的企業(yè)能從中獲實際價值,“上下文悖論” 成關(guān)鍵阻礙。如何突破?Contextual AI CEO 演講總結(jié)出部署生產(chǎn)級 RAG 代理的 10 條經(jīng)驗。

最近刷到了Contextual AI CEO Douwe Kiela關(guān)于企業(yè)級AI落地的演講,很受啟發(fā),翻譯成中文與大家共享。

最新一代大語言模型(LLM)展示了驚人的推理能力。然而,要在企業(yè)環(huán)境中釋放其真正價值,需要將這些代理能力應(yīng)用于正確的企業(yè)數(shù)據(jù)。在AI代理的熱潮中,我們必須記住那句永恒的格言:

“垃圾進(jìn),垃圾出”

只有經(jīng)過恰當(dāng)?shù)那榫郴?,語言模型才能有效發(fā)揮作用。

企業(yè)AI的機遇與挑戰(zhàn)

企業(yè)AI蘊含著巨大機遇——麥肯錫估計其可為全球經(jīng)濟(jì)增加4.4萬億美元的價值。人人都想分一杯羹。然而,挫敗感普遍存在。許多AI副總裁面臨其項目投資回報率(ROI)的壓力。一項福布斯研究顯示,僅四分之一的企業(yè)能從AI中獲得實際價值。

AI中的“上下文悖論”

為何如此艱難?這類似于機器人領(lǐng)域的莫拉維克悖論:對人類而言簡單的任務(wù)(如吸塵)對機器人很難,而復(fù)雜任務(wù)(如下棋)卻相對容易。

同樣,企業(yè)AI面臨“上下文悖論”。LLM在編程或數(shù)學(xué)等任務(wù)上表現(xiàn)優(yōu)異,甚至超越人類,但在將信息置于正確上下文中時卻舉步維艱。而人類專家(尤其是領(lǐng)域?qū)<遥﹦t能輕松做到,憑借多年經(jīng)驗和直覺。

這一悖論是釋放AI ROI的核心。當(dāng)前AI常通過通用助手提供便利,帶來效率提升,但企業(yè)追求差異化價值和商業(yè)轉(zhuǎn)型。要獲得更高價值,必須更好地處理企業(yè)特定上下文;價值越高,對上下文的要求也越高。

正是這一認(rèn)識促成了Contextual AI兩年前的成立。以下是Contextual AI在大規(guī)模部署企業(yè)RAG系統(tǒng)過程中,為《財富》500強構(gòu)建穩(wěn)健系統(tǒng)時總結(jié)的經(jīng)驗:

部署生產(chǎn)級RAG代理的10條經(jīng)驗

1. 系統(tǒng)思維,而非僅關(guān)注模型

語言模型令人印象深刻,但在企業(yè)AI中,它們通常只占完整系統(tǒng)的20%。企業(yè)AI通常采用檢索增強生成(RAG),這是讓生成式AI適配企業(yè)數(shù)據(jù)的標(biāo)準(zhǔn)。

人們往往只關(guān)注新LLM,忽視真正解決問題的周邊系統(tǒng)。一個優(yōu)秀RAG管道中的普通模型,能勝過糟糕管道中的頂尖模型。關(guān)注整個系統(tǒng),模型只是其中一環(huán)。

2. 專業(yè)化優(yōu)于通用能力

企業(yè)專業(yè)知識是最寶貴的資產(chǎn)。目標(biāo)是釋放機構(gòu)知識。通用助手無法匹敵公司內(nèi)部的深度專長。專業(yè)化是有效捕捉這些知識的關(guān)鍵。

在Contextual AI,我們稱之為“專業(yè)化優(yōu)于AGI”。盡管通用人工智能(AGI)有其價值,但解決復(fù)雜、領(lǐng)域特定的問題需要專業(yè)化以獲得更優(yōu)結(jié)果。在AGI的喧囂中,這看似反直覺,但專業(yè)化讓解決真實商業(yè)問題更簡單。

3. 數(shù)據(jù)是護(hù)城河(規(guī)?;螅?/h3>

隨著時間推移,公司由其數(shù)據(jù)定義,因為員工會流動。數(shù)據(jù)代表公司的長期身份和競爭優(yōu)勢。常見誤區(qū)是認(rèn)為數(shù)據(jù)必須完美清洗后才能用于AI。真正的挑戰(zhàn)與機遇,是讓AI有效利用規(guī)?;蟮脑肼晹?shù)據(jù)。

實現(xiàn)這一點將釋放差異化價值,并構(gòu)建競爭護(hù)城河,因為你獨有的數(shù)據(jù)定義了你的公司。

4. 為生產(chǎn)設(shè)計,而非僅試點

一個殘酷事實:構(gòu)建試點RAG系統(tǒng)相對容易。用框架和幾份文檔做演示,往往能獲得小范圍好評。然而,邁向生產(chǎn)的鴻溝巨大:

  • 從數(shù)十份擴(kuò)展到數(shù)百萬份文檔;
  • 支持?jǐn)?shù)千用戶;
  • 處理眾多多樣化用例;
  • 滿足嚴(yán)格的安全與合規(guī)要求。

現(xiàn)有開源工具在此規(guī)模下常顯乏力。從第一天就為生產(chǎn)需求設(shè)計,避免代價高昂的陷阱。

5. 速度優(yōu)于完美,快速迭代

在生產(chǎn)部署中,速度常比完美更重要。盡早將RAG代理發(fā)布給真實用戶,哪怕僅是最小可行版本。收集反饋并迭代(“爬坡”)至“足夠好”狀態(tài)。

過度追求完美會加劇試點到生產(chǎn)的鴻溝。 基于真實用戶反饋的迭代對成功部署企業(yè)AI至關(guān)重要。

6. 讓工程師專注價值,而非瑣事

為加速迭代,確保工程師專注業(yè)務(wù)價值與差異化,而非瑣碎任務(wù)。他們易陷入優(yōu)化分塊策略或打磨提示詞——這些應(yīng)由穩(wěn)健平臺抽象化。

讓工程師聚焦真正關(guān)乎競爭力的高影響力工作。

7. 讓AI易消費、易集成

即使生產(chǎn)級GenAI也不能保證被采用。若風(fēng)險緩解使其不實用,或用戶不知如何使用,系統(tǒng)常被閑置。讓AI易消費至關(guān)重要。

這不僅意味著讓AI適配企業(yè)數(shù)據(jù),還意味著無縫集成到現(xiàn)有用戶工作流。更緊密的集成將顯著提升成功采用的可能性。

8. 設(shè)計“驚艷時刻”

推動使用需要黏性,常由“驚艷時刻”觸發(fā)——用戶瞬間理解工具價值。設(shè)計引導(dǎo)流程和初期體驗,快速呈現(xiàn)這一瞬間。

例如,在高通(Qualcomm)(我們的系統(tǒng)支持全球數(shù)千工程師),一位用戶興奮地從一份塵封7年的文檔中找到答案,瞬間解決長期問題。這些“小勝利”是強大的采用驅(qū)動力。

9. 聚焦可觀測性,而非僅準(zhǔn)確率

準(zhǔn)確率重要,但已成為基本要求。達(dá)到100%常不可能。企業(yè)愈發(fā)關(guān)注如何管理不可避免的誤差(5-10%的缺口)。

超過最低準(zhǔn)確率后,重點轉(zhuǎn)向通過可觀測性管理誤差。這需要穩(wěn)健的評估方法和審計跟蹤,尤其在受監(jiān)管行業(yè)。RAG系統(tǒng)中的恰當(dāng)溯源(將答案關(guān)聯(lián)到源文檔)至關(guān)重要。 實施后處理檢查以驗證陳述,確?;卮鹩袚?jù)可依。

10. 志存高遠(yuǎn)

許多AI項目失敗并非因目標(biāo)過高,而是過低。將GenAI用于瑣碎任務(wù)(如基礎(chǔ)HR查詢)ROI極低,常淪為閑置噱頭。

相反,設(shè)定宏大目標(biāo),一旦成功將帶來可觀ROI。 我們身處變革時代。AI將重塑社會。從事AI的人有機會推動有意義的變革。勿滿足于低垂果實,志存高遠(yuǎn)。

結(jié)語

“上下文悖論”仍是企業(yè)AI的核心挑戰(zhàn)。通過擁抱這些經(jīng)驗——系統(tǒng)思維、專業(yè)化、生產(chǎn)設(shè)計、快速迭代、聚焦價值、易用性、創(chuàng)造“驚艷時刻”、可觀測性、志存高遠(yuǎn)——你可將挑戰(zhàn)化為重大機遇。

本文由 @Hughugh 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖由作者提供

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!