AI 產(chǎn)品思維:我如何把一個 AI 應(yīng)用從基礎(chǔ) RAG 升級到 multi-agent 架構(gòu)
這篇文章把我最近這一年多以來業(yè)余時間做 AI 應(yīng)用的過程做一次復盤,一方面聊聊如何構(gòu)建一個多智能體驅(qū)動的 AI 應(yīng)用,另一方面在這個全新的時代,大家基本站在一個起跑線上,我以淺薄的 AI 應(yīng)用落地經(jīng)歷,分享些做產(chǎn)品思維上的一些變化。
技術(shù)演進總是以指數(shù)級加速。大型語言模型問世以來,AI 應(yīng)用已從簡單的聊天機器人和信息檢索系統(tǒng),迅速發(fā)展為能夠執(zhí)行復雜推理與多步驟任務(wù)解決的智能系統(tǒng)。在這場技術(shù)變革中,傳統(tǒng)的系統(tǒng)架構(gòu)與產(chǎn)品管理方法不僅面臨挑戰(zhàn),更走向了徹底重構(gòu)。
這段時間最大的感受:當傳統(tǒng)方法失效時,創(chuàng)新不是選擇而是必然
文中會涉及到一些不同應(yīng)用的案例,因為我做了好幾個,文章內(nèi)容從 2023 年初橫跨到現(xiàn)在,可能一些概念已經(jīng)有點“過時”,你也可能在上一段看到某個場景,下一段換到了另一個場景案例。
希望這篇文章能給正在設(shè)計 AI Agent 應(yīng)用的 產(chǎn)品經(jīng)理 builder 創(chuàng)業(yè)者 … 一些啟發(fā),本文沒有技術(shù)講解,也沒有宏觀戰(zhàn)略的大概念,非常具體的聊聊問題和如何改建的產(chǎn)品設(shè)計思路。
從我做的第一個工具說起。
固定 LLM 工作流 + RAG 的根本局限
檢索增強生成(RAG)技術(shù)是讓 LLM 能夠獲取特定知識控制模型發(fā)散按照既有知識返回結(jié)果的關(guān)鍵技術(shù),在 2023 年的 AI 應(yīng)用基本上都是基于這個模式,常見的企業(yè)內(nèi)知識點問答機器人都是這種模式。
最開始在我開發(fā)這個 AI 應(yīng)用的時候也是基于 LLM 設(shè)定固定的 workflow,RAG 在其中是一個標準流程。
這是個 AI 驅(qū)動的任務(wù)拆解器,只要你輸入一個想法,AI 就可以基于特定的工作流,拆解任務(wù),然后搜索信息 RAG 內(nèi)容返回,最終告訴你你的這個想法如何能轉(zhuǎn)化為一個可落地的 MVP 策略。
你只需要描述想法,通過 LLM 的 workflow 拆解后,會調(diào)動谷歌 API 搜索不同緯度的內(nèi)容完成 RAG ,然后在根據(jù)既定的 workflow 整合內(nèi)容生成結(jié)果
這在特定單一場景領(lǐng)域是奏效的,但從架構(gòu)設(shè)計上是絕對不夠抽象的(后面會聊這個場景和抽象的關(guān)系)當場景一旦擴展,馬上就會發(fā)現(xiàn)這個架構(gòu)的局限性。
比如,我要繼續(xù)通過多輪對話來優(yōu)化結(jié)果,此時固定的單輪 RAG 就會出現(xiàn)問題。
單次單向傳遞的 LLM workflow 瓶頸
傳統(tǒng) LLM 工作流系統(tǒng)遵循一種線性工作流:接收查詢、檢索相關(guān)文檔、基于檢索內(nèi)容生成回答,或動作執(zhí)行后返回結(jié)果 。這種”一次性”流程在簡單信息查詢場景下運作良好,但在面對復雜、多層次問題時迅速崩潰。
比如在客服場景中:
客戶:”我想退回上個月購買的無線耳機,但我丟失了收據(jù)。我還保留著原包裝,訂單號是 A12345。”
傳統(tǒng) RAG 處理這一查詢時,會檢索退貨政策和訂單詳情,然后生成回復。但這種方法很難理解復雜因素間關(guān)系:
- 根據(jù)訂單號識別特定產(chǎn)品信息與購買時間
- 確定適用的退貨時間及當期退貨政策
- 檢查該產(chǎn)品類別可能存在的特殊退貨要求
- 考量客戶歷史記錄對處理流程的影響
這些相互關(guān)聯(lián)的考量需要多輪信息檢索,每輪檢索可能依賴先前步驟中發(fā)現(xiàn)的信息。傳統(tǒng) RAG 的線性單向處理模式無法實現(xiàn)這種自適應(yīng)信息收集過程。
語言模型受限于固定的上下文窗口,一次能處理的最大文本量。傳統(tǒng) RAG 試圖通過在這有限空間中塞入盡可能多的可能相關(guān)信息來應(yīng)對挑戰(zhàn),期望模型能從中識別重要內(nèi)容。
這種”盡可能多塞入”策略因兩個根本原因而失效:
- 相關(guān)性稀釋:當語言模型的有限上下文窗口被邊際相關(guān)的信息淹沒時,就會發(fā)生相關(guān)性稀釋,導致真正關(guān)鍵的信息在處理過程中丟失或得到不足的注意力 以上面的退貨為例,當客戶詢問“我兩周前購買的無線耳機沒有收據(jù)可以退貨嗎?”時,最相關(guān)的信息(特定產(chǎn)品類別和時間段的例外政策)可能被埋藏在一般的退貨政策中,使得回復不夠精確,甚至可能具有誤導性。
- 不可能的檢索策略:系統(tǒng)無法先檢索基礎(chǔ)信息,進行思考,再基于推理結(jié)果執(zhí)行針對性的后續(xù)檢索。 對于查詢“我想退回我上個月購買的無線耳機,但我丟失了收據(jù)。我還有原始包裝,訂單號 A12345” 傳統(tǒng)的固定工作流 RAG 無法執(zhí)行這種多步驟查詢,因為它缺乏對初始檢索進行推理并基于該推理制定新查詢?nèi)蝿?wù)的能力。
那么要解決這些問題就需要通過在業(yè)務(wù)流程中構(gòu)建智能體,將原本的固定工作流拆解抽象成不同的單元,為每個單元構(gòu)建出具有特定目標和工具集的智能體,從而將固定的工作流基于用戶場景動態(tài)生成
智能體架構(gòu)的范式轉(zhuǎn)變
首先我們還是要確定我們的產(chǎn)品要解決問題的邊界,這是我開發(fā)的另一個應(yīng)用,通過 多 Agent 互相協(xié)作實現(xiàn)了更豐富的場景拓展和動態(tài)的 Task 規(guī)劃,從而驅(qū)動其他應(yīng)用的 API 完成自動化任務(wù)。
舉個例子:
user:為我創(chuàng)建一個任務(wù),下周回北京 約一下 DK 和 XY 的時間, 避免我遺忘在飛書里給我創(chuàng)個提醒
此時 Agent 將拿到這個用戶的提問后進行反思,這個問題顯然不夠具體,此時 AI 會進行反問
AI:我將幫助你安排下周在北京的會議。我需要一些更多細節(jié)來正確地設(shè)置你的任務(wù)和飛書提醒,請問具體是哪天的會議,具體什么時間在哪里見面?可以告訴我更詳細的信息嗎
可以發(fā)現(xiàn)此時具備了多輪對話能力
User:我們周三下午見,大概 3 點左右。我們可以在三里屯的星巴克見面
到這里 AI 已經(jīng)具有了完備的豐富信息,那么接下來 Agent 就要去完成任務(wù)分解,假設(shè)規(guī)劃如下
- 首先在應(yīng)用內(nèi)生成了一個 todo
- 根據(jù) Agent 具備的 Tools 找到了飛書的 API ,進行 function Call ,這個過程中會將用戶的消息變成參數(shù)
- 最終在飛書里也同步了這個任務(wù),并攜帶了任務(wù)內(nèi)容和提醒時間的參數(shù)。
這本質(zhì)上是一個基于 ReAct(”Reasoning” and “Acting” )完成的單 Agent 應(yīng)用
那么如果問題再復雜一個層級呢,除了多輪對話和初步理解問題完成行動之外,讓復雜度提高到 可以接近一個真實的員工,或者是類似 manus 這種級別的復雜度。
此時就需要多 Agent 互相協(xié)作來完成復雜度更高的任務(wù)
通過多 Agent 架構(gòu)構(gòu)建 Agentic 產(chǎn)品
Agentic 特性的產(chǎn)品是通過嵌入具有自主決策能力的專業(yè)化智能體,從根本上解決了傳統(tǒng)方法的局限。這些智能體能夠動態(tài)管理檢索策略、迭代優(yōu)化上下文理解、適應(yīng)復雜工作流程,將系統(tǒng)從被動信息處理轉(zhuǎn)變?yōu)橹鲃永斫鈫栴}并規(guī)劃解決。
傳統(tǒng)固定工作流系統(tǒng)與 Agentic 系統(tǒng)的對比
構(gòu)建多 Agent 系統(tǒng)
在上述架構(gòu)中,我們采用了一個「協(xié)調(diào)智能體」在最前面理解用戶的需求,通過下發(fā)任務(wù)給各種專家智能體來完成信息的獲取,然后評估智能體來評估信息的完備性,是否能成功解決用戶問題,如果不能則一直循環(huán),直到通過評估,生成響應(yīng)結(jié)果,將結(jié)果回傳給協(xié)調(diào)智能體,交給最終負責輸出的 LLM 基于提示詞潤色內(nèi)容完成輸出或完成動作
這種架構(gòu)整合了五個關(guān)鍵元素:
- 專業(yè)化智能體網(wǎng)絡(luò):每個智能體都有明確定義的專長和責任領(lǐng)域
- 動態(tài)任務(wù)分解:將復雜查詢分解為可管理的子問題
- 自適應(yīng)檢索策略:根據(jù)上下文選擇最優(yōu)信息獲取方法
- 迭代推理過程:通過多步驟推理逐步構(gòu)建理解
- 持續(xù)上下文優(yōu)化:在對話過程中維護并增強交互語境
這種集成使系統(tǒng)能處理遠超傳統(tǒng)方法能力的復雜場景。
接下來我們一個一個來拆解每個智能體
ps:產(chǎn)品經(jīng)理在這個過程中有大量的提示詞要去評測,要基于 case 寫評估集 … Etc ,這些過于專業(yè)的細節(jié)本篇就不展開了,未來慢慢寫
協(xié)調(diào)智能體
協(xié)調(diào)代理是系統(tǒng)中的中央控制單元,負責接收用戶查詢、分析查詢意圖,并將任務(wù)分配給合適的代理。它充當系統(tǒng)的“大腦”,確保各個代理之間的協(xié)作和任務(wù)的有序執(zhí)行。
具有以下能力:
- 理解用戶需求:深入理解用戶問題的本質(zhì),而非僅關(guān)注表面描述,以及意圖目標是可被執(zhí)行的,如果信息不夠完整,則需要反問用戶(想把反問做好還需要點技巧,以后分享)
- 任務(wù)分解:基于用戶的意圖,來進行任務(wù)拆分,并確定哪個專業(yè)代理應(yīng)該處理對應(yīng)的任務(wù)
- 規(guī)劃:在需要多個專業(yè)領(lǐng)域時,指導信息在專家智能體之間“流動”按順序執(zhí)行
- 維護上下文:以及與記憶系統(tǒng)交互,確保智能體和用戶交互的上下文連貫性
- 評估結(jié)果:確保當前的結(jié)果是可以解決用戶提問的
- 合成最終回復:整合各專業(yè)智能體的輸出,生成一致且全面的回應(yīng)
若要設(shè)計這個智能體,需要考慮較多方面到業(yè)務(wù)場景,比如是否需要識別特定實體,需要構(gòu)建意圖識別,協(xié)調(diào)智能體的有效性很大程度上取決于它對問題進行分解和理解的能力,以及它協(xié)調(diào)其他智能體的策略。
專業(yè)智能體團隊
在專家智能體團隊中,這個 AI 任務(wù)助手項目構(gòu)建了三個智能體
- 網(wǎng)絡(luò)搜索智能體:具備搜索互聯(lián)網(wǎng)數(shù)據(jù)的能力,通過公開的搜索引擎 API 獲取數(shù)據(jù)
- 知識檢索智能體:基于智能助手中的文檔記錄(私有知識)進行 RAG 為任務(wù)提供更具有個人領(lǐng)域知識點上下文,并且基于 RAG 來獲取領(lǐng)域知識
- 應(yīng)用交互智能體:基于問題調(diào)動其他應(yīng)用接口,比如個人日歷
專業(yè)智能體團隊的有效設(shè)計是構(gòu)建高性能 AI 任務(wù)助手的核心。網(wǎng)絡(luò)搜索智能體、知識檢索智能體和應(yīng)用交互智能體各司其職,形成一個全面的知識獲取和執(zhí)行系統(tǒng)。這種模塊化、專業(yè)化的設(shè)計不僅提高了系統(tǒng)的整體性能,也使得系統(tǒng)更具可維護性和擴展性。
在實施過程中,關(guān)鍵是確保智能體間的無縫協(xié)作和清晰的職責劃分。隨著系統(tǒng)的發(fā)展,可以根據(jù)業(yè)務(wù)需求逐步擴展智能體團隊,增加更多專業(yè)領(lǐng)域的能力。這種微服務(wù)式的智能體架構(gòu)將成為未來企業(yè)級 AI 系統(tǒng)的主流設(shè)計模式。
現(xiàn)在你肯定會有一個疑問,他們之間是如何通訊調(diào)度的,協(xié)調(diào)智能體一定不是簡單的并行分配任務(wù),有的任務(wù)是具有時序依賴的,在我實現(xiàn)這個助手過程中,采用了 星型拓撲的通訊機制,除此之外不同的多智能體框架有不同的通訊機制,比如 MetaGPT 框架采用了 消息池訂閱機制(可以理解成一群人坐那開會,不斷的發(fā)表言論,每個智能體只獲取對自己需要多信息)
星型拓撲:企業(yè)級多智能體架構(gòu)的首選通訊機制
這種機制通過將一個中央?yún)f(xié)調(diào)智能體與多個專業(yè)智能體相連接,形成類似星狀的組織結(jié)構(gòu),從而實現(xiàn)高效的信息流通和任務(wù)管理。在企業(yè)級 AI 解決方案中,這種架構(gòu)已成為處理復雜業(yè)務(wù)場景的首選模式,特別是在需要整合多種專業(yè)能力的應(yīng)用場景中。
這是一種中心化的通訊機制有以下特點
- 中心協(xié)調(diào)節(jié)點:核心位置由協(xié)調(diào)智能體(Orchestrator Agent)占據(jù),作為系統(tǒng)的指揮中心
- 放射狀連接:所有專業(yè)智能體都直接與協(xié)調(diào)智能體相連,形成輻射狀結(jié)構(gòu)
- 單點通信原則:專業(yè)智能體之間不直接通信,所有交互必須通過中央?yún)f(xié)調(diào)者中轉(zhuǎn)
這種設(shè)計避免了網(wǎng)狀拓撲中的復雜連接關(guān)系,同時比鏈式拓撲提供了更高的響應(yīng)效率和容錯能力。
當信息以中線點向外流動時,視為任務(wù)分配,當以專家智能體為核心向上流動時,視為結(jié)果聚合
當協(xié)調(diào)智能體進行任務(wù)分配時,還需要維護一個狀態(tài)機,記錄以下內(nèi)容:
- 每個專業(yè)智能體的當前工作狀態(tài)
- 已分配任務(wù)的執(zhí)行進度
- 系統(tǒng)整體響應(yīng)流程的狀態(tài)
- 可能的阻塞點或瓶頸
這種狀態(tài)同步確保協(xié)調(diào)智能體能夠?qū)崟r把握系統(tǒng)運行狀況,進行必要的干預和調(diào)整。
這雖然已經(jīng)能夠滿足絕大多數(shù)需要,但還是不夠高效,更高效的方式還應(yīng)在此基礎(chǔ)上疊加優(yōu)先級系統(tǒng)。
優(yōu)先級系統(tǒng)
設(shè)計一個方法確定任務(wù)的執(zhí)行順序。不是所有任務(wù)都需要串行執(zhí)行。一些策略包括:
- 關(guān)鍵路徑優(yōu)先:某些信息必須先獲取才能執(zhí)行后續(xù)任務(wù)
- 速度優(yōu)先:一些快速任務(wù)可以并行處理
- 重要性加權(quán):優(yōu)先處理對最終答案最關(guān)鍵的信息
- 業(yè)務(wù)特殊性有限:命中一些意圖時,可以觸發(fā)特定的工作流有限處理或阻斷其他任務(wù)
現(xiàn)在這已經(jīng)是一個較為完備的多 Agent 系統(tǒng)了
我們應(yīng)該可以清晰的感受到,協(xié)調(diào)智能體才是業(yè)務(wù)的核心,一旦進入到復雜場景,和業(yè)務(wù)鏈條極其復雜的業(yè)務(wù)時,要確保該智能體有非常豐富的推理空間,那么我們?nèi)绾巫?AI 應(yīng)用變得加與“我”適配呢?隨著使用的深入,應(yīng)該具有更加了解我的特點的能力。
這就需要一套完備的記憶系統(tǒng)
記憶的本質(zhì):創(chuàng)建真正個性化體驗
上下文和記憶系統(tǒng)構(gòu)成了真正有效 AI 產(chǎn)品的基礎(chǔ)。沒有強大的記憶架構(gòu),即便最先進的推理能力也無法創(chuàng)造用戶期望的個性化體驗。
多層次記憶
我們的實現(xiàn)采用分層記憶系統(tǒng),平衡即時上下文需求與長期理解能力
會話上下文(短期記憶)
該層維護即時對話歷史,通常包括用戶與系統(tǒng)之間最近 5-10 輪交互。它確保單次互動會話內(nèi)的對話連貫性。
核心特性:
- 完整存儲在上下文窗口中
- 精確保留近期交流內(nèi)容
- 通過滑動窗口機制自動管理
- 支持對近期陳述的直接引用
會話記憶(中期記憶)
該層在整個服務(wù)事件中保存關(guān)鍵信息,可能跨越多個對話片段或不同渠道的接觸點。
核心特性:
- 結(jié)構(gòu)化存儲已識別實體和意圖
- 保存關(guān)鍵決策和提供的信息
- 多步驟流程的狀態(tài)追蹤
- 持續(xù)時間通常為數(shù)小時至數(shù)天
用戶記憶(長期記憶)
該層維護跨越多次對話的客戶關(guān)鍵信息、偏好和交互模式。
核心特性:
- 高度選擇性地保存關(guān)鍵信息
- 關(guān)注模式和偏好而非具體對話內(nèi)容
- 與客戶數(shù)據(jù)平臺和 CRM 系統(tǒng)集成
- 持久性以月或年計
如何形成記憶
記憶系統(tǒng)不是單純的存儲原始對話,而是提取和索引關(guān)鍵實體與事件。這種方法實現(xiàn)了相關(guān)先前交互的精確回溯,同時避免用無關(guān)歷史數(shù)據(jù)淹沒上下文窗口。
記憶的結(jié)構(gòu)化示例:
{
“memory_id”: “mem_78912”,
“memory_type”: “technical_issue”,
“primary_entity”: “smartphone_model_xyz”,
“related_entities”: [“camera_app”, “battery_performance”],
“information”: “設(shè)備遇到電池消耗和相機應(yīng)用凍結(jié)問題”,
“context”: “客戶嘗試重啟和應(yīng)用重裝但未解決”,
“resolution_status”: “unresolved”,
“resolution_attempts”: [“restart”, “app_reinstallation”],
“customer_sentiment”: “frustrated”,
“timestamp”: “2023-05-15T14:30:00Z”,
“importance_score”: 0.85
}
這種結(jié)構(gòu)化方法實現(xiàn)了:
- 上下文相關(guān)檢索:基于當前對話相關(guān)性檢索記憶
- 模式識別:識別跨客戶的相似問題
- 個性化:根據(jù)過往交互調(diào)整響應(yīng)策略
- 持續(xù)學習:追蹤解決方案有效性
可以理解為,讓大模型去理解對話中的含義,并且抽取其中的實體和事務(wù),然后針對性的完成 短期 中期 長期的對應(yīng)存儲方式,這樣做的好處并不是一味的將歷史信息大量灌入上下文窗口,而是先理解問題,選擇預置匹配的記憶來補充。
讓我們舉個例子來感受記憶系統(tǒng)的價值,跨時間的交互場景,展示記憶系統(tǒng)如何創(chuàng)建更個性化、更有效的客戶體驗:
之前互動(2 周前):
客戶:”我在將新智能音箱連接到家庭 Wi-Fi 網(wǎng)絡(luò)時遇到問題。”
系統(tǒng):[提供 Wi-Fi 連接故障排除步驟]
客戶:”解決了!但現(xiàn)在我在鏈接音樂賬戶時遇到問題。”
系統(tǒng):[引導完成流媒體服務(wù)連接]
客戶:”太好了,現(xiàn)在一切正常。謝謝!”
當前互動:
客戶:”嗨,我們之前討論的音箱又出問題了?,F(xiàn)在它會隨機與我的手機斷開連接。”
沒有有效記憶系統(tǒng)的情況下,系統(tǒng)對”我們之前討論的音箱”沒有上下文理解,需要詢問設(shè)備型號、購買時間等基本信息。
這創(chuàng)造了一種無縫體驗,讓客戶感到被理解和重視,顯著提高滿意度和解決效率。
總結(jié)一下
到這里我們已經(jīng)完全完成了這個項目,我們已經(jīng)把固定的 workflow 編排,升級為了具有 Agentic 性的多 Agent 系統(tǒng),從較為簡單的單輪查詢,升級到多輪反復循環(huán)自主規(guī)劃任務(wù)的強大系統(tǒng),在這套以協(xié)調(diào)智能體作為核心入口,驅(qū)動專家智能體團隊完成任務(wù)的多 agent 架構(gòu)中,我們幾乎可以勝任 80% 的企業(yè)級需求,隨著能力的擴張,需要不斷延伸專家智能體的數(shù)量來拓展能力邊界。
AI 時代的產(chǎn)品思維變革
變革一:從工作流的定義到邊界與目標定義
軟件產(chǎn)品專注于定義明確的用戶旅程和工作流程。去梳理業(yè)務(wù)場景,然后把業(yè)務(wù)拆解為可解釋的固定環(huán)節(jié),然后對應(yīng)構(gòu)建產(chǎn)品,每個步驟都有確定的輸入、輸出和 UI 元素。產(chǎn)品經(jīng)理精確規(guī)定系統(tǒng)在每個場景中的行為。
AI 產(chǎn)品則需要根本不同的方法。產(chǎn)品經(jīng)理不再規(guī)定精確工作流,而是定義:
- 邊界:智能體責任范圍的清晰界限,
- 目標:成功結(jié)果的明確標準,
- 環(huán)境/容器:智能體有效運行所需的上下文環(huán)境
這種面向目標的方法關(guān)注智能體應(yīng)當實現(xiàn)什么,而非在每種可能情況下如何實現(xiàn),要更加的擁抱灰度,與此同時,要構(gòu)建評估思維,因為需求的迭代不再是固定且線性的,這就需要有很強的評估思維,根據(jù)結(jié)果來反推 AI 系統(tǒng)中某個環(huán)節(jié)或某個變量的調(diào)整,形成反饋循環(huán)
變革二:抽象優(yōu)于場景
軟件產(chǎn)品經(jīng)理高度依賴特定用戶故事和場景:”作為客戶,我希望查看訂單歷史,以便追蹤過去購買。”
這種細粒度方法在面對通過自然語言交互并處理同類請求無數(shù)變體的 AI 產(chǎn)品時變得不切實際。
AI 產(chǎn)品經(jīng)理必須轉(zhuǎn)向抽象和模式思維:”系統(tǒng)應(yīng)理解并響應(yīng)關(guān)于用戶過往交易的查詢,無論表述形式如何,通過檢索相關(guān)交易詳情并在對話上下文中呈現(xiàn)。”
這種轉(zhuǎn)變要求產(chǎn)品經(jīng)理發(fā)展:
- 模式識別能力:識別多樣表達中的基本用戶需求
- 意圖映射:理解用戶表達類似需求的各種方式
- 邊界定義:明確區(qū)分 AI 責任范圍內(nèi)外的事項
所有這些都表達同一基本需求的變體。產(chǎn)品經(jīng)理不應(yīng)為每種可能表達創(chuàng)建場景,而應(yīng)定義抽象能力及其邊界。
變革三:從關(guān)注功能到定義原子能力
從功能到能力的轉(zhuǎn)變代表產(chǎn)品經(jīng)理思維的另一根本轉(zhuǎn)變:
軟件產(chǎn)品經(jīng)理:”我們要在訂單歷史頁面添加’重新訂購’按鈕,自動將之前購買的商品添加到購物車。”
AI 產(chǎn)品經(jīng)理:”我們要使智能體能夠理解并執(zhí)行用戶在任何對話上下文中重復過往購買的意圖。”
這種基于能力的思維使 AI 產(chǎn)品能以僵化功能定義無法實現(xiàn)的方式適應(yīng)用戶需求。它的價值不在于特定 UI 元素或工作流步驟,而在于系統(tǒng)理解并滿足用戶意圖的能力。
用戶故事應(yīng)該只是抽象為元子能力的思考基礎(chǔ)。
變革四:從確定性到概率性思維
對產(chǎn)品經(jīng)理而言,最深刻的轉(zhuǎn)變是從確定性思維轉(zhuǎn)向概率性思維。
傳統(tǒng)軟件開發(fā)中,我們習慣于使用二元判斷標準來評估產(chǎn)品質(zhì)量——系統(tǒng)要么”工作”(正常運行),要么”不工作”(出現(xiàn)錯誤)。這種思維模式根植于確定性系統(tǒng)的特性:給定相同輸入,系統(tǒng)總是產(chǎn)生完全相同的輸出。
而 AI 系統(tǒng),特別是基于大型語言模型的系統(tǒng),其質(zhì)量表現(xiàn)卻存在于一個連續(xù)譜系中,具體體現(xiàn)為:
響應(yīng)準確度梯度:AI 響應(yīng)不是簡單的”對/錯”二分法,而是存在從”完全準確”到”部分準確”再到”完全不準確”的連續(xù)過渡
適用性層級:回答可能技術(shù)上正確但上下文適用性存在不同程度的匹配,從”完美契合”到”大致相關(guān)”再到”完全偏離”
用戶價值遞進:提供的解決方案可能從”超出期望”到”基本滿足需求”再到”沒有解決問題”形成價值連續(xù)體
這種情況場景無法窮盡列舉,必須通過邊界和原則管理
這要求產(chǎn)品經(jīng)理適應(yīng),設(shè)置可接受性能范圍而非精確規(guī)格,定義護欄保持系統(tǒng)在適當邊界內(nèi),以及建立反饋機制使系統(tǒng)能隨時間改進
寫在最后
“不是所有能被計算的都有價值,也不是所有有價值的都能被計算。”愛因斯坦的這句名言,或許是我們面對 AI 產(chǎn)品范式轉(zhuǎn)變最恰當?shù)膯⑹尽?/p>
傳統(tǒng)軟件世界中,我們習慣于線性思維、確定性假設(shè)和可預測的結(jié)果。我們用流程圖描繪用戶旅程,用功能清單定義產(chǎn)品邊界。這種方法在確定性系統(tǒng)中運作良好,就像牛頓力學在中等尺度世界的精確預測一樣。
然而,隨著人工智能帶來的范式轉(zhuǎn)變,我們進入了一個全新的認知領(lǐng)域這里的規(guī)則更像量子力學,充滿了概率、不確定性和涌現(xiàn)屬性。在這個領(lǐng)域中,產(chǎn)品不再是靜態(tài)的工具,而是與人類共舞的動態(tài)伙伴。
正如物理學家尼爾斯·玻爾所言:”如果量子力學沒有讓你感到震驚,那說明你還沒有理解它。”同樣,如果 AI 產(chǎn)品的新范式?jīng)]有讓我們重新思考產(chǎn)品的本質(zhì),那我們可能仍停留在舊世界的認知框架中。
作者:張浩然darren;公眾號:張大倫
本文由@SaaS張大倫 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!