Perplexity CEO 最新洞察:從搜索到執(zhí)行,推理模型正在接管生成式 AI 的下一站

0 評(píng)論 2717 瀏覽 0 收藏 24 分鐘

當(dāng)大模型“能寫會(huì)說(shuō)”已成標(biāo)配,Perplexity CEO 指出:下一戰(zhàn)是“能做會(huì)執(zhí)行”。文章揭示,行業(yè)正從堆參數(shù)的預(yù)訓(xùn)練時(shí)代,轉(zhuǎn)向以推理模型為核心的系統(tǒng)工程——讓 AI 像 Agent 一樣規(guī)劃、行動(dòng)、拿結(jié)果。訓(xùn)練數(shù)據(jù)從“文本”變“任務(wù)軌跡”,商業(yè)路徑從“賣 API”變“賣閉環(huán)”,誰(shuí)先搭好“任務(wù)—反饋—資源”飛輪,誰(shuí)就率先拿到 AGI 入場(chǎng)券。

推理模型正逐步接棒預(yù)訓(xùn)練范式,成為生成式系統(tǒng)進(jìn)入部署階段的關(guān)鍵轉(zhuǎn)折點(diǎn)。Perplexity 聯(lián)合創(chuàng)始人兼 CEO Aravind Srinivas 在一場(chǎng)哈佛對(duì)談中指出,當(dāng)前行業(yè)焦點(diǎn)已從擴(kuò)大模型參數(shù)與語(yǔ)料規(guī)模,轉(zhuǎn)向構(gòu)建具備執(zhí)行力與反饋機(jī)制的系統(tǒng)架構(gòu)。

他表示,這場(chǎng)范式轉(zhuǎn)移不僅關(guān)乎模型本體的能力提升,更牽動(dòng)整個(gè) AI 工程流程的重構(gòu),從數(shù)據(jù)采集、用戶反饋到任務(wù)調(diào)度與系統(tǒng)集成,逐一轉(zhuǎn)入推理范式的適配軌道。

Srinivas 所領(lǐng)導(dǎo)的團(tuán)隊(duì)正將語(yǔ)言模型作為系統(tǒng)構(gòu)件嵌入搜索問(wèn)答場(chǎng)景,圍繞真實(shí)使用路徑持續(xù)迭代其 agent 能力與部署邏輯。其判斷核心在于:通用預(yù)訓(xùn)練模型構(gòu)建了語(yǔ)言理解的基底,但無(wú)法直接轉(zhuǎn)化為可用系統(tǒng),唯有借助推理機(jī)制與行為反饋,才可落地為具備自主任務(wù)執(zhí)行能力的產(chǎn)品形態(tài)。在這一背景下,訓(xùn)練范式正從 token 預(yù)測(cè)走向行為規(guī)劃,模型目標(biāo)不再是模仿語(yǔ)言,而是解決任務(wù)。

以 Perplexity、DeepSeek 等系統(tǒng)為代表的推理模型體系,正在形成新的產(chǎn)品架構(gòu)共識(shí):用結(jié)構(gòu)化任務(wù)路徑替代文本擬合,用真實(shí)反饋閉環(huán)替代離線評(píng)估,在系統(tǒng)工程層解構(gòu)模型邊界。

這一轉(zhuǎn)變也促使產(chǎn)業(yè)鏈重構(gòu)資源配置策略,從 UI 包裝先行、開(kāi)源模型試驗(yàn),到行為路徑驗(yàn)證后再行訓(xùn)練與部署,真正建立起“任務(wù)能力—系統(tǒng)結(jié)構(gòu)—資源決策”三位一體的閉環(huán)機(jī)制。

從全球系統(tǒng)架構(gòu)的推進(jìn)路徑來(lái)看,Srinivas 所面對(duì)的問(wèn)題正是整個(gè) AI 工程邁入執(zhí)行時(shí)代的典型縮影——在模型能力尚未定義清晰、反饋機(jī)制仍未閉環(huán)的條件下,如何推進(jìn)具備部署意義的階段性系統(tǒng)建設(shè)。

推理模型接棒預(yù)訓(xùn)練范式

過(guò)去兩年,生成式預(yù)訓(xùn)練模型在語(yǔ)言理解與生成方面取得顯著突破,但這一范式已觸及階段性邊界。行業(yè)重心正從擴(kuò)大語(yǔ)料與參數(shù)規(guī)模,轉(zhuǎn)向提升系統(tǒng)執(zhí)行能力與任務(wù)推理深度。新一代模型將更依賴后訓(xùn)練階段的結(jié)構(gòu)化調(diào)優(yōu),以支持復(fù)雜邏輯鏈的處理、任務(wù)流程的執(zhí)行及網(wǎng)頁(yè)環(huán)境下的行為操作。這一趨勢(shì)已成為全球頭部模型實(shí)驗(yàn)室的主要研究方向。

預(yù)訓(xùn)練提供了模型對(duì)世界常識(shí)與語(yǔ)義結(jié)構(gòu)的底層掌握,但若要構(gòu)建真正具備實(shí)用價(jià)值的智能系統(tǒng),仍需在垂直任務(wù)場(chǎng)景中實(shí)現(xiàn)能力精修與結(jié)構(gòu)落地。以 Perplexity 為代表的系統(tǒng)正圍繞真實(shí)使用路徑進(jìn)行再訓(xùn)練,目標(biāo)是在產(chǎn)品層實(shí)現(xiàn)連續(xù)價(jià)值傳遞。與此同時(shí),中國(guó)開(kāi)源體系的快速演進(jìn)也對(duì)全球節(jié)奏形成牽引,DeepSeek 的出現(xiàn)已成為北美團(tuán)隊(duì)顯著對(duì)標(biāo)壓力之一。

DeepSeek 的突破不僅體現(xiàn)在工程能力上——包括系統(tǒng)編譯、浮點(diǎn)運(yùn)算優(yōu)化、內(nèi)核調(diào)度及低端 GPU 上的大模型部署能力,更關(guān)鍵在于提出并實(shí)現(xiàn)了“推理模型”的具象路徑。其發(fā)布的 DeepSeek Zero 展示了在無(wú)監(jiān)督環(huán)境中,通過(guò)強(qiáng)化學(xué)習(xí)引導(dǎo)模型產(chǎn)生具備執(zhí)行力的推理行為,為自動(dòng)化 agent 的訓(xùn)練機(jī)制提供了結(jié)構(gòu)性模板,也為行業(yè)探索能力邊界打開(kāi)了新通道。

在產(chǎn)品與研究協(xié)同推進(jìn)的路徑中,部分團(tuán)隊(duì)已引入結(jié)構(gòu)化機(jī)制,將前沿研究聚焦于模型任務(wù)能力與系統(tǒng)性能優(yōu)化,產(chǎn)品端則專注于界面設(shè)計(jì)、信息組織與用戶體驗(yàn),借助問(wèn)答搜索融合場(chǎng)景測(cè)試表達(dá)策略與推理流程。這一“雙螺旋”機(jī)制確保每輪迭代均具備明確實(shí)驗(yàn)驗(yàn)證基礎(chǔ),形成穩(wěn)定的反饋與更新節(jié)奏。

在資源調(diào)度層面,領(lǐng)先企業(yè)基于對(duì)模型機(jī)制的理解,將系統(tǒng)反饋信號(hào)直接轉(zhuǎn)化為計(jì)算資源決策:當(dāng)小規(guī)模推理 agent 實(shí)驗(yàn)取得正向驗(yàn)證,便快速放大部署規(guī)模,直接采購(gòu)萬(wàn)張 GPU 構(gòu)建完整推理系統(tǒng)。其背后邏輯建立在對(duì) AI 模型性能與經(jīng)濟(jì)回報(bào)之間強(qiáng)關(guān)聯(lián)的深度認(rèn)知。

同時(shí),一種“延遲訓(xùn)練”策略也在部分公司內(nèi)部被驗(yàn)證有效:初期通過(guò) UI 包裝構(gòu)建原型,先行獲取用戶數(shù)據(jù)與行為反饋,再擇機(jī)啟動(dòng)大模型訓(xùn)練,利用開(kāi)源模型的性能進(jìn)展彌合初期資源限制。2023 年,這一策略在多個(gè)項(xiàng)目中獲得驗(yàn)證,并已被納入產(chǎn)品設(shè)計(jì)、技術(shù)投入與資本配置的主流程中。

任務(wù)路徑主導(dǎo)的數(shù)據(jù)重構(gòu)范式

模型訓(xùn)練的重心正在從大規(guī)模語(yǔ)料抓取轉(zhuǎn)向具象任務(wù)路徑的構(gòu)建。在任務(wù)導(dǎo)向的訓(xùn)練范式下,模型能力的提升不再依賴復(fù)刻人類語(yǔ)言表達(dá),而聚焦于執(zhí)行鏈?zhǔn)叫袨椤〝?shù)學(xué)推理、代碼生成、網(wǎng)頁(yè)點(diǎn)擊、文件處理等具體操作。訓(xùn)練樣本以“任務(wù)行為路徑”為單位組織,形成 agent 系統(tǒng)推理能力的關(guān)鍵基座。

這一轉(zhuǎn)變也帶來(lái)了數(shù)據(jù)來(lái)源與訓(xùn)練目標(biāo)的深度變化。企業(yè)普遍放棄自建預(yù)訓(xùn)練模型,將通用語(yǔ)義建構(gòu)交由開(kāi)源社區(qū)與閉源實(shí)驗(yàn)室完成,自身則聚焦在此基礎(chǔ)上構(gòu)建封閉式微調(diào)體系。調(diào)優(yōu)任務(wù)集中于結(jié)構(gòu)化生成能力與系統(tǒng)性操作流程,如摘要提取、格式轉(zhuǎn)換、文檔重寫與上傳執(zhí)行等模塊性技能,意在打造可部署、可評(píng)估的智能組件。

在訓(xùn)練數(shù)據(jù)合規(guī)性上,盡管圍繞著作權(quán)與生成內(nèi)容的爭(zhēng)議仍存,例如《紐約時(shí)報(bào)》所發(fā)起的訴訟尚在推進(jìn)中,行業(yè)實(shí)踐已逐步形成共識(shí):只要輸出未顯著復(fù)現(xiàn)原始內(nèi)容,即可被視為“合理使用”。為此,多數(shù)企業(yè)采用隔離語(yǔ)料、轉(zhuǎn)換輸出格式、強(qiáng)調(diào)任務(wù)導(dǎo)向的策略來(lái)降低潛在風(fēng)險(xiǎn),主動(dòng)規(guī)避語(yǔ)義復(fù)刻路徑。

模型數(shù)據(jù)來(lái)源亦在機(jī)制上全面重構(gòu)。真實(shí)用戶的查詢行為與交互反饋成為最核心的能力訓(xùn)練信號(hào),點(diǎn)贊、修改、點(diǎn)擊等行為被系統(tǒng)性采集,用于指導(dǎo)模型排序與強(qiáng)化過(guò)程。同時(shí),系統(tǒng)也基于歷史回答表現(xiàn),動(dòng)態(tài)調(diào)整信息源的抓取策略——優(yōu)先提升高價(jià)值內(nèi)容的爬蟲(chóng)頻次與索引深度,形成反饋驅(qū)動(dòng)的數(shù)據(jù)供給機(jī)制。

人工評(píng)估依然是訓(xùn)練流程不可替代的環(huán)節(jié)。常見(jiàn)流程為:并列呈現(xiàn)兩個(gè)模型輸出,由人工判定優(yōu)劣,進(jìn)一步用于訓(xùn)練排序模型或標(biāo)注樣本質(zhì)量,在摘要精度、多輪對(duì)話連貫性與任務(wù)響應(yīng)合理性等任務(wù)中,仍需人工信號(hào)作為質(zhì)量錨點(diǎn)。

與此并行的是合成數(shù)據(jù)機(jī)制的系統(tǒng)性引入。訓(xùn)練流程中,大模型已承擔(dān)“教師模型”角色,對(duì)小模型輸出進(jìn)行打分、結(jié)構(gòu)標(biāo)注或行為分類,以生成微調(diào)用的小樣本數(shù)據(jù)集。此機(jī)制在構(gòu)建 UI 分類器等任務(wù)中效果尤為顯著。以用戶意圖識(shí)別為例,通過(guò)大模型自動(dòng)識(shí)別金融、旅游、購(gòu)物等查詢類別并回傳標(biāo)注,再由小模型模仿學(xué)習(xí),形成自我監(jiān)督閉環(huán)。

該路徑不僅提升了數(shù)據(jù)生產(chǎn)效率,也奠定了用戶意圖理解、檢索路徑規(guī)劃與響應(yīng)行為分流等系統(tǒng)能力的訓(xùn)練基礎(chǔ),成為支撐推理型 agent 架構(gòu)的關(guān)鍵技術(shù)底座。

搜索替代路徑與系統(tǒng)資源重構(gòu)

算力資源已成為當(dāng)前 AI 系統(tǒng)擴(kuò)展能力的核心約束。早期基礎(chǔ)模型的訓(xùn)練高度依賴超大規(guī)模算力支持,即便存在方法層創(chuàng)新,若缺乏工程調(diào)度與資源后端,成果往往難以形成產(chǎn)業(yè)影響力。與學(xué)術(shù)機(jī)構(gòu)相比,平臺(tái)型科技企業(yè)在算力組織、系統(tǒng)工程與產(chǎn)品部署方面具備更強(qiáng)統(tǒng)合能力,也因此吸引大量研究人才從實(shí)驗(yàn)室遷移至產(chǎn)業(yè)端,尋求高執(zhí)行力的落地平臺(tái)。

盡管底層大模型訓(xùn)練仍被少數(shù)資源集中型團(tuán)隊(duì)主導(dǎo),但在模型抽象層之上的系統(tǒng)架構(gòu)設(shè)計(jì),仍保有廣闊創(chuàng)新空間。從 Agent 框架構(gòu)建、任務(wù)評(píng)估機(jī)制、上下文協(xié)議標(biāo)準(zhǔn)化,到模擬環(huán)境設(shè)計(jì)與多模塊協(xié)同策略,系統(tǒng)價(jià)值更多取決于結(jié)構(gòu)效率而非參數(shù)規(guī)模。這一層的研究不依賴極限算力,更適合在產(chǎn)學(xué)之間建立長(zhǎng)線合作路徑。

面對(duì)搜索引擎巨頭的存量?jī)?yōu)勢(shì),新系統(tǒng)普遍選擇避開(kāi)算力正面碰撞,轉(zhuǎn)向機(jī)制異構(gòu)的路徑切入。其基本判斷是:一旦大型平臺(tái)將生成式系統(tǒng)部署至全域入口,查詢量所帶來(lái)的系統(tǒng)負(fù)荷將呈非線性放大,導(dǎo)致基礎(chǔ)設(shè)施成本結(jié)構(gòu)性失衡。與此同時(shí),高品牌溢價(jià)平臺(tái)在面對(duì)誤生成結(jié)果時(shí)容錯(cuò)空間極小,內(nèi)容安全機(jī)制無(wú)法有效閉環(huán)的前提下,其策略迭代頻率受限,進(jìn)一步削弱系統(tǒng)更新能力。

更深層次的錯(cuò)位來(lái)自商業(yè)模型本身。傳統(tǒng)搜索平臺(tái)依賴點(diǎn)擊導(dǎo)向的廣告變現(xiàn)路徑,CPC 模型與生成式問(wèn)答系統(tǒng)的行為機(jī)制難以直接映射。生成內(nèi)容不具備標(biāo)準(zhǔn)化跳轉(zhuǎn)目標(biāo)與轉(zhuǎn)化路徑,廣告投放的 ROI 難以衡量,廣告預(yù)算逐步向更可控渠道轉(zhuǎn)移。與此同時(shí),搜索廣告具備高毛利、低邊際成本優(yōu)勢(shì),而生成式系統(tǒng)部署與運(yùn)行成本高企,導(dǎo)致單位收益比明顯劣后,形成結(jié)構(gòu)性商業(yè)落差。

正是這種路徑與結(jié)構(gòu)的錯(cuò)位,為新興系統(tǒng)打開(kāi)了機(jī)會(huì)窗口。相比動(dòng)輒重構(gòu)商業(yè)邏輯的大型平臺(tái),輕結(jié)構(gòu)團(tuán)隊(duì)可跳過(guò)既有依賴,直接構(gòu)建“技術(shù)—產(chǎn)品—商業(yè)”的快速閉環(huán)。在技術(shù)實(shí)驗(yàn)與商業(yè)路徑之間建立高速反饋機(jī)制,使問(wèn)答搜索融合系統(tǒng)具備現(xiàn)實(shí)可行的替代潛力。

部分團(tuán)隊(duì)采用“先用后訓(xùn)”策略,即初期以開(kāi)源模型搭建系統(tǒng)框架,獲取用戶交互與行為數(shù)據(jù),在系統(tǒng)結(jié)構(gòu)穩(wěn)定后再轉(zhuǎn)向自研模型體系。該路徑顯著降低早期資金消耗,同時(shí)建立在對(duì)開(kāi)源能力演進(jìn)的前瞻判斷基礎(chǔ)上。隨著開(kāi)源模型逼近閉源性能上限,工程替代的可行性與實(shí)用性已被逐步驗(yàn)證。

搜索系統(tǒng)的收入結(jié)構(gòu)當(dāng)前仍在重構(gòu)期,用戶點(diǎn)擊路徑尚未穩(wěn)定重構(gòu),AI 系統(tǒng)在人均變現(xiàn)效率上與傳統(tǒng)搜索存在顯著差距。無(wú)論是 Gemini 等訂閱模型,還是嵌套于搜索入口的預(yù)覽式生成系統(tǒng),當(dāng)前商業(yè)化能力尚未具備廣告系統(tǒng)的成熟支撐。搜索結(jié)構(gòu)性變革仍處在早期窗口期,而這一階段,正是新路徑實(shí)驗(yàn)的關(guān)鍵周期。

擬人化誤用與教育結(jié)構(gòu)重構(gòu)

生成式 AI 的實(shí)際使用路徑,正在系統(tǒng)性偏離其原始設(shè)計(jì)目標(biāo)。自 Eliza 聊天程序以來(lái),用戶便傾向?qū)⒄Z(yǔ)言系統(tǒng)視為具備情感理解與互動(dòng)能力的“類人存在”,即使底層邏輯完全建立在統(tǒng)計(jì)與預(yù)測(cè)基礎(chǔ)上。當(dāng)代大模型雖被明確定位為“對(duì)話式搜索”或任務(wù)型助手,用戶仍頻繁構(gòu)建出角色扮演式的交互場(chǎng)景,擬人化使用模式在多個(gè)平臺(tái)中持續(xù)增長(zhǎng),難以僅靠界面設(shè)計(jì)或輸出約束加以徹底規(guī)避。

這種誤用行為的普遍性也引發(fā)對(duì)系統(tǒng)倫理邊界的關(guān)注。生成式系統(tǒng)已在婚姻、醫(yī)療等高度私人化場(chǎng)景中被非預(yù)期使用,即便系統(tǒng)未直接給出建議,內(nèi)容呈現(xiàn)或路徑引導(dǎo)本身已構(gòu)成對(duì)決策過(guò)程的介入。部分團(tuán)隊(duì)嘗試以“引用驅(qū)動(dòng)型問(wèn)答”限制系統(tǒng)角色定位,但在使用慣性與擬人理解框架下,用戶誤用仍廣泛存在。

這一趨勢(shì)在個(gè)體案例中表現(xiàn)尤為顯性。曾有角色型 AI 產(chǎn)品在真實(shí)事件中被卷入爭(zhēng)議:一位年輕用戶在結(jié)束生命前高頻使用該系統(tǒng),雖然系統(tǒng)責(zé)任難以界定,但沉浸式交互模式已引發(fā)對(duì)“情感接口依賴”的廣泛擔(dān)憂。盡管產(chǎn)品設(shè)計(jì)避免模擬情緒反應(yīng),用戶依然將其視為情感替代體。部分開(kāi)發(fā)團(tuán)隊(duì)已開(kāi)始回歸以“行為導(dǎo)向、工具導(dǎo)向”為核心的產(chǎn)品哲學(xué),試圖用功能邊界取代人格模擬,成為新一輪設(shè)計(jì)共識(shí)。

在未成年用戶群體中,風(fēng)險(xiǎn)復(fù)雜性進(jìn)一步放大。兒童用戶繞過(guò)系統(tǒng)限制的能力往往被低估,例如通過(guò)多語(yǔ)言混輸規(guī)避語(yǔ)義識(shí)別,或分段提示引導(dǎo)模型生成敏感內(nèi)容。當(dāng)前行業(yè)尚缺乏統(tǒng)一內(nèi)容審查機(jī)制,“交互白名單”“內(nèi)容頻次攔截”等防護(hù)策略仍在試驗(yàn)階段,但監(jiān)管與風(fēng)險(xiǎn)控制需求已日益迫近。

與此同時(shí),教育系統(tǒng)正經(jīng)歷由生成式 AI 引發(fā)的結(jié)構(gòu)性轉(zhuǎn)變。不僅教學(xué)手段需圍繞 AI Agent 所提供的個(gè)性化能力進(jìn)行重構(gòu),更關(guān)鍵的是教育目標(biāo)本身正在遷移。在信息可得性極高的背景下,傳統(tǒng)以知識(shí)灌輸為核心的教育模式逐步失效,“問(wèn)題定義力”與“判斷標(biāo)準(zhǔn)構(gòu)建”成為教學(xué)系統(tǒng)的核心輸出。

任務(wù)設(shè)計(jì)正從重復(fù)練習(xí)與模板化答案轉(zhuǎn)向結(jié)構(gòu)思維與探索導(dǎo)向。教師角色也正在從知識(shí)評(píng)分者轉(zhuǎn)為學(xué)習(xí)路徑的激發(fā)者,系統(tǒng)應(yīng)圍繞“提出 AI 無(wú)法直接解決的問(wèn)題”展開(kāi)設(shè)計(jì),讓學(xué)生在提出、驗(yàn)證與修正問(wèn)題的過(guò)程中,構(gòu)建具備解釋力與審美張力的知識(shí)結(jié)構(gòu)。

隨之提升的,是對(duì)表達(dá)力與結(jié)構(gòu)化認(rèn)知的需求。從數(shù)學(xué)模型到倫理議題,真正激發(fā)學(xué)習(xí)動(dòng)機(jī)的,往往不是知識(shí)本身的難度,而是其呈現(xiàn)方式的復(fù)雜性與美感。“如何組織復(fù)雜信息、表達(dá)認(rèn)知張力”正成為未來(lái)最稀缺的學(xué)習(xí)能力之一。

教育結(jié)構(gòu)的底層邏輯也在同步遷移:越來(lái)越多的本科生已開(kāi)始承擔(dān)原屬研究生階段的開(kāi)放任務(wù),教育系統(tǒng)正在由“傳授知識(shí)”向“喚起能力”轉(zhuǎn)變。面對(duì) AI 工具普及,教育的獨(dú)立價(jià)值將由是否能賦予學(xué)生結(jié)構(gòu)性認(rèn)知與判斷力來(lái)決定,而非知識(shí)點(diǎn)掌握本身。

能力閉環(huán)瓶頸與 AGI 路徑分歧

關(guān)于 AGI 的能力定義與路徑選擇,業(yè)界已形成結(jié)構(gòu)性分歧,這一爭(zhēng)議不再停留于學(xué)術(shù)層面,而直接影響到企業(yè)在系統(tǒng)架構(gòu)與產(chǎn)品策略上的根本判斷。盡管生成式 AI 已在多個(gè)垂直任務(wù)中展現(xiàn)初步執(zhí)行能力,但要實(shí)現(xiàn)具備通用性與自治決策力的系統(tǒng),仍面臨關(guān)鍵斷點(diǎn)。真正的挑戰(zhàn)不在于某項(xiàng)能力的單點(diǎn)突破,而在于“任務(wù)理解—計(jì)劃生成—?jiǎng)幼鲌?zhí)行—反饋評(píng)估”四個(gè)環(huán)節(jié)的完整閉環(huán)是否能夠建成。

這一斷裂在產(chǎn)品實(shí)踐中表現(xiàn)為:即使底層模型已更新,如 GPT-4 被替換為 O 系列,用戶仍普遍停留在舊版本標(biāo)簽下的性能感知中,對(duì)“推理模型”“O3”等術(shù)語(yǔ)缺乏理解。這意味著系統(tǒng)能力的實(shí)際躍遷被前端體驗(yàn)屏蔽,模型更新價(jià)值無(wú)法穿透至用戶側(cè),從而在產(chǎn)品路徑中造成“能力不可見(jiàn)”的結(jié)構(gòu)遮蔽。

基礎(chǔ)模型的研發(fā)方正在通過(guò)平臺(tái)化路徑重構(gòu)生態(tài)控制力,即同時(shí)掌握模型本體、用戶界面與數(shù)據(jù)反饋閉環(huán),形成從行為采集到能力演進(jìn)的自主循環(huán)。這種“模型即平臺(tái)”的結(jié)構(gòu)強(qiáng)化了數(shù)據(jù)主權(quán)與調(diào)優(yōu)能力,也讓單純依賴 API 的公司面臨商品化與價(jià)值鏈外溢的風(fēng)險(xiǎn)。

在此背景下,開(kāi)源模型的可行性獲得重新評(píng)估。以 DeepSeek 為代表的項(xiàng)目通過(guò)結(jié)構(gòu)創(chuàng)新與推理機(jī)制構(gòu)建,在非極限算力條件下實(shí)現(xiàn)能力逼近,打破了“開(kāi)源只能做輕量模型”的舊有認(rèn)知。當(dāng)前部分開(kāi)源系統(tǒng)已具備在部署效率、能力呈現(xiàn)與模塊架構(gòu)上的獨(dú)立價(jià)值,成為產(chǎn)業(yè)鏈中具備戰(zhàn)略選擇意義的變量。

與此同時(shí),模型系統(tǒng)與外部軟件環(huán)境之間的接口邊界依然模糊。當(dāng)前尚缺乏統(tǒng)一協(xié)議來(lái)實(shí)現(xiàn)模型與桌面軟件、Web App、第三方服務(wù)的順暢銜接,調(diào)用權(quán)限、上下文封裝與行為反饋標(biāo)準(zhǔn)未被統(tǒng)一,成為平臺(tái)間博弈的結(jié)構(gòu)焦點(diǎn)。誰(shuí)掌握最終執(zhí)行路徑的控制權(quán),決定了流量與收益的分配模式,也直接影響平臺(tái)對(duì) agent 系統(tǒng)的態(tài)度。

例如,Amazon、Instacart 等依賴廣告變現(xiàn)的平臺(tái)通常對(duì)外部 agent 系統(tǒng)保持克制態(tài)度,避免 agent 繞過(guò)前端完成交易,破壞其推薦系統(tǒng)與廣告定價(jià)模型。而 Uber 等按次計(jì)費(fèi)平臺(tái)對(duì) agent 嵌入接受度更高,甚至將其視為增量流量通道。平臺(tái)是否允許被“代理”或“封裝”,本質(zhì)上取決于其商業(yè)結(jié)構(gòu)與收益分配模式。

在系統(tǒng)架構(gòu)演進(jìn)過(guò)程中,模塊化抽象粒度成為設(shè)計(jì)策略中的核心變量。早期推理系統(tǒng)普遍采用顯式模塊劃分——排序、檢索、摘要等組件獨(dú)立調(diào)用,部分產(chǎn)品甚至通過(guò)角色命名(如 Sir Johnny、Mother Dinosaur)標(biāo)識(shí)模塊職能。但隨著復(fù)雜度上升與運(yùn)維壓力增加,系統(tǒng)結(jié)構(gòu)正向調(diào)度集成傾斜,主模型承擔(dān)更多任務(wù)分發(fā)與邏輯判斷職能,追求路徑收斂與穩(wěn)定性。

模塊設(shè)計(jì)的顆粒度折射出團(tuán)隊(duì)對(duì)“可維護(hù)性—任務(wù)復(fù)雜度—系統(tǒng)彈性”三者關(guān)系的理解。組件劃分過(guò)細(xì)容易引發(fā)接口不穩(wěn)定、邊界模糊等協(xié)作瓶頸,劃分過(guò)粗則削弱系統(tǒng)的適配靈活性與功能復(fù)用能力。這一策略無(wú)法靠通用模板解決,更依賴團(tuán)隊(duì)的工程判斷與系統(tǒng)直覺(jué)。

從能力判定的角度出發(fā),AGI 的真正成立并不在于模型是否能答對(duì)一個(gè)問(wèn)題,而在于其是否具備提出一套可執(zhí)行方案,并獲得組織信任的能力。例如,若模型能夠制定一條六個(gè)月的產(chǎn)品路線圖,解釋其資源配置依據(jù),并促使管理層投入百萬(wàn)元預(yù)算,即構(gòu)成“可信任的自治執(zhí)行體”的雛形。這一標(biāo)準(zhǔn)遠(yuǎn)高于傳統(tǒng)答題型 AI,更接近系統(tǒng)級(jí)決策支持。

限制這一目標(biāo)實(shí)現(xiàn)的關(guān)鍵因素,在于部署后的高質(zhì)量反饋鏈條仍未建成。即使模型能給出合理建議,如代碼修復(fù)方案,系統(tǒng)通常無(wú)法自動(dòng)驗(yàn)證其是否真正解決問(wèn)題,或是否引入新的潛在錯(cuò)誤,導(dǎo)致“行為結(jié)果—能力更新”之間缺乏穩(wěn)定傳導(dǎo)路徑。

一種潛在解決思路是:構(gòu)建容錯(cuò)的真實(shí)部署環(huán)境,引入強(qiáng)化學(xué)習(xí)機(jī)制,使行為結(jié)果成為訓(xùn)練反饋信號(hào),進(jìn)而實(shí)現(xiàn)“任務(wù)執(zhí)行—后驗(yàn)評(píng)估—能力微調(diào)”的動(dòng)態(tài)閉環(huán)。這一路徑的挑戰(zhàn)在于如何控制部署風(fēng)險(xiǎn)、評(píng)估延遲與成本,但一旦機(jī)制得以搭建,模型將從靜態(tài)能力體躍遷為具備自我校正能力的動(dòng)態(tài)執(zhí)行節(jié)點(diǎn),構(gòu)成通向 AGI 的現(xiàn)實(shí)工程通路。

本文由人人都是產(chǎn)品經(jīng)理作者【江天 Tim】,微信公眾號(hào):【有新Newin】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Perplexity 聯(lián)合創(chuàng)始人兼 CEO Aravind Srinivas 演講截圖

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!