字節(jié)扣子空間,這次扣的緊嗎?

0 評(píng)論 1510 瀏覽 1 收藏 16 分鐘

字節(jié)跳動(dòng)近期推出了通用AI Agent平臺(tái)“扣子空間(Coze Space)”,旨在讓用戶與AI Agent高效協(xié)作,完成復(fù)雜任務(wù)。然而,這一新平臺(tái)的實(shí)際表現(xiàn)如何?它是否真正滿足了用戶需求?本文將通過(guò)親身體驗(yàn),深入探討扣子空間的功能優(yōu)劣、MCP協(xié)議的創(chuàng)新與局限,以及這一平臺(tái)在商業(yè)化和生態(tài)建設(shè)方面的潛力與挑戰(zhàn)。

昨天(4月19日),字節(jié)推出通用AI Agent平臺(tái)扣子空間(Coze Space),目的讓用戶和AI Agent高效協(xié)作,完成各種復(fù)雜的任務(wù)。

核心能力有三個(gè):任務(wù)自動(dòng)化、專家Agent生態(tài)、以及打通MCP擴(kuò)展集成;據(jù)說(shuō),未來(lái)還將開(kāi)放開(kāi)發(fā)者平臺(tái),支持開(kāi)發(fā)者將應(yīng)用發(fā)布至扣子空間。

01.

拿到邀請(qǐng)碼,趕緊試了試。新建兩個(gè)任務(wù),一個(gè)整理內(nèi)容,另一個(gè)生成一個(gè)研究報(bào)告。

整理內(nèi)容上,選擇了探索模式。

上傳4個(gè)文件,全是Word文檔,跟它說(shuō):幫我把這幾個(gè)文件里的內(nèi)容整理一下。它就開(kāi)始干活了,這個(gè)任務(wù)它分成了三個(gè)步驟。

第一步,它跟我說(shuō),把這幾個(gè)文件的內(nèi)容混在一起整,輸出一個(gè)新文件;第二步,它說(shuō)已經(jīng)把文件格式轉(zhuǎn)換好了,把Excel轉(zhuǎn)成CSV,Word轉(zhuǎn)成Markdown,再把Markdown轉(zhuǎn)成TXT。

第三步,它說(shuō)已經(jīng)提取關(guān)鍵信息,總結(jié)出文件核心觀點(diǎn),現(xiàn)在要梳理下邏輯結(jié)構(gòu),輸出成一個(gè)Markdown格式的文檔就可以了。

整個(gè)過(guò)程大概花了不到30秒。

說(shuō)到優(yōu)點(diǎn),整理內(nèi)容結(jié)構(gòu)清晰,能清楚看到報(bào)告基本框架。比如:概述、特點(diǎn)、市場(chǎng)定位、目標(biāo)、未來(lái)規(guī)劃都非常清晰。

缺點(diǎn)也很明顯,內(nèi)容不夠詳細(xì)、大而全,重要東西根本沒(méi)提到。要是我想了解更多,再跟它發(fā)信息,它又重新開(kāi)始一輪探索,這有點(diǎn)尷尬了。

相比之下,Kimi、Grok或者Qwen整理出來(lái)的內(nèi)容更完整,還能接著提問(wèn)、優(yōu)化,效率好像更高。這是我對(duì)探索模式的感受。

再來(lái)說(shuō)說(shuō)規(guī)劃模式。

我跟它說(shuō):現(xiàn)在要寫(xiě)一篇關(guān)于扣子空間的內(nèi)容。然后請(qǐng)你幫我規(guī)劃一下,告訴我該從哪些方面入手。它第一步挺讓我滿意,把需求提煉出來(lái),整理成提示詞。

并說(shuō):第一步要先收集信息,第二步要規(guī)劃文章邏輯,第三步梳理邏輯,最后一步結(jié)構(gòu)化輸出,這些提示詞我可以改,也可以直接點(diǎn)開(kāi)始。

執(zhí)行步驟也挺清楚,按照上面的提示詞一步步來(lái);不過(guò)整個(gè)過(guò)程時(shí)間比較長(zhǎng),因?yàn)橐?guī)劃步驟多,大概花了13分鐘。

13分鐘里,我能清楚看到它每一步都在深度思考。我還能看到它是怎么思考的。比如:它會(huì)去瀏覽各種網(wǎng)站,像人人都是產(chǎn)品經(jīng)理、鈦媒體、騰訊新聞等。

不過(guò),搜索范圍和深度比智譜GLM、Kimi的探索版、Grok3要差一些。我提一個(gè)問(wèn)題,它匆匆調(diào)取三五個(gè)信息源,就結(jié)束總結(jié)了。

每一輪結(jié)束后,它會(huì)生成一個(gè)Markdown格式的文檔存起來(lái)。過(guò)程中可以點(diǎn)擊右側(cè)直接查看,它還提供代碼模式,直接下載,挺透明。

最終生成完,它會(huì)形成一個(gè)Markdown文檔,還包含一個(gè).gsx文件。前者我可以直接下載,后者能在網(wǎng)站里打開(kāi)。

說(shuō)說(shuō)它的優(yōu)勢(shì),一,內(nèi)容很全面,文檔大概有8000字,上下文記憶模型還不錯(cuò);二,它能自主規(guī)劃并生成網(wǎng)站,可視化能力也挺強(qiáng)。

劣勢(shì)也很明顯,內(nèi)容深度不夠,抓取信息、生成文本都比較表面,純理論、廢話多,沒(méi)加入具體的研究案例。

還有一點(diǎn),它目前支持多任務(wù)同時(shí)進(jìn)行。新建一個(gè)任務(wù),返回主頁(yè)面再建一個(gè),它依然可以同步運(yùn)行。這就是我對(duì)規(guī)劃模式的整體感受。

一句話總結(jié)即:能跑通流程,但還有很大的提升空間。

02.

體驗(yàn)完之后,我感覺(jué)MCP平臺(tái)是不是卷錯(cuò)方向了。

MCP(Model Context Protocol)平臺(tái)的核心,是用一個(gè)標(biāo)準(zhǔn)化協(xié)議,重新定義AI應(yīng)用和外部系統(tǒng)怎么合作。

以前,各種任務(wù)系統(tǒng)之間對(duì)接很麻煩。

釘釘審批流程要單獨(dú)對(duì)接CRM、ERP系統(tǒng),開(kāi)發(fā)成本高,更新也很慢;百度千帆AppBuilder以前接入企業(yè)數(shù)據(jù)庫(kù),得為MySQL、MongoDB分別開(kāi)發(fā)接口。用了MCP之后,直接調(diào)用一個(gè)預(yù)置的“MCP SQL Server”,就能搞定不同數(shù)據(jù)庫(kù)的對(duì)接。

字節(jié)扣子空間接入高德地圖服務(wù),用了MCP協(xié)議,本質(zhì)也是為了縮短開(kāi)發(fā)和工具調(diào)用的時(shí)間。

再看看開(kāi)發(fā)和維護(hù)成本方面,MCP是組件資產(chǎn)化和生態(tài)復(fù)用,把任務(wù)系統(tǒng)開(kāi)發(fā),從「手工作坊」升級(jí)成「工業(yè)化生產(chǎn)」的過(guò)程。

比如,支付功能集成,傳統(tǒng)方式要5個(gè)人天,用了MCP可能只要0.5個(gè)人天;跨平臺(tái)數(shù)據(jù)同步,傳統(tǒng)方式要8個(gè)人天,用了MCP只要1個(gè)人天。

開(kāi)放協(xié)作生態(tài)這塊,MCP屬于「人在環(huán)路」機(jī)制。

什么意思呢?

任務(wù)執(zhí)行到關(guān)鍵節(jié)點(diǎn)時(shí),系統(tǒng)會(huì)自動(dòng)觸發(fā)人工確認(rèn);比如合同審核,最后你要簽字,這樣一來(lái),既利用了自動(dòng)化的效率,又能在關(guān)鍵時(shí)刻控制風(fēng)險(xiǎn),平衡兩者。

這種機(jī)制讓MCP通過(guò)協(xié)議中立性和工具可插拔性,打破了傳統(tǒng)生態(tài)的割據(jù),讓任務(wù)系統(tǒng)從封閉走向開(kāi)放。

所以,MCP平臺(tái)的本質(zhì)是什么?

表面看,它就是一個(gè)任務(wù)系統(tǒng)。但深層來(lái)看,它是通過(guò)協(xié)議層的抽象,把任務(wù)執(zhí)行從“工具驅(qū)動(dòng)”升級(jí)為「意圖驅(qū)動(dòng)」。

什么是意圖驅(qū)動(dòng)?

我要查詢訂單狀態(tài)、獲取天氣信息、處理投訴等,MCP通過(guò)智能路由,識(shí)別出我的意圖,然后在任務(wù)執(zhí)行過(guò)程中,根據(jù)實(shí)際情況,進(jìn)行調(diào)整。

如果某個(gè)服務(wù)不可用,系統(tǒng)可以自動(dòng)切換到備用服務(wù)。鑒于此,這項(xiàng)革新的核心價(jià)值可以歸結(jié)為三點(diǎn):

一,降低依賴 ,系統(tǒng)之間不再緊緊綁在一起,改動(dòng)起來(lái)更輕松;

二,靈活應(yīng)對(duì):流程不是固定的,能隨時(shí)根據(jù)需求和資源變化調(diào)整;

三,開(kāi)放共享,打破封閉,讓更多工具和資源可以互通復(fù)用。

說(shuō)白了,這種革新,是讓任務(wù)系統(tǒng),從「死板的執(zhí)行工具」,變成「靈活的智能連接器」,能更好地對(duì)接AI能力和實(shí)際需求。

03.

再看看現(xiàn)在的MCP平臺(tái),有沒(méi)有“重復(fù)造輪子”的問(wèn)題?

目前,傳統(tǒng)網(wǎng)絡(luò)接口(比如RESTful API和OpenAPI)已經(jīng)非常成熟,它們像不同軟件之間的“通信橋梁”,用起來(lái)很方便。

現(xiàn)在,MCP要求把現(xiàn)有的接口重新封裝成一個(gè)專用的“服務(wù)”。這不僅增加了開(kāi)發(fā)成本,還未能解決核心的交互問(wèn)題。

舉個(gè)例子:

直接調(diào)用接口生成數(shù)據(jù)結(jié)構(gòu)(相當(dāng)于把數(shù)據(jù)打包成標(biāo)準(zhǔn)格式)其實(shí)更簡(jiǎn)單,而MCP的協(xié)議層抽象,可能顯得有些“過(guò)度設(shè)計(jì)”。

再看看函數(shù)調(diào)用機(jī)制。MCP實(shí)現(xiàn)了不同模型之間的統(tǒng)一調(diào)用,但在一些高頻輕量的任務(wù)中,大家還是更傾向于使用原廠接口。在簡(jiǎn)單的查詢場(chǎng)景里,函數(shù)調(diào)用依然是最高效的。

另外,對(duì)開(kāi)發(fā)者來(lái)說(shuō),學(xué)習(xí)MCP的協(xié)議語(yǔ)法、工具鏈和調(diào)試規(guī)范(比如:服務(wù)器發(fā)送事件SSE的傳輸配置)增加了不少?gòu)?fù)雜度;而傳統(tǒng)的接口調(diào)用,只要掌握基本的網(wǎng)絡(luò)通信技能就夠了。

更重要的是,在多模態(tài)數(shù)據(jù)處理(比如:同時(shí)處理文字、圖片、聲音等復(fù)雜數(shù)據(jù))這種場(chǎng)景下,MCP協(xié)議的擴(kuò)展性目前還得打個(gè)問(wèn)號(hào);可以說(shuō),協(xié)議的復(fù)雜度可能已經(jīng)超出了實(shí)際需求。

再說(shuō)說(shuō),標(biāo)準(zhǔn)化與碎片化的悖論。

現(xiàn)在很多大廠都在推出自己的MCP市場(chǎng),但這些服務(wù)互不兼容。阿里云只支持通義千問(wèn)模型,這就導(dǎo)致了一個(gè)問(wèn)題:可能會(huì)形成類似Android的碎片化生態(tài),和協(xié)議初衷背道而馳。

開(kāi)源社區(qū)的工具(比如魔塔社區(qū))和企業(yè)級(jí)方案之間也有技術(shù)斷層,中小開(kāi)發(fā)者不得不面對(duì)「適配多套協(xié)議」的困境。

另外,MCP的協(xié)議擴(kuò)展性也存在局限。目前它的權(quán)限控制只能到會(huì)話級(jí)別,往深層次的就不支持了,這對(duì)于金融、醫(yī)療行業(yè)有很大制約性。

值得一提的是安全性。MCP的「人在環(huán)路」機(jī)制依賴人工干預(yù),但現(xiàn)在很多MCP平臺(tái)卻希望實(shí)現(xiàn)自動(dòng)化流程,這其實(shí)和技術(shù)創(chuàng)新的方向有點(diǎn)背道而馳。

因?yàn)樵诙郃gent協(xié)作時(shí),規(guī)劃有效性不足,會(huì)導(dǎo)致級(jí)聯(lián)故障,一個(gè)小問(wèn)題引發(fā)一連串的大麻煩,你還修改不了;反之,用戶希望的是:哪個(gè)環(huán)節(jié)不滿意,都能參與進(jìn)去。

至于,商業(yè)化問(wèn)題就更不用說(shuō)了。

目前MCP市場(chǎng)的應(yīng)用主要集中在生活服務(wù)類工具上(天氣查詢、地圖導(dǎo)航),但在制造業(yè)領(lǐng)域,像OT系統(tǒng),這樣的接入案例還很少,而且,復(fù)雜工業(yè)協(xié)議里的MCP也沒(méi)有被突破。

雖然Serverless部署降低了運(yùn)維負(fù)擔(dān),但像阿里云這樣的平臺(tái),計(jì)費(fèi)模式不夠透明,長(zhǎng)期使用下來(lái)的成本可能比自建API還高。

所以,我個(gè)人認(rèn)為,它的商業(yè)價(jià)值,還存在驗(yàn)證性,未來(lái)要推動(dòng)協(xié)議標(biāo)準(zhǔn)化和行業(yè)深度適配。

04.

既然這樣,問(wèn)題來(lái)了,什么樣的MCP平臺(tái)具備商業(yè)價(jià)值?或者說(shuō)能被中小企業(yè)用起來(lái)?

我沒(méi)辦法從宏觀角度回答這個(gè)問(wèn)題,但從具體使用場(chǎng)景出發(fā),可以談?wù)劯惺堋?/p>

假設(shè)要用一個(gè)MCP平臺(tái)來(lái)搭建一個(gè)高效工作流,比如做PPT或者搞用戶研究,那我更喜歡一種叫「規(guī)劃模式」的方式。

所謂規(guī)劃模式,即把想法告訴系統(tǒng),通過(guò)不斷交互和補(bǔ)充內(nèi)容,系統(tǒng)能夠記住需求,并逐步幫我規(guī)劃出一個(gè)可行性的報(bào)告或解決方案。

這種模式是從用戶角度出發(fā),讓用戶在使用MCP平臺(tái)時(shí),感覺(jué)像在Notion上完成一項(xiàng)任務(wù)一樣自然;雖然Notion本質(zhì)是個(gè)協(xié)作筆記管理工具,但從底層邏輯來(lái)看,它和MCP平臺(tái)的使用體驗(yàn)其實(shí)是相通的。

比如:

我在Notion里輸入一個(gè)問(wèn)題,用斜杠(/)調(diào)用各種工具,基于問(wèn)題的內(nèi)容選擇合適的工具,最終完成整個(gè)工作流;如果把這種體驗(yàn)搬到MCP平臺(tái)上,其實(shí)是輸入問(wèn)題后,通過(guò)調(diào)用不同的AI模型或工具,一步步完成任務(wù)。

從這個(gè)角度反推,開(kāi)發(fā)者要做這幾件重要的事:

一,建立通用任務(wù)框架;開(kāi)發(fā)者要先設(shè)計(jì)一個(gè)通用任務(wù)框架,可以適用于多種場(chǎng)景;

二,支持靈活交互;在用戶使用過(guò)程中,最好能支持暫?;蛘{(diào)整任務(wù)流程,這樣才能為未來(lái)的自動(dòng)化打下基礎(chǔ)。

三,提升任務(wù)的準(zhǔn)確性;只有當(dāng)任務(wù)的每個(gè)環(huán)節(jié)都能被精準(zhǔn)規(guī)劃和執(zhí)行時(shí),才有可能實(shí)現(xiàn)真正的自動(dòng)化。換句話說(shuō),中間過(guò)程不用人工干預(yù),則很難更聰明。

從企業(yè)角度看也是一樣。假設(shè)我在釘釘、飛書(shū)的生態(tài)中想用一個(gè)MCP平臺(tái),我會(huì)怎么用呢?

舉個(gè)例子:

我是一名銷售,定期拜訪客戶并形成資料,最后匯報(bào)給老板。整個(gè)過(guò)程可能會(huì)是這樣的:

首先是信息沉淀。拜訪完客戶后,把信息整理出來(lái),這一步涉及AI輔助撰寫(xiě)內(nèi)容;撰寫(xiě)完成后,把內(nèi)容整理成一份可視化報(bào)告,這一步要MCP平臺(tái)調(diào)用可視化工具,最后,我要把這份報(bào)告發(fā)到領(lǐng)導(dǎo)的郵箱里,調(diào)用郵箱工具。

所以,整個(gè)流程用MCP串聯(lián)起來(lái)是:調(diào)用寫(xiě)作工具、調(diào)用可視化工具、調(diào)用外部郵箱、定時(shí)發(fā)送給工具進(jìn)行分發(fā)。

從這個(gè)角度看,MCP平臺(tái)的作用是通過(guò)協(xié)議或API把這些工具串聯(lián)起來(lái),形成一個(gè)完整的工作流。

因此,一個(gè)好的MCP平臺(tái)應(yīng)該能讓用戶像在Notion上完成任務(wù)一樣輕松,同時(shí)為開(kāi)發(fā)者提供足夠的擴(kuò)展性和靈活性。

再對(duì)比字節(jié)的扣子平臺(tái),它扣的緊用戶需求嗎?我覺(jué)得第一步做對(duì)了,但任務(wù)過(guò)程的干預(yù)還不夠靈活,至于生態(tài)的補(bǔ)齊,這要時(shí)間。

以上,是我的看法。

本文由人人都是產(chǎn)品經(jīng)理作者【王智遠(yuǎn)】,微信公眾號(hào):【王智遠(yuǎn)】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!