字節(jié)扣子空間,這次扣的緊嗎?
字節(jié)跳動(dòng)近期推出了通用AI Agent平臺(tái)“扣子空間(Coze Space)”,旨在讓用戶與AI Agent高效協(xié)作,完成復(fù)雜任務(wù)。然而,這一新平臺(tái)的實(shí)際表現(xiàn)如何?它是否真正滿足了用戶需求?本文將通過(guò)親身體驗(yàn),深入探討扣子空間的功能優(yōu)劣、MCP協(xié)議的創(chuàng)新與局限,以及這一平臺(tái)在商業(yè)化和生態(tài)建設(shè)方面的潛力與挑戰(zhàn)。
昨天(4月19日),字節(jié)推出通用AI Agent平臺(tái)扣子空間(Coze Space),目的讓用戶和AI Agent高效協(xié)作,完成各種復(fù)雜的任務(wù)。
核心能力有三個(gè):任務(wù)自動(dòng)化、專家Agent生態(tài)、以及打通MCP擴(kuò)展集成;據(jù)說(shuō),未來(lái)還將開(kāi)放開(kāi)發(fā)者平臺(tái),支持開(kāi)發(fā)者將應(yīng)用發(fā)布至扣子空間。
01.
拿到邀請(qǐng)碼,趕緊試了試。新建兩個(gè)任務(wù),一個(gè)整理內(nèi)容,另一個(gè)生成一個(gè)研究報(bào)告。
整理內(nèi)容上,選擇了探索模式。
上傳4個(gè)文件,全是Word文檔,跟它說(shuō):幫我把這幾個(gè)文件里的內(nèi)容整理一下。它就開(kāi)始干活了,這個(gè)任務(wù)它分成了三個(gè)步驟。
第一步,它跟我說(shuō),把這幾個(gè)文件的內(nèi)容混在一起整,輸出一個(gè)新文件;第二步,它說(shuō)已經(jīng)把文件格式轉(zhuǎn)換好了,把Excel轉(zhuǎn)成CSV,Word轉(zhuǎn)成Markdown,再把Markdown轉(zhuǎn)成TXT。
第三步,它說(shuō)已經(jīng)提取關(guān)鍵信息,總結(jié)出文件核心觀點(diǎn),現(xiàn)在要梳理下邏輯結(jié)構(gòu),輸出成一個(gè)Markdown格式的文檔就可以了。
整個(gè)過(guò)程大概花了不到30秒。
說(shuō)到優(yōu)點(diǎn),整理內(nèi)容結(jié)構(gòu)清晰,能清楚看到報(bào)告基本框架。比如:概述、特點(diǎn)、市場(chǎng)定位、目標(biāo)、未來(lái)規(guī)劃都非常清晰。
缺點(diǎn)也很明顯,內(nèi)容不夠詳細(xì)、大而全,重要東西根本沒(méi)提到。要是我想了解更多,再跟它發(fā)信息,它又重新開(kāi)始一輪探索,這有點(diǎn)尷尬了。
相比之下,Kimi、Grok或者Qwen整理出來(lái)的內(nèi)容更完整,還能接著提問(wèn)、優(yōu)化,效率好像更高。這是我對(duì)探索模式的感受。
再來(lái)說(shuō)說(shuō)規(guī)劃模式。
我跟它說(shuō):現(xiàn)在要寫(xiě)一篇關(guān)于扣子空間的內(nèi)容。然后請(qǐng)你幫我規(guī)劃一下,告訴我該從哪些方面入手。它第一步挺讓我滿意,把需求提煉出來(lái),整理成提示詞。
并說(shuō):第一步要先收集信息,第二步要規(guī)劃文章邏輯,第三步梳理邏輯,最后一步結(jié)構(gòu)化輸出,這些提示詞我可以改,也可以直接點(diǎn)開(kāi)始。
執(zhí)行步驟也挺清楚,按照上面的提示詞一步步來(lái);不過(guò)整個(gè)過(guò)程時(shí)間比較長(zhǎng),因?yàn)橐?guī)劃步驟多,大概花了13分鐘。
13分鐘里,我能清楚看到它每一步都在深度思考。我還能看到它是怎么思考的。比如:它會(huì)去瀏覽各種網(wǎng)站,像人人都是產(chǎn)品經(jīng)理、鈦媒體、騰訊新聞等。
不過(guò),搜索范圍和深度比智譜GLM、Kimi的探索版、Grok3要差一些。我提一個(gè)問(wèn)題,它匆匆調(diào)取三五個(gè)信息源,就結(jié)束總結(jié)了。
每一輪結(jié)束后,它會(huì)生成一個(gè)Markdown格式的文檔存起來(lái)。過(guò)程中可以點(diǎn)擊右側(cè)直接查看,它還提供代碼模式,直接下載,挺透明。
最終生成完,它會(huì)形成一個(gè)Markdown文檔,還包含一個(gè).gsx文件。前者我可以直接下載,后者能在網(wǎng)站里打開(kāi)。
說(shuō)說(shuō)它的優(yōu)勢(shì),一,內(nèi)容很全面,文檔大概有8000字,上下文記憶模型還不錯(cuò);二,它能自主規(guī)劃并生成網(wǎng)站,可視化能力也挺強(qiáng)。
劣勢(shì)也很明顯,內(nèi)容深度不夠,抓取信息、生成文本都比較表面,純理論、廢話多,沒(méi)加入具體的研究案例。
還有一點(diǎn),它目前支持多任務(wù)同時(shí)進(jìn)行。新建一個(gè)任務(wù),返回主頁(yè)面再建一個(gè),它依然可以同步運(yùn)行。這就是我對(duì)規(guī)劃模式的整體感受。
一句話總結(jié)即:能跑通流程,但還有很大的提升空間。
02.
體驗(yàn)完之后,我感覺(jué)MCP平臺(tái)是不是卷錯(cuò)方向了。
MCP(Model Context Protocol)平臺(tái)的核心,是用一個(gè)標(biāo)準(zhǔn)化協(xié)議,重新定義AI應(yīng)用和外部系統(tǒng)怎么合作。
以前,各種任務(wù)系統(tǒng)之間對(duì)接很麻煩。
釘釘審批流程要單獨(dú)對(duì)接CRM、ERP系統(tǒng),開(kāi)發(fā)成本高,更新也很慢;百度千帆AppBuilder以前接入企業(yè)數(shù)據(jù)庫(kù),得為MySQL、MongoDB分別開(kāi)發(fā)接口。用了MCP之后,直接調(diào)用一個(gè)預(yù)置的“MCP SQL Server”,就能搞定不同數(shù)據(jù)庫(kù)的對(duì)接。
字節(jié)扣子空間接入高德地圖服務(wù),用了MCP協(xié)議,本質(zhì)也是為了縮短開(kāi)發(fā)和工具調(diào)用的時(shí)間。
再看看開(kāi)發(fā)和維護(hù)成本方面,MCP是組件資產(chǎn)化和生態(tài)復(fù)用,把任務(wù)系統(tǒng)開(kāi)發(fā),從「手工作坊」升級(jí)成「工業(yè)化生產(chǎn)」的過(guò)程。
比如,支付功能集成,傳統(tǒng)方式要5個(gè)人天,用了MCP可能只要0.5個(gè)人天;跨平臺(tái)數(shù)據(jù)同步,傳統(tǒng)方式要8個(gè)人天,用了MCP只要1個(gè)人天。
開(kāi)放協(xié)作生態(tài)這塊,MCP屬于「人在環(huán)路」機(jī)制。
什么意思呢?
任務(wù)執(zhí)行到關(guān)鍵節(jié)點(diǎn)時(shí),系統(tǒng)會(huì)自動(dòng)觸發(fā)人工確認(rèn);比如合同審核,最后你要簽字,這樣一來(lái),既利用了自動(dòng)化的效率,又能在關(guān)鍵時(shí)刻控制風(fēng)險(xiǎn),平衡兩者。
這種機(jī)制讓MCP通過(guò)協(xié)議中立性和工具可插拔性,打破了傳統(tǒng)生態(tài)的割據(jù),讓任務(wù)系統(tǒng)從封閉走向開(kāi)放。
所以,MCP平臺(tái)的本質(zhì)是什么?
表面看,它就是一個(gè)任務(wù)系統(tǒng)。但深層來(lái)看,它是通過(guò)協(xié)議層的抽象,把任務(wù)執(zhí)行從“工具驅(qū)動(dòng)”升級(jí)為「意圖驅(qū)動(dòng)」。
什么是意圖驅(qū)動(dòng)?
我要查詢訂單狀態(tài)、獲取天氣信息、處理投訴等,MCP通過(guò)智能路由,識(shí)別出我的意圖,然后在任務(wù)執(zhí)行過(guò)程中,根據(jù)實(shí)際情況,進(jìn)行調(diào)整。
如果某個(gè)服務(wù)不可用,系統(tǒng)可以自動(dòng)切換到備用服務(wù)。鑒于此,這項(xiàng)革新的核心價(jià)值可以歸結(jié)為三點(diǎn):
一,降低依賴 ,系統(tǒng)之間不再緊緊綁在一起,改動(dòng)起來(lái)更輕松;
二,靈活應(yīng)對(duì):流程不是固定的,能隨時(shí)根據(jù)需求和資源變化調(diào)整;
三,開(kāi)放共享,打破封閉,讓更多工具和資源可以互通復(fù)用。
說(shuō)白了,這種革新,是讓任務(wù)系統(tǒng),從「死板的執(zhí)行工具」,變成「靈活的智能連接器」,能更好地對(duì)接AI能力和實(shí)際需求。
03.
再看看現(xiàn)在的MCP平臺(tái),有沒(méi)有“重復(fù)造輪子”的問(wèn)題?
目前,傳統(tǒng)網(wǎng)絡(luò)接口(比如RESTful API和OpenAPI)已經(jīng)非常成熟,它們像不同軟件之間的“通信橋梁”,用起來(lái)很方便。
現(xiàn)在,MCP要求把現(xiàn)有的接口重新封裝成一個(gè)專用的“服務(wù)”。這不僅增加了開(kāi)發(fā)成本,還未能解決核心的交互問(wèn)題。
舉個(gè)例子:
直接調(diào)用接口生成數(shù)據(jù)結(jié)構(gòu)(相當(dāng)于把數(shù)據(jù)打包成標(biāo)準(zhǔn)格式)其實(shí)更簡(jiǎn)單,而MCP的協(xié)議層抽象,可能顯得有些“過(guò)度設(shè)計(jì)”。
再看看函數(shù)調(diào)用機(jī)制。MCP實(shí)現(xiàn)了不同模型之間的統(tǒng)一調(diào)用,但在一些高頻輕量的任務(wù)中,大家還是更傾向于使用原廠接口。在簡(jiǎn)單的查詢場(chǎng)景里,函數(shù)調(diào)用依然是最高效的。
另外,對(duì)開(kāi)發(fā)者來(lái)說(shuō),學(xué)習(xí)MCP的協(xié)議語(yǔ)法、工具鏈和調(diào)試規(guī)范(比如:服務(wù)器發(fā)送事件SSE的傳輸配置)增加了不少?gòu)?fù)雜度;而傳統(tǒng)的接口調(diào)用,只要掌握基本的網(wǎng)絡(luò)通信技能就夠了。
更重要的是,在多模態(tài)數(shù)據(jù)處理(比如:同時(shí)處理文字、圖片、聲音等復(fù)雜數(shù)據(jù))這種場(chǎng)景下,MCP協(xié)議的擴(kuò)展性目前還得打個(gè)問(wèn)號(hào);可以說(shuō),協(xié)議的復(fù)雜度可能已經(jīng)超出了實(shí)際需求。
再說(shuō)說(shuō),標(biāo)準(zhǔn)化與碎片化的悖論。
現(xiàn)在很多大廠都在推出自己的MCP市場(chǎng),但這些服務(wù)互不兼容。阿里云只支持通義千問(wèn)模型,這就導(dǎo)致了一個(gè)問(wèn)題:可能會(huì)形成類似Android的碎片化生態(tài),和協(xié)議初衷背道而馳。
開(kāi)源社區(qū)的工具(比如魔塔社區(qū))和企業(yè)級(jí)方案之間也有技術(shù)斷層,中小開(kāi)發(fā)者不得不面對(duì)「適配多套協(xié)議」的困境。
另外,MCP的協(xié)議擴(kuò)展性也存在局限。目前它的權(quán)限控制只能到會(huì)話級(jí)別,往深層次的就不支持了,這對(duì)于金融、醫(yī)療行業(yè)有很大制約性。
值得一提的是安全性。MCP的「人在環(huán)路」機(jī)制依賴人工干預(yù),但現(xiàn)在很多MCP平臺(tái)卻希望實(shí)現(xiàn)自動(dòng)化流程,這其實(shí)和技術(shù)創(chuàng)新的方向有點(diǎn)背道而馳。
因?yàn)樵诙郃gent協(xié)作時(shí),規(guī)劃有效性不足,會(huì)導(dǎo)致級(jí)聯(lián)故障,一個(gè)小問(wèn)題引發(fā)一連串的大麻煩,你還修改不了;反之,用戶希望的是:哪個(gè)環(huán)節(jié)不滿意,都能參與進(jìn)去。
至于,商業(yè)化問(wèn)題就更不用說(shuō)了。
目前MCP市場(chǎng)的應(yīng)用主要集中在生活服務(wù)類工具上(天氣查詢、地圖導(dǎo)航),但在制造業(yè)領(lǐng)域,像OT系統(tǒng),這樣的接入案例還很少,而且,復(fù)雜工業(yè)協(xié)議里的MCP也沒(méi)有被突破。
雖然Serverless部署降低了運(yùn)維負(fù)擔(dān),但像阿里云這樣的平臺(tái),計(jì)費(fèi)模式不夠透明,長(zhǎng)期使用下來(lái)的成本可能比自建API還高。
所以,我個(gè)人認(rèn)為,它的商業(yè)價(jià)值,還存在驗(yàn)證性,未來(lái)要推動(dòng)協(xié)議標(biāo)準(zhǔn)化和行業(yè)深度適配。
04.
既然這樣,問(wèn)題來(lái)了,什么樣的MCP平臺(tái)具備商業(yè)價(jià)值?或者說(shuō)能被中小企業(yè)用起來(lái)?
我沒(méi)辦法從宏觀角度回答這個(gè)問(wèn)題,但從具體使用場(chǎng)景出發(fā),可以談?wù)劯惺堋?/p>
假設(shè)要用一個(gè)MCP平臺(tái)來(lái)搭建一個(gè)高效工作流,比如做PPT或者搞用戶研究,那我更喜歡一種叫「規(guī)劃模式」的方式。
所謂規(guī)劃模式,即把想法告訴系統(tǒng),通過(guò)不斷交互和補(bǔ)充內(nèi)容,系統(tǒng)能夠記住需求,并逐步幫我規(guī)劃出一個(gè)可行性的報(bào)告或解決方案。
這種模式是從用戶角度出發(fā),讓用戶在使用MCP平臺(tái)時(shí),感覺(jué)像在Notion上完成一項(xiàng)任務(wù)一樣自然;雖然Notion本質(zhì)是個(gè)協(xié)作筆記管理工具,但從底層邏輯來(lái)看,它和MCP平臺(tái)的使用體驗(yàn)其實(shí)是相通的。
比如:
我在Notion里輸入一個(gè)問(wèn)題,用斜杠(/)調(diào)用各種工具,基于問(wèn)題的內(nèi)容選擇合適的工具,最終完成整個(gè)工作流;如果把這種體驗(yàn)搬到MCP平臺(tái)上,其實(shí)是輸入問(wèn)題后,通過(guò)調(diào)用不同的AI模型或工具,一步步完成任務(wù)。
從這個(gè)角度反推,開(kāi)發(fā)者要做這幾件重要的事:
一,建立通用任務(wù)框架;開(kāi)發(fā)者要先設(shè)計(jì)一個(gè)通用任務(wù)框架,可以適用于多種場(chǎng)景;
二,支持靈活交互;在用戶使用過(guò)程中,最好能支持暫?;蛘{(diào)整任務(wù)流程,這樣才能為未來(lái)的自動(dòng)化打下基礎(chǔ)。
三,提升任務(wù)的準(zhǔn)確性;只有當(dāng)任務(wù)的每個(gè)環(huán)節(jié)都能被精準(zhǔn)規(guī)劃和執(zhí)行時(shí),才有可能實(shí)現(xiàn)真正的自動(dòng)化。換句話說(shuō),中間過(guò)程不用人工干預(yù),則很難更聰明。
從企業(yè)角度看也是一樣。假設(shè)我在釘釘、飛書(shū)的生態(tài)中想用一個(gè)MCP平臺(tái),我會(huì)怎么用呢?
舉個(gè)例子:
我是一名銷售,定期拜訪客戶并形成資料,最后匯報(bào)給老板。整個(gè)過(guò)程可能會(huì)是這樣的:
首先是信息沉淀。拜訪完客戶后,把信息整理出來(lái),這一步涉及AI輔助撰寫(xiě)內(nèi)容;撰寫(xiě)完成后,把內(nèi)容整理成一份可視化報(bào)告,這一步要MCP平臺(tái)調(diào)用可視化工具,最后,我要把這份報(bào)告發(fā)到領(lǐng)導(dǎo)的郵箱里,調(diào)用郵箱工具。
所以,整個(gè)流程用MCP串聯(lián)起來(lái)是:調(diào)用寫(xiě)作工具、調(diào)用可視化工具、調(diào)用外部郵箱、定時(shí)發(fā)送給工具進(jìn)行分發(fā)。
從這個(gè)角度看,MCP平臺(tái)的作用是通過(guò)協(xié)議或API把這些工具串聯(lián)起來(lái),形成一個(gè)完整的工作流。
因此,一個(gè)好的MCP平臺(tái)應(yīng)該能讓用戶像在Notion上完成任務(wù)一樣輕松,同時(shí)為開(kāi)發(fā)者提供足夠的擴(kuò)展性和靈活性。
再對(duì)比字節(jié)的扣子平臺(tái),它扣的緊用戶需求嗎?我覺(jué)得第一步做對(duì)了,但任務(wù)過(guò)程的干預(yù)還不夠靈活,至于生態(tài)的補(bǔ)齊,這要時(shí)間。
以上,是我的看法。
本文由人人都是產(chǎn)品經(jīng)理作者【王智遠(yuǎn)】,微信公眾號(hào):【王智遠(yuǎn)】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!