Manus真的是AGI曙光嗎?

0 評論 953 瀏覽 0 收藏 7 分鐘

近日,一家創(chuàng)業(yè)公司推出了他們的AGI產(chǎn)品——Manus。這款產(chǎn)品具備多種調(diào)用工具的能力,從生成PPT到安排面試,再到開發(fā)小游戲,無所不能。在鋪天蓋地的自媒體宣傳下,Manus似乎成了AI新時代的曙光。本文將冷靜分析Manus的進步與局限,探討它是否真的能改變世界。

GPT3.5在轟動世界之初,奧特曼就指出他們的目標是通用人工智能,即改變世界的AI力量;24年初OpenAI內(nèi)部的一系列人員動蕩,被外界小道消息解讀為GPT迎來了AGI,內(nèi)部爭斗是因為AI到了影響人類安全的地步,一度引起業(yè)內(nèi)緊張和躁動;而隨著事件的平息,AGI又逐步褪去了聚光燈;

2025年3月6日凌晨,武漢(北京亦有分部)一家創(chuàng)業(yè)公司發(fā)布視頻介紹,推出了他們內(nèi)部打磨許久的AGI產(chǎn)品”Manus“,從介紹視頻中能看到,Manus具備調(diào)用工具的能力,可以生成PPT、做面試安排、開發(fā)小游戲、生成旅行規(guī)劃等等,相比我們用習慣了的對話產(chǎn)品,讓人眼前一亮;

借助鋪天蓋地的自媒體信息,Manus被推上神壇,冠以”有一次改變國運“的稱號??吹組anus介紹的第一個,我想到了Copilot,而過去1年多,我所在團隊也一直在深入探索和嘗試金融終端的Copilot助手模式落地。所以,今天我們冷靜分析下,Manus,這個AGI時代的曙光。

Manus的進步意義

絕大多數(shù)人接觸AIGC是從GPT3.5、文心一言、豆包等chat對話類產(chǎn)品開始,他們把AI想象成一個類人,能傾聽和理解,并給出回復。隨著抖音AI特效的推廣,又逐漸有人接觸活照片(DID)、文生圖/視頻(text2img、img2vid)等AIGC應用。對于分從業(yè)人員來說,可能很多人難以把大模型與AI應用區(qū)別看。

雖然,越來越多的AI對話產(chǎn)品,如文心一言、豆包等,都集成了文生圖、PPT生成、音樂生成等技能,但操作流程不便(需要手動切換并選中相關技能),導致使用者少,未充分發(fā)揮AI的效用;在Manus介紹視頻推出的瞬間,大家被AI編排工具、調(diào)用工具和整合產(chǎn)出結(jié)果的能力所震撼,似乎看到了AI規(guī)劃、執(zhí)行和落地的想象空間。絕大多數(shù)人被這種臆想的未來所鼓舞,加之無法親身驗證,才有了如此轟動的效果。

總結(jié)一下,Manus在Agent規(guī)劃上邁出了一步,將大眾對于AI的”聊天“這一產(chǎn)品形態(tài)認知,推向了更廣闊的”應用“這一領域,大模型從 “通用對話” 邁向 “解決實際問題”,勢必加快AIGC在各垂直領域的落地;

Manus的核心價值

ChatGPT在推出時,曾轟轟烈烈推廣過AppStore計劃,開放API生態(tài),廣泛接入X(Twitter)等各大應用,借助chat形態(tài),調(diào)用相關APP實現(xiàn)發(fā)文、定外賣等操作,實現(xiàn)AI助理的雛形;

然而,GPT的Plugin有頭無尾(私以為技術驅(qū)動型公司,缺乏運營和商業(yè)策略),偉大構(gòu)想未能有效落地。自23年開始,Microsoft、Apple、Honor、Vivo、HUAWEI等一眾擁有應用生態(tài)的廠商,加碼手機AI助手的研發(fā),這些都是基于Agent模式,與Manus的產(chǎn)品規(guī)劃無異。

如果一定有差異,那就是Manus缺乏可調(diào)用的工具(手機和PC生態(tài)廠商是贏家),從演示視頻和官方介紹中能看出,Manus接觸前沿模型實現(xiàn)Agent規(guī)劃能力,借助工程鏈路調(diào)用搜索、瀏覽器訪問、現(xiàn)有的AIGC工具,完成用戶任務。根據(jù)我團隊過去一年多的經(jīng)驗,我們70%的精力在工具建設、30%的精力在Agent模型訓練。并且隨著工具集的不斷擴大,對Agent模型的挑戰(zhàn)也迅速上升(AI需要不斷認識和理解新工具)。

從一定程度上來說,工具集(FunctionCall)越小,Agent準確率越高,技術難度越??;Manus如若定位通用助手,勢必不斷豐富工具集,提升Agent的規(guī)劃和調(diào)用能力,從而實現(xiàn)任務解決;

AGI面臨的困難

前面介紹了我對Manus的理解,作為Copilot的一部分,Manus脫離了工具界面,小小地實現(xiàn)了用戶問題解決,但其背后的Agent能力還有待前身驗證。

AGI作為圣杯,目前仍有不小的差距。從跨領域能力、自主推理和決策、持續(xù)學習這3大特點來看,跨領域能力依賴Agent規(guī)劃和工具集建設,自主推理和決策在deepseek模式上已看到曙光,持續(xù)學習可能是最重要,也是最難的一步??赡芤蕾嚹P图軜?gòu),也可能從量變到質(zhì)變導致完全的不可控,繼而引發(fā)倫理災難。

我們可以大膽暢享,未來的AGI一定不是單一超大模型可以實現(xiàn)和解決的,必定由一個超級Agent,輔以海量工具及其對應模型組成,形成一個覆蓋生活工作方方面面的完備生態(tài)系統(tǒng)。換個角度,Apple手機的成果離不開千千萬萬的iOS應用開發(fā)者。

以上內(nèi)容限于2025.3.8前的個人知識和經(jīng)驗,如有不足接受批評,歡迎探討,謝謝!

本文由 @Ma.x 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。

更多精彩內(nèi)容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!