邀請(qǐng)碼炒到10萬(wàn)?OpenManus深夜開源打臉!Manus X賬號(hào)遭凍結(jié),平替光速上線
離了個(gè)大譜,Manus全網(wǎng)邀請(qǐng)碼一票難求?激動(dòng)人心的是,開源界凌晨來了一場(chǎng)核爆攻擊,用3小時(shí)代碼量開源了平替項(xiàng)目——OpenManus,免費(fèi)體驗(yàn)不要邀請(qǐng)碼!同時(shí)發(fā)布的還有另一個(gè)「Manus同款」OWL,直接干到GAIA基準(zhǔn)測(cè)試開源最強(qiáng)!
昨天,所有人都被Manus刷屏了,一個(gè)邀請(qǐng)碼已經(jīng)被炒到了天價(jià)。
雖然被Manus強(qiáng)勢(shì)刷屏,很多人卻只能眼睜睜地看著,沒法親自上手體驗(yàn),只因一碼難求。
最新消息,就在剛剛,Manus AI的官方X賬號(hào)已被平臺(tái)凍結(jié)。
不過就在此時(shí),開源界以迅雷不及掩耳之勢(shì)上演了一波速度與激情——有這樣一個(gè)項(xiàng)目,僅憑三小時(shí)的代碼量,就掀翻了AI的高墻。
昨天晚上,GitHub開源了一個(gè)無需邀請(qǐng)碼的OpenManus項(xiàng)目,剛剛開源不到一天,Star數(shù)就已經(jīng)破千。
項(xiàng)目地址:https://github.com/mannaandpoem/OpenManus
現(xiàn)在,所有開發(fā)者都可以實(shí)測(cè)了。
其中最亮眼的,莫過于這句「只需修改config.toml即可開玩」,直接對(duì)封閉生態(tài)公開打臉。
創(chuàng)建環(huán)境,克隆項(xiàng)目并CD到目錄,改一下config/config.toml里的大模型信息,再輸入一行命令,就可以愉快地在terminal里體驗(yàn)了。
conda create -n open_manus python=3.12conda activate open_manus
git clone https://github.com/mannaandpoem/OpenManus.gitcd OpenManus
pip install -r requirements.txt
cp config/config.example.toml config/config.toml
# Global LLM configuration[llm]model = "gpt-4o"base_url = "https://api.openai.com/v1"api_key = "sk-..." # Replace with your actual API keymax_tokens = 4096temperature = 0.0
# Optional configuration for specific LLM models[llm.vision]model = "gpt-4o"base_url = "https://api.openai.com/v1"api_key = "sk-..." # Replace with your actual API key
python main.py
開源界3小時(shí)復(fù)刻Manus,跟邀請(qǐng)碼說再見
來自國(guó)內(nèi)的這支團(tuán)隊(duì)宣布:晚餐后2小時(shí),OpenManus的核心功能直接開源!
沒有邀請(qǐng)碼,沒有壁壘,這支團(tuán)隊(duì)用3小時(shí)的代碼量,就把邀請(qǐng)碼機(jī)制掃進(jìn)歷史垃圾堆,跟饑餓營(yíng)銷徹底說拜拜!
OpenMunus的作者均為MetaGPT的核心貢獻(xiàn)者。
OpenManus的實(shí)現(xiàn)很簡(jiǎn)單,使用到了computer use、基本的智能體和規(guī)劃。
就像在Manus中那樣,任何人都可以使用OpenManus,把自己的想法變?yōu)楝F(xiàn)實(shí)。
無論在手機(jī)上還是OS上,如果想做Deep Research,只要提交你的問題,它就可以幫你實(shí)現(xiàn)了。
比如,我們可以給OpenManus這樣一個(gè)任務(wù):「對(duì)Karpathy的網(wǎng)站(https://karpathy.ai/)進(jìn)行全面的SEO審核,并提供詳細(xì)的優(yōu)化報(bào)告,包括可執(zhí)行的改進(jìn)建議。」
OpenManus會(huì)展開思考,將自己的任務(wù)分解為如下幾步。
- 首先,檢查網(wǎng)站并收集基本信息
- 然后,分析關(guān)鍵的SEO要素
- 第三,檢查技術(shù)性SEO方面的問題
- 最后,整理優(yōu)化建議
明確任務(wù)細(xì)節(jié)后,OpenManus就打開Karpthy的網(wǎng)站,開始收集信息、展開詳細(xì)分析。
整個(gè)思考過程,每一步都清晰可見。
最終,它生成了一份完整、詳實(shí)的Karpathy個(gè)人網(wǎng)站優(yōu)化報(bào)告。
其中,它提出的高優(yōu)先級(jí)任務(wù)如下:Meta標(biāo)簽優(yōu)化(如優(yōu)化頁(yè)面標(biāo)題,使其包含相關(guān)關(guān)鍵詞)、技術(shù)設(shè)置(如創(chuàng)建并提交XML站點(diǎn)地圖)、內(nèi)容優(yōu)化(如為所有圖片添加alt文本、在個(gè)人網(wǎng)站上實(shí)施Schema標(biāo)記等)。
OpenManus的核心,就是一個(gè)革命性的模塊化Agent系統(tǒng),由高度智能的專業(yè)團(tuán)隊(duì),組成了一個(gè)協(xié)作網(wǎng)絡(luò)。
- Manus主代理:項(xiàng)目經(jīng)理,能理解用戶需求,協(xié)調(diào)各個(gè)專業(yè)團(tuán)隊(duì)的工作。
- PlanningAgent:戰(zhàn)略專家,將復(fù)雜的任務(wù)分解為清晰可執(zhí)行的步驟。
- ToolCallAgent:技術(shù)專家,掌握各種強(qiáng)大工具的使用方法。
由此,開發(fā)者可以根據(jù)自身需要,自由組合不同的功能模塊,創(chuàng)造出自己獨(dú)有的AI助手。
OpenManus無縫集成了包括Claude 3.5、Qwen VL Plus在內(nèi)的多個(gè)頂級(jí)大模型,開發(fā)者能充分利用各個(gè)模型的優(yōu)勢(shì)。
為何只用短短3小時(shí),團(tuán)隊(duì)就能打破Manus的高墻壟斷?
原因就在于,OpenManus其實(shí)源于MetaGPT的開源積累。
我們只是把瀏覽器工具鏈嫁接到過去代碼上,配合沉淀的Agent工具包,核心系統(tǒng)1小時(shí)就完成了。
OpenManus的另一強(qiáng)大功能,就是它的實(shí)時(shí)反饋機(jī)制。
LLM思維鏈的過程,會(huì)被可視化地呈現(xiàn)出來。無論是任務(wù)執(zhí)行進(jìn)度的實(shí)時(shí)更新、思考過程日志、文件的即時(shí)通知等,都隨時(shí)可見。
此外,OpenManus還配備了一套強(qiáng)大的工具鏈,能處理各種復(fù)雜任務(wù)。
- Python代碼執(zhí)行器:實(shí)時(shí)生成和執(zhí)行代碼
- 網(wǎng)絡(luò)搜索工具:自動(dòng)獲取和分析網(wǎng)絡(luò)信息
- 瀏覽器自動(dòng)化:模擬人類操作進(jìn)行網(wǎng)頁(yè)交互
- 文件處理系統(tǒng):自動(dòng)生成和管理各類文檔
其中,這些工具都不是簡(jiǎn)單的獨(dú)立模塊,而是被精心設(shè)計(jì)的協(xié)同系統(tǒng),在處理任務(wù)時(shí)能默契配合,高效完成任務(wù)。
實(shí)測(cè)生成一份關(guān)于Manus的報(bào)告
問題來了:OpenManus能成為Manus的平替嗎?
OpenManus的開發(fā)者HKUST(GZ)博士生Jiayi Zhang上傳了一段實(shí)測(cè)視頻。
視頻中他給出了這樣一段提示:
深度調(diào)研和Manus這個(gè)Agent有關(guān)的信息,自己整理信息,然后寫一個(gè)新聞html頁(yè)面介紹它,你寫的html應(yīng)該盡可能美觀。
接著OpenManus就開始干活了。它將這個(gè)任務(wù)分步進(jìn)行,首先使用GoogleSearch搜索Manus Agent的相關(guān)信息。
在這個(gè)過程中還不斷打出思考過程:「好的,讓我們繼續(xù)深入調(diào)研Manus,我會(huì)逐步訪問搜索到的重要鏈接,收集信息,然后創(chuàng)建一個(gè)精美的HTML網(wǎng)頁(yè)?!?/p>
它開始不斷調(diào)用工具「browser_use」,訪問不同的文章來搜集信息。
整理完信息,OpenManus再次輸出:「現(xiàn)在讓我們使用正確的完整路徑來打開HTML文件:」渲染完后,它就給出了網(wǎng)頁(yè)的鏈接。
打開后可以看到完整的報(bào)告。然而,OpenManus的能力還不止于此,在視頻中,它被人要求繼續(xù)完善這個(gè)頁(yè)面,添加更多具體的技術(shù)細(xì)節(jié)和實(shí)際應(yīng)用案例。
接著它就又開始調(diào)用起「google_search」以及「browser_use」這些工具,很快就重新給出了一個(gè)新的頁(yè)面網(wǎng)址。
可以看出,OpenManus給出的這份關(guān)于Manus的報(bào)告,包括了Manus的誕生與發(fā)展、技術(shù)架構(gòu)與創(chuàng)新以及實(shí)際應(yīng)用案例與未來展望等。
雖然這份報(bào)告的結(jié)構(gòu)看上去比較完整,但是細(xì)節(jié)還是有點(diǎn)乏善可陳。
Browser-use:讓智能體直接操作瀏覽器
在OpenManus項(xiàng)目中,很重要的一項(xiàng)功能就是Browser-use。
Browser-use是一種使AI智能體能夠操作瀏覽器的簡(jiǎn)單方式。它在GitHub上開源,許多項(xiàng)目都使用了它的功能,目前已經(jīng)獲得有超過35.8k個(gè)星星了。
項(xiàng)目地址:https://github.com/browser-use/browser-use
它通過提取網(wǎng)站的交互元素(如按鈕、表單等),使AI能夠自動(dòng)化執(zhí)行瀏覽器操作,例如填寫表單、搜索信息或?qū)Ш骄W(wǎng)頁(yè)。這對(duì)于開發(fā)AI驅(qū)動(dòng)的網(wǎng)絡(luò)代理非常有用。
比如,它可以將商品添加到你的購(gòu)物車,并完成結(jié)賬。
甚至是閱讀你的簡(jiǎn)歷,然后幫你找工作!中途如果有需要,還會(huì)遵從你的指示。
作者團(tuán)隊(duì)
OpenManus的作者團(tuán)隊(duì),此前就憑MetaGPT受到大量關(guān)注。
MetaGPT是一款開源的AI智能體框架,將多個(gè)AI模型整合在一起,模仿現(xiàn)實(shí)世界公司的運(yùn)作,在模擬軟件開發(fā)流程方面表現(xiàn)出色。
當(dāng)時(shí)一經(jīng)開源,MetaGPT就火爆全網(wǎng),如今在GitHub上已經(jīng)收獲了49.1k stars。
向勁宇
向勁宇,研究方向?yàn)長(zhǎng)LM智能體,強(qiáng)化學(xué)習(xí)和NLP,曾獲得阿里巴巴數(shù)學(xué)競(jìng)賽AI賽道全球第二名。此前,他在西南交通大學(xué)獲得學(xué)士學(xué)位。
于兆洋
于兆洋,研究方向是LLM智能體及其推理,此前在中國(guó)人民大學(xué)高瓴人工智能學(xué)院獲得學(xué)士學(xué)位。
張佳釔
張佳釔,香港科技大學(xué)(廣州) 的博士生。研究興趣是LLM智能體,尤其關(guān)注其推理能力以及適應(yīng)多種環(huán)境的智能體構(gòu)建范式。此前,他在中國(guó)人民大學(xué)信息學(xué)院獲得學(xué)士學(xué)位。
洪思睿
洪思睿,研究興趣是LLM、NLP和多智能體系統(tǒng)。此前在暨南大學(xué)獲得學(xué)士學(xué)位,在香港科技大學(xué)獲得碩士學(xué)位。
One More Thing:0天復(fù)刻Manus,OWL完全開源
不僅如此,另一個(gè)來自CAMEL AI團(tuán)隊(duì)的0天復(fù)刻Manus通用智能體,也被開源了。
這個(gè)名為OWL的項(xiàng)目,直接干到開源界GAIA的性能天花板,達(dá)到57.7%,超越Hugging Face提出的Open Deep Research 55.15%的表現(xiàn)。
項(xiàng)目地址:https://github.com/camel-ai/owl
簡(jiǎn)單來說,OWL是一個(gè)頂尖的多智能體協(xié)作框架,致力于突破任務(wù)自動(dòng)化的界限。
在GAIA基準(zhǔn)測(cè)試中,OWL取得了58.18的平均分,并在開源框架中排名第一。
在這個(gè)任務(wù)中,OWL智能體非常絲滑地完成了任務(wù):調(diào)研總結(jié)GitHub倉(cāng)庫(kù)里都有什么。
另外,它還能自動(dòng)幫我們查找今天在倫敦有什么電影。
在這個(gè)過程中,CAMEL AI對(duì)Manus的技術(shù)路線做了一波逆向工程,啟動(dòng)了深度復(fù)刻計(jì)劃。
首先,是把Manus的核心工作流拆成6步。
- 啟動(dòng)一個(gè)Ubuntu容器(Agent遠(yuǎn)程工位就位)
- 知識(shí)召回(把之前學(xué)過的內(nèi)容撿起來用)
- 連接數(shù)據(jù)源(數(shù)據(jù)庫(kù)、網(wǎng)盤、云存儲(chǔ)全覆蓋)
- 把數(shù)據(jù)掛載到Ubuntu(Agent的搬磚時(shí)刻)
- 自動(dòng)生成todo.md(規(guī)劃任務(wù)+寫待辦清單)
- Ubuntu工具鏈+外接工具組合拳,執(zhí)行全流程任務(wù)
然后,所有Manus里智能體用到的操作,團(tuán)隊(duì)都會(huì)給OWL配齊。
啟動(dòng)一個(gè)Ubuntu容器,OWL就能隨時(shí)隨地遠(yuǎn)程辦公了。
在項(xiàng)目描述中,團(tuán)隊(duì)表達(dá)了對(duì)AI智能體的愿景:
我們的愿景是徹底改變AI智能體協(xié)作解決現(xiàn)實(shí)世界任務(wù)的方式。通過利用動(dòng)態(tài)的智能體交互,OWL能夠在多個(gè)領(lǐng)域中實(shí)現(xiàn)更自然、高效和穩(wěn)健的任務(wù)自動(dòng)化。
相信我們還將不斷見證各類復(fù)現(xiàn)項(xiàng)目,打破「邀請(qǐng)碼」的壟斷。
參考資料:
https://github.com/mannaandpoem/OpenManus
https://x.com/didiforx/status/1897675038972883408
https://github.com/camel-ai/owl
https://mp.weixin.qq.com/s/0AWaSNynyjjY5TpdtKN-3w
編輯:編輯部 JHNZ
本文由人人都是產(chǎn)品經(jīng)理作者【【新智元】,微信公眾號(hào):【新智元】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評(píng)論,等你發(fā)揮!