這壁壘……一夜走紅的Manus,現(xiàn)在已經(jīng)有了開源復(fù)刻版!
5個人3個小時,一個完全免費(fèi)、無需排隊等待的OpenManus就做好了。
至于復(fù)現(xiàn)程度,還是直接看Manus官方和開源團(tuán)隊提供的demo對比(點(diǎn)擊鏈接跳轉(zhuǎn)觀看)。
從開源反推Manus的實現(xiàn)路徑
與此同時,通過深扒OpenManus,我們其實還可以看出一條實現(xiàn)Manus的合理路徑。
(當(dāng)前Manus使用了哪家模型、Agent框架等具體細(xì)節(jié)處于保密狀態(tài))
概括而言,OpenManus的背后有三大關(guān)鍵:
擁有模塊化Agent系統(tǒng);
具備實時反饋機(jī)制;
配備了一整套強(qiáng)大的工具鏈;
展開來說,其核心設(shè)計就在這種模塊化Agent系統(tǒng)。開發(fā)者可以根據(jù)需要自由組合不同的功能模塊,從而創(chuàng)造出獨(dú)特的AI助手。
在OpenManus中,擁有不同分工的Agent會協(xié)作完成需求理解、規(guī)劃、行動等任務(wù)。
比如Manus主代理就像項目經(jīng)理,負(fù)責(zé)理解用戶需求并完成分工;PlanningAgent作為規(guī)劃員,負(fù)責(zé)將復(fù)雜任務(wù)進(jìn)一步拆解成可執(zhí)行的步驟;而ToolCallAgent則是技術(shù)專家,負(fù)責(zé)掌管各類工具使用。
以上這一套都是靠開源團(tuán)隊曾經(jīng)提出的MetaGPT(一個多智能體框架)實現(xiàn),開發(fā)者可以自由集成多個合適的大語言模型。
此外,OpenManus的另一關(guān)鍵在于其思維過程是公開透明的。
正如開頭提到的例子,拿到任務(wù)后,OpenManus如何思考問題,如何規(guī)劃執(zhí)行……全都能實時反饋。
這為人類在合適時間進(jìn)行干預(yù)提供了“窗口”,有助于更高質(zhì)量完成任務(wù)。
后不得不提到Agent對工具的使用。
為了完成復(fù)雜任務(wù),OpenManus也配備了一系列“外援”:
瀏覽器自動化:像人類一樣操作瀏覽器,自動分析網(wǎng)絡(luò)信息并交互;
各種代碼執(zhí)行器:能夠?qū)崟r生成和執(zhí)行代碼;
文件處理:自動生成和管理各類文檔;
……
需要注意的是,各類工具都不是單獨(dú)的模塊,而是需要協(xié)同設(shè)計。
將以上組合在一起,這類多智能體系統(tǒng)的一般架構(gòu)為:底層由各類大語言模型構(gòu)成,中間層通過多智能體協(xié)作拆解任務(wù),執(zhí)行層調(diào)用各類API接口完成具體操作。
總之,按照OpenManus作者的總結(jié),這一開源成果結(jié)合了computer-use、基本的Agents以及融合了規(guī)劃能力。
正如OpenManus團(tuán)隊在項目致謝中提到的,Claude廠商Anthropic去年上線的computer-use,以及YC投資的項目browser-use,都給OpenManus提供了基礎(chǔ)支持。
顧名思義,這兩個項目分別被用來操作電腦和瀏覽器,而在沙盒環(huán)境中操縱正是Manus工作的一大核心特征。
5人開發(fā)團(tuán)隊,3小時完成復(fù)刻
OpenManus團(tuán)隊只用了1個小時就完成了核心系統(tǒng),整體也只用了3個小時。
核心作者梁新兵介紹,OpenManus的火速上線,來源于MetaGPT積累下的技術(shù)沉淀。
(注:MetaGPT是一個多智能體框架,為了處理復(fù)雜任務(wù),將不同的角色分配給GPT模型,形成一個協(xié)作性“軟件公司”。)
我們只是把瀏覽器工具鏈嫁接到過去代碼上,配合沉淀的Agent工具包。
幾位研發(fā)成員,也都是來自MetaGPT團(tuán)隊。
“開源版Devin”——數(shù)據(jù)解釋器(Data Interpreter),也是出自MetaGPT團(tuán)隊之手。
OpenManus核心作者梁新兵,畢業(yè)于華東師大,還在讀時就參與了Data Interpreter的工作。
另一名核心作者向勁宇,本科就讀于西南交通大學(xué)應(yīng)用物理系。
去年,讀大四的他和隊友一起使用GPT-4與Claude 3組成多智能體的方案,讓AI分飾多個角色、相互驗證來完成答題步驟,獲得了阿里巴巴數(shù)學(xué)競賽AI賽道全球第二名。
在MetaGPT社區(qū),向勁宇還和其他成員一起,讓智能體成功在“我的世界”當(dāng)中采集到了鉆石。
甚至他還曾經(jīng)讓智能體假扮知乎大V,回答了100多個問題,獲得3萬余次閱讀,還有贊同、反駁甚至私信關(guān)注,結(jié)果直到他主動停止,AI的身份都未被發(fā)現(xiàn)。
張佳釔,去年本科畢業(yè)于中國人民大學(xué)高瓴人工智能學(xué)院,現(xiàn)在是港科大(廣州)在讀博士,被ICLR 2025接收的智能體框架AFlow,他和向勁宇是共同一作。
于兆洋,張佳釔在人大的同級同學(xué);洪思睿,MetaGPT和Data Interpreter兩篇論文的共同一作,DeepWisdom高級研究員,香港科技大學(xué)碩士,本科畢業(yè)于暨南大學(xué)。
AFlow的作者當(dāng)中,也有于兆洋和洪思睿的名字。
今年,以張佳釔和向勁宇為共同一作,五個人的名字共同出現(xiàn)在了一個名為SPO的項目當(dāng)中,該項目能夠讓提示詞自我進(jìn)化,讓人們擺脫研究提示詞工程的繁瑣過程。
并且綜合五名作者的經(jīng)歷和署名信息可以推斷,除了15年取得碩士學(xué)位的洪思睿年齡稍長之外,其余4位作者,幾乎都是本科畢業(yè)不久,當(dāng)中有人選擇繼續(xù)深造,也有人加入了DeepWisdom。
重新看Manus“套殼風(fēng)波”
除此之外,OpenManus的出現(xiàn),或許也給Manus的“套殼風(fēng)波”提供了新的視角。
先簡單回顧一下這場風(fēng)波。
Manus被質(zhì)疑“套殼”主要源于兩點(diǎn):
一是有前車之鑒。Manus背后團(tuán)隊曾打造出另一款產(chǎn)品——Monica,而作為一款集成各類大語言模型的插件,Monica也曾一度陷入套殼爭議。
所以對于一家公司出品的東西,大家很容易產(chǎn)生聯(lián)想。
在此基礎(chǔ)之上,由于產(chǎn)品被懷疑是套殼縫合而成,因此大家很容易形成Manus技術(shù)含量不高的印象。
然而,之所以說OpenManus是一個新視角,是因為從其復(fù)現(xiàn)路徑來看,許多模塊都是基于已有開源項目實現(xiàn)。
實現(xiàn)不同模塊的統(tǒng)籌、調(diào)度,形成新的功能,絕非人人都有能力實現(xiàn)。
而且開源社區(qū)的一大意義,本就是讓后來的開發(fā)者,能夠直接站在巨人的肩膀上。
即使不談開源,各大模型廠商提供API給開發(fā)者的目的,同樣是讓他們能夠開發(fā)新的應(yīng)用。
說得再夸張一些,引用Perplexity創(chuàng)始人的說法,“OpenAI就是英偉達(dá)套殼,英偉達(dá)就是臺積電套殼,臺積電就是沙子套殼……”。
所以是否“套殼”,不是問題的核心,關(guān)鍵是它能不能產(chǎn)生實質(zhì)性的生產(chǎn)力提升。
但從我們昨天的實測感受來看,Manus距離這一目標(biāo),還有相當(dāng)長的距離。
所以,把產(chǎn)品的能力打磨好,可能才是比糾結(jié)套殼更要緊的事。
你對Manus的感受如何?歡迎評論區(qū)留言討論。
開源地址:https://github.com/mannaandpoem/OpenManus
參考鏈接:[1]https://x.com/didiforx/status/1897675038972883408[2]https://www.sohu.com/a/827134153_121798711[3]https://modelscope.cn/studios/AI-ModelScope/SPO
本文鏈接:http://www.horoscopes9.com/news-134007.html5個人三小時復(fù)刻開源版Manus:邀請碼也不需要了