如何看待”首個(gè)真干活”AI—Manus?
話題背景
今日凌晨,一款通用AI Agent產(chǎn)品「Manus」正式發(fā)布。GAIA評分已超越OpenAI的DeepResearch,成為GAIA評分第一。這一產(chǎn)品以“數(shù)字代理人”自居,宣稱能獨(dú)立完成復(fù)雜任務(wù)并交付完整成果,迅速成為科技圈的焦點(diǎn)。與 Manus 同步出圈的還有一段長達(dá)四分鐘的演示 demo。在這些案例中,Manus完全自主地完成從規(guī)劃到執(zhí)行的全流程,展示了真正的Agent能力,而非簡單的助手功能。
那么,當(dāng)AI不僅擁有強(qiáng)大的思考能力,還具備高效的執(zhí)行力時(shí),將會(huì)帶來怎樣的變革?關(guān)于Manus,你怎么看?
鵝廠工程師的看法
@arsene-應(yīng)用研究員
看了官網(wǎng)的案例,manus會(huì)把任務(wù)拆解,放在一個(gè) todo.md 里,每做完一步就勾掉一個(gè)。這種用外置文件來實(shí)現(xiàn)“工作記憶”的方式很有趣。
@vin-數(shù)據(jù)分析師
產(chǎn)品的設(shè)計(jì)思路是非常不錯(cuò)的,不過缺乏很多細(xì)節(jié)推證,沒有邀請碼無法復(fù)現(xiàn)具體細(xì)節(jié)。
對任務(wù)拆解的復(fù)雜性還是顯得非常低級。另外,關(guān)于執(zhí)行任務(wù)中的資源也是一個(gè)不小的開銷,啟動(dòng)資源時(shí),是否合理評估資源大小,按任務(wù)的復(fù)雜度來分配資源大小也沒有,合理的是加上這方面的思考過程。總的來說:任務(wù)拆解+資源分配+效果評估+結(jié)果輸出。才是這類型產(chǎn)品更合理的方向。
@keyi-行業(yè)應(yīng)用
看了界面的所有case感覺想象力可以完全打開,但是苦于沒有邀請碼,先申請?jiān)囉玫却齣ng。
對比年前的cua,先一波“炸裂”給到monica團(tuán)隊(duì)
@匿名
說了什么不重要,做了什么做成了什么更重要!用戶并不在乎底層用了什么,如何調(diào)用各種工具,關(guān)鍵是在體驗(yàn)上,是不是能做到完整融合,這方面至少看起來 Manus 做的還不錯(cuò)。
這波AI 產(chǎn)品的發(fā)展有幾個(gè)特點(diǎn):
- 產(chǎn)品的開發(fā)團(tuán)隊(duì),可能是大廠,可能是金融企業(yè),可能是小作坊,背景越來越不重要;
- 說得再漂亮,都沒用,就要看用戶體驗(yàn)。是騾子是馬,都要拿出來溜溜;
- 大模型廠商繼續(xù)在 AGI 的道路上邁進(jìn),留下了給應(yīng)用型企業(yè)的窗口期,而應(yīng)用型產(chǎn)品的設(shè)計(jì),需要新型的“AI 產(chǎn)品經(jīng)理”(AIPM),既對市場上 SOTA (最為先進(jìn))的 AI 模型、工具有足夠的了解(特別是國外的最新產(chǎn)品,主要觀察窗口就是 Producthunt,Manus 其實(shí)有點(diǎn)類似于 Deep Research),又對人性、用戶體驗(yàn)、使用習(xí)慣等有互聯(lián)網(wǎng)產(chǎn)品的認(rèn)知;
- 這給很多to B to A的企業(yè)(比如我們騰訊云)帶來了機(jī)會(huì),而參考上面的趨勢,AI 好不好,光方案沒用,還是要“溜”,這需要“陪跑”。但是這樣的“陪跑”,對于to B to A企業(yè)的要求很高,既需要具備傳統(tǒng)的客戶教育、咨詢能力,又要有扎實(shí)的整合、交付和運(yùn)維能力。這種新型的 AI落地咨詢、陪跑服務(wù),是市場目前需要的。
@yark-客戶端開發(fā)
看demo和Devin有點(diǎn)類似,訓(xùn)練一個(gè)planner來生成plan,調(diào)用其他LLM做執(zhí)行。感覺這種能力 Devin、Cursor 做的已經(jīng)比較成熟了, 他們基于 Claude 的模型一次性能調(diào)用很多的 Tool,不過主要場景是寫代碼和文件編輯。 這次 Manus 的營銷點(diǎn)應(yīng)該是通過 加上了 computer use 和 虛擬機(jī)的能力,把能力擴(kuò)展到了更多日常辦公的場景,所以比較出圈。
@vikyfj-應(yīng)用開
給AI加上眼睛(視覺)和手(至少會(huì)控制鍵盤鼠標(biāo)),能用上目前面向人的各種工具,就7788了。
@grey-前端開發(fā)
看了下幾個(gè)博主的評測視頻,確實(shí)非常牛。。。無論是報(bào)表生成、游戲開發(fā)等等從思考過程到最終的產(chǎn)出質(zhì)量都很高,目測又是一個(gè)現(xiàn)象級的AI新形態(tài)產(chǎn)品。
Manus本質(zhì)上有點(diǎn)像一個(gè)套殼工具,將大模型作為中央處理器,支持各種多模態(tài)數(shù)據(jù)的輸入輸出,并通過智能體工具實(shí)現(xiàn)跨應(yīng)用操作,有種集百家之長的感覺??這種設(shè)計(jì)讓Manus能夠自主完成各種復(fù)雜任務(wù)。
但個(gè)人覺得Manus最突出的亮點(diǎn)還是具備強(qiáng)大的工具調(diào)用能力,能夠自主調(diào)用瀏覽器、代碼編輯器、數(shù)據(jù)分析工具等,直接交付任務(wù)成果。比如他可以根據(jù)你的一份簡單的游戲設(shè)計(jì)思路,自己從整個(gè)游戲玩法設(shè)計(jì)出發(fā)逐漸完善,然后再自行調(diào)用各種工具如繪圖工具、代碼編輯器等等完成開發(fā),全程無需手動(dòng)介入,真正意義上的從任務(wù)拆解到成果交付全程自主執(zhí)行。
很期待后續(xù)各家大廠的跟進(jìn)措施。
@lawrence-應(yīng)用開發(fā)
現(xiàn)在就等團(tuán)隊(duì)說的會(huì)開源的做過 post training 的模型包含會(huì)拆解任務(wù)的那個(gè)模型了,然后開始“微創(chuàng)新”
@ericj-刑事法律
朋友有拿到邀請碼,應(yīng)該體驗(yàn)最好的operator了,太炸裂。
@groot-后臺(tái)開發(fā)
本條由 Manus 使用 deepseek r1 作答:
關(guān)于「Manus」的技術(shù)實(shí)現(xiàn)、工具調(diào)用和工程調(diào)優(yōu)方面,以下是一些可能的看法:
- 技術(shù)實(shí)現(xiàn):Manus作為一款通用AI Agent,可能依賴于先進(jìn)的算法與模型,例如深度學(xué)習(xí)和自然語言處理。它的能力在于協(xié)調(diào)思維與行動(dòng),這意味著在理解任務(wù)的基礎(chǔ)上,它可以執(zhí)行復(fù)雜的操作。這種結(jié)合可以使得AI在多個(gè)領(lǐng)域內(nèi)更高效地工作,例如在醫(yī)療、金融或制造業(yè)等。
- 工具調(diào)用:Manus可能集成了多種API和工具,可以在不同的應(yīng)用場景下調(diào)用相應(yīng)的資源。這使得它能夠處理各種數(shù)據(jù)輸入并優(yōu)化決策過程,例如通過實(shí)時(shí)數(shù)據(jù)分析來改進(jìn)工作流程。
- 工程調(diào)優(yōu):為了使Manus能夠高效穩(wěn)定地運(yùn)行,工程調(diào)優(yōu)是至關(guān)重要的。這可能涉及到持續(xù)的模型訓(xùn)練、參數(shù)調(diào)整和算法優(yōu)化,以改善其性能和響應(yīng)時(shí)間。此外,通過用戶反饋和使用數(shù)據(jù)的學(xué)習(xí),Manus也可以不斷自我提升。