微軟五大Agent聯手,這下厲害了!
近期,微軟推出了一款創新性的通用Multi-Agent框架——Magentic-One。這個開源項目致力于處理各類復雜的開放性任務,涵蓋范圍包括網絡瀏覽操作、本地文件管理、Python代碼編寫與執行、市場研究分析以及學術論文撰寫等多個方面。
該框架由五個核心智能體構成:總體協調的Orchestrator、負責網絡任務的WebSurfer、管理文件系統的FileSurfer、專注編程的Coder,以及處理終端操作的ComputerTerminal。在這個體系中,Orchestrator作為核心智能體,承擔著任務規劃、進度監控和錯誤修正等重要職責。
從運作機制來看,Magentic-One采用了雙循環結構:外循環負責管理任務賬本,記錄事實、推測和計劃;內循環則專注于進度賬本的維護,包括當前進度狀態和任務分配情況。
各智能體的具體職能如下:
- Orchestrator擔任總指揮角色,負責任務拆解、規劃和協調其他智能體
- WebSurfer專門處理基于Chromium的瀏覽器操作,能夠執行網頁導航、交互和內容解析
- FileSurfer主要負責Markdown格式的文件處理和目錄管理
- Coder著重于代碼編寫和信息分析
- ComputerTerminal提供控制臺訪問權限,支持程序執行和庫安裝
在性能評測方面,Magentic-One在GAIA和AssistantBench等測試平臺上展現出與現有頂級方案相當的表現,并在WebArena測試中取得了具有競爭力的成績。
- 官方博客:https://www.microsoft.com/en-us/research/articles/magentic-one-a-generalist-multi-agent-system-for-solving-complex-tasks/
- 項目地址:https://github.com/microsoft/autogen/tree/main/python/packages/autogen-magentic-one
本文轉載自 ??探索AGI??,作者: 獼猴桃
贊
收藏
回復
分享
微博
QQ
微信
舉報

回復
相關推薦