從 Manus 到 DeepSearcher,2025年最值得關注的十大 Agent 智能體架構設計 原創 精華
2025年無疑是 Agent 智能體的元年。
這一判斷從 Deep Research 帶來搜索新范式,到 Manus 一夜爆火,再到 MCP 成為新的接口標準,已經被多次證實。
與普通 AI 工具相比,Agent 具有以下優勢:
- 更強的推理能力:基于多種推理模型,Agent 不僅執行指令,還會深入思考問題。
- 豐富的工具運用能力:Agent 能夠幫助用戶連接 API 或控制硬件設備。
- 更強的信息檢索能力:通過與 LLM、向量數據庫以及 Embedding 模型等工具集成,Agent 能夠輕松處理海量數據集。
- 更完整的環境感知能力:Agent 能夠更充分地理解對話語境或物理世界中的情境。
Agent 的成熟,標志著 AI 從簡單給出答案到交付完整任務結果的進化。那么,2025 年有哪些值得關注的 Agent 呢?
在這篇文章中,我們將詳細介紹2025年值得關注的10個 Agent 智能體。
1、Deep Research 與 DeepSearcher:專業級報告生成
不久前,OpenAI 推出了深度內容生成工具“DeepResearch”,用戶只需提出類似“特斯拉的合理市值是多少”這樣的問題,DeepResearch 就能生成一份涵蓋企業財務、業務增長分析以及市值推演的專業報告。這無疑為搜索 AGI 的發展方向指明了道路。
在這樣的背景下,如何基于“DeepResearch”理念進行定制化改造,成為了一個熱門話題。而 Zilliz 在這一領域也取得了顯著進展,推出了 DeepSearcher 開源項目,僅一個月時間,該項目在 GitHub 上的 Star 數量就接近 5000。
DeepSearcher 基于 DeepResearch 的大模型、超級搜索和研究助理的三合一架構,通過 Milvus 向量數據庫引入本地數據,并支持用戶自由更換底層模型(如 DeepSeek-R1),為用戶帶來了更符合企業級場景的全新 RAG 范式。
從架構上看,DeepSearcher 主要分為兩大模塊:
- 數據接入模塊:通過 Milvus 向量數據庫接入各種第三方私有知識。這是 DeepSearcher 相比 OpenAI 原版 DeepResearch 的一大重大升級,使其更適合擁有獨家數據的企業級場景。
- 在線推理查詢模塊:包括各種 Agent 策略和 RAG 的實現部分,負責為用戶提供準確且有深度的回答。該模塊引入了動態循環迭代機制:每次完成向量數據庫中的數據查詢后,系統會啟動一個反饋(Reflection)流程。在每輪迭代結束時,Agent 會對查詢到的知識進行評估,判斷其是否足以解答初始問題。如果存在知識缺口,則觸發下一輪迭代查詢;如果知識足夠,則生成最終報告。
2、Manus:一夜爆火的全能 Agent
Manus 是由創業公司 Monica 推出的一款 AI Agent,它被定位為全球首款通用 AI Agent。今年3月初一經發布,便立刻引發了全網的熱議。根據官方展示的案例,Manus 能夠自主完成包括簡歷篩選、房產研究、股票分析等多種類型的復雜任務。它具備自主思考、規劃和執行復雜任務的能力,并且能夠直接交付完整的成果。
官方披露的數據表明,Manus 在 GAIA 基準測試中取得了 SOTA(State-of-the-Art)的成績,超越了 OpenAI 等同層次的大模型。
Manus 的架構設計可以表示為:Manus = LLM + Tools + Memory + Computer Use +Artifacts + 虛擬機
Manus 最核心的是 Computer User 技術,這個技術的架構設計如下所示:
3、Google Astra:重新定義日常生活中的 AI 助手
Google Astra 是由 DeepMind 開發的一款 AI Agent,旨在通過多模態功能無縫融入日常生活。該 Agent 由 Gemini 2.0 驅動,能夠處理并響應多種輸入信息,包括文本、圖像、視頻和音頻。
Astra 的主要特點包括:
- 實時記憶功能,能夠理解上下文;
- 先進的工具使用能力,例如谷歌搜索、谷歌地圖和谷歌智能鏡頭;
- 協助完成諸如識別物體或提供推薦等任務。
例如,用戶可以將手機對準書架,讓 Astra 識別評分最高的書籍,從而將數字世界和物理世界相連接。未來,谷歌計劃將其部分功能集成到旗下其他產品中,Astra 有望在 2025 年重新定義個人 AI 助手。
4、微軟的 Copilot:簡化工作流程并提高生產力
微軟的 Copilot 是一款集成在諸多微軟辦公平臺(例如 Office 365 和 Dynamics 365)中的 AI Agent,其目標是簡化日常任務與工作流程。以 Word 為例,Copilot 能夠協助用戶撰寫報告或優化已有文本;在 Excel 中,它可根據自然語言指令生成公式并創建可視化圖表;在 Teams 里,Copilot 可以總結會議要點、突出關鍵信息并提出后續行動建議,從而提升協作效率。
對于開發者來說,Copilot 的功能遠不止于終端用戶的任務。它還提供與 Azure 的集成,助力實現工作流程自動化和業務流程管理。通過將 AI 融入人們日常使用的工具,微軟的 Copilot 讓重復性工作變得簡單,使團隊能夠將精力集中在更具挑戰性和創造性的任務上。
Copilot 的架構設計如下圖所示:
5、ChatGPT Plugins 與 Operator:將 GPT 的能力拓展到現實世界任務中
ChatGPT 插件為 OpenAI 的 GPT 模型賦予了強大的交互能力,使其能夠與外部系統進行溝通,從而執行一系列現實世界中的任務,而不僅僅局限于文本生成。通過與 Expedia、Wolfram Alpha 和 Zapier 等第三方服務的集成,這些插件讓 ChatGPT 能夠獲取實時數據并實現工作流程的自動化,使其更接近于成為個人和企業的動態 AI 助手。例如,用戶可以利用 ChatGPT 來預訂航班或計算復雜的方程式。
盡管 ChatGPT 插件并非完全自主的 Agent,但它們通過動態響應提示并利用外部工具來完成任務,實現了類似 Agent 的行為。對于開發者而言,這意味著可以以更低的成本構建自己的工作流程。
除了 ChatGPT 插件,OpenAI 還發布了首款 AI 智能體工具 Operator(意為操作員)。Operator 能夠代理用戶執行基于網頁的操作,簡單來說,它能夠像人類一樣使用網頁瀏覽器。
6、AutoGPT:自主任務執行領域的先驅
AutoGPT 是一個實驗性的開源項目,它將 GPT 模型轉化為能夠在極少人工干預的情況下執行復雜、多步驟任務的自主 Agent。借助 GPT-4 的強大能力,AutoGPT 能夠將復雜目標拆解為更小的、可執行的任務,依次執行這些任務,并根據結果進行迭代,以達成預期目標。這使得 AutoGPT 成為最早被開發者廣泛采用的自主 AI Agent 示例之一。
盡管仍處于早期階段,AutoGPT 通過展示自主 Agent 的潛力,激發了 AI 社區的想象力。開發者們可以借鑒它的思路,構建復雜的應用程序,例如研究助手、自動化工作流程管理器等。AutoGPT 突顯了 AI Agent 不斷增長的趨勢:它們不僅提供答案,還能采取行動,為未來更復雜的自主系統鋪平了道路。
AutoGPT 的架構設計主要圍繞以下幾個核心功能展開:
https://hub.baai.ac.cn/view/27039
- 任務分解
AutoGPT 能夠將復雜的目標分解為更小的、可執行的任務,依次執行這些任務,并根據結果進行迭代,以達成預期目標。
- 自主決策
AutoGPT 利用 GPT-4 的強大能力,能夠自主決策并執行任務,無需過多人工干預。
- 多步驟任務執行
AutoGPT 支持多步驟任務的執行,能夠根據任務的復雜性動態調整執行路徑。
- 迭代優化
AutoGPT 根據任務執行的結果進行迭代優化,逐步改進任務執行的效率和準確性。
7、BabyAGI:用于可擴展解決方案的輕量級任務自動化工具
BabyAGI 是一款輕量級的開源自主 Agent,專注于以迭代和智能的方式執行任務,由 GPT-4 驅動。它在任務管理和執行方面表現出色,是面向任務的 AI 解決方案中的佼佼者。其模塊化設計允許開發者根據需求自定義工作流程,與各種數據庫集成,并構建特定的解決方案。
與僅響應孤立查詢的普通大語言模型不同,BabyAGI 能夠根據總體目標創建任務隊列,對任務進行優先級排序,并逐步完成它們。例如,面對“研究一個主題并總結研究結果”這樣的復雜指令時,BabyAGI 會自主地將其分解為子任務,如收集資源、分析內容和起草連貫的總結。
BabyAGI 的獨特之處在于其輕量級和可擴展的設計。它在不需要大量資源的情況下,就能提供核心 AI 功能,為預算有限的企業提供了一個易于使用的工具。此外,其自適應學習系統會隨著用戶需求的變化而發展,確保隨著時間的推移提供越來越個性化和高效的幫助。最近的更新還引入了增強的協作功能,使 BabyAGI 成為小型團隊處理共享項目的優秀工具。
8、甲骨文 Miracle Agent:面向企業數據驅動決策 AI 工具
Oracle 的 Miracle Agent 是一套由 50 多個專門的 AI Agent 組成的工具集,專為企業環境設計,專注于數據庫管理。通過深度集成到 Oracle 的云生態系統中,Miracle Agent 實現了數據處理和可視化的自動化,使公司能夠在極少人工干預的情況下獲得洞察。
例如,Shift Scheduling 助手可以幫助創建和管理員工的輪班時間表,同時考慮個人偏好和合規規定。Employee Hiring Advisor 可以協助尋找候選人并簡化招聘流程,縮短招聘時間。在供應鏈管理方面,Customer Sales Representative Guide 可以提供個性化的洞察,以增強客戶互動。
9、MultiOn Agent API:為開發者簡化網頁自動化
MultiOn Agent API 是為開發者構建的專業級集成平臺,支持將 AI Agent 無縫部署至多樣化應用場景與終端設備。該平臺通過先進的網頁自動化能力,顯著提升任務執行效率并優化終端用戶體驗。自2024年4月公測發布以來,開發者已可利用其構建具備復雜網頁操作能力的AI代理,包括但不限于:
- 動態網站導航與交互
- 多源數據智能提取
- 全流程在線交易自動化
平臺提供 Python/JavaScript 雙語言 SDK ,并與主流大語言模型框架(如LangChain、LlamaIndex)實現深度兼容。這種開箱即用的集成特性使開發者能夠快速構建高階應用,包括:
- 自適應網頁瀏覽器
- 智能數據采集系統
- 網頁內容管理自動化解決方案
圖片
10、亞馬遜 Bedrock Agents:企業工作流程智能自動化工具
AWS Bedrock Agents 是亞馬遜云科技推出的創新AI代理服務,旨在將AWS強大的基礎模型與企業工具及數據無縫集成,為開發者提供構建智能應用的完整解決方案。
第一、靈活多變的 AI Agent 能力
Bedrock Agents 以其卓越的靈活性著稱,適用于多種 AI 驅動場景:
智能客服:打造自然交互的客戶支持聊天機器人
流程自動化:優化后端業務流程,提升運營效率
個性化推薦:構建精準的推薦系統,增強用戶體驗
此外,Bedrock Agents 內置豐富的 AP I支持,可輕松與企業現有技術棧集成?;?Serverless 架構,該服務天然具備彈性擴展能力,無需額外管理基礎設施。
第二、向量數據庫:AI Agent 的智能記憶核心
現代 AI Agent(如AutoGPT、Google Astra等)不僅能夠處理數據,更能像人類一樣進行推理與決策。而實現這一能力的關鍵在于長期記憶系統——這正是向量數據庫的核心價值所在。
第三、為什么向量數據庫至關重要?
采用高維向量存儲技術,精準捕捉文本、圖像、音頻等非結構化數據的語義信息
支持高效的相似性搜索與上下文檢索,使 Agent 能夠快速調用歷史知識
行業領先解決方案(如Milvus、Zilliz Cloud)為AI Agent提供高速、可擴展的記憶管理
第四、實際應用示例
當 Agent 遇到新問題時,可實時查詢向量數據庫,檢索過往相似案例或相關知識,從而做出更精準的決策。缺乏這種記憶能力的 Agent,將難以實現持續學習和復雜推理,極大限制其智能化水平。
Bedrock Agents 結合向量數據庫技術,為企業提供了構建下一代 AI 應用的強大基石。
本文中介紹的這些 AI Agent 僅僅是 2025 年代表性產品中的一小部分,其他有前景的 Agent,如 Anthropic Claude Agents、Hugging Face Transformers Agents 以及 Llamaindex 的 Llama Agents,同樣值得關注。
如果這些 Agent 都不能滿足您的需求,我們可以利用向量數據庫、大語言模型輕松構建自己的 AI Agent。
本文轉載自公眾號玄姐聊AGI 作者:玄姐
