不到24小時,開源版Deep Research瘋狂來襲!一月少花1400
昨日,AI 社區最大的新聞當屬 OpenAI 發布的全新智能體 Deep Research 了!
作為一個使用推理來綜合大量在線信息并為用戶完成多步驟研究任務的智能體,Deep Research 旨在幫助用戶進行深入、復雜的信息查詢與分析。
顯然,對于那些在金融、科學、政策和工程等領域從事密集知識工作并需要徹底、精確和可靠研究的用戶而言,Deep Research 稱得上研究神器了。
項目負責人之一 Zhiqing Sun(孫之清)本科畢業于北京大學計算機科學與技術系。2019 年起在 CMU 語言技術研究所攻讀博士學位,現為 OpenAI 研究科學家。
遺憾的是,Deep Research 目前僅供 Pro 訂閱用戶使用,每月 200 美元著實令很多人望而卻步。
所以,在 Deep Research 發布之后,各種開源復現版本紛至沓來。
從 OpenAI 發布的官方博客來看,Deep Research 用到了端到端的強化學習,并且在多個領域的復雜瀏覽和推理任務上進行了訓練,因此才有了現在的性能。
其實,早在去年,來自字節跳動 ByteDance Research 的研究人員就提出了基于強化學習(Reinforcement Learning, RL)的 LLM Agent 框架 ——AGILE。該研究已被NeurIPS接收,這應該是學術界第一個用強化學習做Agent的端到端訓練的工作。了解更多內容可以參考機器之心此前報道《端到端優化所有能力,字節跳動提出強化學習LLM Agent框架AGILE》。
接下來,我們看看在一天之內,都有哪些 Deep Research開源復現項目。
一、Open Deep Research
其中一個開源復現版本為「Open Deep Research」。
項目地址:https://github.com/nickscamara/open-deep-research
具體而言,Open Deep Research 是一個 AI 智能體,可以對大量的 web 數據進行推理,該方法沒有使用 o3 的微調版本,而是使用了爬蟲工具 Firecrawl 的提取 + 搜索功能以及推理模型來深入研究網絡。
項目主頁還放出了 demo 展示,我們可以發現,在詢問 Open Deep Research 關于「2025 年 B2B 領域最大的創業機會」時,Open Deep Research 給出了思考過程,答案也相當完美。
根據項目介紹,我們可以得知 Open Deep Research 背后默認的模型為 gpt-4o,如果你想換個其他模型使用也是可以的,只需幾行代碼即可切換為 Anthropic、Cohere 等發布的模型。
二、OpenDeepResearcher
另外一個比較熱門的復現項目為「OpenDeepResearcher」。
項目地址:https://github.com/mshumer/OpenDeepResearcher
作為一個開源的 AI 智能體,OpenDeepResearcher 可以提供全面的研究。用戶只需提供一個主題,該智能體就會展開研究,并返回一份綜合報告。
其工作過程非常簡單,對于給定的查詢,OpenDeepResearcher 執行以下步驟:
- 執行搜索,查看結果頁面,并提取重要信息;
- 如果它想深入了解,其可以重復此過程,并提出新的查詢;
- 完成后,它會使用上下文生成報告。
三、node-DeepResearch
最后一個復現項目是「node-DeepResearch」,它是由 Jina AI CEO 肖涵(Han Xiao)創建。
他表示,OpenAI 的 Deep Research 只是在 while 循環中進行「搜索 + 讀取 + 推理」。他在 nodejs 運行環境中,使用谷歌 gemini-flash 和 jina reader(Jina AI 推出的開源工具,將互聯網上的 HTML 網頁內容轉換為適合 LLM 處理的純文本格式)進行了復現。
我們來看下運行效果。
下面是「jina ai 最新博客文章內容是什么」(what is the latest blog post from jina ai)的 2/3 步搜索示例:首先找到 jina ai 新聞網站、閱讀其內容,然后確定最新帖子內容。
下面視頻是關于「who is the biggest, cohere, jina ai, voyage」的 13 步查詢,經過搜索、反饋、循環之后,結果是正確的(cohere)。這里視頻 2 倍加速。
對于 node-DeepResearch,顯然缺少了微調 o3 推理模型的支持。
有人認為,這個項目實現了 OpenAI 準備了半年多的東西所做到的功能。還有人呼吁,趕緊把 UI 做得漂亮一點。
目前,該項目已經收獲了近 700 個 Stars。
項目地址:https://github.com/jina-ai/node-DeepResearch
相信后續會有更多類似的開源智能體項目出來。