OpenAI推出新人工智能代理Deep Research
上個月,DeepSeek改寫了人工智能的劇本,這促使整個行業坐下來關注。一些科技巨頭被迫重新思考他們的游戲,因為舊的戰術可能會在這個快速變化的環境中削弱自己。
OpenAI是人工智能領域的關鍵參與者,對DeepSeek的挑戰做出了回應,承諾“提供更好的模型”并加快產品發布。就在宣布這一消息幾天后,這家總部位于舊金山的公司發布了一款新的人工智能代理,旨在進行深入而復雜的研究。
名為Deep Research (深度研究)的新產品可以在互聯網上對包括科學、金融、工程和政策在內的各種主題進行多步驟研究。它建立在最近宣布的o3推理AI模型的特殊版本之上。
根據OpenAI的說法,Deep Research可用于廣泛的應用程序,包括為研究人員提供深入的知識,幫助購物者尋找超個性化的推薦。OpenAI在一篇博客文章中聲稱,Deep Research可以“在幾十分鐘內完成人類需要幾個小時才能完成的任務”
OpenAI分享道:“Deep Research獨立發現、推理并整合來自網絡的見解。”為了實現這一點,它接受了需要瀏覽器和Python工具使用的真實任務的訓練,使用了我們第一個推理模型OpenAI o1背后的相同強化學習方法。”
“雖然o1在編碼、數學和其他技術領域表現出了令人印象深刻的能力,但許多現實世界的挑戰需要從不同的在線來源收集廣泛的背景和信息。深入的研究建立在這些推理能力的基礎上,以彌合這一差距,使其能夠解決人們在工作和日常生活中面臨的問題。”
Deep Research現已面向OpenAI Pro用戶開放,每月最多可查詢100次。此外,團隊用戶接下來將被授予訪問權限,企業用戶隨后將被授予。該公司在不久的將來會發布更具成本效益的Deep Research版本時,所有付費用戶都將有更高優惠。
目前,該代理僅通過網絡提供,并計劃在本月晚些時候集成移動和桌面應用程序。
在性能基準方面,OpenAI分享說,Deep Research在Humanities Last Exam上的準確率達到了26.6%的新高,這是一種基于專家級問題的人工智能評估工具。
那么,Deep Research與DeepSeek的R1相比如何?這兩家公司在功能上似乎不是直接競爭對手。Deep Research更適合結構化研究、引文管理和自動推理。而R1更適合解決復雜的數學和計算問題。盡管如此,兩者之間的比較是不可避免的,特別是考慮到它們名稱的相似和發布日期的接近。
Sam Altman在今年伊始大膽宣稱,OpenAI現在對如何創建AGI充滿信心。Deep Research的發布與公司開發AGI的更廣泛目標相一致。
OpenAI的Deep Research有可能大大減少在線研究所需的時間和精力。通過簡單的查詢,用戶可以輕松找到個人研究分析師。然而,說起來容易做起來難。
人工智能幻覺仍然是GenAI模型中的一個持續挑戰,Deep Research也不例外。OpenAI承認,根據其內部評估,Deep Research有時會產生幻覺或做出不正確的反應。在進行深入研究時,這可能是一個主要問題。
OpenAI分享說,Deep Research可能“難以區分權威信息和謠言,目前在信心校準方面表現出弱點,往往無法準確傳達不確定性。”然而,它預計隨著更多的使用和時間,這些問題會得到改善。
DeepSeek R1的發布重新引發了關于開源代碼在人工智能世界中的作用的爭論。盡管OpenAI有著開源的初衷和名字,但它已經轉向了閉源開發方法。
Altman上周在Reddit AMA上寫道,他承認OpenAI“站在了歷史的錯誤一邊”,現在需要“想出一個不同的開源策略”。然而,他很快提到,并非OpenAI的每個人都認同這一觀點,這也不是最高優先級的事情。
OpenAI首席產品官Kevin Weil表示,該公司被認為將其一些較舊、不太先進的型號開源。它也在考慮在引擎蓋下透露更多信息。他承認在透明度和競爭風險之間取得平衡的挑戰,但指出OpenAI正在積極探索在不損害其競爭優勢的情況下加強披露的方法。
OpenAI可能正在考慮一種更開源的方法,但這可能不會很快發生。該公司指控DeepSeek非法使用其人工智能模型,然而,Altman表示,該公司“沒有計劃起訴DeepSeek。”有趣的是,OpenAI本身也面臨著十幾起非法使用受版權保護的互聯網數據來訓練其模型的訴訟。OpenAI似乎擔心他們的模型被復制的可能性,開源確實可以使復制更容易。OpenAI是否愿意承擔這種風險還有待觀察。