OpenAI擴大了對Deep Research的訪問
OpenAI宣布,它已經擴大了對其Deep Research的訪問,這是其開發的一種新的人工智能代理,旨在進行復雜的研究。Deep Research本月早些時候向ChatGPT Pro的用戶首次亮相,該公司的訂閱級別為每月200美元,但現在所有付費用戶都可以使用。
該公司在周二的一篇社交媒體帖子中表示:“Deep Research現在正在向所有ChatGPT Plus、Team、Edu和Enterprise用戶推出。”
以前,Pro用戶每月最多可以查詢100次。現在,專業用戶每月可獲得120個查詢,而Plus、Team、Edu和Enterprise用戶每月可獲得10個查詢。
OpenAI還宣布自Deep Research首次推出以來對其進行了改進,包括增加了嵌入式圖像的引用,并增強了理解和引用上傳文件的能力。
“給它一個提示,ChatGPT將在幾十分鐘內找到、分析和綜合數百個在線資源,以創建一份全面的報告,而人類需要幾個小時。”該公司在談到通過ChatGPT界面訪問的新Deep Research功能時說。
Deep Research是一個人工智能代理,專為深入的互聯網研究而設計,能夠進行多步查詢,分析文本、圖像和PDF,并根據新信息調整其方法。它由OpenAI o3模型的早期版本提供支持,還支持用戶提供的文件,并可以執行Python代碼進行數據分析。
OpenAI表示,Deep Research是為在金融、科學、政策和工程等領域從事密集知識工作并需要深入可靠研究的人而建立的。該公司表示,對于那些需要仔細研究的挑剔購物者來說,這也是非常有用的,他們希望獲得高度個性化的購物推薦。
OpenAI首席執行官Sam Altman在推特上說:“為ChatGPT Plus用戶進行深入研究!”并稱該功能是“我們推出過的最喜歡的功能之一”。
OpenAI首席項目官Kevin Weil也表示,這是該公司推出的他最喜歡的產品,并描述了他是如何使用它的:“它可以在15分鐘內完成為期一周的研究任務。我用它來更好地了解μ介子對撞機、可再生能源市場和人工智能訓練后技術,并為我的孩子研究/購買籃球架,為自己研究/購買新鞋。”
Deep Research在一項名為“人類最后一次考試”的基準測試中表現良好,該測試由人工智能安全中心的研究人員與數據注釋公司Scale AI聯合進行。該測試由數學和哲學等學術領域的專家提交和審查的約3000個多項選擇題和簡答題組成。
Deep Research在測試中的得分為26.6%,目前處于領先地位,乍一看可能并不令人印象深刻。但之前的領導者,OpenAI的o1和DeepSeek的R1模型,都只獲得了9%的分數。根據OpenAI的數據,這代表著Deep Research的智力有了大幅提升,在與化學、人文社會科學和數學相關的問題上獲得了最大的收益。
盡管如此,所有大型語言模型都容易產生幻覺,或者完全捏造看起來和聽起來都可信的事實和事件。那些使用生成式人工智能進行研究的人必須仔細檢查模型輸出的準確性,盡管這些模型在基準測試中表現得很好。
這是佛羅里達州律師事務所Morgan and Morgan最近面臨的現實,因提交了一份由聊天機器人生成的八個虛構法庭案件的案件檔案而被懷俄明州法官罰款。
該案的首席律師Mike Morgan在一份聲明性文件中寫道:“隨著我們進入一個人工智能與日常實踐更加交織的世界,這份令人深感遺憾的文件對我和我們的公司來說是一個沉痛的教訓。”他補充說:“法律上沒有捷徑。”