成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

5分鐘頂人類8小時!OpenAI Deep Research訂閱全推送,端到端強化微調是關鍵

人工智能 新聞
最近,OpenAI的研究團隊在采訪中表示,全新的Deep Research功能,可以為你節省幾個小時甚至幾天的時間!

Deep Research(深度研究)是繼「Operator」之后,OpenAI推出的第二個智能體,利用模型的推理能力,綜合分析浩瀚的互聯網信息,從而完成復雜的研究任務。

月初,OpenAI首先向ChatGPT Pro用戶開放了Deep Research功能。最近,進一步開放給了更多等級的訂閱用戶。

其中,Plus、Team、教育和企業用戶每月10次查詢機會,Pro用戶每月120次機會。

OpenAI對新功能寄予厚望:

它能在幾分鐘內完成人類需要數小時才能完成的工作

綜合知識的能力是創造新知識的先決條件。

因此,深度研究標志著我們在開發AGI(通用人工智能)這一更廣泛目標上邁出了重要一步。

長期以來,我們一直設想AGI能夠進行創新性科學研究。

奧特曼表示:這是他最喜歡的已發布的功能之一。

此次更新,固然給用戶帶來了新體驗,「錢沒白花」。

但考慮到每月最多使用10次,新功能顯得「雞肋」:

考慮到同一梯隊的競爭對手,不僅類似功能推出的更早,而且免費,OpenAI這次發布,的確算不上出彩。

那這次OpenAI都推出哪些新特性?為什么這次落后競爭對手了呢?

技術報告發布

在X上,OpenAI連發多條消息,介紹深度研究相關更新情況。

除更多用戶可用之外,本次更新的主要改進為:

在輸出中嵌入帶引用的圖片

更好理解和參閱上傳的文件

然后,其他改進呢?無。

至于,沒什么落后競爭對手,OpenAI給出的解釋是為了控制風險,保證安全:

在推出深度研究并將其提供給Pro用戶之前,我們進行了嚴格的安全性測試、準備評估和治理審查

我們還進行了額外的安全性測試,以更好地了解與深度研究瀏覽網頁能力相關的逐步風險,并添加了新的緩解措施。重點工作包括加強對在線發布的個人信息的隱私保護,并訓練模型抵抗在互聯網搜索過程中,可能遇到的惡意指令。

在廣泛發布深度研究之前,我們花時間進行了更多的人工探測和自動化測試,以評估特定風險

在官網發布的系統卡(System card),OpenAI從提示注入、禁止內容、隱私、運行代碼能力、偏見和幻覺等方面,全面測試、評估并緩解了系統安全問題。

OpenAI展示了一系列測試結果,最后認為

總體上,深度研究在準備框架(Preparedness Framework)中被歸類為中等風險,并且已采取相應的保障措施和安全緩解措施,為這個模型做好了準備。

值得關注的是,在模型自主性方面,在處理更長時間跨度和智能體任務時,深度研究性能有所改進,尤其是在模型自主性風險相關的任務中。

比如,在SWE-Bench Verified評測中,深度研究展現了執行明確定義的編程任務的能力,被評定為中等風險水平。

已有網友給出了全面的總結:

更多安全測試結果與分析,參閱OpenAI官方系統卡:

文檔鏈接:https://cdn.openai.com/deep-research-system-card.pdf

尷尬之處在于,已免費推出相關功能的Grok-3,以安全性著稱。

紅杉采訪亮點

紅杉資本合伙人Sonya和Lauren,與OpenAI Deep Research的產品負責人Isa和Josh展開了深度對話。

當問及2025年的風口時,Isa和Josh不約而同地回答:「智能體」。

Deep Research是OpenAI在「Operator」之后推出的第二個智能體。通過端到端的強化學習訓練,Deep Research能像經驗豐富的研究員一樣,查資料、思考并完成全面的報告。

這不僅是節省5%時間,而是將原本需要8小時的任務縮減到5分鐘!

Deep Research無法為你完成一切,但它能為你節省幾個小時,甚至是幾天。

Isa表示:「我確信它會成為人們生活中不可或缺的一部分。」

從行業分析到醫學研究,再到計劃生日派對,Deep Research幾乎無所不能。

Deep Research不是普通的搜索工具,它能廣泛收集有關來源的信息,擅長在互聯網上找到小眾的事實,并整合到一個漂亮、整潔的報告中,嵌入圖表,并附上指向原始信息的引用。

當你想尋找特定的信息,并需要搜尋大量資料時,它才能發揮出最佳水平。它很擅長尋找和綜合信息,但Isa不認為Deep Research當前能做出新的科學發現。

應用場景

Deep Research常被應用于科學研究、醫學研究等領域。人們用它來了解市場、公司和房地產等。

Isa的朋友正考慮創辦一家消費品公司,會用它來做競品調研,查看特定域名是否被占用,以及估算市場規模。

出人意料的是,用戶會用Deep Research搜索代碼,查找關于某個軟件包的最新文檔,并幫他們編寫腳本。

Deep Research不僅能用于工作,在購物和旅行建議上也很有用。比如想買一輛新車時,可以請它整理一份報告。在日本發布Deep Research功能時,它可以用來幫忙尋找餐廳。

個性化教育也是非常有趣的場景,如果想復習生物學知識,它會是個好幫手。

輸入想了解的信息,它會為你整理出一份很棒的報告。

技術架構

驅動Deep Research的是o3模型的微調版本,o3是OpenAI最先進的推理模型。

模型針對困難的搜索和推理任務進行了訓練,可以調用瀏覽工具和Python工具。通過在這些任務上進行端到端訓練,模型學會了在線搜索和分析。

Deep Research最大的創新在于「端到端訓練」。研究的過程中,很多事是無法預測的。Isa認為沒有腳本能像訓練出的模型那樣靈活,能對實時的信息做出反應。

Deep Research在做有創造性的搜索,查看思維鏈總結會發現,它在想出下一個要查找的內容方面非常聰明。

Josh表示「我們經常誤以為自己寫代碼會比模型更聰明,但實際上,模型通常會提出更好的解決方案。」

強化學習微調很可能是構建強大智能體的關鍵!

Yann LeCun有個「蛋糕比喻」,無監督學習是蛋糕,監督學習是糖霜,強化學習是頂部的櫻桃。

成功的秘訣是構建高質量的數據集,數據質量是決定模型質量的最大因素。

Josh認為「AGI」目前只是運營問題。

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-04-09 13:19:29

2025-02-17 08:40:00

人工智能模型研究

2025-02-06 08:12:41

2025-02-03 12:07:52

2021-12-02 06:58:03

AIOps通信服務

2012-06-28 10:26:51

Silverlight

2025-03-10 10:26:16

2025-04-25 09:09:00

2018-09-19 13:51:21

遠程醫療

2025-02-06 15:07:27

2014-12-02 10:07:58

華為云VDC

2018-11-02 08:24:55

GitHub網絡鏈路

2011-07-25 09:37:12

大型機管理CA自動化管理

2013-05-27 10:21:39

游戲設計

2021-07-21 07:55:22

技術

2018-04-10 08:33:18

NVMe閃存存儲

2015-11-23 17:34:33

秒借

2013-06-24 15:32:41

JPush極光推送Android Pus移動開發

2021-03-03 11:36:57

Java 8Java 15Java

2025-02-27 09:45:50

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品一区二区三区四区 | 毛片a级 | 超碰高清 | 成人国产在线观看 | 亚洲欧美日韩中文字幕一区二区三区 | 欧美不卡在线 | 一区在线观看 | 亚洲性视频| 欧美a在线 | 91在线中文字幕 | 久久久国产精品网站 | 夜夜草导航 | 国产精品久久久久久久久久久久久久 | 日日噜噜夜夜爽爽狠狠 | 久久久久中文字幕 | 欧美一区二区三区大片 | 亚洲狠狠丁香婷婷综合久久久 | 欧美日韩中 | 自拍视频网站 | 日韩精品1区2区 | 久久人人网| 97国产爽爽爽久久久 | 久草网免费 | 日韩中文字幕视频在线观看 | 成人婷婷 | 国产农村妇女毛片精品久久麻豆 | 日韩欧美专区 | 在线激情视频 | 亚洲一区自拍 | 一级欧美 | 999视频 | 久久精品久久久久久 | 国产精品国产精品国产专区不卡 | 四虎影视免费观看 | 午夜激情在线 | 国产国语精品 | 国产不卡一区 | 99久久免费精品视频 | 91国自视频 | 国产精品久久久久久婷婷天堂 | 亚洲国产一 |