成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

OpenAI揭示o3的推理過程,以彌合與DeepSeek-R1的差距 原創(chuàng)

發(fā)布于 2025-2-18 08:12
瀏覽
0收藏

OpenAI公司推出o3-mini推理模型,展示了更詳細(xì)的思維鏈軌跡,并希望以更透明的方式彌合與顯示其全部思維鏈的DeepSeek-R1的競爭差距。

生成式人工智能開發(fā)商OpenAI公司首席執(zhí)行官Sam Altman最近在?Reddit AMA??問答活動中承認(rèn),該公司在開源軟件研究方面站在了“歷史錯誤的一邊”。

OpenAI揭示o3的推理過程,以彌合與DeepSeek-R1的差距-AI.x社區(qū)

盡管OpenAI公司尚未發(fā)布其開源模型,但已經(jīng)邁出了提高透明度的第一步。正如該公司在其?X帳號??上所宣布的那樣,其最新的推理模型o3-mini現(xiàn)在展示了其思維鏈(CoT)跟蹤的更詳細(xì)版本。

OpenAI揭示o3的推理過程,以彌合與DeepSeek-R1的差距-AI.x社區(qū)

此前,OpenAI公司的推理模型僅展示了CoT的高級概述,這使得開發(fā)人員難以理解模型的推理邏輯并對提示進(jìn)行相應(yīng)的調(diào)整。

OpenAI公司隱藏了CoT以防止競爭對手利用這一技術(shù)來訓(xùn)練他們自己的模型。但是,在展示所有CoT令牌的DeepSeek-R1模型發(fā)布之后,OpenAI在保持其競爭優(yōu)勢方面面臨著嚴(yán)峻挑戰(zhàn)。

OpenAI公司最近進(jìn)行的更改展示了CoT的更詳細(xì)版本,但并沒有揭示原始的推理令牌,這讓OpenAI公司在增強(qiáng)透明度和保護(hù)其核心競爭力(如果有的話)之間取得了巧妙的平衡。

OpenAI揭示o3的推理過程,以彌合與DeepSeek-R1的差距-AI.x社區(qū)

以下是展示思維鏈非常重要的原因。在本文作者之前的?對比實驗??中,發(fā)現(xiàn)OpenAI公司的o1模型在處理來自網(wǎng)絡(luò)的噪聲數(shù)據(jù)時略優(yōu)于DeepSeek-R1。然而,由于o1沒有揭示其思維鏈,因此很難對其錯誤進(jìn)行故障排除(而且當(dāng)這兩個模型不是解決簡單問題時,它們都會出現(xiàn)錯誤)。另一方面,DeepSeek-R1的透明度使其成為現(xiàn)實應(yīng)用中更好的整體模型。

例如,在一個失敗的實驗中,DeepSeek-R1的CoT幫助開發(fā)人員發(fā)現(xiàn)問題不在于模型本身,而在于獲取數(shù)據(jù)的檢索組件(這種問題在實際應(yīng)用中經(jīng)常發(fā)生)。另一方面,o1只給出了一個錯誤的答案和一個模糊的推理鏈。

OpenAI揭示o3的推理過程,以彌合與DeepSeek-R1的差距-AI.x社區(qū)

本文作者對o3-mini進(jìn)行了一項測試,他向這一模型提供了包含2024年至2025年歷史股票價格數(shù)據(jù)的文件,并向它提出了需要推理和數(shù)據(jù)分析的問題(由于ChatGPT o3-mini不支持文件附件上傳,因此只能將內(nèi)容粘貼到提示中)。這項測試旨在計算每月在Magnificent 7股票上投資140美元的投資組合的價值。該文件包含從雅虎財經(jīng)獲取的繁雜數(shù)據(jù)。這些數(shù)據(jù)包含純文本和HTML元素,其中涵蓋了“Mag 7”股票和非“Mag 7”股票。

測試結(jié)果表明,這種新提供的詳盡的CoT極具價值。它可以跟蹤模型推理過程,其中包括哪些股票是“Mag 7”股票,哪些股票在文件中,哪些應(yīng)該被忽略,以及如何在這些股票之間合理分配投資,以及如何在每個月初準(zhǔn)確地獲取每個股票的價值數(shù)據(jù)等。該模型提供了詳細(xì)的答案,不僅詳細(xì)闡述了整個推理過程,還明確指出了投資組合的最終價值。

OpenAI揭示o3的推理過程,以彌合與DeepSeek-R1的差距-AI.x社區(qū)

DeepSeek-R1在開放性、價格和透明度方面具有OpenAI公司的推理模型無法比擬的三大優(yōu)勢。OpenAI通過發(fā)布o(jì)3-mini在一定程度上縮小了差距。

o3-mini的成本極具競爭力,輸出每百萬令牌僅需4.40美元,遠(yuǎn)低于o1的60美元,與此同時,它在多個推理基準(zhǔn)測試中的表現(xiàn)還優(yōu)于o1。相比之下,DeepSeek-R1在美國供應(yīng)商的運行成本約為每百萬令牌7至8美元。(值得注意的是,雖然DeepSeek在其服務(wù)器上運行的R1服務(wù)以每百萬令牌2.19美元的優(yōu)惠價格提供,但許多組織因地域限制而無法使用。)

更改之后的CoT輸出也將幫助OpenAI公司在透明度方面取得顯著進(jìn)展。但隨著越來越多的云計算服務(wù)提供商將其集成到他們的產(chǎn)品中,模型構(gòu)建者也在此基礎(chǔ)上創(chuàng)建衍生品,DeepSeek-R1正迅速成為推理模型的標(biāo)準(zhǔn)。然而,OpenAI公司是否會改變其保持模型封閉的政策仍有待觀察。

原文標(biāo)題:??OpenAI reveals o3’s reasoning process to bridge gap with DeepSeek-R1??,作者:Ben Dickson

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責(zé)任
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
主站蜘蛛池模板: 久久国产精品久久久久久久久久 | av成人在线观看 | 成人国产精品免费观看 | 亚洲人人舔人人 | 国产激情视频在线 | 亚洲精品在线91 | 色婷婷亚洲国产女人的天堂 | 天天操夜夜拍 | 国产精品久久久久久久久久久免费看 | 国产精品一区二区三区在线 | 国产一区二区三区www | 视频一二区 | 欧美视频在线播放 | 2019天天操 | 国产伦精品一区二区三区高清 | 九九热国产精品视频 | 狠狠综合久久av一区二区小说 | 国产区第一页 | 香蕉一区二区 | 成人免费毛片在线观看 | 成人乱人乱一区二区三区软件 | 亚洲精品久久久久久久久久久 | 91精品一区 | 国产精品久久久乱弄 | 日韩av免费看 | 一级黄色影片在线观看 | av一区二区三区在线观看 | www四虎com| 亚洲欧美一区二区三区在线 | 男人的天堂中文字幕 | 欧美激情综合 | 性色在线| 韩日一区二区三区 | 黄色一级片aaa | 欧美一级片在线播放 | 国产欧美一区二区三区在线看 | 久视频在线 | 丁香久久| 久久精品aaa | 成人国产精品久久 | 欧美视频在线免费 |