成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<samp id="16111"><tr id="16111"></tr></samp>

<ruby id="16111"></ruby>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

OpenAI揭示o3的推理過程，以彌合與DeepSeek-R1的差距原創(chuàng)

51CTO內(nèi)容精選

發(fā)布于 2025-2-18 08:12

瀏覽

0收藏

OpenAI公司推出o3-mini推理模型，展示了更詳細(xì)的思維鏈軌跡，并希望以更透明的方式彌合與顯示其全部思維鏈的DeepSeek-R1的競爭差距。

生成式人工智能開發(fā)商OpenAI公司首席執(zhí)行官Sam Altman最近在?Reddit AMA??問答活動中承認(rèn)，該公司在開源軟件研究方面站在了“歷史錯誤的一邊”。

OpenAI揭示o3的推理過程，以彌合與DeepSeek-R1的差距-AI.x社區(qū)

盡管OpenAI公司尚未發(fā)布其開源模型，但已經(jīng)邁出了提高透明度的第一步。正如該公司在其?X帳號??上所宣布的那樣，其最新的推理模型o3-mini現(xiàn)在展示了其思維鏈（CoT）跟蹤的更詳細(xì)版本。

OpenAI揭示o3的推理過程，以彌合與DeepSeek-R1的差距-AI.x社區(qū)

此前，OpenAI公司的推理模型僅展示了CoT的高級概述，這使得開發(fā)人員難以理解模型的推理邏輯并對提示進(jìn)行相應(yīng)的調(diào)整。

OpenAI公司隱藏了CoT以防止競爭對手利用這一技術(shù)來訓(xùn)練他們自己的模型。但是，在展示所有CoT令牌的DeepSeek-R1模型發(fā)布之后，OpenAI在保持其競爭優(yōu)勢方面面臨著嚴(yán)峻挑戰(zhàn)。

OpenAI公司最近進(jìn)行的更改展示了CoT的更詳細(xì)版本，但并沒有揭示原始的推理令牌，這讓OpenAI公司在增強(qiáng)透明度和保護(hù)其核心競爭力（如果有的話）之間取得了巧妙的平衡。

OpenAI揭示o3的推理過程，以彌合與DeepSeek-R1的差距-AI.x社區(qū)

以下是展示思維鏈非常重要的原因。在本文作者之前的?對比實驗??中，發(fā)現(xiàn)OpenAI公司的o1模型在處理來自網(wǎng)絡(luò)的噪聲數(shù)據(jù)時略優(yōu)于DeepSeek-R1。然而，由于o1沒有揭示其思維鏈，因此很難對其錯誤進(jìn)行故障排除（而且當(dāng)這兩個模型不是解決簡單問題時，它們都會出現(xiàn)錯誤）。另一方面，DeepSeek-R1的透明度使其成為現(xiàn)實應(yīng)用中更好的整體模型。

例如，在一個失敗的實驗中，DeepSeek-R1的CoT幫助開發(fā)人員發(fā)現(xiàn)問題不在于模型本身，而在于獲取數(shù)據(jù)的檢索組件（這種問題在實際應(yīng)用中經(jīng)常發(fā)生）。另一方面，o1只給出了一個錯誤的答案和一個模糊的推理鏈。

OpenAI揭示o3的推理過程，以彌合與DeepSeek-R1的差距-AI.x社區(qū)

本文作者對o3-mini進(jìn)行了一項測試，他向這一模型提供了包含2024年至2025年歷史股票價格數(shù)據(jù)的文件，并向它提出了需要推理和數(shù)據(jù)分析的問題（由于ChatGPT o3-mini不支持文件附件上傳，因此只能將內(nèi)容粘貼到提示中）。這項測試旨在計算每月在Magnificent 7股票上投資140美元的投資組合的價值。該文件包含從雅虎財經(jīng)獲取的繁雜數(shù)據(jù)。這些數(shù)據(jù)包含純文本和HTML元素，其中涵蓋了“Mag 7”股票和非“Mag 7”股票。

測試結(jié)果表明，這種新提供的詳盡的CoT極具價值。它可以跟蹤模型推理過程，其中包括哪些股票是“Mag 7”股票，哪些股票在文件中，哪些應(yīng)該被忽略，以及如何在這些股票之間合理分配投資，以及如何在每個月初準(zhǔn)確地獲取每個股票的價值數(shù)據(jù)等。該模型提供了詳細(xì)的答案，不僅詳細(xì)闡述了整個推理過程，還明確指出了投資組合的最終價值。

OpenAI揭示o3的推理過程，以彌合與DeepSeek-R1的差距-AI.x社區(qū)

DeepSeek-R1在開放性、價格和透明度方面具有OpenAI公司的推理模型無法比擬的三大優(yōu)勢。OpenAI通過發(fā)布o(jì)3-mini在一定程度上縮小了差距。

o3-mini的成本極具競爭力，輸出每百萬令牌僅需4.40美元，遠(yuǎn)低于o1的60美元，與此同時，它在多個推理基準(zhǔn)測試中的表現(xiàn)還優(yōu)于o1。相比之下，DeepSeek-R1在美國供應(yīng)商的運行成本約為每百萬令牌7至8美元。（值得注意的是，雖然DeepSeek在其服務(wù)器上運行的R1服務(wù)以每百萬令牌2.19美元的優(yōu)惠價格提供，但許多組織因地域限制而無法使用。）

更改之后的CoT輸出也將幫助OpenAI公司在透明度方面取得顯著進(jìn)展。但隨著越來越多的云計算服務(wù)提供商將其集成到他們的產(chǎn)品中，模型構(gòu)建者也在此基礎(chǔ)上創(chuàng)建衍生品，DeepSeek-R1正迅速成為推理模型的標(biāo)準(zhǔn)。然而，OpenAI公司是否會改變其保持模型封閉的政策仍有待觀察。

原文標(biāo)題：??OpenAI reveals o3’s reasoning process to bridge gap with DeepSeek-R1??，作者：Ben Dickson

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責(zé)任

標(biāo)簽

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

語言模型的神秘面紗：小學(xué)數(shù)學(xué)與隱含推理過程

sbf_2000 ? 2329瀏覽 ? 0回復(fù)
解密o1推理過程！DeepSeek-R1-Lite預(yù)覽版上線

kede96 ? 3179瀏覽 ? 0回復(fù)
DeepSeek-AI 發(fā)布 DeepSeek-R1-Zero 和 DeepSeek-R1

Halo咯咯 ? 4148瀏覽 ? 0回復(fù)
OpenAI o3-mini 干翻了 DeepSeek R1？

PyTorch研習(xí)社 ? 2329瀏覽 ? 0回復(fù)
DeepSeek-R1：通過強(qiáng)化學(xué)習(xí)激發(fā)大語言模型的推理潛能

柏企閱文 ? 4639瀏覽 ? 0回復(fù)
OpenAI被逼急了？o3思維鏈突然開放，DeepSeek功不可沒！

探索AGI ? 1836瀏覽 ? 0回復(fù)
一文讀懂 DeepSeek-R1：大語言模型推理能力進(jìn)化的秘密武器

十一月雨_55 ? 5760瀏覽 ? 0回復(fù)
圖文詳解：帶你讀懂 DeepSeek-R1 的核心原理

Baihai_IDP ? 5663瀏覽 ? 0回復(fù)
DeepSeek-R1、o3-mini能解奧數(shù)題卻算不了多位數(shù)乘法？

輕薄滴假象 ? 2204瀏覽 ? 0回復(fù)
大模型對決：DeepSeek R1與o3-mini

丟翅膀的魚 ? 2562瀏覽 ? 0回復(fù)
AI領(lǐng)域的“新王”誕生! 馬斯克發(fā)布Grok 3，趕超OpenAI o1和Deepseek R1！

AI博物院 ? 2076瀏覽 ? 0回復(fù)
可以展示推理過程

一個幽默的程序員 ? 1834瀏覽 ? 0回復(fù)
Grok 3 與 DeepSeek-R1 是怎么學(xué)會思考的？

機(jī)器學(xué)習(xí)與數(shù)學(xué) ? 3529瀏覽 ? 0回復(fù)
沖，DeepSeek-R1/V3推理系統(tǒng)架構(gòu)設(shè)計被開源了！

PaperAgent ? 2298瀏覽 ? 0回復(fù)
Vision-R1：多模態(tài)領(lǐng)域的DeepSeek R1-Zero，7B參數(shù)比肩OpenAI O1

Syrupup ? 2377瀏覽 ? 0回復(fù)
Deepseek-R1，論文番外篇!

NLP前沿1 ? 1300瀏覽 ? 0回復(fù)
一文讀懂 DeepSeek-R1 的 “最強(qiáng)外掛” GRPO 算法

鴻煊的學(xué)習(xí)筆記 ? 2861瀏覽 ? 0回復(fù)
Qwen3力壓DeepSeek-R1和OpenAI o1，登頂開源王座！

算家計算 ? 1562瀏覽 ? 0回復(fù)
DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當(dāng)，實測來了

老蛀蟲 ? 4161瀏覽 ? 0回復(fù)

51CTO內(nèi)容精選

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

從OCR瓶頸到結(jié)構(gòu)化理解來有效提升RAG的效果 1天前發(fā)布
“遠(yuǎn)超預(yù)期”：Midjourney在迪士尼和環(huán)球影業(yè)提起訴訟之際發(fā)布首款人工智能（AI）視頻模型 2天前發(fā)布

熱門推薦

AI Agents開源工具棧全解析~ 1回復(fù)

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒問題 0回復(fù)

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復(fù)

本命周！MiniMax M1有多猛？網(wǎng)友：僅用40k思考預(yù)算就干翻Gemini，實測：真·超DS！ 1回復(fù)

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當(dāng)，實測來了 0回復(fù)

上一篇：大模型前綴緩存技術(shù)，有望將服務(wù)成本降低90%

下一篇：一文說清楚分布式思維狀態(tài)：由事件驅(qū)動的多智能體系統(tǒng)

社區(qū)精華內(nèi)容

目錄

主站蜘蛛池模板：久久国产精品久久久久久久久久 | av成人在线观看 | 成人国产精品免费观看 | 亚洲人人舔人人 | 国产激情视频在线 | 亚洲精品在线91 | 色婷婷亚洲国产女人的天堂 | 天天操夜夜拍 | 国产精品久久久久久久久久久免费看 | 国产精品一区二区三区在线 | 国产一区二区三区www | 视频一二区 | 欧美视频在线播放 | 2019天天操 | 国产伦精品一区二区三区高清 | 九九热国产精品视频 | 狠狠综合久久av一区二区小说 | 国产区第一页 | 香蕉一区二区 | 成人免费毛片在线观看 | 成人乱人乱一区二区三区软件 | 亚洲精品久久久久久久久久久 | 91精品一区 | 国产精品久久久乱弄 | 日韩av免费看 | 一级黄色影片在线观看 | av一区二区三区在线观看 | www四虎com| 亚洲欧美一区二区三区在线 | 男人的天堂中文字幕 | 欧美激情综合 | 性色在线| 韩日一区二区三区 | 黄色一级片aaa | 欧美一级片在线播放 | 国产欧美一区二区三区在线看 | 久视频在线 | 丁香久久| 久久精品aaa | 成人国产精品久久 | 欧美视频在线免费 |

<samp id="66116"></samp>

<video id="66116"><abbr id="66116"></abbr></video>

<tfoot id="66116"><legend id="66116"></legend></tfoot>

<samp id="66116"><font id="66116"></font></samp>

<sub id="66116"></sub>

<video id="66116"><tt id="66116"></tt></video>

<strike id="66116"><s id="66116"></s></strike>