成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

怕被對手蒸餾,OpenAI只敢公開“閹割版”思維鏈!網友失望:錯誤的摘要還不如沒有!OpenAI員工挽尊:推理混亂但結果對了

原創 精選
人工智能
OpenAI 發言人在接受采訪時表示:“我們正在為 o3-mini 引入更新后的 [思維鏈],讓用戶更容易理解模型的思考方式。通過這次更新,用戶可以更清晰地跟隨模型的推理過程,從而對其回答更有信心。”

編輯 | 伊風

OpenAI又Open了一點點!

奧特曼預告的o3 "one-more-thing"來了!

圖片圖片

OpenAI突然更新了免費和付費用戶的o3-mini思維鏈。在這一更新之后,我們終于能看看模型的推理步驟以及它如何得出答案的過程了!

同時,據 OpenAI 介紹,使用 o3-mini 并選擇“高推理”模式的高級 ChatGPT 訂閱用戶也將看到這一改進后的推理顯示。

OpenAI在推文中還給了一個例子,用戶問ChatGPT“今天為啥不是周五呢?”o3思考了一下,甚至還用了個??的emoji,“我也很驚訝今天不是周五,我猜,當你準備好過周末時時間的流速就變慢了吧”。

圖片圖片

OpenAI 發言人在接受采訪時表示:“我們正在為 o3-mini 引入更新后的 [思維鏈],讓用戶更容易理解模型的思考方式。通過這次更新,用戶可以更清晰地跟隨模型的推理過程,從而對其回答更有信心。”

看到OpenAI的新動向,評論區紛紛驚呼:DeepSeek效應無敵了,讓我們一起說謝謝!

圖片圖片

但是……也不能高興得太早!網友很快就發現了其中的蹊蹺——現在o3-mini展示的思維鏈居然是“閹割版”。

OpenAI評論區第一熱評就是:你給的這是原始思維鏈嗎?

圖片圖片

一位網友回復道,我幾乎可以肯定不是,它只是被小模型復述的摘要版 CoT。

圖片圖片

連奧特曼都直接承認了,現在的 CoT是經過“整理”的,更好讀(手動狗頭)。并且也會針對用戶語言進行翻譯。

圖片圖片

許多網友表示大失所望。o3-mini "one-more-thing"就是這?不如DeepSeek免費看完整推理。

圖片圖片

而且,再做一次摘要其實很容易出bug。

例如這位網友,就看到了疑似o3-mini原始思維鏈以及摘要代碼……真的很尷尬啊!

圖片圖片

所以,為啥OpenAI不能大大方方的展示完整思維鏈呢?

1.OpenAI為啥不公開原始思維鏈?

真相只有一個:怕被蒸餾。

在上周的 Reddit AMA(在線問答)中,OpenAI 首席產品官 Kevin Weil 透露說:

“我們正在努力展示比現在更多的內容——[展示模型的思維過程] 很快就會實現。具體方案尚未確定——完整展示思維鏈可能會導致競爭對手進行知識蒸餾(competitive distillation),但我們也知道用戶(至少是高階用戶)希望看到完整的推理過程,所以我們會找到合適的平衡點。”

因此,“摳摳搜搜”的OpenAI找到了一個折中的方案:o3-mini 先進行推理,然后將思維整理成摘要。

OpenAI 發言人在接受采訪時補充了思維鏈的“整理”細節:“為了提升清晰度和安全性,我們新增了一個后處理步驟,模型會復查原始思維鏈,移除任何不安全內容,并簡化復雜的概念。此外,該后處理步驟還能讓非英語用戶以其母語獲取思維鏈,使體驗更加友好和易于理解。”

當然,OpenAI的擔心不無道理。優質的思維鏈數據構造出的數據集,使得復刻模型推理能力變得簡單且成本低廉。昨天,我們剛剛報道過李飛飛團隊,利用1000個問題及其答案,記錄了Gemini 2.0 Flash Thinking Experimental的“思考過程”數據,以此構建的訓練集對開源小模型進行微調,性能可媲美o1mini。詳見:不到140塊!李飛飛團隊超低成本復刻DeepSeek R1推理!16張H100只訓練了26分鐘,與R1訓練方法不同!

問題是,OpenAI很難找到防止蒸餾與保障用戶體驗的“平衡點”,反而會鬧出烏龍。

諷刺的是,此前o3-mini被發現使用中文做推理。被網友懷疑o3是不是蒸餾過DeepSeek,或使用了部分代碼/數據。

圖片圖片

2.o3思維鏈一手實測:錯誤的摘要可能比“黑箱”更糟糕

OpenAI的員工 Noam  Brown發推,用井字棋問題測試o3-mini。

他稱贊說,“o3-mini 是首個穩定答對這個井字棋問題的大型語言模型(LLM)。”但也直言了o3-mini的大缺陷:“總結后的思維鏈(CoT)看起來有些混亂,但你可以看到,在右側的最終推理過程中,模型還是找到了正確答案。”

圖片圖片

圖片圖片

圖片圖片

問題是,用戶本來就依賴推理過程,來判斷結果是否是值得信任的。

在混亂的推理過程后,用戶該如何理解模型得出的“正確答案”呢?就像一位網友所說的:我擔心總結后的思維鏈實際上比什么都沒有更加糟糕。

圖片圖片

另外,小編好奇o3-mini是不是真的是首個能穩定回答井字棋問題的模型。于是用Noam  Brown的prompt丟給了DeepSeek。

因為模型思考這個問題會遍歷所有的可能,再加上模型自己會做檢查,一度我看著AI不斷地輸出推理,懷疑它是否已經陷入了循環。大家也可以從右側滑塊感受這篇推理到底有多長。

圖片圖片

最終,DeepSeek拿下了正確答案,而且,它全部的推理過程都是可查的!

圖片圖片

而如此篇幅的推理過程,很難被形成一個正確的摘要。這就是o3出現混亂的原因。

3.寫在最后:前CTO的創業公司或成為OpenAI新對手

OpenAI試圖獲取的平衡,正暴露了這家公司陷入了一個兩難的困境中。

值得注意的是,在Anthropic之后,又一家OpenAI“原版人馬”的創業公司要和其打擂臺了。

那就是OpenAI前CTOMira Murati 低調創立的新創業公司!

據《財富》報道,OpenAI 聯合創始人 John Schulman 本周早些時候從 AI 公司 Anthropic 離職,將跳槽到Mira的新公司。值得注意的是,John Schulman才剛剛加入Anthropic五個月。

自去年 9 月離開 OpenAI 以來,Mira對新公司的情況守口如瓶。不過,據知情人士透露,Murati 已招募了多名前 OpenAI 員工,其中包括曾在 OpenAI 超算團隊工作的 Christian Gibson。

所以,OpenAI的人才動蕩估計又要持續一陣了。

參考鏈接:

1.https://techcrunch.com/2025/02/06/report-openais-ex-cto-mira-murati-has-recruited-openai-co-founder-john-schulman/

2.https://techcrunch.com/2025/02/06/openai-now-reveals-more-of-its-o3-mini-models-thought-process/

想了解更多AIGC的內容,請訪問:

51CTO AI.x社區

http://www.ekrvqnd.cn/aigc/

責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2025-02-08 17:00:11

2025-02-07 09:05:36

2023-02-01 13:37:59

ChatGPTAI

2025-05-15 11:54:11

GPT-4.1PlusAPI

2025-01-20 15:22:55

2023-01-15 13:52:18

AIChatGPT

2024-07-15 00:15:00

OpenAI人工智能AI安全風險

2023-11-18 09:09:44

OpenAI微軟

2024-01-29 00:05:00

OpenAI嵌入機器學習

2025-01-20 07:30:00

OpenAIGPT-5模型

2023-06-04 13:29:24

OpenAI員工UC

2023-06-08 07:58:29

2024-06-07 16:40:53

2024-02-21 13:31:00

2023-03-31 15:12:33

ChatGPTOpenAI谷歌

2024-02-21 15:05:30

2024-05-10 12:58:08

2023-05-16 20:47:38

2023-11-01 13:37:26

2025-01-26 14:07:34

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美成人猛片aaaaaaa | 欧美激情在线精品一区二区三区 | 精品久久久网站 | 久草精品视频 | 日韩欧美成人一区二区三区 | 美女黄色在线观看 | 免费国产一区二区 | 国产黄色av网站 | 日本久久网站 | 91视频网址| 午夜理伦三级理论三级在线观看 | 一级特黄网站 | 偷派自拍 | 国产黄色大片网站 | 久久青青| 成人在线精品视频 | 亚洲福利一区 | 亚洲欧美一区二区三区在线 | 美女网站视频免费黄 | 色一情一乱一伦一区二区三区 | 高清成人av | 日本不卡一区 | 国产视频久 | 紧缚调教一区二区三区视频 | www一级片 | 欧美亚洲激情 | 羞羞视频一区二区 | 2018天天干天天操 | 亚洲精品在线免费播放 | 免费在线观看一级毛片 | 毛片一区二区三区 | 亚洲综合二区 | 精品欧美黑人一区二区三区 | 国产一二区在线 | 在线成人精品视频 | 色综合色综合色综合 | 午夜视频网| 国产精品一区二区三区四区 | 蜜桃视频在线观看www社区 | 一本久久a久久精品亚洲 | 国产一区二区在线免费观看 |