成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<tbody id="pyzuw"></tbody>

<kbd id="pyzuw"></kbd>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

賬號設置退出

OpenAI第一場直播就炸場！o1滿血版上線，史上最貴訂閱費：1450元/月

2024-12-06 08:23:40

?最強推理模型o1，正式上線滿血版，還有更強的Pro版本一同登臺。ChatGPT也推出了Pro訂閱計劃，一個月兩百美金，直接成為了“世界最貴的大模型”。

OpenAI“雙十二”第一天，直接拋出重磅炸彈——

最強推理模型o1，正式上線滿血版，還有更強的Pro版本一同登臺。

ChatGPT也推出了Pro訂閱計劃，一個月兩百美金，直接成為了“世界最貴的大模型”。

CEO奧特曼與三名員工圍坐桌前，一邊演示一邊介紹著新產品的特性。

整個發布會僅持續不到15分鐘，但包含了巨大的信息量：

相比preview版本，滿血o1的數學和代碼能力均大幅提升，Pro版則是再上一層樓。
滿血版推理速度更快，比preview快了60%。
網友們期待的多模態推理，滿血版o1也安排上了。

如奧特曼所說，滿血版已經正式上線ChatGPT，作為預覽的preview版從用戶界面中消失了。

至于更強的o1 Pro則是ChatGPT Pro訂閱用戶的特權，除此之外，這些用戶還可以獲得o1滿血版的不限量訪問權限。

o1已支持多模態推理

接下來到了演示環節。

一開始，團隊就拿滿血版o1（左邊）和o1-preview（右邊）來了場競速。

他們問了一個歷史問題，回答過程be like：

列出二世紀的羅馬皇帝，包括他們的統治時期和成就。

可以看出，滿血版o1（14秒）早于o1-preview（33秒）完成了作答。再加上團隊成員幾次類似的離線測試，最終得出結論：

滿血版o1的平均響應速度比o1-preview快了60%。

值得注意的是，通過一整套人類評估，OpenAI還發現滿血版o1在推理時犯重大錯誤的頻率比o1-preview少了34%。

而滿血o1的另一大亮點就是支持多模態輸入，具備視覺推理能力，團隊也進行了現場展示。

只見他們拿出了一張畫著數據中心草圖的A4紙，拍照上傳后，原始提示詞翻譯后如下：

這里展示了一個高度簡化的太空數據中心示意圖。對于任何簡化的假設，請提供理由。
你的任務是估算這個托管GPU的數據中心所需的散熱器表面積的下限。在此過程中，還需要回答以下問題：
你如何處理太陽和深空？
熱力學第一定律如何發揮作用？

這邊團隊成員們還在閑聊，10秒過后，模型就開始唰唰唰給答案了……

有意思的是，團隊還特意給o1模型挖了個坑——故意省略了其中一個參數，以此來測試模型面對模糊問題的處理能力。

在團隊看來，模型能夠意識到這是一個重要但被忽略的參數，也是推理能力的體現。

驚喜的是，滿血版o1不僅選擇了正確的參數范圍，還通過進一步的細致論證最終找出了準確參數。

（如模型所回答，正確答案是242）

最后，團隊也展示了“大會員”專用的Pro版的表現。

既然是Pro，那測試的問題當然也要上上難度。

團隊成員指出，一些高難度的生化問題，以往o1-preview都搞不定，這下讓Pro mode來試試。

比如下面這道o1-preview曾“束手無策”的“猜蛋白質”問題：

哪個蛋白質嚴格符合以下標準？
前體多肽的長度為210到230個氨基酸殘基。
編碼該蛋白質的基因跨越32k堿基。
該基因位于X染色體上，特別是在Xp22區域。
信號肽包含23個氨基酸殘基。
該蛋白質促進細胞間的粘附。
該蛋白質在維持神經系統特定部分的健康中發揮關鍵作用。

只見提問后，Pro mode出現了一個“思考進度條”，大約53秒后模型給出了答案。

進一步點擊回答最上面的小框框，就可以在側邊欄展開推理細節，里面詳細記錄了模型的思考步驟。

畢竟按照OpenAI的說法，o1（包括之前的preview版）在博士級科學問答上的表現是超過人類專家的。

不過有一說一，Pro版200美元一個月的價格也是讓網友們挺震驚的。

至于到底值不值這個價格，可能要等先試水的用戶用上一段時間之后的反饋了。

對了，團隊這次也提到，后面將以API的形式為大家提供o1模型的一些功能，包括結構化輸出、函數調用、圖像API等。

BTW，活動結束前，奧特曼特意cue思維鏈作者講了一個笑話。

圣誕老人想用大語言模型來解決數學問題，結果任何提示詞都不管用，你知道最后是怎么成功的嗎？

reindeer forcement(馴鹿強制，暗指強化學習reinforcement）

好冷……

模型更強，也更加安全了

o1滿血版發布的同時，技術報告也在OpenAI官網上線。

這份報告當中，Ilya的名字依然位列基礎貢獻者（Foundational Contributor）之中。

在宣傳頁面當中，OpenAI公開展示了o1在數學、代碼和博士級科學問答三類任務上的成績。

在此基礎之上，OpenAI還進行了更加嚴苛的測試，每個問題會詢問四次，模型必須四次全答對才能得分。

除此之外，技術報告還展示了o1的多語言能力。

在包括中文在內的14種語言的MMLU測試中，o1的表現相比preview版均有程度不等的增強。

這里插播一句，面對這種帶陷阱的弱智吧問題，滿血版o1依然是被成功蒙騙（手動狗頭）。

不過這份報告更多圍繞著安全性展開討論，內部及紅隊測試結果表明，整體上滿血版o1在安全性與o1-preview接近。

如果和GPT-4o比，o1對有害內容的檢測和拒絕能力也更強，并且在越獄測試中展現出更強的魯棒性。

在現實風險上，OpenAI和紅隊針對網絡安全、生化和核威脅等情景對o1進行了測試，結果同樣與o1-preview接近。

另外，OpenAI對o1和o1-preview的思維鏈推理過程進行了欺騙性分析，通過讓模型解釋其行為背后的思考，了解模型是否有隱瞞信息、操縱數據的傾向。

結果，o1-preview在26%的案例中會故意隱瞞信息操縱數據，而o1的比例降到了19%。

Two More Things

在發布會開始之前，就已經有網友從ChatGPT的JS代碼中發現了Pro版的蛛絲馬跡。

其中，200美元的價格以及o1 pro模式，還有對滿血o1的不限量訪問，都和這次發布對得上。

另外，從這份JS代碼中還能看到，在Team版本的相關位置，還出現了“GPT-4.5”。

再順便提一句，有網友讓馬斯克的Grok結合X上的推文預測了一下OpenAI都會發布些什么，其中第二條成功命中了此次發布的滿血o1。

不知道接下來的11個發布日中，GPT-4.5是否會“如約而至”，Grok又能猜對多少個產品呢？

參考鏈接：
[1]https://openai.com/index/introducing-chatgpt-pro/。

[2]https://x.com/theredwall__/status/1864677161535156358?s=46。

[3]https://x.com/btibor91/status/1864709670470066605。

技術報告：https://cdn.openai.com/o1-system-card-20241205.pdf。

責任編輯：姜華來源：量子位

推理模型o1 ChatGPT 人工智能

51CTO技術棧公眾號

業務
速覽

媒體

51CTO CIOAge HC3i

社區

51CTO博客鴻蒙開發者社區 AI.x社區

教育

51CTO學堂精培企業培訓 CTO訓練營

主站蜘蛛池模板：精品一二区 | 美女黄网站 | www.狠狠干 | 精品www| 亚洲第1页 | 99一级毛片| 亚洲一区二区三区四区五区午夜 | 99re在线视频 | h片在线观看网站 | 欧美日韩国产在线观看 | av高清毛片| 成人av片在线观看 | 国产精品免费一区二区三区 | 国产精品视频网 | 精品亚洲一区二区 | 免费午夜电影 | 亚洲国产精品99久久久久久久久 | av网站在线看 | 国产91在线观看 | 99re在线视频 | 国产精品电影在线观看 | 日韩视频中文字幕 | 欧美性区 | 毛片一级片 | 欧美13videosex性极品 | 天天爱av| 亚洲国产精品一区二区三区 | 91网站在线看 | 亚洲国产69 | 黄网免费| 国产精品一区在线观看你懂的 | 中文字幕日韩欧美 | 福利视频一区二区三区 | 国产99在线 | 欧美 | 国产高清在线精品一区二区三区 | 精品久久视频 | 成人在线精品视频 | 久久精品久久久久久 | 国产精品视频久久 | 99精品在线 | 久久综合av |

<label id="eiruy"><style id="eiruy"></style></label>

<output id="eiruy"><option id="eiruy"><em id="eiruy"></em></option></output>

<label id="eiruy"></label>