成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

ChatGPT首次帶圖深度思考:OpenAI連發o3/o4 mini,比前代性能更強價格更低

人工智能
OpenAI表示,o3是他們目前最強大的推理模型,在編程、數學、科學、視覺感知等多個維度的基準測試中都刷新了SOTA,在分析圖像、圖表和圖形等視覺任務中表現尤為出色。

僅隔一天,OpenAI再次突然放大招:

一口氣,o3o4 mini同步上線。

圖片圖片

依然是最熱門推理模型,并且這一次,它們終于能夠調用ChatGPT里的各種工具了,包括網絡搜索、Python、圖像分析、文件解釋和圖像生成。

也就是說,你現在可以也用o3來生成吉卜力風格的奧特曼抱子圖了(doge)。

圖片圖片

還不只是能看懂、生成圖像,官方提到,o3和o4-mini是OpenAI首次能將上傳圖像集成到思維鏈中的模型——

這意味著,它們可以基于圖像展開思考,be like:

OpenAI表示,o3是他們目前最強大的推理模型,在編程數學科學視覺感知等多個維度的基準測試中都刷新了SOTA,在分析圖像、圖表和圖形等視覺任務中表現尤為出色

圖片圖片

在外部專家評估中,o3在困難現實任務中,能比o1少犯20%的重大錯誤。

o4-mini則是一款專為快速、經濟高效的推理而優化的小模型。

在專家評估中,o4-mini在非STEM任務以及數據科學領域都超過了前代的o3-mini。

在AIME 2024和AIME 2025中,甚至有超過o3的表現。

圖片圖片

即日起,ChatGPT的Plus、Pro會員以及Team用戶,都能直接體驗o3、o4-mini和o4-mini-high,而原本的o1、o3-mini和o3-mini-high則已悄然下架。

圖片圖片

實測o3/o4-mini

所以,在基準測試上表現如此強勢的o3和o4-mini,具體能帶來哪些體驗上的改變?

Talk is cheap,來看實測案例。

在OpenAI的官方直播中,研究員們展示了這樣一個用法:

讓o3直接讀一份未完成的學術海報,讓它根據其中的研究線索,幫忙估算質子的同位旋矢量標量電荷,并搜索相關最新研究成果,對比新成果跟估算值的不同。

圖片圖片

思考了不到3分鐘,o3完全沒有被難住,吐出了這樣的結果:

圖片圖片

網友們也第一時間給o3和o4-mini上了小球測試:

圖片圖片

△圖源:x@flavioAd

還有醫學教授在搶先體驗后表示:完全停不下來。

我覺得o3的智能程度已經達到或接近天才水平了!

圖片圖片

這位醫學專家表示,他在向o3提出一些頗具挑戰的臨床或醫學問題時,o3能給出像直接來自頂級專科醫生的回答。

我們也簡單測試了一下,比如讓o3和o4-mini分別解讀一下“洛就完了”表情包。

圖片圖片

o3:

圖片圖片

o4-mini:

圖片圖片

你pick哪個答案?

強化學習的Scaling Law

值得注意的是,在OpenAI o3的開發過程中,研究人員觀察到:

大規模強化學習呈現出與預訓練一樣的“更大計算量=更好性能”的趨勢。

而o3正是通過在強化學習中踐行Scaling Law,得到了明顯的性能提升。

OpenAI表示:

這證明了模型性能會隨著思考時間的增加而持續提升。

在延遲和成本與OpenAI o1相同的條件下,o3實現了更強的性能——而且我們已經驗證,如果讓它思考更長時間,它的性能還會持續提升。

不過自打DeepSeek成了攪動大模型格局的鯰魚,OpenAI也是越來越強調“性價比”了:

相比o1和o3-mini,o3和o4-mini更強了,但卻更經濟了!

比如,在AIME 2025中,o4-mini比之o3-mini、o3比之o1,都能在同樣的推理成本下拿到更高的分數。

圖片圖片

圖片

API定價方面,拉上1天前剛剛亮相的GPT-4.1,具體價格如下:

圖片圖片

One More Thing

OpenAI再次開源了!發布一款一款本地代碼智能體Codex CLI。

可將自然語言轉化為可運行的代碼,兼容所有OpenAI模型,包括剛剛發布的o3、o4-mini和GPT-4.1。

圖片圖片

Codex CLI為已經習慣使用終端,并希望擁有ChatGPT級別推理能力以及實際運行代碼、操作文件和迭代能力的開發者打造。

它是一種聊天驅動的開發方式 ,能夠理解并執行本地代碼庫。

圖片圖片

GitHub項目:https://github.com/openai/codex

參考資料:
[1]https://openai.com/index/introducing-o3-and-o4-mini/
[2]https://x.com/sama/status/1912558064739459315

責任編輯:武曉燕 來源: 量子位
相關推薦

2025-05-13 08:24:14

2025-04-23 08:30:05

2024-12-24 16:15:04

2025-04-17 08:59:59

2025-04-18 11:18:51

2025-06-03 14:13:56

ChatGPT模型AI

2025-04-21 16:25:58

OpenAI測試模型

2025-04-17 06:10:57

2025-04-25 10:26:19

2025-04-07 07:18:48

2025-04-11 10:32:39

2025-04-17 06:36:29

2025-06-03 08:28:00

2024-07-22 15:13:24

2025-05-14 10:09:12

2025-02-07 09:05:36

2025-05-28 00:00:00

2025-04-21 16:32:29

視覺模型AI

2025-04-17 14:09:52

OpenAI模型編程

2025-03-11 13:54:11

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 一区二区三区精品在线视频 | 亚洲国产aⅴ成人精品无吗 欧美激情欧美激情在线五月 | 欧美激情一区二区三级高清视频 | 日韩精品色网 | 在线第一页 | 日韩在线免费观看视频 | 国产美女在线观看 | 免费亚洲成人 | 午夜精品一区二区三区在线观看 | 久久里面有精品 | 天天久久 | 怡红院成人在线视频 | 黄色一级免费 | 精品一区二区在线观看 | 开操网 | 一区二区三区高清 | 亚洲欧洲成人av每日更新 | 综合久久99 | 日韩免费一区二区 | 老头搡老女人毛片视频在线看 | 精品久久久久久久久久久久久 | 国产在线一区二 | 国产在线视频一区 | 成人一区二区三区在线 | 亚洲一区二区三区在线视频 | 91色视频在线 | 日韩成人在线播放 | 亚洲视频免费观看 | 日本不卡免费新一二三区 | 久久在线 | 国产在线麻豆精品入口 | 欧美黄色绿像 | 91xxx在线观看 | 国产精品伦理一区二区三区 | 久久网一区二区 | 国产精品高潮呻吟久久 | 亚洲高清一区二区三区 | www.日韩欧美 | 久在线| 精品入口麻豆88视频 | 天天爱天天操 |