剛剛，OpenAI正式發布o3-pro！奧特曼激動更新博客：溫和的奇點

2025-06-11 09:13:44

從即日起，所有 Pro 訂閱用戶均可通過 ChatGPT 和 API 使用這款強大的推理模型。

今天凌晨一點，OpenAI 宣布：OpenAI o3-pro today.

前沿模型的輪流更新這一次輪到 OpenAI 了。

https://x.com/piet_dev/status/1932530536225935374

從即日起，所有 Pro 訂閱用戶均可通過 ChatGPT 和 API 使用這款強大的推理模型。Team 用戶也可在模型選擇器選擇使用它。而企業用戶和教育用戶還需等待下一周。

有趣的是，這一次發布 o3-pro，OpenAI 并未采用以往大家熟悉的發布形式（視頻直播 + 博客文章），而只是簡單地發布了幾條介紹推文。

盡管如此，OpenAI CEO Sam Altman 還是表示： o3-pro「真是太聰明了！我第一次看到它相對于 o3 的勝率時，簡直不敢相信。」他甚至還久違地發了一篇題為「溫和的奇點（The Gentle Singularity）」的博客文章 —— 將在后文呈現。

下面我們先來看看 o3-pro 的基準測試表現，然后分享一下 Pro 用戶們早期測試得到的案例。

o3-pro 的基準成績

首先來看專家評估結果，下圖展示了在多項任務上，o3-pro 相較于 o3 的勝率情況。

可以看到 o3-pro 有明顯優勢。OpenAI 表示，在專家評估中，評論者更喜歡 OpenAI o3-pro 而不是 o3 并具有一致性，這一結果凸顯了其在科學、教育、編程、數據分析和寫作等關鍵領域的性能提升。另外，評論者還對 o3-pro 的清晰度、全面性、指令遵從性和準確性給予了更高的評價。

與 OpenAI o1-pro 一樣，OpenAI o3-pro 尤其擅長數學、科學和編程，以下的學術評估結果也證明了這一點。

另外，為了評估 OpenAI o3-pro 的關鍵優勢，OpenAI 再次使用了嚴格的「4/4 可靠性」評估，即只有在四次嘗試中（而不僅僅是一次）正確回答問題，模型才被視為成功，結果如下：

可以看到，o3-pro 的表現依然相當出色。

而 ARC Prize 也已經公布了該模型在 ARC-AGI 半私有評估數據集上的結果。意外的是，在這個基準上，o3-pro 的表現看起來與 o3 差不多，但成本明顯更高。

當然，o3-pro 也可以使用 ChatGPT 已經集成的各種工具，包括搜索網頁、分析文件、推理視覺輸入、使用 Python、使用記憶個性化響應等等。

目前 OpenAI 尚未公布這款強大推理模型的系統卡，但由于 o3-pro 使用了與 o3 相同的底層模型，因此安全信息等數據也可以在 o3 系統卡中找到。

另外，根據模型文檔，o3-pro 支持文本和圖像兩種輸入模態，上下文窗口大小為 200k，最大輸出 token 數為 100k，知識的截至時間為 2024 年 6 月 1 日，所以它本身并不具備近一年內的信息，但用戶可以通過搜索和知識庫等工具為其提供更多上下文。

至于定價，ChatGPT 用戶自然需要先購買 200 美元的 Pro 訂閱套餐。

而 API 定價為每百萬輸入 token 20 美元 / 每百萬輸出 token 80 美元，雖然比 o1-pro 便宜 87%，但依然還是相當貴的。OpenAI 同時也建議使用 o3-pro 的后臺模式：長時間運行的任務將異步啟動，從而防止超時。

同時，由于已經上線了 o3-pro，o3 的價格自然也就下降了：API 定價為每百萬輸入 token 2 美元 / 每百萬輸出 token 8 美元，也就是 o3-pro API 定價的十分之一。

網友實測

和所有前沿模型更新時一樣，o3-pro 一上線就有不少網友對其進行了測試。首先來看個司空見慣的六角彈跳球實驗。

https://x.com/flavioAd/status/1932530860063961288

測試者 Flavio Adamo 表示：「我已經秘密測試 o3-pro 一段時間了…… 比 o1-pro 便宜得多、更快、更精確（而且使用 o3 和 o3-pro 進行編程簡直感覺是天壤之別）。」

生物醫學科學家 Derya Unutmaz 則分享了一個更有趣的案例：與 o3-pro 合作開發免疫系統 2.0。

用戶 @Suzacque 則分享了 o3-pro 在海報設計和分析中的卓越表現。

用戶 @adonis_singh 表示 o3-pro 可以 100% 地解決外科醫生誤導性注意力難題，并且從不懷疑自己。他感慨到：「這是真正巨大的進步。」他還表示該模型懂得何時需要思考 ——「在不需要思考的時候也會少思考很多，根據我的經驗，它比我接觸過的任何其他模型都更不阿諛奉承。（沒有任何自定義指令 / 系統提示）對于第一點，對于提示『Hi there』，o1 pro 思考了 28 秒，而 o3 pro 的回復時間不到 7 秒。」

該用戶還讓 o3-pro 使用純 HTML、CSS 和 JS 在單個文件中制作的一個「非常酷的」極限空間行走模擬器。這個過程使用了 2 個提示詞，得到了如下演示的結果。

當然，也有一些用戶直言失望。

https://x.com/quietlogic22/status/1932533482355347669

https://x.com/JaydenDavisNC/status/1932532525634605364

你已經體驗過 o3-pro 了嗎？不妨與我們分享一下你的看法。

最后，我們來看看 OpenAI 山姆?奧特曼這篇充滿樂觀未來主義的博客吧。

溫和的奇點（The Gentle Singularity）

作者：Sam Altman
原文鏈接：https://blog.samaltman.com/the-gentle-singularity

我們已經超越了事件視界；騰飛已經開始。人類即將打造數字超級智能（digital superintelligence），而至少目前看來，它遠沒有想象的那么奇怪。

街道上還沒有機器人行走，我們大多數人也還沒有整天和 AI 對話。人們仍然會死于疾病，我們仍然無法輕易進入太空，而且關于宇宙，我們還有很多不理解的地方。

然而，我們最近構建了在很多方面都比人類更聰明的系統，并且能夠顯著提升使用者的產出。最不可能的部分已經過去；讓我們獲得 GPT-4 和 o3 等系統的科學洞見來之不易，但將引領我們走得更遠。

AI 將在很多方面為世界做出貢獻，但 AI 所推動的更快科學進步和生產力提升對于生活質量的提升而言將是非常巨大的；未來可能比現在更加美好。科學進步是整體進步的最大驅動力；想想我們還能擁有多少進步，就令人無比興奮。

從某種意義上來說，ChatGPT 已經比任何人類都強大。數億人每天都依賴它完成日益重要的任務；一項小小的新功能就能帶來巨大的積極影響；而一個微小的不對齊（misalignment），加上數億人的乘數，就可能造成巨大的負面影響。

2025 年，能夠進行真正認知工作的智能體已經出現；編寫計算機代碼的方法早已不同。2026 年，我們很可能會看到能夠提出全新見解的系統出現。2027 年，我們或許會看到能夠在現實世界中執行任務的機器人到來。

更多的人將能夠創作軟件，以及藝術。但世界對軟件和藝術的需求遠超于此，只要專家能夠接受新工具，他們可能仍然比新手更優秀。總的來說，到 2030 年，一個人能夠完成比 2020 年多得多的工作，這將是一個重大轉變，許多人將會找到從中受益的方法。

從最重要的方面來看，2030 年代可能不會有太大不同。人們仍然會愛他們的家庭、表達他們的創造力、玩游戲、在湖中游泳。

但在仍然非常重要的方面，2030 年代可能會與以往任何時候截然不同。我們不知道 AI 能超越人類智能水平到什么程度，但我們將會找到答案。

在 2030 年代，智力和能量 —— 想法，以及將想法付諸實踐的能力 —— 將變得異常豐富。長期以來，這兩者一直是人類進步的根本限制因素；有了豐富的智力和能量（以及良好的治理），理論上我們可以擁有任何其他東西。

我們已經生活在令人難以置信的數字智能之中，在最初的震驚之后，我們大多數人都已經相當習慣了。很快，我們就從驚訝于 AI 可以生成一個優美的段落，轉變為想知道它什么時候可以生成一部優美的小說；或者從驚嘆它能做出救命的醫學診斷，到好奇它何時能研發出治愈方法；或者從驚嘆它能編寫一個小型計算機程序，到好奇它何時能創立一家全新的公司。奇點就是這樣：奇跡變成日常，然后成為籌碼。

我們已經聽到科學家們說，他們的生產力比 AI 出現之前提高了兩到三倍。高級 AI 之所以引人注目，原因有很多，但或許最重要的，莫過于我們能用它來更快地進行 AI 研究。我們或許能夠發現新的計算基礎、更好的算法，以及誰知道還有什么其他發現。如果我們能在一年或一個月內完成十年的研究成果，那么進步的速度顯然會截然不同。

從現在開始，我們已經構建的工具將幫助我們獲得進一步的科學洞見，并幫助我們創建更好的 AI 系統。當然，這與 AI 系統完全自主地更新其代碼不同，但這仍然是遞歸式自我改進的早期版本。

還有其他自我強化的循環在起作用。經濟價值創造已經啟動了一個飛輪：不斷增加基礎設施建設，以運行這些日益強大的 AI 系統。而能夠構建其他機器人的機器人（從某種意義上說，也包括能夠構建其他數據中心的數據中心）也并非遙不可及。

如果我們必須以傳統的方式制造出第一批百萬數量級的人形機器人，但之后它們能夠操作整個供應鏈 —— 開采和提煉礦物、駕駛卡車、運營工廠等等 —— 來制造更多機器人，而這些機器人又可以建造更多的芯片制造設施、數據中心等等，那么進展速度顯然會大不相同。

隨著數據中心生產的自動化，智能成本最終應該會收斂到接近電力成本。（人們經常好奇 ChatGPT 查詢消耗了多少能源；平均每次查詢消耗大約 0.34 瓦時，大約相當于烤箱的耗電量略高于一秒鐘，高效燈泡的耗電量則為幾分鐘。它消耗的水量約為 0.000085 加侖；大約相當于十五分之一茶匙的水。

技術進步的速度將持續加快，人們也將繼續能夠適應幾乎任何事物。雖然會有一些非常艱難的時刻，比如某些工作崗位會逐漸消失，但另一方面，世界將以驚人的速度變得更加富裕，以至于我們能夠認真考慮以前從未考慮過的新政策理念。我們或許不會一下子就采納一項新的社會契約，但幾十年后回首往事，這些漸進式的變革將產生巨大的影響。

如果以史為鑒，我們會發現新的事情要做，新的東西要追求，并迅速吸收新的工具（工業革命后的工作變化就是一個很好的例子）。期望值會上升，但能力也會同樣快速地提升，我們都會得到更好的東西。我們將為彼此創造更加美好的事物。人類比 AI 擁有一項長期而重要且令人好奇的優勢：我們天生就關心他人以及他們的想法和行為，而我們不太關心機器。

一千年前，一位自給自足的農民會看著我們許多人的所作所為，說我們所做的工作是虛假的，認為我們只是在玩游戲自娛自樂，因為我們擁有充足的食物和難以想象的奢侈品。我希望一千年后，我們看待這些工作時，會認為它們非常虛假，而且我毫不懷疑，從事這些工作的人會感到無比重要和滿足。

新的奇跡將以驚人的速度不斷涌現。今天甚至很難想象到 2035 年我們會發現什么；也許我們會在今年解決高能物理問題，第二年就開始太空殖民；或者從今年的重大材料科學突破，到第二年實現真正的高帶寬腦機接口。許多人會選擇以大致相同的方式生活，但至少有些人可能會決定「接入互聯網」。

展望未來，這聽起來難以理解。但經歷這一切或許會讓人感到印象深刻，但并非不可避免。從相對論的角度來看，奇點是一點一點出現的，融合也是緩慢發生的。我們正在攀登指數級技術進步的長弧；它總是向前看是垂直的，向后看是平坦的，但它是一條平滑的曲線。（回想一下 2020 年，如果 2025 年就能實現接近通用 AI 的設想，那會是什么樣子，而過去五年實際上卻并非如此。）

在巨大的優勢之外，也存在著嚴峻的挑戰。我們確實需要解決技術和社會層面的安全問題，但考慮到其經濟影響，廣泛普及超級智能的使用權也至關重要。最佳的前進之路或許是這樣的：

解決協同問題，這意味著我們可以強有力地保證 AI 系統能夠學習并朝著我們共同的長期目標行動（社交媒體信息流就是一個協同失調的 AI 的例子；驅動這些系統的算法非常擅長讓你不斷滾動瀏覽并清晰地了解你的短期偏好，但它們是通過利用你大腦中某些凌駕于長期偏好之上的東西來做到這一點的）。

然后，專注于讓超級智能變得廉價、廣泛可用，并且不會過于集中于任何個人、公司或國家。社會具有韌性、創造力，并且適應能力強。如果我們能夠駕馭人們的集體意志和智慧，那么盡管我們會犯很多錯誤，有些事情會變得非常糟糕，但我們能夠快速學習和適應，并能夠利用這項技術獲得最大的好處和最小的壞處。在社會必須決定的寬泛范圍內賦予用戶很大的自由度，似乎非常重要。世界越早開始討論這些寬泛的界限是什么，以及我們如何定義集體協同，就越好。我們（整個行業，不僅僅是 OpenAI）正在為世界構建一個大腦。它將極其個性化，人人皆可輕松使用；我們將受到好點子的限制。長期以來，初創企業的技術人員一直嘲笑「創意人」；那些有想法卻想找團隊來實現的人。現在在我看來，他們即將迎來輝煌的一天。

OpenAI 現在有很多業務，但首先，我們是一家超級智能研究公司。我們面前有很多工作要做，但大部分路途如今已被照亮，黑暗區域正在迅速消退。我們非常感激能夠從事我們所做的事情。

廉價到無法計量的智能觸手可及。這聽起來可能很瘋狂，但如果我們在 2020 年告訴你我們將會達到今天的水平，那聽起來可能比我們現在的預測更瘋狂。

希望我們能夠通過超級智能平穩、指數級、平安地 scale。

責任編輯：張燕妮來源：機器之心

模型 AI OpenAI

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

剛剛，OpenAI正式發布o3-pro！奧特曼激動更新博客：溫和的奇點

o3-pro 的基準成績

網友實測

溫和的奇點（The Gentle Singularity）