游戲結束了?OpenAI可能已經突破,跨過起飛的最后臨界閾值
剛剛,X 上的一則帖子爆火,瀏覽量達到 30 多萬。
該推文涉及引領 AI 潮流的 OpenAI。內容顯示「OpenAI 遞歸式自我改進目前在一個盒子里,準確的說是在一個無法破解的盒子!」
我們不難看出,帖子內容突出了 OpenAI 的發展態勢,AI可以自我改進,并且很難有人短期內破解。還有一則帖子表示:
「OpenAI 可能已經獲得了突破,并最終跨越了臨界點,達到一個起飛狀態 —— 即智能達到了可以自我遞歸改進的程度,o4 或 o5 將能夠自動化 AI 研發并完成其余工作。
像 o1 這樣的模型的大部分意義不在于部署它,而在于為下一個模型生成訓練數據。o1 解決的每一個問題現在都是 o3 的訓練數據點。
實際上我們有點驚訝于 OpenAI 竟然費心的部署了 o1-pro,而不是將其保持私密并投資計算資源進行更多的 o3 訓練等。這顯然與 Anthropic 和 Claude-3.6-opus 的開發不同,這個模型沒有研發失敗,只是 Anthropic 選擇將其保持私密,并將其蒸餾成一個小而便宜但很智能的 Claude-3.6-sonnet。
如果你想知道為什么 OpenAI 的人突然在 X 上變得幾乎是狂喜地樂觀,認真觀察從原始 4o 模型到 o3 的改進可能就是原因。
這就像觀看 AlphaGo 的 Elo 曲線:它只是不斷 up……up……up……
這給我們一種感覺,他們已經獲得突破,終于跨越了臨界點,即從僅僅是尖端 AI 工作(其他機構將在幾年內才能復制),到起飛(破解智能),以至于 o4 或 o5 將能夠自動化 AI 研發并完成其余工作。」
在這條推文下,大家的討論格外熱烈。
有人表示「如果這是真的,如果模型不需要人類進行訓練,那么《黑客帝國》的結果就不再有效了。」
「我一直是這么想的,OpenAI 沒有向公眾發布他們最新的優秀模型,他們總是在內部領先 1 或 2 代,因為這為他們提供了開發優勢。」
「也許最可怕的不是上述觀點是否正確,而是我們無法判斷他是否錯誤。」
就連 OpenAI 研究員 Jason Wei 也跑到評論區發言:魔法,就是當一個不可阻擋的強化學習(RL)優化算法,在充足的計算資源驅動下,遇到一個無法被攻破的強化學習環境時,奇跡就發生了。
Andrej Karpathy 也發表了自己的觀點:魔法就是當優化技巧破解了那個環境時,就會出現。