強如Operator也怕驗證碼,1450元花得值嗎?第一波實測來了
要花1450元才能玩到Operator,讓本來滿滿期待的大伙,一下難受住了。
而交了錢的各位,開始興奮的曬出各種測試結果。
有網友分享,Operator通過瀏覽網頁在3分鐘之內幫打找到了附近牙醫診所,回報了地址和電話。
圖片
也有人讓它作為研究助手,在arXiv上挨個打開每篇論文,看完后輸出總結。
也有“壞人”專門出難題,看AI如何應對:讓Operator到ChatGPT官網使用Operator會如何?
但沒想到OpenAI預判了他的預判,直接給出一個嘲諷式報錯。
試得好,下次別試了。
圖片
強如Operator,上網沖浪時也會被驗證碼難住,但好在它學會了向人類用戶求助:
我遇到了一個驗證碼……你能接管并幫我搞定嗎?
圖片
沒錯,這只是一個早期預覽版。
參與發布直播的基礎研究貢獻者(Fundamental Research Contributor)Casey Chu認為,它會犯錯誤,但它讓你提前窺見未來。
而且他的這個帖子,就是Operator寄幾發的,成功套娃了:
圖片
核心貢獻者(Core Contributor)Yilong Qin認為,測試時間計算的Scaling Law在這里繼續發揮威力。
給Agent更多時間,它會內省、更新、一遍又一遍地嘗試直至最終成功。
圖片
同為核心貢獻者的姚順雨表示,有了強化學習的新范式,Operator的進步速度會像從o1-preview到o3一樣。
圖片
同時他介紹,Agent是OpenAI(甚至是AI)誕生以來就有的目標,在發展過程中做了多次嘗試。
但只有發現GPT和草莓(o1)兩種新范式后,Agent的潛能才真正被解鎖。
2025年將是Agent之年。
圖片
他為什么這么說?還要從OpenAI成立之初講起。
OpenAI的十年Agent之路
早在2016-2017年,OpenAI就通過Word of Bits和Universe探索了讓AI操作瀏覽器上網。
Word of Bits由OpenAI與斯坦福大學合作,參與者包括大家熟悉的Karpathy和Jim Fan、斯坦福大學副教授Percy Liang等,以及姚班校友施天麟。
圖片
施天麟只在OpenAI工作了一年,隨后在2017年創辦了Cresta,業務正是AI Agents 方向,專注于為客服中心提供各種AI助手。
2024年11月,Cresta完成1.25億美元D輪融資,總融資金額達到2.7億美元。
圖片
OpenAI Universe則是一個Agent訓練和測試的平臺。他們從李飛飛的ImageNet上受到啟發,希望能把圖像識別任務上的快速進步復制到Agent領域。
2017年的Universe已經能讓AI完成一些簡單的瀏覽器操作,以及玩Atari游戲等任務。
圖片
但隨后不久,OpenAI就把主要精力從強化學習轉向了語言模型GPT系列上。
2021年底,到了GPT-3時代,OpenAI不忘初心推出WebGPT,使用基于文本的Web瀏覽器更準確地回答開放式問題。
圖片
這項研究把GPT-3回答開放式問題的真實性和有用性從20%-30%提升到了40%-80%,但仍未達到人類平均水平。
圖片
WebGPT的作者中,有4位也出現在最新的Operator貢獻名單里,分別是歐陽龍,Christina Kim,Reiichiro Nakano,Kevin Button。
其中Reiichiro Nakano(中野禮一郎)是Operator項目的研究主管之一,也出現在了發布直播中。
圖片
△Sam Altman,Yash Kumar,Casey Chu,Reiichiro Nakano
最新的Operator背后模型命名為CUA(Computer Use Agent),與此前的探索相比,有了幾項重大突破:
- 多模態理解帶來“感知”能力,由GPT-4o提供。
- 長上下文作為“任務視野”,讓Agent能連續執行任務長達20分鐘。
- o1式的思維鏈推理,這種內心獨白使模型能夠評估其觀察結果、跟蹤中間步驟并動態適應。
參與、觀察了整個十年發展過程的Karpathy總結到:
Operator之于數字世界,就像人形機器人之于物理世界。
在數字世界的發展速度要比物理世界更快,因為翻轉比特的成本相比移動原子只有約1/1000。
……
與其說2025年是Agent年,不如說2025-2035年是Agent的十年。
圖片
World of Bitshttps://proceedings.mlr.press/v70/shi17a/shi17a.pdf
Universehttps://openai.com/index/universe/
WebGPThttps://openai.com/index/webgpt/
Operatorhttps://openai.com/index/openai-gym-beta/
參考鏈接:
[1]https://www.reddit.com/r/singularity/comments/1i8fi3l/openai_operator_finds_me_an_in_network_dentist/[2] https://x.com/omarsar0/status/1882545077219926031[3]https://x.com/liambolling/status/1882565960697282812[4]https://x.com/caseychu9/status/1882507704566235407[5]https://x.com/yilongqin/status/1882507643669123230[6]https://x.com/liambolling/status/1882565960697282812[7]https://x.com/karpathy/status/1882544526033924438