OpenAI 親自下場!全能ChatGPT Agent發布,Manus們危險了
昨天,OpenAI在凌晨正式推出了全新的“ChatGPT Agent”,這一產品整合了此前的Operator和DeepResearch兩大系統。
圖片
Operator善于網頁互動,能像人一樣瀏覽網站、點擊按鈕、填寫表單,但它讀文章太慢,需要慢慢滾動。
DeepResearch擅長信息挖掘,能從全網抓取材料、整合分析并生成研究報告,但它基本不會和網頁互動。
一個慢工細磨,一個信息狂魔。OpenAI最終決定把兩者的長處整合,推出“統一的Agent系統”。
這個Agent能同時調度文本瀏覽器、圖形界面瀏覽器和代碼終端,還跑在一個虛擬機中。
這意味著,它不只是讀網頁、分析網頁,還能執行代碼、訪問API、創建文檔,真正具備“工具使用能力”。
OpenAI稱之為“agentic能力”:自主選工具,自動完成任務。
一、它究竟能做什么?
圖片
OpenAI官網:https://openai.com/zh-Hans-CN/index/introducing-chatgpt-agent/
這個Agent可以完成一整套復雜任務,而不是只回答問題。比如,它可以幫你制定早餐菜單、查價格、比對營養、列清單、生成購物鏈接。
還能幫你分析競爭對手,寫分析報告,順手做個PPT。還可以抓取最新的日程變動新聞,自動更新你的日歷和提醒事項。
圖片
所有這些,不是靠插件,而是它自己在“動手”。
Agent會在執行中自行判斷,是該打開圖形界面瀏覽器,還是用文本版瀏覽器,或者該寫段代碼。
它能主動登錄網站,篩選信息,提取結果,還能生成可編輯文檔,比如Excel表格或幻燈片。
更重要的是,它不會盲目行動。在執行任何有后果的操作前,它會先征求用戶確認。你也可以隨時打斷它的行為,手動接管。它還會主動提問,如果不清楚目標或數據不全,就會暫停任務請求更多信息。
此外,核心模型在多項基準測試中刷新紀錄。在被稱為“人類最后的考試”的HLE測試中拿下41.6的高分。低于馬斯克的Gork 4 heavy。
圖片
在復雜數學基準FrontierMath中準確率達27.4%。在SpreadsheetBench中,它在電子表格處理上也超過了現有AI工具Copilot。
瀏覽器測試BrowseComp中,它比DeepResearch高出17.4個百分點。
這套系統如今面向Pro、Plus和Team用戶開放,未來將逐步覆蓋企業與教育用戶。
不過,PPT功能仍處于beta階段,OpenAI也承認目前生成內容較為粗糙。
關于額度,Pro用戶每月可使用400次,Plus與Team用戶為40次。首次允許用戶購買額外次數。
圖片
使用方式就在GPT網頁的工具一欄。(目前小編的這個功能還沒給開放o(╥﹏╥)o)
二、能力提升背后的代價
擁有強大行動力的Agent,也意味著帶來更高的安全風險。OpenAI承認:新Agent的整體風險水平“更高”。
最突出的風險之一是“提示注入攻擊”。即黑客通過網頁中的隱藏命令欺騙Agent執行不當操作。
OpenAI為此進行了針對性訓練,讓模型識別這類威脅。它還設有實時監控機制,對關鍵操作強制雙重確認。
例如,發送郵件前會啟動“觀察模式”監控,銀行轉賬等高風險任務被默認屏蔽。
OpenAI將這個Agent歸入“具備高度生物和化學能力”的模型級別。
根據其“安全準備框架”,它已啟動迄今最全面的安全體系。這包括構建詳細威脅模型、部署專門分類器監測濫用、建立異常行為升級流程。
還請來生物安全專家進行“紅隊測試”,模擬真實攻擊。開發過程中,OpenAI與多家安全研究機構展開合作。
此外,還開放了漏洞獎勵計劃,邀請外部開發者尋找潛在風險。
隨著Agent與用戶日常操作融合更深,OpenAI將持續強化多層防護。
而與此同時,Operator將被正式下線,其核心功能已被完全整合進新Agent中。
三、Manus們的時間不多了,Agent賽道被徹底改寫
OpenAI的這次“親自下場”,對整個Agent行業格局造成了沖擊。
幾個月前,Manus曾被稱為“國產Agent的希望”,其展示的能力與這次OpenAI發布的Agent高度相似。
但不同的是,OpenAI不是做了一個“演示工具”,而是把這種能力“做進了系統底層”。
Agent不再是工具集合,而是AI架構的一部分。
這讓Manus式的初創路線面臨一個根本性問題:基礎設施層的機會已經被巨頭鎖死。
就像朱嘯虎公開表示的那樣:“大模型會吃掉90%的Agent?!?/p>
AI產業的“二次演進”,很可能從“對話代理”過渡到“行為代理”,而ChatGPT Agent就是這條路徑的起點。
過去一年,市場上出現了大量以Agent為賣點的AI創業公司。
但它們很多只是簡單把幾個開源工具粘在一起,跑個流程演示,缺乏對系統能力的整合。
而ChatGPT Agent的出現,把“粘合工具”的玩家一夜之間打回了原形。
更殘酷的是,OpenAI Agent的迭代方式已從靜態微調轉向“端到端強化學習”。
這意味著,模型通過真實任務來訓練“動手能力”,其學習方式與人類更接近,升級速度更快。
圖片
如今,再看當時奧特曼有點狂的話語,是不是值得一些初創企業思考思考?