OpenAI 親自下場！全能ChatGPT Agent發布，Manus們危險了

2025-07-22 11:56:26

人工智能

昨天，OpenAI在凌晨正式推出了全新的“ChatGPT Agent”，這一產品整合了此前的Operator和DeepResearch兩大系統。

圖片

Operator善于網頁互動，能像人一樣瀏覽網站、點擊按鈕、填寫表單，但它讀文章太慢，需要慢慢滾動。

DeepResearch擅長信息挖掘，能從全網抓取材料、整合分析并生成研究報告，但它基本不會和網頁互動。

一個慢工細磨，一個信息狂魔。OpenAI最終決定把兩者的長處整合，推出“統一的Agent系統”。

這個Agent能同時調度文本瀏覽器、圖形界面瀏覽器和代碼終端，還跑在一個虛擬機中。

這意味著，它不只是讀網頁、分析網頁，還能執行代碼、訪問API、創建文檔，真正具備“工具使用能力”。

OpenAI稱之為“agentic能力”：自主選工具，自動完成任務。

一、它究竟能做什么？

圖片

OpenAI官網：https://openai.com/zh-Hans-CN/index/introducing-chatgpt-agent/

這個Agent可以完成一整套復雜任務，而不是只回答問題。比如，它可以幫你制定早餐菜單、查價格、比對營養、列清單、生成購物鏈接。

還能幫你分析競爭對手，寫分析報告，順手做個PPT。還可以抓取最新的日程變動新聞，自動更新你的日歷和提醒事項。

圖片

所有這些，不是靠插件，而是它自己在“動手”。

Agent會在執行中自行判斷，是該打開圖形界面瀏覽器，還是用文本版瀏覽器，或者該寫段代碼。

它能主動登錄網站，篩選信息，提取結果，還能生成可編輯文檔，比如Excel表格或幻燈片。

更重要的是，它不會盲目行動。在執行任何有后果的操作前，它會先征求用戶確認。你也可以隨時打斷它的行為，手動接管。它還會主動提問，如果不清楚目標或數據不全，就會暫停任務請求更多信息。

此外，核心模型在多項基準測試中刷新紀錄。在被稱為“人類最后的考試”的HLE測試中拿下41.6的高分。低于馬斯克的Gork 4 heavy。

圖片

在復雜數學基準FrontierMath中準確率達27.4%。在SpreadsheetBench中，它在電子表格處理上也超過了現有AI工具Copilot。

瀏覽器測試BrowseComp中，它比DeepResearch高出17.4個百分點。

這套系統如今面向Pro、Plus和Team用戶開放，未來將逐步覆蓋企業與教育用戶。

不過，PPT功能仍處于beta階段，OpenAI也承認目前生成內容較為粗糙。

關于額度，Pro用戶每月可使用400次，Plus與Team用戶為40次。首次允許用戶購買額外次數。

圖片

使用方式就在GPT網頁的工具一欄。（目前小編的這個功能還沒給開放o(╥﹏╥)o）

二、能力提升背后的代價

擁有強大行動力的Agent，也意味著帶來更高的安全風險。OpenAI承認：新Agent的整體風險水平“更高”。

最突出的風險之一是“提示注入攻擊”。即黑客通過網頁中的隱藏命令欺騙Agent執行不當操作。

OpenAI為此進行了針對性訓練，讓模型識別這類威脅。它還設有實時監控機制，對關鍵操作強制雙重確認。

例如，發送郵件前會啟動“觀察模式”監控，銀行轉賬等高風險任務被默認屏蔽。

OpenAI將這個Agent歸入“具備高度生物和化學能力”的模型級別。

根據其“安全準備框架”，它已啟動迄今最全面的安全體系。這包括構建詳細威脅模型、部署專門分類器監測濫用、建立異常行為升級流程。

還請來生物安全專家進行“紅隊測試”，模擬真實攻擊。開發過程中，OpenAI與多家安全研究機構展開合作。

此外，還開放了漏洞獎勵計劃，邀請外部開發者尋找潛在風險。

隨著Agent與用戶日常操作融合更深，OpenAI將持續強化多層防護。

而與此同時，Operator將被正式下線，其核心功能已被完全整合進新Agent中。

三、Manus們的時間不多了，Agent賽道被徹底改寫

OpenAI的這次“親自下場”，對整個Agent行業格局造成了沖擊。

幾個月前，Manus曾被稱為“國產Agent的希望”，其展示的能力與這次OpenAI發布的Agent高度相似。

但不同的是，OpenAI不是做了一個“演示工具”，而是把這種能力“做進了系統底層”。

Agent不再是工具集合，而是AI架構的一部分。

這讓Manus式的初創路線面臨一個根本性問題：基礎設施層的機會已經被巨頭鎖死。

就像朱嘯虎公開表示的那樣：“大模型會吃掉90%的Agent?！?/p>

AI產業的“二次演進”，很可能從“對話代理”過渡到“行為代理”，而ChatGPT Agent就是這條路徑的起點。

過去一年，市場上出現了大量以Agent為賣點的AI創業公司。

但它們很多只是簡單把幾個開源工具粘在一起，跑個流程演示，缺乏對系統能力的整合。

而ChatGPT Agent的出現，把“粘合工具”的玩家一夜之間打回了原形。

更殘酷的是，OpenAI Agent的迭代方式已從靜態微調轉向“端到端強化學習”。

這意味著，模型通過真實任務來訓練“動手能力”，其學習方式與人類更接近，升級速度更快。

圖片

如今，再看當時奧特曼有點狂的話語，是不是值得一些初創企業思考思考？

責任編輯：武曉燕來源：大數據文摘

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

OpenAI 親自下場！全能ChatGPT Agent發布，Manus們危險了

一、它究竟能做什么？

二、能力提升背后的代價

三、Manus們的時間不多了，Agent賽道被徹底改寫

OpenAI 親自下場！全能ChatGPT Agent發布，Manus們危險了

二、能力提升背后的代價

三、Manus們的時間不多了，Agent賽道被徹底改寫