成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

OpenAI 親自下場!全能ChatGPT Agent發布,Manus們危險了

人工智能
昨天,OpenAI在凌晨正式推出了全新的“ChatGPT Agent”,這一產品整合了此前的Operator和DeepResearch兩大系統。

昨天,OpenAI在凌晨正式推出了全新的“ChatGPT Agent”,這一產品整合了此前的Operator和DeepResearch兩大系統。

圖片圖片

Operator善于網頁互動,能像人一樣瀏覽網站、點擊按鈕、填寫表單,但它讀文章太慢,需要慢慢滾動。

DeepResearch擅長信息挖掘,能從全網抓取材料、整合分析并生成研究報告,但它基本不會和網頁互動。

一個慢工細磨,一個信息狂魔。OpenAI最終決定把兩者的長處整合,推出“統一的Agent系統”。

這個Agent能同時調度文本瀏覽器、圖形界面瀏覽器和代碼終端,還跑在一個虛擬機中。

這意味著,它不只是讀網頁、分析網頁,還能執行代碼、訪問API、創建文檔,真正具備“工具使用能力”。

OpenAI稱之為“agentic能力”:自主選工具,自動完成任務。

一、它究竟能做什么?

圖片圖片

OpenAI官網:https://openai.com/zh-Hans-CN/index/introducing-chatgpt-agent/

這個Agent可以完成一整套復雜任務,而不是只回答問題。比如,它可以幫你制定早餐菜單、查價格、比對營養、列清單、生成購物鏈接。

還能幫你分析競爭對手,寫分析報告,順手做個PPT。還可以抓取最新的日程變動新聞,自動更新你的日歷和提醒事項。

圖片圖片

所有這些,不是靠插件,而是它自己在“動手”。

Agent會在執行中自行判斷,是該打開圖形界面瀏覽器,還是用文本版瀏覽器,或者該寫段代碼。

它能主動登錄網站,篩選信息,提取結果,還能生成可編輯文檔,比如Excel表格或幻燈片。

更重要的是,它不會盲目行動。在執行任何有后果的操作前,它會先征求用戶確認。你也可以隨時打斷它的行為,手動接管。它還會主動提問,如果不清楚目標或數據不全,就會暫停任務請求更多信息。

此外,核心模型在多項基準測試中刷新紀錄。在被稱為“人類最后的考試”的HLE測試中拿下41.6的高分。低于馬斯克的Gork 4 heavy。

圖片圖片

在復雜數學基準FrontierMath中準確率達27.4%。在SpreadsheetBench中,它在電子表格處理上也超過了現有AI工具Copilot。

瀏覽器測試BrowseComp中,它比DeepResearch高出17.4個百分點。

這套系統如今面向Pro、Plus和Team用戶開放,未來將逐步覆蓋企業與教育用戶。

不過,PPT功能仍處于beta階段,OpenAI也承認目前生成內容較為粗糙。

關于額度,Pro用戶每月可使用400次,Plus與Team用戶為40次。首次允許用戶購買額外次數。

圖片圖片

使用方式就在GPT網頁的工具一欄。(目前小編的這個功能還沒給開放o(╥﹏╥)o)

二、能力提升背后的代價

擁有強大行動力的Agent,也意味著帶來更高的安全風險。OpenAI承認:新Agent的整體風險水平“更高”。

最突出的風險之一是“提示注入攻擊”。即黑客通過網頁中的隱藏命令欺騙Agent執行不當操作。

OpenAI為此進行了針對性訓練,讓模型識別這類威脅。它還設有實時監控機制,對關鍵操作強制雙重確認。

例如,發送郵件前會啟動“觀察模式”監控,銀行轉賬等高風險任務被默認屏蔽。

OpenAI將這個Agent歸入“具備高度生物和化學能力”的模型級別。

根據其“安全準備框架”,它已啟動迄今最全面的安全體系。這包括構建詳細威脅模型、部署專門分類器監測濫用、建立異常行為升級流程。

還請來生物安全專家進行“紅隊測試”,模擬真實攻擊。開發過程中,OpenAI與多家安全研究機構展開合作。

此外,還開放了漏洞獎勵計劃,邀請外部開發者尋找潛在風險。

隨著Agent與用戶日常操作融合更深,OpenAI將持續強化多層防護。

而與此同時,Operator將被正式下線,其核心功能已被完全整合進新Agent中。

三、Manus們的時間不多了,Agent賽道被徹底改寫

OpenAI的這次“親自下場”,對整個Agent行業格局造成了沖擊。

幾個月前,Manus曾被稱為“國產Agent的希望”,其展示的能力與這次OpenAI發布的Agent高度相似。

但不同的是,OpenAI不是做了一個“演示工具”,而是把這種能力“做進了系統底層”。

Agent不再是工具集合,而是AI架構的一部分。

這讓Manus式的初創路線面臨一個根本性問題:基礎設施層的機會已經被巨頭鎖死。

就像朱嘯虎公開表示的那樣:“大模型會吃掉90%的Agent?!?/p>

AI產業的“二次演進”,很可能從“對話代理”過渡到“行為代理”,而ChatGPT Agent就是這條路徑的起點。

過去一年,市場上出現了大量以Agent為賣點的AI創業公司。

但它們很多只是簡單把幾個開源工具粘在一起,跑個流程演示,缺乏對系統能力的整合。

而ChatGPT Agent的出現,把“粘合工具”的玩家一夜之間打回了原形。

更殘酷的是,OpenAI Agent的迭代方式已從靜態微調轉向“端到端強化學習”。

這意味著,模型通過真實任務來訓練“動手能力”,其學習方式與人類更接近,升級速度更快。

圖片圖片

如今,再看當時奧特曼有點狂的話語,是不是值得一些初創企業思考思考?

責任編輯:武曉燕 來源: 大數據文摘
相關推薦

2025-03-12 10:00:44

2023-03-02 12:32:36

2023-08-01 09:48:07

AIChatGPT

2025-07-18 10:46:11

2023-02-01 13:15:41

2023-02-01 13:37:59

ChatGPTAI

2023-02-07 13:33:55

谷歌ChatGPT

2025-01-10 12:56:03

2024-12-25 11:30:43

2023-05-19 07:35:03

ChatGPTOpenAI

2024-12-04 15:37:28

2021-03-23 10:03:43

蘋果 iOS開發者

2024-11-18 14:20:00

ChatGPTAI

2024-10-05 07:00:00

OpenAIGPT-4o人工智能

2023-10-08 13:56:00

英偉達芯片AI

2023-10-23 15:27:09

OpenAIChatGPT

2025-03-07 08:28:56

2024-04-25 13:09:10

AI模型

2023-12-19 19:50:49

GPT-5OpenIA風險

2023-09-21 10:31:06

人工智能模型
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 一级片久久 | 久久久精品在线 | 中文字幕av一区 | 亚洲天堂av网 | 国产毛片视频 | 成人午夜视频在线观看 | 亚洲一级片 | 欧美日韩久久久 | 深夜福利在线播放 | 日日干日日| 欧美成人一区二区三区 | 久久h| 欧美视频久久 | 亚洲欧美综合网 | 91免费网 | 国产精品一区在线观看 | 天天干天天色 | 成人9ⅰ免费影视网站 | 国产黄在线观看 | 久久成人免费视频 | 中文久久乱码一区二区 | 亚洲国产网站 | 精品日韩一区二区三区 | 天天干b | 三级中文字幕 | √8天堂资源地址中文在线 av网址在线免费观看 | 97在线视频观看 | 国产无遮挡 | 国产色播| 天天干天天干天天操 | 中文字幕一区在线观看 | 国产一区免费在线观看 | 草少妇 | 亚洲精品1区2区 | 91av视频在线观看 | 精品国产精品三级精品av网址 | 在线观看视频国产 | 少妇特黄a一区二区三区 | 天天爽爽 | 香蕉伊人网 | 精东影业一区二区三区 |