今天,OpenAI徹底顛覆AI助手!ChatGPT智能體上線,融合三大AI 原創
具備自主決策能力的ChatGPT智能體正式發布!無縫融合思考、操作、進化三大AI引擎。
?
今天凌晨,OpenAI 臨時直播,奧特曼與四位研究員正式宣告 ChatGPT Agent 上線——一個能自主思考、規劃并執行復雜任務的AI智能體。
?
?
奧特曼更是直言「這讓我真切感受到AGI的存在」。據介紹,ChatGPT Agent 融合了 Operator 智能體網頁交互能力、Deep Research 的互聯網信息搜集能力,以及 ChatGPT 的對話能力,成為了一個統一智能體。
?
?
它具備自主思考和行動的能力,能夠主動從 Operator、Deep Research 和 ChatGPT的技能庫中選擇合適的工具,來完成各種超復雜任務。這意味著 ChatGPT 不再只是那個大家熟悉的問答機器人,還能通過 “內置計算機” 代表用戶完成復雜的多步驟任務。
?
OpenAI 介紹稱,ChatGPT 智能體能夠通過互聯網搜索或 API 獲取數據,進行深入的財務研究、制作精美的幻燈片,或者預定活動、規劃行程。
?
在內部基準測試中,ChatGPT 智能體展現出能夠處理入門級投資銀行分析師(1 - 3 年工作經驗)任務的能力,比如為財富 500 強公司構建符合準則的財務報表模型,或為私有化交易構建杠桿收購模型。
?
?
在演示中,OpenAI 給出了有趣的案例。根據結婚請柬上的日期、地點和著裝要求,ChatGPT 智能體根據提示詞,通過自主瀏覽、顯示思維鏈并執行任務,圓滿地完成了工作,列出了所有推薦的男裝、鞋子商品,并附上推薦理由和鏈接。
?
?
在另一個案例中,它被要求根據美國職業棒球大聯盟賽程,規劃一條在 2025 賽季常規賽期間,走遍全美 30 座大聯盟棒球隊的觀賽路線,推薦酒店住宿,最后以電子表格的形式呈現并生成一張可視化路線圖,它也出色地完成了任務。
?
用戶甚至可以要求它分析三個競爭對手并制作幻燈片演示文稿,只需要一個提示,ChatGPT 智能體就會幫你完成所有工作,你只需等待結果就好。
?
技術實現層面,OpenAI 采用了創新的"鏈式推理架構"。不同于常規模型的單次響應,智能體在接收指令后會啟動多輪內部思考:首先解析任務目標,然后規劃執行路徑,接著調用瀏覽器、代碼編輯器等外部工具,最后驗證結果并調整策略。
?
此外,還配備了多種網絡工具,包括可視化瀏覽器、文本瀏覽器和直接 API 訪問權限。
?
對于大家關心的數據安全問題,OpenAI 表示,ChatGPT 智能體在執行敏感或重要操作(例如發送郵件、購買商品、提交個人數據)時,會明確征求用戶授權。
?
當用戶在使用 ChatGPT 智能體訪問金融網站時,將不能離開當前標簽頁,否則工具會停止運作。而對于讓 ChatGPT 智能體炒股這類操作暫時受到限制,主要考量是避免 AI 出錯導致高額損失。
?
在安全性方面,它具備主動監督和風險緩解功能,能夠主動拒絕高風險任務,例如金融交易或敏感法律互動。
?
根據 OpenAI 公布的測試數據,ChatGPT 智能體在 “人類最后的考試” 中,單次嘗試通過率達 41.6%,遠超此前 OpenAI o3 模型的 20.3% 和 Deep Research 的 26.6%。
?
?
在 BrowseComp 基準中,它以 68.9% 的成績創 SOTA,比 Deep Research 高 17.4%。
?
?
同時,在 WebArena? 基準測試中,相較于由 o3 驅動的 CUA,ChatGPT 智能體表現更佳。
?
?
目前該功能已向 Pro、Plus 和 Team 用戶開放,OpenAI 表示將在未來幾周內向更多用戶開放,并整合更多功能。據內部路線圖,未來智能體將支持自定義工作流,允許企業接入內部系統。
?
想象一下,當AI能直接操作公司的 ERP、CRM 系統,自動處理財務報銷、客戶跟進等事務,或許整個辦公生態都將被重新定義。
