成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

又一華人面孔!OpenAI 深夜祭Agent大招!背后研究人員曝光!奧特曼:感受AGI!VibePPT將至,Manus曬對比測評

精選
人工智能
7 月對于 OpenAI 而言意義非凡,從去年盛傳 GPT-5 將會發布,再到近日的被挖角風波,再到 OpenAI 即將推出 AI 瀏覽器,各種傳言全都醞釀在今天凌晨的直播里。

編輯 | 云昭

出品 | 51CTO技術棧(微信號:blog51cto)

又是一個不眠夜!

7 月對于 OpenAI 而言意義非凡,從去年盛傳 GPT-5 將會發布,再到近日的被挖角風波,再到 OpenAI 即將推出 AI 瀏覽器,各種傳言全都醞釀在今天凌晨的直播里。

發布前,小編的預期是,肯定是 Agentic 辦公類的產品。因為在前兩個月的博客中,Sam Altman 不止一次提及,現在是 Vibe Coding,下一個則看好類似 Google Docs 的辦公 Agent 產品。

這次,Sam 在官宣發布推文后,給出的第一條推文總結了他的感受:

“feel the AGI” moment。 

圖片

“觀看 ChatGPT Agent 使用計算機思考、計劃和執行復雜任務對我來說是一個真正的‘感受 AGI’時刻。”

合二為一的縫合怪?

果然,小編只猜中了一半。猜對的是果真是面向日常辦公工作的產品,主打一個 一句提示搞定 Excel 和 PPT。

正如那位 OpenAI 的研究員所發的推文:

在對各種實際工作任務(可能需要> 10 小時的專家任務)進行測試時,我們發現其輸出幾乎在 50% 的時間內都達到了人類質量。

沒猜到的是,Altman 坦承了想法:很簡單,我們就是融二為一了。

省流版的解釋,這個 Agent 就是兼有下面兩種功能,研究和動手兩不誤——

  • Operator:可與網頁交互,如填寫表單、點擊按鈕等;
  • Deep Research:可執行多步驟的深入研究任務。

圖片

這次直播中,Sam Altman 表示,ChatGPT Agent 的想法是在 OpenAI 推出其其他代理 Operator 和 Deep Research 之后產生的。Operator 使用自己的瀏覽器執行任務,而 Deep Research 可以在互聯網上進行多步驟調查。

“我們很清楚,人們真正想要的是將這些功能整合在一起……人們想要一個統一的代理,它可以獨立運行,使用自己的電腦,并為他們執行真正復雜的任務。”

OpenAI 表示,這款新工具可以“使用它自己的電腦”來處理復雜任務。

不過,在人類看來,這里的復雜任務,算不上多復雜。無疑就是我們日常辦公的那些事兒了:讀/發郵件、做PPT、編輯 Excel、網上購物等等。

為什么仍然值得一看?

但如果說這次給的演示有什么特別的話,就是場景更加貼近實際生活工作了:

  • ChatGPT 代理可以充當虛擬助手,連接到 Gmail 和 Google 日歷等應用程序,執行起草電子郵件和安排預約等任務。它使用自己的虛擬計算機完成任務,并自行在推理和行動之間切換以執行指令。
  • OpenAI 表示,新工具可以“分析三個競爭對手并制作幻燈片”——代理將制定行動方案、瀏覽網站并創建可編輯的幻燈片。
  • 它還可以通過“根據舊金山年度綜合財務報告 (ACFR) 制作電子表格”之類的提示來創建可編輯的 Excel 電子表格。
  • 該代理還可以為用戶在線購物,但在執行敏感操作(例如輸入個人信息或進行購買)之前,它始終會征求批準。

這些任務的完成并非通過傳統編程接口調用,而是由 ChatGPT 自己在一個虛擬計算機環境中完成,這個環境配備了多種工具,能在網頁上模擬真實用戶的操作。

用戶還可以授權連接自己的 Gmail、GitHub 等服務,讓 ChatGPT 在任務中調用其中的信息。

圖片

這里小編為大家扒了看下兩個案例:PPT 和 Excel。

至于原理,OpenAI 介紹道,Agent 模式可以調用三種工具:文本瀏覽器、可視化瀏覽器和終端。模型可以自主選擇切換各種工具。

具體來說,文本瀏覽器用于廣泛地讀取和檢索文字信息;可視化瀏覽器則在確定目標信息后,模擬鼠標和鍵盤操作,甚至可以處理圖像內容;而終端則具備執行代碼的能力,能夠生成如 PPT、Excel 等各類文檔,同時還可以調用云端 API 完成更復雜的任務,比如投行建模這些燒腦的事情。

總之,ChatGPT Agent 會動態選擇最佳執行路徑:它可以篩選結果、運行代碼,甚至生成幻燈片和電子表格——同時在多步驟任務中保持完整上下文

這里小編還要強調三個不同的地方:

  • 大家都知道,目前大模型不是萬能的,但大模型調用工具的能力可以說是“愛無限”。在演示中,Agent 可以連接 Google Drive API,讀取文件之后生成更精準的 PPT 或郵件、表格;也可以調用 Image 生成器/生成模型,來實現文本到多模態的跨越(想起了騰訊元寶讓DeepSeek畫圖的消息~)
  • 對于涉及到隱私風險的操作,通知并得到用戶的交互許可,依舊是主流。
  • Agent 的安全風險問題依舊嚴峻。OpenAI 隨后在官方推文中表示,ChatGPT 具備新能力的同時,也引入了新的風險。目前,OpenAI 已針對多個風險類別實施了廣泛的安全防護措施

尤其是針對 對抗性提示注入(prompt injection)攻擊采取了特別的防護機制,以防止模型被惡意操控。(似乎是在暗懟最近Claude和Grok的安全問題。)

圖片

有趣的是:機構叫好,用戶喊沒勁

好了,現在來說下大家的評價。

首先,發布后,很多人都覺得跟 Manus 很像,群里也有不少朋友對其表示失望。這種心情很普遍,也是大眾對于 OpenAI 產品的過高期望。

比如一位網友就吐槽“生成的 PPT Slides 很丑”。這一點 OpenAI 也承認:

目前,部分功能如幻燈片生成仍處于 beta 階段,排版可能不夠完美,某些編輯也還存在邊界。但這只是開始。OpenAI 正在持續優化:

幻燈片排版更自然

表格編輯速度更快

任務記憶和長期計劃能力增強

循環任務的設置更便捷

其次,更多的網友,是覺得這次的演示Demo無新意,不夠驚艷。

圖片

最后,甚至、網友們反問道:它幫我完成90~95%的占用我時間的工作后,那我豈不是被解雇了?

圖片

你看,這就是發布不驚艷的下場,用戶的槽點就會轉移到“AI替代我工作”的話題上,蠻無聊的。

不過,hackernews 上的用戶的注意力就很極客,更多的是在討論電子表格的案例。

他打開表格說:“我覺得它98%的信息都正確……我只需要復制/粘貼幾項。如果它能幫你完成90%到95%的耗時工作,那能幫你省下一大筆時間。”

圖片

喜歡說出真相的網友則表示:找到剩下的 2% 的錯誤才是最麻煩最難得,可能需要我花費更多的時間!要命!

爭議也由此展開了:

  • 類比到編程,有網友評論指出“AI代碼生成”也存在類似風險:通過測試不代表質量合格,測試無法發現所有漏洞,尤其是邏輯和架構上的錯誤。
  • 同時也有反對者強調:“測試是找你已知問題的工具,但不是萬能的”,必須配合審查流程、代碼理解和良好的工程文化。

哈哈,只能說,這是另一個話題了。

做產品,OpenAI 不是唯一正確,但參考它準沒錯

但小編想說的是,全球 AI 發展早已經不是 OpenAI 一家驅動了,谷歌、Anthropic 已經鼎足。所以彼此之間、甚至模型和 Agent 產品之間的“左腳踩右腳”的發展態勢會長期存在。期望 OpenAI 領跑產品形態這件事,不要抱太大期望。

那肯能會問,OpenAI 這次發了什么新東西嗎?小編認為還是有的。

試想一下,你有沒有在安裝試用某款AI瀏覽器時,總是會被這樣一段文字勸退:

你需要同意授權該產品可以收集、使用真實網頁中用戶數據,并可以執行操作。

這樣帶來的問題怎么解決?這個其實是很多廠商有意回避、沒有解決方案的。

Agent 若獲得過多數據訪問權限,可能誤讀并采取不當行動了怎么辦?

有惡意網站試圖誘導 Agent 執行非法操作該怎么辦?

Agent 可能誤點按鈕、選擇錯誤商品、產生不可預期后果又來誰負責?

至少,OpenAI 帶頭提出了標桿式的解決措施:

  • 關鍵操作需確認(如購物、付款等)
  • 拒絕執行高風險任務(如銀行轉賬)
  • 支持隨時刪除瀏覽記錄與登出
  • 敏感輸入不會被記錄或存儲

除此之外,還有嗎?小編只能說,Spreadsheets 那個也是個不錯的用例。

很多做數據爬蟲工具的網站、甚至BI賽道的玩家都要重新思考將來的轉型了。

如果不相信,就看一下OpenAI 的內部測試數據,以及Epoch AI 剛剛出爐的測評——

  • 在多項復雜的數據科學與投資任務中超過人類表現
  • 在網頁瀏覽與任務完成的準確性上優于歷代AI模型
  • 在表格編輯、數據建模、高階數學問題上表現極佳

圖片

圖像

華人新面孔:Agent背后的兩位高材生

ps: 小編發現,這次又有新的華人面孔。左二,Zhiqing Sun ,去年 6 月加入OpenAI,目前是研究科學家,一口中式英語,非常親切,細心地網友認出就是北大校友孫之清了。

圖片

在OpenAI期間,孫之清不僅參與到了o3/o4-mini、計算機使用智能體,以及Deep Research這幾個關鍵項目當中,而且還是Deep Research的研究負責人。

另一位坐在C位的則是老面孔:Casey Chu,于2020年4月加入OpenAI,擔任研究員。這位可以說是元老級別了,很多次直播發布中都有看到 Casey。他不僅是DALL·E 2的共同一作,而且還主導了GPT-4視覺輸入的初始原型的開發。

圖片

什么時候用上?

OpenAI 這波新品正在被嵌入到 ChatGPT 中,目前只允許付費用戶使用。

通過在 ChatGPT 的下拉工具菜單中選擇“代理模式”即可訪問。該代理現已從今天開始向 Pro、Plus 和 Team 用戶推出,并計劃于今年夏季向企業版和教育版用戶推出。

不過,小編發現,身為plus用戶的我,貌似并沒有被cover到,有知道原因的道友可以告訴下原因。

圖片

不過,小編為大家找到了幾張提前體驗的用戶交互截圖。

圖片

圖片

圖片

最有意思的是,manus 今天官推也發了幾張對比截圖,嘲諷味道出來了??

圖片

圖片

圖片

完結。各位大佬如何看待這次的ChatGPT Agent呢?

責任編輯:龐桂玉 來源: 51CTO技術棧
相關推薦

2023-06-28 10:13:23

2024-11-14 13:30:00

2025-03-12 10:32:23

2024-12-27 12:38:54

2025-02-25 10:21:12

2025-03-12 10:00:44

2021-02-02 09:32:06

黑客攻擊l安全

2024-12-31 10:48:04

2021-05-06 08:48:30

谷歌人工智能AI

2021-11-23 17:59:12

微軟漏洞Windows

2023-02-16 20:24:07

OpenAI谷歌ChatGPT

2025-06-23 09:16:00

2017-03-27 16:09:58

2014-08-25 11:06:42

2025-07-22 11:56:26

2024-01-25 16:03:24

2025-05-26 09:07:00

2023-07-12 10:09:20

論文

2012-05-04 10:16:08

2014-12-25 09:51:32

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 午夜黄色大片 | 久久久精品一区 | 成人在线国产 | 色爽视频 | 黄色小视频免费 | 黄色高清网站 | 久久精品国产一区 | 成人黄色网 | 欧美成人一区二区 | 一区二区三区四区在线 | 亚洲久草 | 国产免费高清视频 | 九九热在线观看 | 日韩欧美一区二区三区久久婷婷 | 免费成人小视频 | 午夜av影院| 你懂的在线网站 | 五月天婷婷激情网 | 日本精品在线观看 | 亚洲免费精品视频 | 天天色影院 | 性大毛片视频 | 中文字幕久久久 | 欧美午夜片 | 在线视频亚洲 | 免费看黄色小视频 | 综合色av| 日批视频免费在线观看 | 国产高清视频在线 | 黄色小视频免费看 | 久久精视频 | 99久久久精品 | 欧美日韩亚洲视频 | 日韩免费一区二区 | 欧美日韩亚洲一区 | 日日夜夜天天 | 色综合久久综合 | 久久精品99久久久久久 | 国产成人高清 | 天天操网 | 日韩精品黄 |