OpenAI智能體新線索曝光！網(wǎng)友：新ChatGPT時(shí)刻要來了

作者：量子位 2025-01-21 12:44:50

人工智能新聞

據(jù)大名鼎鼎的“情報(bào)員”光頭哥爆料，OpenAI在MAC版ChatGPT桌面應(yīng)用中隱藏了啟用/禁用智能體的選項(xiàng)。

沒錯(cuò)，OpenAI的智能體時(shí)代真的要來了！

據(jù)大名鼎鼎的“情報(bào)員”光頭哥爆料，OpenAI在MAC版ChatGPT桌面應(yīng)用中隱藏了啟用/禁用智能體的選項(xiàng)。

從截圖來看，確實(shí)是傳聞已久、代號(hào)為“Operator（操作員）”的辣個(gè)：

而且這則爆料也得到了日常關(guān)注蘋果方面消息的博主@M1的再次佐證：

Operator正在內(nèi)測(cè)中，即將上線MAC版ChatGPT桌面應(yīng)用……

根據(jù)介紹，Operator能夠接管用戶PC，直接代替人類自主執(zhí)行一系列操作（如編碼開發(fā)應(yīng)用、訂餐，做攻略等等）。

與此同時(shí)，OpenAI智能體和其他競(jìng)爭(zhēng)對(duì)手（如Anthropic、谷歌智能體），以及人類選手的跑分對(duì)比也曝光了。

先劃個(gè)重點(diǎn)，在幾個(gè)評(píng)估智能體執(zhí)行自動(dòng)化任務(wù)水平的基準(zhǔn)測(cè)試中，OpenAI這邊均戰(zhàn)勝了Claude智能體。

網(wǎng)友們紛紛激動(dòng)表示，看起來離發(fā)布已經(jīng)很近了，或許又會(huì)是下一個(gè)ChatGPT時(shí)刻。

而Windows用戶則開啟了刷屏模式，請(qǐng)不要僅限于Mac、請(qǐng)不要僅限于Mac、請(qǐng)不要僅限于Mac……（OpenAI你聽到了嗎）

多個(gè)基準(zhǔn)跑分超過Claude智能體

從光頭哥的另一條推文里，我們看到了OpenAI智能體和其他競(jìng)品的詳細(xì)對(duì)比。

相關(guān)數(shù)據(jù)來自O(shè)penAI網(wǎng)站，具體為圖中標(biāo)黃部分。

單拉出來看，在OSWorld這個(gè)專為多模態(tài)Agent設(shè)置的基準(zhǔn)測(cè)試中，OpenAI CUA（據(jù)推測(cè)可能是驅(qū)動(dòng)Operator的AI模型）得分為38.1%，領(lǐng)先于Anthropic的Computer use功能，但還不及人類自己操作的一半水平。

類似情況也在WebArena（CMU發(fā)布的基于Web環(huán)境的基準(zhǔn)測(cè)試）上演。

不過，在WebVoyager（由騰訊AI Lab發(fā)布的多模態(tài)網(wǎng)絡(luò)Agent基準(zhǔn)測(cè)試）則稍有反轉(zhuǎn)，OpenAI CUA取得了87%的好成績(jī)，不僅一如既往地領(lǐng)先Anthropic，還以小幅優(yōu)勢(shì)超過了人類（85.3%）。