成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

OpenAI智能體新線索曝光!網(wǎng)友:新ChatGPT時(shí)刻要來了

人工智能 新聞
據(jù)大名鼎鼎的“情報(bào)員”光頭哥爆料,OpenAI在MAC版ChatGPT桌面應(yīng)用中隱藏了啟用/禁用智能體的選項(xiàng)。

沒錯(cuò),OpenAI的智能體時(shí)代真的要來了!

據(jù)大名鼎鼎的“情報(bào)員”光頭哥爆料,OpenAI在MAC版ChatGPT桌面應(yīng)用中隱藏了啟用/禁用智能體的選項(xiàng)

從截圖來看,確實(shí)是傳聞已久、代號(hào)為“Operator(操作員)”的辣個(gè):

圖片

而且這則爆料也得到了日常關(guān)注蘋果方面消息的博主@M1的再次佐證:

Operator正在內(nèi)測(cè)中,即將上線MAC版ChatGPT桌面應(yīng)用……

圖片

根據(jù)介紹,Operator能夠接管用戶PC,直接代替人類自主執(zhí)行一系列操作(如編碼開發(fā)應(yīng)用、訂餐,做攻略等等)

與此同時(shí),OpenAI智能體和其他競(jìng)爭(zhēng)對(duì)手(如Anthropic、谷歌智能體),以及人類選手的跑分對(duì)比也曝光了。

先劃個(gè)重點(diǎn),在幾個(gè)評(píng)估智能體執(zhí)行自動(dòng)化任務(wù)水平的基準(zhǔn)測(cè)試中,OpenAI這邊均戰(zhàn)勝了Claude智能體。

圖片

網(wǎng)友們紛紛激動(dòng)表示,看起來離發(fā)布已經(jīng)很近了,或許又會(huì)是下一個(gè)ChatGPT時(shí)刻。

圖片
圖片

而Windows用戶則開啟了刷屏模式,請(qǐng)不要僅限于Mac、請(qǐng)不要僅限于Mac、請(qǐng)不要僅限于Mac……(OpenAI你聽到了嗎)

圖片

多個(gè)基準(zhǔn)跑分超過Claude智能體

從光頭哥的另一條推文里,我們看到了OpenAI智能體和其他競(jìng)品的詳細(xì)對(duì)比。

圖片

相關(guān)數(shù)據(jù)來自O(shè)penAI網(wǎng)站,具體為圖中標(biāo)黃部分。

圖片

單拉出來看,在OSWorld這個(gè)專為多模態(tài)Agent設(shè)置的基準(zhǔn)測(cè)試中,OpenAI CUA(據(jù)推測(cè)可能是驅(qū)動(dòng)Operator的AI模型)得分為38.1%,領(lǐng)先于Anthropic的Computer use功能,但還不及人類自己操作的一半水平。

類似情況也在WebArena(CMU發(fā)布的基于Web環(huán)境的基準(zhǔn)測(cè)試)上演。

不過,在WebVoyager(由騰訊AI Lab發(fā)布的多模態(tài)網(wǎng)絡(luò)Agent基準(zhǔn)測(cè)試)則稍有反轉(zhuǎn),OpenAI CUA取得了87%的好成績(jī),不僅一如既往地領(lǐng)先Anthropic,還以小幅優(yōu)勢(shì)超過了人類(85.3%)。

圖片

從一些具體任務(wù)的完成通過率來看,有輔助的Operator表現(xiàn)好過完全自主操作,不過偶爾還是比不上帶視覺能力的GPT-4o。

圖片

有網(wǎng)友據(jù)此提問Operator是否不如GPT-4o,對(duì)此另有熱心網(wǎng)友指出了二者區(qū)別:

一個(gè)是自主操作,一個(gè)是教你做事。

圖片

另外,對(duì)二者安全性的評(píng)估如下,GPT-4o在拒絕非法宣傳、極端活動(dòng)討論等方面均為100%,而Operator在越獄(Jailbreaks)進(jìn)行非法活動(dòng)以及禁止的金融活動(dòng)方面沒有達(dá)到100%。

圖片

需要提醒的是,在光頭哥看來,以上跑分也可能只是占位符,具體真實(shí)性無法保證。(先來個(gè)免責(zé)聲明)

圖片

2025:OpenAI重點(diǎn)布局Agent

事實(shí)上,Operator這款智能體早在去年11月就有相關(guān)爆料。

當(dāng)時(shí)彭博社聲稱,OpenAI將在明年1月推出它,來替用戶自動(dòng)執(zhí)行任務(wù)。

圖片

而現(xiàn)在,也算是進(jìn)一步佐證了之前的消息。

甚至就在去年底,OpenAI CEO奧特曼也在新年目標(biāo)中,明晃晃地將Agent排在前列。

圖片

而Flag立完后,OpenAI剛一開年也是馬不停蹄地開始了相關(guān)動(dòng)作。

上周,OpenAI就為ChatGPT推出了新功能「Tasks」,讓AI有了執(zhí)行力,可以替你完成各種任務(wù)。

無論是一次性提醒還是重復(fù)執(zhí)行的動(dòng)作,告訴ChatGPT你需要什么以及何時(shí)需要,它會(huì)自動(dòng)幫你處理。

圖片

整體看起來有點(diǎn)偏向日程提醒,更像Agent的初級(jí)階段。

合理推測(cè),Operator將在此基礎(chǔ)上有更多、更強(qiáng)的能力表現(xiàn)。

話說,從國(guó)內(nèi)外科技企業(yè)對(duì)Agent的新追逐來看,今年Agent絕對(duì)有好戲看!

據(jù)市場(chǎng)研究公司Markets and Markets的分析,AI Agent的市場(chǎng)規(guī)模至2030年有望達(dá)到471億美元

如此吸引下,再加上已經(jīng)成熟的大模型技術(shù),Agent火爆2025簡(jiǎn)直不言而喻。

甚至就在今年的CES上,英偉達(dá)CEO黃仁勛也對(duì)Agent大加贊賞:

未來公司IT部門將成為Agent人力資源部門……(為公司改進(jìn)大量Agents,從而為各部門提供新支持)

此番言論下,了解AI Agent技術(shù)也被開發(fā)者們提上了2025學(xué)習(xí)日程。

圖片

好嘛,不管是企業(yè)還是個(gè)人,接下來大家都得卷Agent了(doge)。

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2024-01-29 00:05:00

OpenAI嵌入機(jī)器學(xué)習(xí)

2024-12-16 11:00:15

2025-05-17 08:55:41

2023-03-03 07:34:05

2024-01-19 12:26:08

AI智能車

2021-01-28 16:58:12

數(shù)字貨幣加密貨幣區(qū)塊鏈

2023-04-09 23:42:54

2024-03-14 11:55:21

2024-12-12 00:40:07

2025-02-13 08:56:12

2024-12-02 10:00:00

ChatGPTAI

2024-07-04 09:26:16

2023-03-24 11:49:57

2023-04-14 13:58:17

代碼智能

2023-10-31 19:11:11

2024-12-10 09:20:00

OpenAI模型

2023-05-19 07:35:03

ChatGPTOpenAI

2017-04-17 09:01:39

科技新聞早報(bào)

2023-05-29 08:38:56

popover控制懸浮層

2024-09-18 13:30:00

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 国产视频在线观看一区二区三区 | 国内精品视频免费观看 | 亚洲看片| 日韩在线欧美 | av黄色在线播放 | 国产精品一区二区久久久久 | 国产综合网站 | 四虎在线观看 | h片在线免费观看 | 国产一区二区 | 米奇狠狠鲁 | 国产精品一二区 | 午夜日韩 | 日韩一区在线播放 | 欧美日韩国产在线 | 无码日韩精品一区二区免费 | 国产在线观看一区 | 精品一区二区免费视频 | 日韩精品三区 | www.日韩| 久久毛片 | 欧美亚洲国产一区二区三区 | 91五月天| 国产精品美女久久久久aⅴ国产馆 | 成人国产精品久久 | 成人av在线播放 | 日韩亚洲欧美一区 | 欧州一区二区三区 | 亚洲精品美女视频 | 亚洲精品第一国产综合野 | 久久久久久久久国产成人免费 | 国产精品国产成人国产三级 | 色资源站| 国产精品揄拍一区二区 | 国产精品一区二区久久精品爱微奶 | 亚洲小视频在线观看 | 99视频网站 | 99re在线 | 久久久久久免费精品一区二区三区 | 色约约视频 | 国产精品污污视频 |