成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

吊打90%人類,Meta首個「AI外交模型」登上Science!網友:請把小扎送上法庭

人工智能 新聞
外交官的活兒,AI也能干了?

幾十年來,外交一直被認為是「AI絕不可能接管的工作」。

因為它要求玩家掌握、理解他人的觀點以及背后的動機,制定復雜的計劃并及時調整,然后應用語言與他人達成合作,最后說服他們建立伙伴關系和聯盟等。

溝通信任背叛的關注,使外交與圍棋和國際象棋等更注重規則的「游戲」截然不同。

然而Meta的最新研究表明:外交官的活兒,AI也很可能能干了!

在2022年8月至10月進行的線上外交游戲比賽中,CICERO在所有「選手」中高居前10%。它的平均得分為25.8%,是其82名對手平均得分(12.4%)的兩倍還多

更加值得一提的是,在實際的比賽過程中,沒有一名玩家——發現是人工智能在打比賽!

如今,這項最新成果也以論文的形式發表在了Science上。

圖片

CICERO的推出,必將成為自然語言處理領域的一項重大成就。

因為這預示著人工智能有潛力「更好、更自然地與人類合作」,代表著人類向AGI邁進的一大步。

吊打90%人類,無人發現AI參與

《外交》是一款七人制經典策略游戲,可以說是棋盤游戲Risk、紙牌游戲撲克和電視節目Survivor的結合,由美國著名玩具公司孩之寶(Hasbro)于1950年代開發。

通過對20世紀初歐洲七大國的「角色扮演」,玩家需要與其他選手建立信任、談判和合作,并盡可能多地占領領土。

為避免因對手的反擊而被阻止,玩家會私下交流、討論潛在的協調行動,然后將他們的行動付諸紙上,遵守或違反對其他參與者的承諾。

這樣一款充滿欺騙與權術的游戲,也被一些玩家視為失去朋友的理想方式,堪稱「友盡賽」!

正如上文所言,與國際象棋和圍棋等游戲不同,外交是一種更關乎于「人」而不是「規則」的游戲。

如果模型無法識別某人可能在虛張聲勢,或者精準識別其他玩家某步棋中的進攻性,它顯然會很快輸掉比賽。

同樣,如果它不像一個真人那樣說話,表現出同理心、建立關系、談論游戲,它就不會找到其他愿意與它一起工作的玩家。

在過去的幾十年里,研究人員一直在構建一種自然語言交流能力的「AI外交官」。然而因為這一重大挑戰已經遠遠超出了現有AI的能力范疇,因此從來沒有一名研究員成功過。

直到近期CICERO的橫空出世,才徹底顛覆了這個事實。

圖片

CICERO本質上是一臺「聊天機器人」,可以與其他外交玩家溝通,從而在游戲中采取有效行動。

西塞羅則是一名古羅馬著名政治家、哲學家、演說家,誕生于公元前106年1月3日,以善于雄辯而聞名于羅馬政界。

Meta將在這款AI模型取名于此,意義不言而喻。

2022年8月至10月,CICERO在webDiplomacy組織的線上《外交》比賽中,共參加了40場比賽,在所有參與者中成績高居前10%;在打了五場或更多比賽的19人中,西塞羅則排名第二。

40場比賽中,CICERO的平均得分為25.8%,是其他82名對手平均得分(12.4%)的兩倍還多,并將其戰略對話和游戲能力展現得淋漓盡致。

會思考又能表述,如此AI誰能不愛?

CICERO基于一個27億參數的類BART語言模型,該模型根據來自互聯網的文本進行預訓練,并使用 webDiplomacy.net上在線玩的4萬多場外交游戲的數據集進行了擴充。

這些數據中還包含玩家之間交流時產生的超過1200萬條消息。

CICERO的模型主要由兩部分組成,分別是「戰略推理」「自然語言處理」

兩項技術的整合使CICERO能夠針對玩家的動機進行推理并制定策略,然后使用自然語言進行交流,達成一致以實現共同目標,形成聯盟并協調計劃,主要體現在「合作」「談判」「協調」三方面。

例如,CICERO可以推斷在游戲的后期,它將需要某個特定玩家的支持,然后制定策略來贏得此人的青睞——甚至識別該玩家的風險和機會。

對話感知策略模塊能夠幫助CICERO預測其他玩家可能采取的行動,以及別的玩家認為CICERO可能采取的行動,給定他們過去的對話和游戲板的狀態。

由此,CICERO將根據這些預測為自己和其他參與者制定互惠互利的計劃。這些規劃不僅能讓CICERO找到互利合作的機會,也能幫助它在無法合作的時候找到有效的舉措。

CICERO中有一個可控對話模型,它與控制對話生成的戰略推理算法相結合。

圖片

可控對話模型允許CICERO在一組精心選擇的計劃中進行對話,通常是對CICERO和其他玩家都有利的計劃。

CICERO的對話深深植根于正在進行的游戲中的自由形式對話中生成的。

例如,CICERO可能會與另一位玩家協商戰術計劃,向盟友保證其意圖,討論游戲中更廣泛的戰略動態,甚至只是進行隨意的閑聊——包括幾乎任何人類玩家可能會討論的內容。

圖片

「西塞羅在使用自然語言與外交人員談判方面非常有效,以至于他們往往更喜歡與西塞羅合作,而不是其他人類參與者。」Meta在自家的Twitter中表示。

Meta AI副總裁兼首席人工智能科學家嚴樂存則認為,「能夠在像外交這樣戰略極其復雜的游戲中上演人類級別的表現,預示了人類與人工智能合作的巨大潛力」。

雖然CICERO只能玩外交,但這項成就背后的技術卻與許多現實世界的應用息息相關,例如通過規劃和RL控制自然語言的生成,可以緩解人類與人工智能模型之間的溝通障礙。

例如,今天的人工智能助手只能進行簡單的問答,比如告訴你今天的天氣等,但如果他們通過長期對話教你一項新技能呢?

亦或者想象一個視頻游戲,其中的非玩家角色 (NPC) 可以像人們一樣自由計劃和交談——了解你的動機并相應調整對話,從而幫助你完成攻城掠地的任務。

當然,就連Meta自己也承認「CICERO還不夠完美」——在游戲的某些重要時刻,CICERO經常會出現十分離譜的錯誤。

因此,Meta選擇將CICERO的代碼開源發布,希望借助AI開發者社區的力量進一步完善它。

網友:請把小扎送上法庭!

全球首款與人類同等水平的「AI外交官」的發布,也引發了網友們的熱議。

不少網友紛紛表示:

「實在太期待這項研究接下來的發展了。」

「擊敗人類可以說是最人性化的游戲。這簡直太迷人了…」

圖片

圖片

雖然CICERO初出茅廬,卻也有人對這項「AI黑科技」在現實生活中的應用前景進行了展望:

「它能構建一個版本來幫助應對集體行動挑戰嗎,比如#COP28?」

圖片

該網友所言的「COP28」,應該是指第28屆聯合國氣候大會。

在剛剛結束的27屆氣候大會上,經過持續數天的緊張談判,各國代表最終同意設立一個基金機制,以補償因氣候變化引發的損失和損害。

此外,CICERO的推出也引發了不少網友的擔心,「這將直接激勵研究人員建立擅長欺騙的模型」。

圖片

「以模仿人類行為的方式欺騙并贏得外交游戲,可愛又有趣。」

「真不知道它還能用來做什么?我們需要警覺此類工具的發展。」

圖片

「人工智能很擅長創作藝術等。但現在,它的說服能力被『激活』了。」

「如果你能說服一個人,就能控制他們的選擇,從而控制他們的生活。」

「因此最終結局會是——AI通過說服來奴役人類!」

圖片

最后,也有不少人逗比的網友調侃道:

「這東西靠譜嗎?西塞羅最終可是被砍了頭的!」

「請將小扎送到海牙(國際法庭)!」

圖片

就在前兩天,因為將謊言陳述為事實,由Meta AI推出的大型語言模型Galactica上線僅3天便倉皇下架。如今CICERO的推出,可謂是再一次在AI科技圈掀起了層層波瀾。

責任編輯:張燕妮 來源: 新智元
相關推薦

2022-12-02 15:25:03

2024-09-26 14:07:30

2022-10-26 11:42:18

AI元宇宙

2024-04-15 12:53:00

模型訓練

2022-06-06 11:07:29

ARAI

2022-12-27 13:36:09

2021-12-20 10:07:35

AI 數據人工智能

2019-10-31 14:37:55

技術人工智能開發

2022-07-28 14:22:50

元宇宙AI

2018-05-08 14:56:37

2024-05-13 13:37:10

模型數據

2025-06-04 03:22:00

AI模型V-JEPA

2025-06-24 09:04:21

2022-02-11 15:16:54

AI機器人技術

2025-04-30 14:12:36

DeepSeekAIApp

2025-06-11 14:44:48

AI文本大模型

2023-06-20 09:24:20

AI開源

2024-02-02 21:39:04

AI模型

2024-10-30 13:13:07

2023-02-28 13:02:51

AIChatGPT
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久精品一区二区三区四区 | 亚洲一区二区日韩 | 国产日韩精品久久 | 男女午夜免费视频 | 午夜免费观看 | 日韩综合 | 国产成人精品网站 | 久久精品一级 | 青青草av网站 | 产真a观专区 | 青娱乐一区二区 | 国产在线91 | 国产精品欧美一区二区 | 国产精品免费高清 | 久久久久久国产精品免费免费 | 久久久精品一区二区三区 | 狠狠爱免费视频 | 97人人超碰 | 日韩中文一区二区三区 | 在线视频日韩精品 | 午夜丰满少妇一级毛片 | 不用播放器看的av | 欧美综合一区 | 亚洲成av人片在线观看无码 | 中文字幕精品一区二区三区精品 | 国产精品久久久久久婷婷天堂 | 亚洲一区二区网站 | 一级欧美 | 国产精品久久国产精品99 | 一区欧美 | 亚洲 精品 综合 精品 自拍 | 在线播放一区二区三区 | 99久久久99久久国产片鸭王 | 国产精品国产三级国产aⅴ原创 | 日韩看片| 国产精品国产三级国产播12软件 | 免费观看av | 国产精品伦理一区二区三区 | 日韩av一区二区在线 | 欧美日韩黄色一级片 | 欧区一欧区二欧区三免费 |