成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

炸場!DeepMind通用人工智能新突破:一套權重通吃視覺文本和決策

人工智能 新聞
只一個模型,使用相同的權重,不僅把看家本領雅達利游戲玩得飛起。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

通用人工智能,還得看DeepMind。

這回,只一個模型,使用相同的權重,不僅把看家本領雅達利游戲玩得飛起。

和人類聊聊天、看圖寫話也不在話下。

甚至還能在現實環境里控制機械臂,讓其聽從指令完成任務!

模型名為Gato,西班牙語中的“貓”。

按照DeepMind的說法,這只貓貓可以使用具有相同權重的同一個神經網絡,適應各種不同的環境。

具體而言,DeepMind讓它在604個不同的任務上接受了訓練,這些任務模式完全不同,需要觀察的元素和行為規則也不同。

而Gato不僅在450個任務中都超過了專家水平的50%,在23個雅達利游戲上表現還超過人類平均分。

DeepMind CEO哈薩比斯直接說:

這是我們目前最通用的智能體。

這一最新成果一發布,當即就在AI圈子里掀起熱議。

有AI研究者指出:

Gato令人印象深刻。只需要在云上花費5萬美元,就能完成對它的訓練。

這點錢只是PaLM訓練費用1100萬美元的一個零頭。用PaLM的預算完全可以將Gato擴展100倍,而這很可能是行之有效的。

PaLM是谷歌發布的5400億參數語言模型。

有人直接祭出了AlphaStar架構和Gato架構的對比:

Zoom AI杰出科學家Awni Hannun則直接感嘆起過去5周以來,谷歌/DeepMind釋出成果之密集。

所以這只來自DeepMind的“貓貓”,究竟怎么一回事?

一個Transformer搞定一切

對于研究方法,DeepMind只用一句話就解釋明白了:

我們受到語言大模型的啟發,用類似的方法把模型能力拓展到文本之外的領域。

沒錯,這次立功的又是語言大模型中常用的Transformer架構。

Transformer的本質就是把一個序列轉換(transform)成另一個序列。

所以要想讓它掌握各種不同任務,首先就需要把各類數據都編碼成序列。

文本自不必說,天然就是序列信息,可用經典的SentencePiece編碼。

圖像,ViT已經打好樣,先按16x16像素分割,再給每個像素編上號處理成序列。

玩游戲時的按鍵輸入同樣是序列,屬于離散值,比如懂得都懂的“上上下下左右左右BABA”。

操縱機器人時的傳感器信號和關節力矩屬于連續值,也通過一系列采樣和編碼處理成離散序列。

最終,所有序列數據都交給同一個Transformer處理。

整個Gato模型使用的訓練數據總體上偏向游戲和機器人控制任務,596個任務占了85.3%。視覺和自然語言任務只占14.7%。

模型架構上,為了簡潔和可擴展性,就在最經典的原版Transformer基礎上小改,具體參數如下:

24層11.8億參數版的Gato,在谷歌16x16 Cloud TPUv3切片上訓練了大約4天。

到了部署階段,Gato對于視覺和語言任務就像傳統Transformer和ViT那樣運行。

對于游戲和機器人控制的行為模式則可以理解為“走一步看一步”。

首先給出一個任務提示,比如游戲操作或機器人動作,作為輸出序列的開頭。

接下來Gato會觀察當前的環境,對動作向量進行一次自回歸采樣,執行動作后環境發生變化,再重復這個過程……

那么這樣訓練出來的Gato,在各項任務中到底表現如何?

僅靠12億參數成為多面手

玩游戲方面,Gato的表現可以用一張圖來總結。

x軸是訓練集之中專家水平的百分比,其中0代表一個隨機參數模型的水平。

y軸是Gato超過或達到對應專家水平的任務數量。

最終結果,Gato在604個任務中,有450個超過了專家水平的50%。

更詳細的結果如下:

雅達利游戲測試中,Gato在23個游戲上表現超過人類平均分,11個游戲上比人類得分高一倍。

這些游戲包括經典的乒乓球、賽車,也包括射擊、格斗等多種類型。

在Bengio團隊推出的BabyAI測試上,Gato幾乎在所有關卡達到了專家水平的80%,最難的幾個Boss關達到75%。與之前BabyAI榜單上的兩個模型水平相當(分別為77%和90%),但這兩個模型都針對性的用了上百萬個演示來訓練。

△BabyAI關卡示例

在Meta-World上(虛擬環境中操作機械臂),Gato在全部45個任務中,有44個超過專家水平的50%,35個超過80%,3個超過90%。

△Meta-World任務示例

操縱真實機器人方面,與之前模型對比也不遑多讓。

至于視覺和文本任務DeepMind這次至少為了驗證通用模型的可行性,沒有做跑分,而是給了一些示例。

△描述圖像

△聊天對話

最后,DeepMind還對Gato模型的可擴展性做了評估。

雖然當前Gato在每一個單獨任務上都還比不上SOTA結果,但實驗結果表明,隨著參數、數據和硬件的增加,Gato模型的性能還有成比例上漲的空間。

另外,Gato在少樣本學習上也表現出一定潛力。

DeepMind認為,這樣一個通用模型將來可通過提示或微調迅速學習新的任務,再也不用為每個任務都重頭訓練一個大模型了。

通用人工智能還有多遠?

看完Gato如此表現,網友們的“大受震撼”也就不奇怪了。

甚至還有人認為,AGI(通用人工智能)近在眼前。

當然,反對/質疑的聲音也不小。

比如始終沖在給人工智能潑冷水一線的馬庫斯,這次也第一時間開了炮:

仔細看看第10頁。無論模型有多大,大型語言模型標志性的不靠譜和錯誤信息仍然存在。

但不管怎么說,DeepMind在通用人工智能方向上的努力都在不斷涌現出新成果。

事實上,無論是2013年驚艷了谷歌的雅達利游戲AI,還是名滿全球的AlphaGo、AlphaStar,DeepMind透過這些階段性成果想要達成的終極目標,一直都通向通用人工智能這個關鍵詞。

去年,DeepMind首席研究科學家、倫敦大學學院教授David Silver還領銜發布了一篇同樣引起不少討論的文章:Reward is Enough。

論文認為,強化學習作為基于獎勵最大化的人工智能分支,足以推動通用人工智能的發展。

而據Gato團隊成員透露,這只“貓貓”已經在DeepMind內部孕育了2年時間。

此次Gato是以有監督方式進行離線訓練的,但論文也強調,原則上,同樣可以采用離線或在線強化學習的方式對其進行訓練。

而就在一周前,DeepMind發布了一個新視頻,其中說到:

我們接下來要做一件大事(the next big thing),那意味著需要去嘗試很多人們認為過于困難的事情。但我們一定要去嘗試一下。

現在看來,這個next big thing就是指AGI了。

論文地址:https://www.deepmind.com/publications/a-generalist-agent

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-05-29 08:19:49

2022-06-20 11:05:58

通用人工智能機器人

2022-07-04 15:29:59

人工智能機器計算機

2022-07-31 23:46:57

人工智能語言模型感知力

2024-01-16 10:22:23

人工智能大型語言模GPT 4

2023-07-10 10:36:17

人工智能AI

2023-02-28 15:21:37

人工智能AGI

2020-10-16 10:27:58

人工智能

2021-02-06 10:43:49

人工智能

2023-11-22 15:53:45

2019-06-13 18:03:26

人工智能互聯網識別

2025-05-23 06:30:00

通用人工智能AGIAI

2022-06-27 11:24:20

人工智能術語AI

2023-05-08 07:24:54

通用人工智能標準

2024-05-30 09:55:05

人工智能AGI領域

2022-07-25 14:10:07

人工智能金融語言

2024-03-14 08:00:00

人工智能生成式對抗網絡網絡釣魚

2023-10-12 15:37:24

人工智能AGI

2023-05-04 13:57:50

人工智能AGI圖靈
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美中文在线 | 日韩精品一区二区在线 | 99成人精品| 爱爱免费视频 | 在线亚洲免费视频 | 超碰日本| 黄色在线观看网址 | 中文字幕在线播放第一页 | 精品在线一区 | 自拍视频国产 | 久久久久国产一区二区三区 | 久久精品视频在线观看 | 久久精品一区二区三区四区 | 免费一级黄色 | 欧美日韩在线精品 | 精品视频一区二区三区四区 | 成人精品国产一区二区4080 | 七七婷婷婷婷精品国产 | 日韩一二区在线 | 欧美自拍另类 | 中文字幕 在线观看 | 网络毛片 | 欧美亚洲视频在线观看 | 91精品国产综合久久婷婷香蕉 | 第一av | 久久精品国产99国产精品 | 欧美激情99| 国产一区二区麻豆 | 欧美精品在线视频 | 在线观看精品视频网站 | 欧美一二三区 | 亚洲一区免费 | 在线看日韩| 成人日韩av| 亚洲另类自拍 | 国产香蕉视频 | 大久| 在线观看国产视频 | 国产一二三区精品视频 | www久久久| 狠狠伊人 |