成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

谷歌AGI機器人大招!54人天團憋7個月,強泛化強推理,DeepMind和谷歌大腦合并后新成果

人工智能 新聞
只需用人話下達命令,面前這個小家伙就能揮動機械臂,思考并完成“主人的任務”。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

爆火的大模型,正在重塑谷歌DeepMind的機器人研究。

最新成果之一,就是他們耗時7個月打造的機器人項目RT-2,狠狠在網上火了一把:

圖片

效果究竟有多好?

只需用人話下達命令,面前這個小家伙就能揮動機械臂,思考并完成“主人的任務”。

像是給流行歌手霉霉(Taylor Swift)遞水、或是辨認明星球隊Logo:

圖片

甚至能主動思考,讓它“撿起已滅絕的動物”,就能從獅子、鯨魚、恐龍這三個塑料玩具中準確pick恐龍。

用網友的話來說,別小看這個能力,這是實現了從“滅絕的動物”到“塑料恐龍”的邏輯飛躍

更“要命”的是,它還能輕松解決“給疲憊的人選一種飲料”這種需要結合思想鏈的多階段推理問題——一聽到命令小手就直奔紅牛而去,簡直不要太聰明。

有網友看完感嘆:

等不及了,趕緊快進到給人類洗碗(手動狗頭)

圖片

據了解,谷歌DeepMind這項成果由54位研究員合作產出,前前后后拉扯7個月,最終才變成我們看到的這樣“so easy”。

圖片

《紐約時報》介紹稱,谷歌DeepMind機器人技術主管Vincent Vanhoucke認為,大模型徹底改變了他們部門的研究方向:

由于(大模型)這一變化,我們不得不重新考慮整個研究項目。

我們之前研究的很多東西,都已經完全失效了。

所以,RT-2究竟能實現什么樣的效果,這研究又具體是怎么一回事兒?

將多模態大模型“塞進”機械臂

這個名叫RT-2(Robotic Transformer 2)的機器人項目,是去年年底發布的RT-1的“進化版”。

相比于其他的機器人研究,RT-2的核心優勢在于,不僅能理解“人話”,還能對“人話”進行推理,并轉變為機器人能理解的指令,從而分階段完成任務。

具體來說,它具備三大能力——符號理解(Symbol understanding)推理(Reasoning)人類識別(Human recognition)

第一個能力是“符號理解”,能將大模型預訓練的知識,直接延展到機器人此前沒見過的數據上。例如機器人數據庫中雖然沒有“紅牛”,但它卻能從大模型的知識中理解并掌握“紅牛”的外貌,并拿捏物品。

第二個能力是“推理”,這也是RT-2的核心優勢,要求機器人掌握數學、視覺推理和多語言理解三大技能。

技能一,包含數學邏輯推理的命令,“將香蕉放到2+1的總和的位置”:

圖片

技能二,視覺推理,像是“將草莓放進正確的碗中”:

圖片

技能三,多語言理解,即使不用英語也能完成指令,例如用西班牙語命令它“從一堆物品中挑出最與眾不同的那個”:

圖片

第三個能力是人類識別,準確識別并理解人類的行為,像開頭看到的“將水遞給泰勒·斯威夫特”例子就是能力展現之一。

那么,這三個能力是怎么實現的?

簡單來說,就是將視覺-文本多模態大模型(VLM)具備的“推理”、“識別”、“數學”等能力,和機器人的操作能力結合起來。

為了實現這一點,研究人員直接給視覺-文本大模型(VLM)增加了一個模態,叫做“機器人動作模態”,從而把它變成了視覺-文本-動作大模型(VLA)

圖片

隨后,將原本非常具體的機器人動作數據,轉變成文本token。

例如將轉動度數、放到哪個坐標點等數據,轉變成文本“放到某個位置”。

這樣一來,機器人數據也能被用到視覺-語言數據集中進行訓練,同時在進行推理的過程中,原本的文本指令也會被重新轉化為機器人數據,實現控制機器人等一系列操作。

沒錯,就是這么簡單粗暴(手動狗頭)

在這次的研究中,團隊主要基于谷歌的一系列基礎大模型來“做升級”,包括50億和550億的PaLI-X、30億的PaLI以及120億的PaLM-E

為了提升大模型本身的能力,研究人員也下了不少功夫,把最近爆火的思維鏈、向量數據庫和無梯度架構(no-gradient architectures)都用上了。

這一系列操作,也讓RT-2和去年發布的RT-1相比,具有了不少新優勢。

下面就來看看具體的實驗結果。

性能可達RT-1三倍

RT-2使用上一代機器人模型RT-1的數據進行訓練(也就是說數據沒變,只是方法不同了)

這些數據是用13個機器人在辦公室搭建的一個廚房環境中耗時17個月收集到的。

在實際測試中(一共歷經6000次),作者給了RT-2許多以前未見過的物體,需要RT-2在微調數據之外進行語義理解來完成任務。

結果完成的都相當不錯:

包括從簡單的識別字母、國旗、人物到從玩偶中識別陸生動物、選出顏色不相同的那只,甚至是撿起快要從桌上掉下去的零食等復雜的命令。

圖片

而從符號理解、推理和人類識別這三個細分能力上來看,RT-2的兩個變體都比RT-1和另一種視覺預訓練方法VC-1要好很多,性能最高可達3倍。

如前文所述,這兩個變體分別在120億參數的PaLM-E和550億參數的PaLI-X上進行訓練。

圖片

具體的泛化能力評估上,通過與多個基線模型的多類細分測試,最終發現RT-2性能提高了大約2倍。

圖片

(稍顯遺憾的是,我們還沒看到它和其他團隊最新基于LLM的機器人方法進行對比)

而為了更好地理解RT-2的不同設置如何影響泛化結果,作者又設計了兩大類評估:

一是在模型尺寸上,僅在RT-2 PaLI-X變體分別采用50億參數與550億參數進行訓練;

二是訓練方法上,分別采用從頭開始訓練模型vs微調vs協同微調的方法。

最終結果表明,視覺語言模型預訓練權重的重要性以及模型泛化能力有隨著模型大小而提高的趨勢。

圖片

另外,作者還在開源語言表基準上評估了RT-2,結果顯示它在模擬基準上實現了SOTA結果(90%vs之前的77%)

最后,由于RT-2 PaLM-E變體是一個視覺-語言-動作模型,可以在單個神經網絡中充當LLM、VLM和機器人控制器,因此RT-2還可以執行可控的思想鏈推理。

如下圖所示的5個需要推理的任務中(尤其最后一個非常有意思:選擇可以替代錘子的物品),它接到命令后會先輸出自然語言步驟,然后再給出具體的動作token。

圖片

最最后,總結來說,這個最新的RT-2模型,不僅能更好地適用于不同的、機器此前沒見過的場景中,泛化能力更好了;與此同時,由于有了更好的大模型加持,它也掌握了一些有難度的新能力,比如推理。

One More Thing

谷歌將機器人研究的重心放在大模型上,似乎也不是“空穴來風”。

就在這兩天,他們和哥倫比亞大學合作的一篇關于“用大模型幫助獲取更多機器人操作技能”的論文,同樣很火:

圖片

這篇論文提出了一種新的框架,不僅能讓機器人很好地適應大模型,同時還能保留原本機器人的基礎操作和控制能力:

圖片

和RT-2有所不同的是,這一項目已經開源:

圖片

屬實是用大模型帶動整個機器人部門升級了。

再聯想到前不久李飛飛團隊的具身智能成果,可以說,用大模型帶動機器人著實成為一種研究趨勢,且已經讓我們看到了一波非常有潛力的進展。

對于這個研究方向,你有哪些期待?

項目地址:https://robotics-transformer2.github.io/

責任編輯:張燕妮 來源: 量子位
相關推薦

2023-09-21 10:29:01

AI模型

2019-03-27 09:27:06

機器人人工智能系統

2024-01-25 11:14:33

2010-02-05 10:31:46

谷歌機器人

2024-01-05 13:27:00

AI訓練

2018-01-09 16:37:09

谷歌安卓支付

2023-01-27 13:56:29

ChatGPTMetaOpenAI

2023-04-21 15:49:13

谷歌DeepMind

2024-01-05 19:44:48

谷歌機器人憲法AI

2023-05-11 09:57:27

谷歌OpenAI開發聊天機器人

2025-03-13 10:28:07

2023-11-13 07:36:27

自動駕駛等級

2023-10-31 15:26:10

人工智能

2022-08-17 14:35:49

谷歌機器人模型

2024-01-05 09:16:22

谷歌機器人人工智能

2019-04-07 18:44:57

谷歌機器人Android

2023-11-02 15:34:00

數據訓練

2024-06-17 13:34:54

2021-03-25 09:25:55

機器人人工智能系統
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲免费在线 | 在线观看免费av网 | 亚洲一区二区三区在线观看免费 | 在线观看国产h | 请别相信他免费喜剧电影在线观看 | 欧美日韩精品亚洲 | 97色在线观看免费视频 | 西西裸体做爰视频 | 亚州无限乱码 | 涩涩视频在线看 | 久久国产激情视频 | 日韩欧美二区 | 欧美国产亚洲一区二区 | 4hu最新网址| 久久亚洲欧美日韩精品专区 | 欧美日韩不卡合集视频 | 狠狠干2020 | 黄视频网站免费观看 | 欧美日韩一卡 | 91精品久久久久久久久 | 免费在线观看91 | 国产精品视频一区二区三 | 中文字幕色站 | 国产免费又色又爽又黄在线观看 | 福利网站导航 | 亚洲人成人一区二区在线观看 | 色播久久久| 国产日产精品一区二区三区四区 | 日韩精品无码一区二区三区 | 酒色成人网| 亚洲综合色视频在线观看 | 亚洲 欧美 另类 综合 偷拍 | 在线观看亚洲 | 国产精品资源在线 | 中文字幕日韩在线观看 | 金莲网| 欧美精品一区二区三区在线 | 天天天堂| 一区二区三区精品视频 | 久久久精品 | 欧美精品久久久 |