成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

用MoE橫掃99個(gè)子任務(wù)!浙大等提出全新通用機(jī)器人策略GeRM

人工智能 新聞
本文分享論文GeRM: A Generalist Robotic Model with Mixture-of-experts for Quadruped Robot,由西湖大學(xué)和浙江大學(xué)聯(lián)合提出一種基于混合專家模型進(jìn)行強(qiáng)化學(xué)習(xí)的通用機(jī)器人策略。

多任務(wù)機(jī)器人學(xué)習(xí)在應(yīng)對多樣化和復(fù)雜情景方面具有重要意義。然而,當(dāng)前的方法受到性能問題和收集訓(xùn)練數(shù)據(jù)集的困難的限制。

這篇論文提出了GeRM(通用機(jī)器人模型),研究人員利用離線強(qiáng)化學(xué)習(xí)來優(yōu)化數(shù)據(jù)利用策略,從演示和次優(yōu)數(shù)據(jù)中學(xué)習(xí),從而超越了人類演示的局限性。

圖片

作者:宋文軒,趙晗,丁鵬翔,崔燦,呂尚可,范亞凝,王東林

單位:西湖大學(xué)、浙江大學(xué)

論文地址:https://arxiv.org/abs/2403.13358

項(xiàng)目地址:https://songwxuan.github.io/GeRM/

之后采用基于Transformer的視覺-語言-動作模型來處理多模態(tài)輸入并輸出動作。

通過引入專家混合結(jié)構(gòu),GeRM實(shí)現(xiàn)了更快的推理速度和更高的整體模型容量,從而解決了強(qiáng)化學(xué)習(xí)參數(shù)量受限的問題,提高了多任務(wù)學(xué)習(xí)中的模型性能,同時(shí)控制了計(jì)算成本。

通過一系列實(shí)驗(yàn)證明,GeRM在所有任務(wù)中均優(yōu)于其他方法,同時(shí)驗(yàn)證了其在訓(xùn)練和推理過程中的效率。

此外,研究人員還提供了QUARD-Auto數(shù)據(jù)集以支持訓(xùn)練,該數(shù)據(jù)集的構(gòu)建遵循文中提出的數(shù)據(jù)自動化收集的新范式,該方法可以降低收集機(jī)器人數(shù)據(jù)的成本,推動多任務(wù)學(xué)習(xí)社區(qū)的進(jìn)步。

主要貢獻(xiàn):

1. 首次提出了用于四足強(qiáng)化學(xué)習(xí)的混合專家模型,其在混合質(zhì)量的數(shù)據(jù)上進(jìn)行訓(xùn)練,從而具備習(xí)得最優(yōu)策略的潛力。

2. 與現(xiàn)有方法相比,GeRM在只激活自身1/2參數(shù)的情況下展現(xiàn)出更高的成功率,激活了涌現(xiàn)能力,同時(shí)在訓(xùn)練過程中展現(xiàn)了更優(yōu)的數(shù)據(jù)利用策略。

3.提出了一個(gè)全自動機(jī)器人數(shù)據(jù)集收集的范式,并收集了一個(gè)大規(guī)模開源數(shù)據(jù)集。

方法

GeRM網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示,包含示范數(shù)據(jù)和失敗數(shù)據(jù)的視覺-語言輸入,分別經(jīng)過編碼器和tokenizer后輸入到8層混合專家結(jié)構(gòu)的decoder中,并生成動作token,最終轉(zhuǎn)化為離散的機(jī)器人動作數(shù)據(jù)并通過底層策略部署到機(jī)器人上,此外我們用強(qiáng)化學(xué)習(xí)的方式進(jìn)行訓(xùn)練。

圖1 GeRM網(wǎng)絡(luò)結(jié)構(gòu)圖

GeRM Decoder是一個(gè)包含 Transformer Decoder架構(gòu)模型,其中前饋網(wǎng)絡(luò)(FFN)從一組 8 個(gè)不同的專家網(wǎng)絡(luò)中選擇。

在每一層,對于每一個(gè)標(biāo)記,門控網(wǎng)絡(luò)選擇兩個(gè)專家來處理token,并將它們的輸出加權(quán)組合。

不同的專家擅長不同的任務(wù)/不同的動作維度,以解決不同場景中的問題,從而學(xué)習(xí)跨多個(gè)任務(wù)的通用模型。該架構(gòu)擴(kuò)大了網(wǎng)絡(luò)參數(shù)量,同時(shí)保持計(jì)算成本基本不變。

圖片

圖2 Decoder結(jié)構(gòu)圖

我們提出了一個(gè)自動的范式來收集機(jī)器人多模態(tài)數(shù)據(jù)。通過這種方式,我們構(gòu)建了一個(gè)大規(guī)模的機(jī)器人數(shù)據(jù)集QUARD-Auto,其中包含演示和次優(yōu)數(shù)據(jù)的組合。它包括5個(gè)任務(wù)和99個(gè)子任務(wù),總共有257k條軌跡。我們將進(jìn)行開源以促進(jìn)機(jī)器人社區(qū)發(fā)展。

表1 數(shù)據(jù)集介紹

圖3 數(shù)據(jù)量統(tǒng)計(jì)

實(shí)驗(yàn)

我們進(jìn)行了一系列全面而可靠的實(shí)驗(yàn),涵蓋了所有 99 個(gè)子任務(wù),每個(gè)子任務(wù)進(jìn)行了 400 條軌跡的精心測試。

如表1所示,GeRM在所有任務(wù)中具有最高的成功率。與 RT-1 和其他GeRM 的變體相比,它有效地從混合質(zhì)量的數(shù)據(jù)中學(xué)習(xí),優(yōu)于其他方法,并在多任務(wù)中展現(xiàn)出優(yōu)越的能力。與此同時(shí),MoE 模塊通過在推理時(shí)激活部分參數(shù)來平衡計(jì)算成本和性能。

表2 多任務(wù)對比實(shí)驗(yàn)

GeRM表現(xiàn)出令人稱贊的訓(xùn)練效率。與其他方法相比,GeRM 僅需極少的batch就獲得了極低的Loss和較高的成功率,凸顯了GeRM優(yōu)化數(shù)據(jù)利用策略的能力。

圖4 成功率/Loss變化曲線

GeRM 在動態(tài)自適應(yīng)路徑規(guī)劃方面展現(xiàn)出了涌現(xiàn)能力。如視頻所示,四足機(jī)器人在初始位置視野受限,難以確定移動方向。為了避開障礙物,它隨機(jī)選擇向左轉(zhuǎn)。

隨后,在遇到錯誤的視覺輸入后,機(jī)器人執(zhí)行了大幅度的重新定向,以與原始視野之外的正確目標(biāo)對齊。然后,它繼續(xù)向目的地駛?cè)ィ罱K完成任務(wù)。

值得注意的是,這樣的軌跡不屬于我們的訓(xùn)練數(shù)據(jù)集分布之內(nèi)。這表明 GeRM 在場景背景下的動態(tài)自適應(yīng)路徑規(guī)劃方面具有涌現(xiàn)能力,即它能夠根據(jù)視覺感知進(jìn)行決策、規(guī)劃未來路徑,并根據(jù)需要改變下一步行動。

圖5 涌現(xiàn)能力

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2025-03-19 10:26:10

2024-10-06 12:32:42

2023-08-21 13:31:36

2024-08-19 14:05:00

2022-06-20 11:05:58

通用人工智能機(jī)器人

2017-03-15 19:03:22

人工智能人類半機(jī)器人

2025-05-30 08:55:00

機(jī)器人AI訓(xùn)練

2022-05-06 13:59:10

機(jī)器人研發(fā)

2021-09-03 16:12:52

機(jī)器人人工智能編程

2015-11-23 18:21:45

Udesk

2020-10-15 15:42:00

人工智能

2024-06-20 14:12:53

2025-03-21 10:21:19

2021-04-01 10:51:44

機(jī)器人人工智能編程

2021-07-22 10:17:55

加密機(jī)器人加密貨幣機(jī)器人

2021-08-19 15:44:20

機(jī)器人人工智能機(jī)器學(xué)習(xí)

2015-07-28 09:36:11

機(jī)器人

2024-11-04 14:35:00

AI機(jī)器人

2016-01-11 19:33:20

Segway
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 亚洲性综合网 | 国产精品一区二区av | 国产综合精品一区二区三区 | 久久成人精品一区二区三区 | 国产欧美二区 | 91麻豆精品国产91久久久资源速度 | 污污免费网站 | 欧美 日韩精品 | 国内自拍真实伦在线观看 | 欧美精品在线视频 | 999久久久久久久 | 在线观看成人精品 | 国产一区二区三区四区三区四 | 天天亚洲| av免费看片 | 青青草在线视频免费观看 | 一级黄色片网址 | 韩国理论电影在线 | xxxxx免费视频 | 黄色大片在线 | 91免费福利在线 | 色婷婷综合久久久中字幕精品久久 | 在线免费观看黄色 | 亚洲精品91 | 激情小视频 | 成人av免费在线观看 | 亚洲精品www | 中文字幕精品一区二区三区精品 | 亚洲欧美日韩中文字幕一区二区三区 | 91在线精品一区二区 | 人人草人人干 | 日韩精品一区二区三区四区视频 | 天天躁日日躁狠狠躁2018小说 | 久久久www成人免费无遮挡大片 | 亚洲精品天堂 | 国产成人高清 | 欧美极品视频在线观看 | 亚洲一区二区高清 | 国产精品不卡视频 | 午夜激情一区 | 综合精品在线 |