成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

25分鐘訓練機器人學會6個動作,伯克利開發(fā)高效機器人操縱框架

新聞 人工智能
這是來自加州大學伯克利分校的一項新研究——高效機器操作框架Framework for Efficient Robotic Manipulation(FERM),專門對機械臂進行高效率操作的算法訓練。

 本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯(lián)系出處。

這個機械臂正在完成夠、拿、移、推、點、開等6個動作。

而且動作嫻熟,還不存在失誤。

更令人意外的是,訓練這個機械臂,只花了短短25分鐘

即使有人為干擾,它也能夠成功完成抓取動作。

還能抓起以前沒有見過的物體形狀。

這就是來自加州大學伯克利分校的一項新研究——高效機器操作框架Framework for Efficient Robotic Manipulation(FERM),專門對機械臂進行高效率操作的算法訓練。

FERM為什么比其他方法效率高?

目前來看,大多數針對機器人訓練的的RL算法效率都不是很好。

采用稀疏獎勵的方法訓練Dota5游戲的人機操作,使之成為達到人類玩家的高手水平,需要花180年的游戲時間。

訓練一個機械臂的手勢,則需要上千萬的模擬學習的樣本和兩周的訓練時間。

Sim2Real模擬學習這兩個方法稍微好點。Sim2Real需要接受模擬訓練,再將訓練結果運用到現實事例中。

模擬學習則需要通過一系列的專業(yè)訓練示范案例和監(jiān)督學習,才能得出最后的訓練策略,實驗結果非常依賴于輸入示范案例的質量。

FERM優(yōu)勢在于,既沒有依靠模擬訓練轉換到現實,也不用高度依賴于輸入的示范案例的質量。

而是基于非監(jiān)督性表征學習和數據擴張技術,使用了pixel-based RL

因此,它僅僅需要10個Demo,25分鐘的訓練時間,就可以讓機器人學會六個動作

FERM具體怎么訓練?

FERM采用了基于像素的強化學習(pixel-based RL)方法。

具體而言,先收集小部分演示數據,并且將這些數據存放在“回放緩沖區(qū)”上。

然后,用觀察結果結合對比損失量,來對編碼器進行預訓練。

而后,編碼器和“回放緩沖區(qū)”運用一種線下的數據來加強RL算法,對RL智能體進行訓練。

在論文中,研究人員總結了FERM主要優(yōu)點:

1、高效率:FERM可以學習6種不同操作任務的最優(yōu)策略,在15-50分鐘的訓練時間內完成每項任務。

2、簡單統(tǒng)一的框架:框架結合現有的組成部分,將無監(jiān)督的預訓練和在線RL與數據擴充成一個單一高效的框架。

3、常規(guī)輕量設置:實施起來只需要一個機器人、一個GPU、兩個攝像頭、幾個演示,以及稀疏獎勵函數等等。

具體的實驗結果如何?

實驗結果

這項實驗采用像素觀察的方法執(zhí)行了一系列任務。下圖的每一欄顯示了初始、中間、結果等三個狀態(tài)。只有當機器人完成任務時,才會獲得稀疏獎勵。

這個訓練算法的效率可謂很高了。具體完成時間如下圖表格所示,在30分鐘左右,它就可以讓機器人學習操作任務。而簡單的“夠”(Reach)動作,則只需要三分鐘

實驗結果稱,它不需要很多的Demo,也不需要到大量的設備,首次完成任務的平均時間為11分鐘,并且可以在25分鐘內訓練出6個機械動作。

所以研究人員驕傲地說:

“據我們所知,FERM是第一個能在不到一小時的時間內,能通過像素點直接完成來自不同組、采用稀疏獎勵方法的機器操作任務。”

而根據相關報告,未來十年,制造業(yè)將需要460萬個崗位。許多制造商也都在轉向自動化生產,機械自動化將占比越來越高。FERM這樣的高效訓練框架,可謂是制造業(yè)福音。

 

 

責任編輯:張燕妮 來源: 量子位
相關推薦

2019-01-15 13:14:03

機器人算法SAC

2024-08-19 14:05:00

2025-05-09 08:50:00

機器人訓練AI

2024-03-26 15:43:00

訓練數據機器人

2022-10-28 13:16:07

四足機器人機器人人工智能

2017-03-27 09:59:25

機器人自創(chuàng)語言交流

2019-12-24 09:31:55

機器人人工智能編程

2023-07-29 13:14:40

谷歌人工智能

2025-04-09 09:34:00

2025-05-21 08:53:00

2017-07-24 09:02:27

2025-06-11 14:45:26

機器人訓練數據

2024-02-21 12:20:00

AI訓練

2022-10-21 17:30:26

機器人

2022-03-23 10:52:07

機器人神經網絡系統(tǒng)

2022-08-27 15:10:36

Ameca機器人模仿

2020-10-15 15:42:00

人工智能

2022-06-30 17:53:56

機器狗智能

2021-03-30 17:51:25

機器人系統(tǒng)聊天

2024-10-29 15:20:00

強化學習模型
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 九九热免费看 | 99在线免费观看视频 | 欧美一级片免费看 | 一本一道久久a久久精品综合蜜臀 | 国产精品1区 | 搞黄网站在线观看 | 日韩中文字幕在线视频 | 欧美精品91 | 欧美激情国产精品 | 国产精品久久 | 午夜三级在线观看 | 91麻豆产精品久久久久久 | 精品福利在线 | 精品在线播放 | 免费毛片网站在线观看 | 黄色大片免费观看 | 一级毛片色一级 | 成人免费三级电影 | 欧美精品第一页 | 国产免费福利 | 午夜精品一区二区三区在线 | 精品免费国产一区二区三区 | 亚洲一区二区视频 | 毛片区 | 欧美一区二区三区在线观看 | 精品视频在线播放 | 国产成人精品久久 | 一级毛片视频在线观看 | 偷派自拍 | 久久久久久免费毛片精品 | 中文字幕一区二区三区精彩视频 | 精品国产女人 | 欧美美乳 | 日韩一区二区三区视频 | 国产成人精品免费 | 国产高清在线精品 | 夜夜爽99久久国产综合精品女不卡 | 精品国产乱码久久久久久老虎 | 欧美极品在线视频 | 久久久久无码国产精品一区 | 国产成人av免费看 |