成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

一套算法控制機器人軍團!純模擬環境強化學習,Figure學會像人一樣走路

人工智能 新聞
Figure公司通過強化學習,成功實現機器人的自然步態。利用高效物理模擬器,僅用幾小時完成相當于多年訓練的數據,訓練出的策略無需額外調整即可「零樣本」遷移至真實機器人。

現在訓練機器人,都不需要真實數據了?

剛剛,Figure提出了一種全新的基于RL的端到端網絡。

只需要在純模擬環境中進行訓練,用幾個小時生成模擬數據,就能讓Figure 02像人類一樣自然行走了!

圖片

該方法的亮點如下:

  • 在模擬環境中運用強化學習,讓機器人不斷試錯,學會像人類一樣走路。
  • 通過高保真物理模擬器,僅用幾個小時,就模擬出多年的數據。
  • 將模擬中的域隨機化與機器人上的高頻扭矩反饋相結合,無需微調,就能把模擬環境中的策略應用于真實機器人。

圖片

更讓人驚喜的是,一個神經網絡策略就能控制一大批機器人!

通過一個高保真物理模擬器,Figure最新的機器人僅用幾個小時,就能模擬出幾年的數據。

圖片

為了把模擬環境的訓練成果應用到真實機器人上,團隊采用了兩種辦法。

一是在模擬訓練時進行域隨機化,讓機器人接觸不同的物理屬性;二是在真實機器人上安裝高頻扭矩反饋裝置。

這樣一來,模擬環境中訓練好的策略,無需任何微調,就可以「零樣本」遷移到真實硬件上。

圖片

在強化學習中,控制器通過不斷試錯,根據獎勵信號來調整自己的行為。

Figure在高保真模擬環境中訓練RL控制器,運行數千個具有不同參數和場景的虛擬人形機器人。

這種多樣化的訓練,使訓練出的策略能直接用在真實的Figure 02機器人上,走出穩健的人類步伐。

Figure基于RL的訓練方法,大大縮短了開發時間,在現實世界中表現也很穩定。

強化學習訓練

用強化學習方法,在GPU加速的物理模擬環境中,訓練行走控制器。

這個模擬環境效率超高,短短幾個小時就能收集到相當于數年的模擬訓練數據。

在模擬器中,數千個Figure 02機器人并行訓練,每個機器人的物理參數都不一樣。

它們會遇到各種各樣的情況,像不同的地形,執行器動力學變化,以及被絆倒、滑倒和推搡等。

這時,一個神經網絡策略學習控制所有的機器人。

圖片

人形機器人有個很大的優勢,它的硬件平臺通用性很強,能執行類似人類的任務。

不過,RL訓練出來的策略,有時不是最佳的,沒辦法讓機器人走出人類走路的感覺,比如腳跟先著地、腳尖蹬地,手臂擺動和腿部動作的配合。

所以,在訓練時,會獎勵那些走路軌跡像人的機器人,把偏好融入學習中。

這些軌跡為策略允許生成的行走風格建立了先驗條件。

除了走路軌跡像人,研究者還設置了其他獎勵條件,比如優化機器人速度跟蹤、功耗更低,更好地應對外界干擾和地形變化。

從模擬到現實的跨越

最后一步,是把模擬環境中訓練好的策略應用到真實的機器人上。

模擬機器人只是高維機電系統的近似,在模擬環境中訓練的策略只能保證在這些模擬機器人上有效,不一定能在真實機器人上正常工作。

圖片

為解決這個問題,在模擬訓練時,采用域隨機化技術,隨機改變每個機器人的物理屬性,讓策略能適應各種不同的情況。

這有助于策略零樣本泛化到真實機器人上,而無需任何額外的微調。

同時,在真實機器人上,用千赫茲速率扭矩反饋控制,來修正執行器模型的誤差。

這樣,即使機器人之間有些差異,如地面摩擦力不同,或受到外界推搡,這個策略都具有魯棒性,能讓Figure 02機器人像人一樣行走。

可以看到,10個Figure 02機器人用得都是同一個RL神經網絡。

圖片

說明現有的策略不用再做調整,就能推廣到大批機器人,對未來的大規模商業應用是個好消息。

Figure Robotics

圖片

Figure Robotics是一家新興的機器人公司,專注于開發通用人形機器人,旨在通過先進的人工智能擴展人類能力。

公司專注于構建像人類一樣學習和推理的機器人。

Figure Robotics一開始與OpenAI合作,然而在內部人工智能(Helix)方面取得「重大突破」后,于2025年2月結束了合作,Figure Robotics轉為自主開發Helix VLA模型。

Figure 02具有肉眼看起來最接近未來成熟形態的外形設計。

簡直和威爾史密斯《I,Robot》中的機器人如出一轍,渾圓的面罩模型也避免了恐怖谷效應。

圖片

身高和體重也完美模擬一個成年男性。

當機器人能像人類一樣學會自然行走,是否意味著也能像人一樣學會其他「自然」動作?

更加重要的一個「隱喻」是,目前所有的人形機器人都是按照人類的形態打造的。

這更加方便了未來機器人與人類生活的融合。

除了自然行走,機器人還有很多「人類技能」需要學習,但他們已經在路上了。

責任編輯:張燕妮 來源: 新智元
相關推薦

2022-11-29 12:53:36

機器人物理MIT

2018-10-25 22:34:34

機器人人工智能系統

2024-12-25 10:58:29

2023-02-23 15:35:14

人工智能ChatGPT聊天機器人

2022-08-08 09:02:54

Meta聊天機器人智能

2021-04-23 15:13:16

算法模型技術

2024-09-05 08:23:58

2025-06-06 14:21:45

Figure機器人快遞

2025-03-27 09:19:57

機器人訓練AI

2020-03-09 10:00:35

人工智能機器學習技術

2024-04-15 08:20:00

機器人技能

2025-03-20 13:19:04

2017-08-25 15:08:24

深度學習機器人

2019-02-15 10:38:30

機器人人工智能系統

2022-04-11 15:21:24

機器人研究變形

2023-07-20 15:18:42

2022-10-21 17:30:26

機器人

2024-02-04 13:43:49

模型訓練

2021-12-20 16:26:53

機器人人工智能技術

2015-03-16 12:50:44

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 夜夜草导航 | 国产一区二区三区久久 | 国产毛片久久久久久久久春天 | 中文在线一区二区 | 色综合久| 日韩av在线免费 | 日韩在线免费播放 | 成人亚洲片| 亚洲精品一 | 免费99精品国产自在在线 | 色www精品视频在线观看 | 国产电影一区二区在线观看 | 视频在线日韩 | 久久丁香 | 高清色视频| av免费网站在线观看 | 大乳boobs巨大吃奶挤奶 | 国产激情在线播放 | 欧美激情在线精品一区二区三区 | 亚洲视频在线看 | 亚洲欧美成人 | a级黄色片在线观看 | 日日夜夜精品视频 | 99视频在线免费观看 | 97天天干 | 精彩视频一区二区三区 | 久久精品综合网 | 亚洲在线免费 | www.日韩免费 | 国内自拍第一页 | 久久久五月天 | 欧美精品一二区 | 黑人久久| 亚洲啊v | 中文字幕在线精品 | 成人不卡| 亚洲第一视频网站 | 久久精品亚洲精品国产欧美 | 国产精品免费一区二区三区四区 | 91视频麻豆 | 日韩在线小视频 |