四足機器人學會“雙腿站立下樓梯”!效率比腿式系統高83%
?還記得那個和特斯拉飆車的機器人嗎?
這是瑞士蘇黎世聯邦理工學院衍生公司研發的與公司同名的四足輪腿式機器人——Swiss-Mile,前身是ANYmal四足機器人。
距離它和特斯拉飆車還不到半年的時間,它又實現了重大升級。
這次升級改進了機器人的算法,運動能力直接UP UP UP !
可以雙腿站立下樓梯:
(小編內心OS:如果是我穿輪滑鞋下樓梯可能會摔個狗吃屎)
樓梯爬累了,坐個電梯吧,用前腳按開電梯門:
面對障礙物應對自如:
它還能知道什么時候該站起來,什么時候該“趴下”,雙腿直立與四足運動之間的切換更絲滑:
AMP 算法首次應用在真實機器人上
Swiss-Mile之前使用過模型預測控制(MPC)與強化學習(RL)方法,然而這需要進行繁瑣的調整才能獲得理想的運動方式。
這次的算法升級,研究人員采用了Multi-AMP(Adversarial Motion Priors對抗性運動先驗)算法增強了傳統的強化學習框架,可以在沒有啟發式的情況下自動執行多個運動先驗的模仿?標和運動選擇過程。
AMP究竟是什么呢?
這是一種基于物理角色動畫的對抗學習系統,由加州?學伯克利分校和上海交通大學的研究者提出,并且Swiss-Mile首次將該方法應用于真正的機器人身上!
對于一般的模仿學習,通常需要手動提取大量需要模仿的運動片段作為跟蹤目標,而使用AMP能夠自動選合適的動作片段來實現目標任務,它將誤差度量、相位和運動剪輯選擇外包給鑒別器,鑒別器學習區分策略和運動數據的狀態轉換。
模擬和部署訓練
研究人員將Multi-AMP 框架部署在具有 16個自由度的Swiss-Mile上,使? Isaac Gym 模擬器實現,超過 4000個機器人可以同時在 42 分鐘內訓練技能。
訓練環境由三個任務組成:
第?個任務是四足運動,運動數據由RL 策略記錄的運動組成。
第二個任務是躲避技能,讓機器?躲到桌?下?。該技能的運動數據由軌跡優化管道?成,由 MPC 控制器部署和跟蹤。
最后?項任務是“站立”到“四足”之間的運動轉換,機器人運用數據解耦技能可以用后腿站起來,?兩條腿滑行,最后使用與站起來時的相同的動作再次坐下。
最后,將Swiss-Mile部署到真實環境中,研究人員使用腿部關節的執行器模型來彌合模擬到真實的差距,并利用崎嶇地形訓練、隨機干擾等提高穩健性;如果某個關節速度超過了執行器的限制,則通過終?軌跡,讓機器人學會保持該限制的安全容差。
四足or人形機器人?效率比腿式系統高83%!
Swiss-Mile不僅是四足機器人,也是個人形機器人。
輪式與腿式相比具有許多顯著優勢,在進行了算法改良后,機器人可以直接以“人形機器人”的狀態站立起來,執行滑行、爬樓梯、下坡等高難度動作,能夠更快、更有效地移動,比四足行走要快的多,效率比腿式系統高 83%!
未來,該公司希望將輪腿機器人商業化,以完成各種任務,包括地圖、檢查、救災和城市環境中的物流等。
也許有一天,你會看到機器人將抬起來的“前腿”作為手臂,抓取快遞包裹,然后將它們放在背上的貨艙中,再回到四肢著地,以最快的速度送貨上門。?