MIT機器狗再進化,碎石冰面上跑也不打滑,這次真的穩如狗了
本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。
那群曾經集體后空翻、踢足球的MIT機器狗迷你獵豹(Mini Cheetah),瘸了?
但你別說,走得依舊挺歡快:
這可不是MIT科學家們在侵犯“機器狗權”,而是因為狗子們在新技術的加持下又進化了。
不僅壞了一條腿也能走路,之前寸步難行的碎石路更是不在話下:
還能在結冰路面轉圈撒歡兒:
不瘸的時候,速度最快能到3.9m/s,尥蹶子跑起來時,開發員只能抱著電腦在后面追得跌跌撞撞:
而上述所有的技能,最原版(也就是開源那版)的MIT機器狗僅用了3小時就完全掌握。
如此強大的學習能力到底從何而來?
3小時積累100多天奔跑經驗
首先,機器狗們的各種行為都依賴于身體里的一個專門的控制器。
工程師們會通過分析運動的物理規律,制定有效的抽象概念,再去設計并實現專門的控制器層次結構,使機器狗能夠在運行時保持平衡。
但要提前人為分析、建立所有可能的地形分析,并使機器狗快速識別對環境的變化作出反應,并不簡單。
例如,草地上的一小塊結冰面,碎石堆上突然出現的大塊凸起,都有可能使機器狗再起不能:
(所以說…不要停下來啊!)
人為設計的控制器,出現問題自然也得人為分析原因,再手動調整,一來二去的時間成本就大大增加。
怎么辦呢?
MIT的科學家們表示:
讓機器狗自己學!
研究團隊開發了一種模擬環境,其中包含了多個地形,再將狗子放在其中進行訓練。
在訓練期間,他們加入了神經網絡,讓機器狗從不同地形的跑步和失敗經驗中總結規律,進而自己找出適應新地形的最好方法。
僅僅3小時,模擬世界中的迷你獵豹就積累了100天的多樣化地形奔跑經驗。
并且,團隊也為機器狗部署了一種基于端到端的傳感運動策略的控制器。
這種控制器會將關節編碼器和IMU(慣性測量單元)數據直接轉換為關節指令,沒有了額外的狀態估計或控制子系統,機器狗在進行敏捷或極限的動作時,便會更加得心應手。
這時的迷你獵豹,就變成了一只經驗豐富的狗子。
剛剛還被絆倒的路沿,現在已經能自信地邁過去了:
高速奔跑中也不會被地上的線絆倒:
室內轉圈的速度能達到5.7rad/s(每秒320°,近一圈):
研究來自MIT CSAIL
這次的研究來自于MIT的計算機科學與人工智能研究院(MIT CSAIL),論文和代碼很快會公開。
一作Gabriel Margolis為MIT的一名博士生,主要研究領域是具身智能(Embodied Intelligence),即開發能與真實世界進行多模態交互的具有身體的人工智能。
共同一作Ge Yang本科畢業于耶魯大學,獲得了物理學和數學學士學位,后來在芝加哥大學獲得物理學博士學位。
現為美國國家科學基金會(NSF)的AI與基礎交互研究所(IAIFI)的一名博士后。
視頻:
https://www.youtube.com/watch?v=-BqNl3AtPVw