迪士尼玩起強化學習,新機器人有星球大戰那味了
迪士尼新機器人閃亮登場!
話不多說,先來看長啥樣——
一閃一閃的大眼睛、搖搖晃晃的腦袋、靈活擺動的觸角,還有一雙小短腿。
走起路來屁顛屁顛,關鍵還很穩:
雖然是機器,但不得不說這神態很有“靈性”:
就在剛舉行完的國際機器人頂會IROS上,迪士尼研究所研究科學家Moritz B?cher帶領團隊展示的這個新機器人,可謂萌翻全場。
雖然這個小家伙還沒有一個正式的名字,但它的表現足夠令人印象深刻。
和常見的雙足機器人最大的不同點在于,它不僅能夠在行走中保持動態平衡,還能夠通過動作表達出一些“情感”。
經研究人員介紹,這主要是因為在訓練過程中使用了團隊去年耗費一年時間研發的強化學習系統;并且還請了專業的動畫師設計動作,將動畫角色用動作表現情感的方式應用到了機器人身上。
基于此,小家伙不再是一個冷冰冰的機器。可以想見,若給它裝一個GPT大腦,家里的狗子危~~~
瑞思拜,我是大學生,給我。
不少網友看到后聯想到了星球大戰中的角色:
另一波網友認為小家伙如此“憨態可掬”,分明就是現實版瓦力(WALL-E,《機器人總動員》中的角色):
更有網友直呼感覺“站在了機器人革命的風口浪尖”:
這個小家伙走起路來為何如此平穩?開發者具體是如何賦予其“情感”的?我們接著往下看。
在瑞士森林中“漫步”
搖頭晃腦還能平穩運動的秘訣,在于頭部和腿部的設計。
其中,小家伙的頭部是一個四自由度的設計,可實現上、下、左、右四個方向傾斜觀察:
而它的腿部更是增加到五自由度,具備髖關節,因此它在行走時能夠保持動態平衡。
偷襲推它,或是故意拖拽它腳下的地毯,它都能應對自如:
挑戰更為復雜的地形,在瑞士野外森林中漫步也不在話下:
穩重又不失風情,走著走著,還能跳上一段:
據研究人員介紹,能做到這種效果,從概念提出到最終打磨成型,其實只用了不到一年的時間。
這還要得益于3D打印技術,使用模塊化硬件和執行器,大為提高了設計和迭代的速度。
再來說說賦予其“情感”。
其實這種讓機器人以有情感的方式運動是迪士尼的專長,早在上世紀六七十年代,迪士尼就開發出了機械人偶。
但隨著機器人變得愈加先進和機動,設計出能夠與其兼容的情感行為變得具有挑戰性。
為此,迪士尼搬出了王牌,請用了擅長使角色通過運動傳達情感的動畫師來為機器人設計動作。
但交由動畫師設計動作,就不得不面臨一個難題——
動畫工具通常沒有內置物理特性,動畫師的設想有時在現實中難以做到。這就使得團隊需要耗費大量時間試驗。
為了彌合這一差距,團隊用到了強化學習系統。
背后是強化學習的加持
研究團隊開發了一個基于強化學習的流程,通過模擬將動畫師的視覺設想和機器人動作相結合。
這個過程本質上是為動畫師提供了物理約束條件,確保動畫師設計的高表現力動作可以在現實中實行,或者盡可能接近機器人所能做到的程度。
迪士尼研究所的研究科學家Morgan Pope表示:
這就不僅僅是走路了,走路只是強化學習系統的輸入之一,另一個重要的輸入是如何行走。
好在這種情況下,強化學習的一大優勢是生成的運動魯棒性很好。
并且根據研究人員的說法,用該流程在一臺PC上只需幾個小時就能訓練機器人做新動作,大大縮短了開發新機器人角色所需的時間。
同時在一遍遍的訓練中,還可以對電機性能、質量分布和機器人與地面之間的摩擦力等進行細微的調整。
團隊負責人B?cher認為,“這使得迪士尼開發新機器人角色所需的時間從幾年縮短到幾個月”。
并且研究人員還強調重要的不是機器人,而是這個過程:
所以如果我們想要增加更多的腿、手臂,或者制作一個全新角色,我們可以迅速教它新的動作。現成的執行器、3D打印組件、可適應性強的強化學習框架,這些都可以應用于外觀和動作都大不相同的機器人。
而這個機器人,只是該旅程的第一步。