DeepMind開源了MuJoCo!Meta竟用來讓「骷髏手」盤核桃
骷髏手「盤核桃」見過沒?
這個神奇的「手」來自Meta剛剛發布的AI平臺MyoSuite。
嗯……終結者的即視感有了。
小扎:元宇宙的「阿凡達」們有救了
傳統行業中流行著這么一句話,「一流企業做標準,二流企業做品牌,三流企業做產品」
雖然這話有點絕對,很多參與制定行業標準的一流企業,品牌和產品更是一流的,但這句話的背后主要凸顯的是「標準」對于一個行業有多重要。
誰掌握了標準,誰就有了制定游戲規則的話語權,誰就有在業內「坐莊」的潛力。
來到AI時代,科技巨頭們同樣在爭奪「標準」這個業務高地,只不過換了不少新的名字,比如框架、平臺、基準,多少都帶了點業界標準的意思。
Meta自然也不例外。
當然,按照小扎All in元宇宙而不惜改名的這波操作,萬事皆可元宇宙。
我們可以訓練模型來完成復雜的動作,如轉筆或轉鑰匙。這項研究不僅可以加速假肢、身體康復和手術技術的發展,而且還有助于我們為元宇宙開發出更真實的化身。我們將開放這些模型的源代碼,以便研究人員可以使用它們來進一步推動這一領域。
好吧,沒想到,下面展示的竟然是轉筆,不是「抓罐子」……
但,這確實有點太粗了吧!
對了,還有轉鑰匙。(已經習慣了,不必再吐槽了)
言歸正傳,雖然目前看起來模型似乎還處在一個初期階段,但是各種細節的控制已經相當完善了。
滑動控制條伸出大拇指,然后再依次收回剩下四指,最后轉動胳膊……
來,給你豎個大拇指!
除此之外,如果研究能有進一步進展的話,確實可以讓Meta的「阿凡達」們擁有一套解剖學上正確的骨骼和動作,而不只是單純的可愛卡通形象。
神經和運動智能的「大一統」
生物體越聰明,所表現出來的運動行為就越復雜。
因此,需要考慮的一個重要問題是:是什么促成了這種復雜決策以及執行這些決策的運動控制?
Meta認為,開發MyoSuite就是為了探索這個問題。
論文地址:https://drive.google.com/file/d/10Le1OmOpy-Veb7n41ywrYLxyipoGfHtt/view
MyoSuite提供了一套肌肉骨骼模型和任務套件,用機器學習來解決生物力學控制問題。
Meta表示,MyoSuite另一個重要意義是統一了智能的兩個方面:運動智能和神經智能,并為機器學習社區開源一套全面的基準。
人類的生物力學是一個復雜的多關節、多執行器的肌肉骨骼系統。一塊肌肉的收縮涉及到多個關節的彎曲運動,每個關節的運動都由多塊肌肉控制。
在如此復雜的系統中,智能行為的合成和表達需要中樞神經系統和外周肌肉骨骼系統之間的有效協調,前者是由數十億個神經元組成的網絡合成決策,后者則是將這些意圖轉化為行動。
MyoSuite是通過對現有模型和功能研究的深入研究而開發的,其研發基礎是手臂和手的OpenSim模型,目前已經廣泛用于人類神經機械控制、人機交互和康復等領域。
為了在MuJoCo中實現這些模型,研究人員開發了一個流程開發新的模型,來進行骨骼和肌肉附著的幾何變換、臂力矩優化和肌力優化。
MyoSuite提供了一個測試幾個生理上精確的肌肉骨骼模型的組合,具體的模型構建可分為三步:
1. 幾何圖形轉換。包括關節的幾何形狀、肌肉附著點和包裹面的轉換。這個步驟是在之前工作的基礎上進行的。
2. 動力臂優化。優化MuJoCo中包裹面的三維位置。MuJoCo中包覆面的三維位置,以便實現與參考OpenSim模型相匹配的力矩臂。
3.肌肉力量優化:對MuJoCo中的肌肉參數進行優化,以實現與對照OpenSim模型相匹配的肌肉發力。經過嚴格的建模和驗證,最終建立了三個復雜程度不同的模型。
MyoSuite中包含的肌肉骨骼模型。A:MyoFinger(4個關節、5塊肌肉),B:MyoElbow:(1個關節、6塊肌肉)。C:MyoHand(23個關節、39塊肌肉)。
手指(MyoFinger): 首先建立一個簡化和直觀的模型,即一個4自由度(DoF)的手指(MyoFinger,上圖A),它是通過一系列簡化的5個拮抗性肌肉-肌腱單元來驅動的。研究團隊為其提供了簡單的扭矩驅動器,以方便比較研究。
手肘(MyoElbow):一個1自由度人類肘關節的模型,基于OpenSim的默認設置測試手臂模型,并使用多個激動劑/拮抗劑對(3個屈肌和3個伸?。┻M行驅動(上圖B)。
手(MyoHand):實際上包括前臂、手腕和手。靈巧的人手需要協調多塊高度冗余的肌肉,這些肌肉對各種關節具有互補和拮抗作用。這個更復雜的肌肉骨骼模型由29塊骨頭,23個關節,39個肌肉-肌腱單元組成(上圖C)。
多年來,人工智能領域一直試圖通過神經結構或神經網絡來模仿智能行為。而在生物力學界,主要是獨立通過體內和體外研究來開發肌肉骨骼系統,以了解外周的驅動力。
有了MyoSuite,研究人員有望在感覺-運動控制的細節上取得更大進展,依靠不同的本體感覺信號來協調全身的運動控制,這是在豐富的互動環境中表現出智能行為所需要的。
MyoSuite的生理學上真實的肌肉骨骼模型,比現有模型的計算效率和可擴展性要高出4000倍。
有了這么強大的資源和計算效率做支撐,什么轉筆、轉鑰匙、單手盤核桃等自然不在話下了。
而且,這些「花活」就是為了告訴你MyoSuite「能干什么」,未來「要干什么」,Meta也說了,主要是運動康復、假肢開發和人體工程學應用。
說不定以后的假肢,比原裝的還好用?
MuJoCo開源
說起來,從AlphaGo到MuZero,過去機器學習算法解決的復雜問題實在是不少,但在復雜運動控制的方向上一直應用不多,Meta認為,主要原因是缺乏與外界復雜環境的互動能力。
換句話說,現有框架既沒有嵌入復雜而熟練的運動任務,也沒有足夠的計算效率或可擴展性來滿足機器學習算法的數據需求。
Meta表示,MyoSuite有望彌補這些差距。
目前,MyoSuite已經在MacOs和Linux上用MuJoCo v2.1.0進行了測試。
正巧的是,DeepMind也在同日對MuJoCo進行了開源。
項目地址:https://github.com/deepmind/mujoco
MuJoCo最初由華盛頓大學運動控制實驗室主任、神經科學家Emo Todorov開發,于2015年通過創業公司Robi LLC, 被打造成了商業產品。
2021年10月,DeepMind宣布收購MuJoCo物理模擬器,并承諾將MuJoCo作為一個免費的、開源的、社區驅動的項目進行開發和維護。
對于現在的機器人研究來說,物理模擬器是其中的關鍵性工具。其通??梢苑譃樯虡I的閉源軟件,和學術界的開源軟件。
第一類對用戶來說是不透明的,雖然有時可以免費使用,但不能修改,也很難理解。第二類通常有較小的用戶群,當其開發者和維護者畢業時,就會受到影響。
MuJoCo是為數不多的由一個成熟的公司支持的全功能模擬器之一,它是真正的開源代碼。
作為一個研究驅動的組織,DeepMind將MuJoCo視為一個合作的平臺,機器人學家和工程師可以加入我們,開發世界上最好的機器人模擬器之一。
目前,DeepMind的開源工作已經完成,MuJoCo的整個代碼庫都已經上傳至在GitHub了。