成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

3B模型打通機器人任督二脈!沖咖啡疊衣服都能干,7種形態適配,OpenAI也投了

人工智能 新聞
在官宣當中,π團隊展示了疊衣服、整理桌子、雞蛋裝盒等等復雜(對機器人來說)任務。

只要一個3B參數的大模型,就能控制機器人,幫你搞定各種家務。

疊衣服沖咖啡都能輕松拿捏,而且全都是由模型自主控制,不需要遙控。

關鍵是,這還是個通用型的機器人控制模型,不同種類的機器人都能“通吃”。

請看VCR:

這些操作背后的大模型叫做π0,參數量只有3B,來自今年剛成立的初創公司Physical Intelligence(簡稱π)

創立之后不久,π公司就獲得了7000萬美元(約5億人民幣)的A輪融資,投資者中還包括OpenAI

而公司的目標,就是開發通用的機器人控制模型,現在的π0,就是其首項成果。

有網友直言,π0控制的機器人,是他見過最接近真正的通用機器人的。

圖片

關鍵是,參數量只有3B,算力消耗非常小,如果和同規模的模型性能特征相近,廉價顯卡就能帶動。

圖片

Hugging Face的機器人團隊領軍人物、前特斯拉Optimus團隊成員Remi Cadene也說,如果π0能開源的話,人們自己在家就能體驗了。

圖片

7種機器人都能控制

在官宣當中,π團隊展示了疊衣服、整理桌子、雞蛋裝盒等等復雜(對機器人來說)任務。

這些任務不僅需要長時間、多階段的連續決策,還要求動作同時具備高頻率與精細程度。

許多任務更是涉及了復雜的接觸動力學,如衣物的變形塑性、紙箱的剛性、雞蛋的脆弱性等。

機器人需要精準建模并控制這些動力學過程,甚至滿足更多物理約束,如保持物體平衡、避免碰撞。

但總之最后π團隊還是成功了,π0不僅能控制機器人,還能控制不同的機器人,出色地完成這些任務。

圖片

比如讓雙臂可移動機器人收拾洗好的衣服。

只見機器人站到洗衣機前,打開了艙門,然后將洗好的衣服取出放入筐內。

圖片

然后又來到一張桌子旁,將筐里的衣服取出、鋪開然后疊好。

圖片

還有讓另一種雙臂機器人把盤子里的雞蛋裝入盒子中,之后再把盒子蓋好。

圖片

甚至有條不紊地折疊好一個展開的紙盒。

圖片

而且知道利用工具,比如這個機器人,用叉子把剩余的食物裝進了打包盒。

圖片

到了收拾桌子的任務當中,負責執行的機器人又變成了單臂。

它可以把要保留的物品放入收納筐,將不需要的垃圾丟進垃圾桶。

圖片

并且在物品和垃圾混合放置時也能準確操作。

圖片

當然從數據上看,π0在零樣本泛化能力、語言控制響應、新任務學習、多階段任務等維度上也表現優異。

圖片

零樣本泛化能力上,π0在所有任務上都顯著超過了baseline模型,即使未加入預訓練視覺模型的π0-small也比這些baseline表現優異。

圖片

指令處理上,π0在3個語言指令任務上,經人類指導取得了最好的自主表現,高層策略指導也有提升。

圖片

在與預訓練數據差異較大的新任務上,π0在大多數任務上性能最好,尤其在微調數據量較小時優勢明顯。

這意味著,不需要專門訓練,π0就能讓機器人自動完成很多開放性任務。

圖片

最后在一系列極具挑戰的復雜任務上,π團隊通過結合微調和語言指令對π0進行了測試。

結果π0能夠完成折衣服、整理餐桌、組裝紙箱、裝雞蛋等長達5-20分鐘的任務,取得了50%以上的平均得分。

效率方面,官方技術報告中公布了π0在4090上的運行時間。

一次完整的前向傳播也需要73-86毫秒,這對實時性要求高的場景可能還有挑戰。

但考慮到流匹配過程能生成50個動作步,平均下來每個動作步的生成時間也并不高。這

所以從整體上看,π0的計算效率,或者說實時性,還是比較高的,當然離網友們期待的家家可用,可能還需要再提速一些

圖片

那么,π團隊在π0模型上,都運用了什么樣的技術呢?

視覺大模型魔改而成

π0是基于視覺模型PaLM-ViT改造而成,在其基礎上增加了一個投影層、一個多層感知機,以及一個較小的動作專家模塊

其中投影層用于處理機器人狀態和動作的輸入輸出,多層感知機用于整合流匹配(flow matching)時間步信息,專家模塊則用單獨的權重處理機器人狀態和動作tokens。

模型的輸入包括圖像、語言指令、機器人本體感受狀態和噪聲動作塊。

圖像和語言tokens送入VLM主干網絡,狀態和動作tokens送入動作專家模塊。

最終,模型會輸出動作塊的向量場表示。

圖片

對于連續動作分布的建模,π0模型使用了條件流匹配(conditional flow matching)方法。

流匹配的工作方式和擴散模型有些類似,核心思想都是通過逐步添加噪聲來簡化數據分布,然后逐步去噪得到隱私數據——

訓練時,隨機對動作施加高斯噪聲,并訓練模型輸出去噪向量場;推理時,從高斯噪聲開始,通過數值積分向量場生成動作序列。

不同之處在于,流匹配直接對數據和噪聲分布之間的映射場(vector field)進行建模,訓練目標是匹配這一映射場,而擴散模型通常學習的是每個去噪步驟的條件分布。

流匹配方法能夠高精度地建模復雜多峰分布,非常適合高頻靈巧操作任務

訓練數據方面,π0是在迄今為止最大的機器人交互數據集上進行訓練的。

預訓練階段的數據集中包括OXE、DROID、Bridge等開源數據,以及團隊在8個不同的機器人平臺中收集的大量靈巧類任務數據等內容。

團隊自己收集的數據集括68個任務,涉及單臂任務106M步、雙臂任務797M步,數據采用了50Hz高頻控制。

開源數據和團隊自己收集的數據,比例大約是1:9。

圖片

另外為了讓π0掌握特定復雜技能,團隊在20多個下游任務上進行了微調。

根據任務的難度和相似度,微調數據量從5小時到100多小時不等,一些任務還結合了高層語言策略模塊來分解復雜目標。

用團隊成員切爾西·芬(Chelsea Finn)的話說,預訓練是為了讓模型能夠應對各種場景,后訓練(微調)則是讓π0掌握更多的策略。

圖片

“不造機器人”的機器人公司

Physical Intelligence公司成立于今年,已經獲得總計7000萬美元的A輪融資。

融資由紅杉資本領先,此外還有包括OpenAI在內的6家公司參投。

公司還有個簡稱叫做π,因為Physical Intelligence的縮寫pi,剛好是π的拉丁轉寫。

圖片

雖然是家機器人公司,但π并不生產機器人硬件,只負責訓練模型,目標是構建能夠通用的機器人模型。

對此,π的聯合創始人兼CEO卡羅爾·豪斯曼(Karol Hausman)在公開場合解釋:

我們的目標是通過一個通用模型將AI帶入物理世界,這個模型可以為任何機器人或任何物理設備提供動力,基本上適用于任何應用。

對于此事的意義,公司另一名聯創謝爾蓋·萊文(Sergey Levine)在推特上舉例說明,π創業要做的事之于機器人控制,其重要程度就像NLP之于大模型。

圖片

π的創始人背景也都十分亮眼,都是機器人和AI專家,在機器人、工程和許多其他領域擁有深厚經驗。

CEO卡羅爾·豪斯曼(Karol Hausman),此前曾是谷歌大腦機器人操作研究主管,2021年至今兼任斯坦福客座教授。

圖片

聯合創始人謝爾蓋·萊文(Sergey Levine),UC伯克利電氣工程和計算機科學系副教授,谷歌學術被引用量為超過12.7萬。

而且還是不折不扣的頂會狂魔,據不完全統計,萊文2018年在ML和NLP頂會上共發表22篇論文,與另外兩人并列全球第一……

萊文在UC伯克利還是個網紅教授,此前推出的深度學習課程Deep Reinforcement Learning(深度強化學習,課程代號CS 285)非常受歡迎。

同時,在斯坦福家務機器人ALOHA的相關論文中,萊文的名字也經常出現。

圖片

聯創切爾西·芬(Chelsea Finn),斯坦福計算機科學和電氣工程系助理教授,谷歌學術論文引用數超4.7萬。

在ALOHA團隊的論文當中,芬經常以通訊作者的身份出現。

圖片

此外,還有谷歌大腦機器人團隊前科學家布賴恩·伊希特(Brian Ichter)、豐田研究院ML研究團隊的研究科學家蘇拉吉·奈爾(Suraj Nair)等。

可以說陣容是非常豪華了。

擁有超級團隊的π,也仍在繼續招兵買馬,在研究科學家、ML工程師、數據工程師等多個崗位招聘員工和實習生。

圖片

技術報告:https://www.physicalintelligence.company/download/pi0.pdf

責任編輯:張燕妮 來源: 量子位
相關推薦

2021-02-26 21:59:22

Git版本系統

2016-10-20 09:29:38

云極星創云計算

2021-04-20 19:20:57

Kafka架構設計

2010-05-04 17:58:22

云計算

2015-07-14 09:00:16

DR Rapid戴爾DR系列

2013-10-28 15:29:49

數字家庭三網融合

2009-06-24 15:21:00

路由器下載速度

2018-01-26 09:37:04

DBAMySQL架構

2024-04-02 11:13:59

機器人人工智能自變量機器人

2016-02-22 14:28:52

2014-04-01 09:31:47

打通任督二脈:用友NC

2018-12-20 11:12:44

機器人算法伯克利

2010-12-20 15:00:43

2019-01-07 19:49:31

Oracle NetS一體化管理

2010-05-20 11:30:47

OA協作平臺寶時得鼎捷軟件

2018-08-13 18:13:00

大數據

2020-05-20 14:41:11

微軟機器學習Windows

2024-09-02 10:00:00

機器人開源

2021-12-13 07:02:47

硬件軟件CPU
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 97av视频在线观看 | 日本久久综合网 | 日韩精品免费 | 日本天堂一区二区 | av在线播放一区二区 | 高清一区二区三区 | 亚洲一区二区三区久久久 | 亚洲国产成人av好男人在线观看 | 国产在线精品免费 | 久久久精| 精品国产一区二区国模嫣然 | 欧美专区在线 | 龙珠z在线观看 | 精品伊人久久 | av免费在线观看网站 | 日韩精品视频一区二区三区 | 日韩欧美视频 | 51ⅴ精品国产91久久久久久 | www.久久精品| 久久久精品影院 | 中国一级特黄毛片大片 | 日韩av福利在线观看 | 超碰在线国产 | 色综合色综合色综合 | 国产欧美在线一区 | 久久一久久 | 亚洲精品视频免费看 | 亚洲视频免费观看 | 亚洲人成网站777色婷婷 | 青青草网站在线观看 | 久久久精品国产 | 免费午夜剧场 | 手机av网| 99热.com | 在线观看的av | 午夜免费网站 | 精品欧美一区二区精品久久久 | 免费国产一区 | 久久久久亚洲精品 | 国产成人精品a视频一区www | 91精品中文字幕一区二区三区 |