成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

拋棄OpenAI,Figure亮王牌:史上首次兩個機器人「共腦」,網友直呼太恐怖!

人工智能
就在剛剛,Figure祭出首個人形視覺-語言-動作模型Helix。機器人學會像人一樣推理,聽從自然語言絲滑拿起任何物體。破紀錄的是,這個AI能夠首次同時操控兩臺機器人,讓它們「共腦」合作!網友:不寒而栗。

與OpenAI分手之后,Figure自研首個模型終于交卷了!

不用ChatGPT,Figure直接把視覺-語言-動作模型(VLA)——Helix裝入人形機器人大腦。

它可以讓機器人感知、語言理解、學習控制,是一個端到端的通用模型。

圖片圖片

果然,Figure的一大目標,就是發展家庭機器人。為此,其內部的AI需要像人一樣推理,需要處理任何家庭用品。

圖片圖片

「機器人若不實現能力上的飛躍,將無法進入家庭領域」

目前,Helix還主要用于Figure上半身控制,包括手腕、頭、單個手指、甚至軀干,能以高速率執行復雜任務。

只需一句話,機器人便可以拿起任何物品。

當被要求「撿起沙漠物品」時,Helix會識別出玩具仙人掌,選擇最近的手,并執行精確的電機指令以牢固地抓住它。

圖片圖片

還有生活中各種小物件,比如金屬鏈、帽子、玩具等等,它皆精準「拿捏」。

圖片圖片

快看,它還會將物品放置在冰箱,而且是兩個Figure協作完成。

圖片圖片

這是因為Helix是首個同時操控兩臺機器人的VLA,使他它們能夠解決共同的、長序列操作任務,即使是處理從未見過的物品。

有網友表示,這一刻讓我瞬間不寒而栗。

圖片圖片

另有網友表示,「這非常令人印象深刻」,甚至有人馬上想要買兩臺體驗一下。

圖片圖片

圖片圖片

圖片圖片

值得一提的是,新款模型采用單一神經網絡權重學習所有行為,無需任何特定的微調。

而且,它還是首款完全在嵌入式低功耗GPU上運行的VLA,未來商業部署,甚至走入家庭近在咫尺。

Helix:通用視覺-語言-動作模型

家庭環境是機器人技術面臨的最大挑戰。

與可控的工業環境不同,家庭中充滿了無數物品——易碎的玻璃器皿、褶皺的衣物、散落的玩具——每個物品都有著不可預測的形狀、尺寸、顏色和質地。

要想讓機器人在家庭中發揮作用,它們需要能夠生成智能化的新行為來應對各種情況,特別是對于那些此前從未見過的物品。

如果沒有質的飛躍,當前的機器人技術將無法適應家庭環境。

目前,僅僅教會機器人一個新行為就需要大量人力投入:要么需要博士級專家花費數小時進行手動編程,要么需要數千次示教。

考慮到家庭環境問題的龐大性,這兩種方法的成本都高得難以承受。

圖片圖片

圖1:不同機器人技能獲取方法的擴展曲線。在傳統啟發式控制中,技能的增長取決于博士研究人員的手動編程。在傳統機器人模仿學習中,技能隨數據采集量擴展。而采用Helix技術,只需通過自然語言即可實時定義新技能

但在人工智能的其他領域已經掌握了即時泛化的能力。

如果我們能夠將視覺語言模型(Vision Language Models,VLM)中捕獲的豐富語義知識直接轉化為機器人動作,將會帶來什么改變?

這種新能力將從根本上改變機器人技術的發展軌跡(圖1)。

突然間,那些曾經需要數百次示教才能掌握的新技能,現在只需通過自然語言與機器人對話就能立即獲得。

關鍵問題在于:我們如何從VLM中提取所有這些常識知識,并將其轉化為可泛化的機器人控制?Helix的構建正是為了跨越這一鴻溝。

圖片圖片

首創「系統1,系統2」VLA

團隊表示,Helix是首個由「系統1,系統2」組成的VLA,可以實現人形機器人上半身的高速精確控制。

先前的VLM主干網絡具有通用性但速度不快,機器人視覺運動策略速度快但缺乏通用性。而Helix通過兩個系統解決了這個難題,兩個系統經過端到端訓練,并可以相互通信:

  • 系統2(S2):VLM主干網絡,經互聯網規模數據預訓練,工作頻率7-9Hz,用于場景和語言理解,可對不同的物體和場景進行泛化。
  • 系統1(S1):80M參數交叉注意力Transformer,依靠一個全卷積的多尺度視覺主干網絡進行視覺處理,該網絡在模擬環境中完成預訓練初始化。

這種解耦架構讓每個系統都能在最佳時間尺度上運行,S2可以「慢思考」高層目標,S1通過「快思考」來實時執行和調整動作。

例如,在協作中,S1能快速適應伙伴機器人的動作變化,同時維持S2設定的語義目標。

圖片圖片

Helix的設計相較現有方法具有以下幾個關鍵優勢:

  • 速度和泛化能力:Helix不僅達到了專門針對單任務行為克隆(behavioral cloning)策略的運行速度,還能夠對數千個全新測試對象實現零樣本學習。
  • 可擴展性:Helix能夠直接輸出高維動作空間的連續控制,避免了先前VLA方法中使用的復雜動作token化方案。這些方案雖然在低維控制設置(如二指夾爪)中取得了一定成功,但在高維人形機器人控制中面臨擴展性挑戰。
  • 架構簡單:Helix采用標準架構——系統2使用開源、開放權重的視覺語言模型,系統1則采用簡單的基于Transformer的視覺運動策略。
  • 職責分離:通過S1和S2的「解耦」,能夠獨立迭代優化每個系統,無需受限于尋找統一的觀察空間或動作表示。

模型和訓練細節

數據

研究人員收集了一個高質量的、多機器人、多操作員的多樣化遙操作行為數據集,總計約500小時。

為了生成自然語言條件下的訓練對,他們使用自動標注VLM來生成回顧性指令。

VLM會處理來自機器人板載攝像頭的分段視頻片段,提示詞是這樣的:「如果要實現視頻中看到的動作,你會給機器人什么指令?」

為了防止數據干擾,所有訓練中使用的物品都被排除在評估之外。

架構

這個系統主要包括兩個主要組件,S2(VLM主干網絡)和S1(基于潛層條件的視覺運動Transformer)。

S2建立在一個經過互聯網規模數據預訓練的7B參數開源開放權重VLM之上。它處理單目機器人圖像和機器人狀態信息(包括手腕姿態和手指位置),將這些信息投影到視覺-語言嵌入空間中。

結合指定期望行為的自然語言命令,S2會將所有與任務相關的語義信息提煉為單個連續潛層向量,傳遞給S1用于條件化其低層動作。

其中S1是一個80M參數的交叉注意力(cross-attention)編碼器-解碼器Transformer,負責低層控制。它依賴于一個全卷積的多尺度視覺主干網絡進行視覺處理,該網絡完全在模擬環境中預訓練初始化。

雖然S1接收與S2相同的圖像和狀態輸入,但它以更高的頻率處理這些信息,以實現更快速的閉環控制。來自S2的潛層向量被投影到S1的token空間,并在序列維度上與S1視覺主干網絡的視覺特征連接,提供任務條件。

S1以200Hz的頻率輸出完整的上半身人形機器人控制信號,包括期望的手腕姿態、手指彎曲和外展控制,以及軀干和頭部方向目標。

另外,團隊還在動作空間中,附加了一個合成的「任務完成百分比」動作,讓Helix能預測自己的終止條件。這樣,多個學習行為的序列化就更容易了。

訓練

Helix采用完全端到端(end-to-end)的訓練方式,將原始像素和文本命令映射到連續動作,使用標準回歸損失。

梯度通過用于條件化S1行為的潛在通信向量從S1反向傳播到S2,實現兩個組件的聯合優化。

Helix不需要任務特定的適配;它保持單一訓練階段和單一神經網絡權重集,無需獨立的動作輸出頭或每個任務的微調階段。

在訓練過程中,研究中還在S1和S2輸入之間添加了時間延遲。這個延遲經過校準,以匹配S1和S2在部署推理延遲之間的差距,確保部署期間的實時控制要求在訓練中得到準確反映。

優化的流式推理

因為這種訓練設計,Helix就能在Figure機器人上進行高效的模型并行部署了,每個機器人都配備了雙低功耗嵌入式GPU。

其中,推理流程在S2(高層潛規劃)和S1(低層控制)模型之間分割,各自在專用GPU上運行。

S2作為異步后臺進程運行,處理最新的觀察數據(機載相機和機器人狀態)和自然語言命令。它會持續更新共享內存中的潛在向量,用于編碼高層行為意圖。

而S1作為獨立的實時進程執行,能維持平滑的整體上半身動作所需的關鍵200Hz控制循環。它會同時接收最新的觀察數據和最近的S2潛在向量。

S2和S1推理之間固有的速度差異,自然會導致S1以更高的時間分辨率處理機器人觀察數據,為響應式控制創建更緊密的反饋循環。

這種部署策略有意模仿訓練中引入的時間延遲,最小化訓練和推理之間的分布差異。異步執行模型允許兩個進程以其最優頻率運行,因此能以與最快的單任務模仿學習策略相當的速度運行Helix。

結果

精細化VLA全上半身控制

Helix以200Hz的頻率協調35個自由度的動作空間,控制從單個手指運動到末端執行器(end-effector)軌跡、頭部注視和軀干姿態的所有動作。

頭部和軀干控制帶來獨特的挑戰——當它們移動時,既會改變機器人的可達范圍,也會改變它的可視范圍,形成傳統上容易導致系統不穩定的反饋循環。

機器人在調整軀干以獲得最佳可達范圍的同時,用頭部平滑地跟蹤其手部動作,并保持精確的手指控制以進行抓取。

從傳統角度來看,即使對于單個已知任務,在如此高維(high-dimensional)的動作空間中實現這種精度一直被認為是極具挑戰性的。

目前,還沒有VLA系統能夠在保持通用泛化能力(適用于不同任務和物體)的同時,展示出這種程度的實時協調控制。

圖片圖片

零樣本學習多機器人協調

研究人員在一個具有挑戰性的多智能體(multi-agent)操作場景中將Helix推向極限:兩臺Figure機器人之間的協作式零樣本學習雜貨存儲任務。

結果顯示,機器人成功操作了在訓練中從未見過的雜貨,展示了對不同形狀、尺寸和材料的強大通用泛化能力。

圖片圖片

此外,兩個機器人使用完全相同的Helix模型權重(model weights)運行,無需針對特定機器人的訓練或明確的角色分配。

它們通過自然語言提示詞來實現協調配合,比如「把餅干袋遞給你右邊的機器人」或「從你左邊的機器人那里接過餅干袋并放入打開的抽屜中」。

這是首次使用VLA實現多機器人之間的靈活、持續性協作任務,而且機器人能夠成功處理完全陌生的物體,這一成就具有重要的里程碑意義。

圖片圖片

「任意物品拾取」能力涌現

研究人員發現配備Helix的Figure機器人只需一個簡單的「拾取[X]」指令就能拾取幾乎任何小型家居物品。

即使在雜亂的環境下,機器人也能成功處理從玻璃器皿和玩具到工具和衣物等數千件前所未見的物品,而這一切無需任何事先示范或定制編程。

值得注意的是,Helix成功地連接了大規模語言理解能力與精確的機器人控制系統。

例如,當接收到「拾取沙漠物品」這樣的提示詞時,Helix不僅能識別出玩具仙人掌符合這個抽象概念,還能選擇最近的機械手臂并執行精確的運動指令(motor commands)來穩固抓取它。

這種通用的「語言到動作」抓取能力為類人機器人在復雜且不確定的非結構化環境中的部署開創了激動人心的可能性。

圖片圖片

討論

Helix的訓練極其高效

Helix僅需極少的資源就實現了強大的物體識別和適應能力(物體泛化能力)。

研究人員總共使用了約500小時的高質量監督數據(supervised data)來訓練Helix,這僅占此前收集的VLA數據集規模的一小部分(<5%),而且無需依賴多機器人實體數據收集或多階段訓練。

值得注意的是,這種數據收集規模更接近現代單任務模仿學習(imitation learning)數據集。盡管數據需求相對較小,Helix仍然可以擴展到更具挑戰性的完整上肢人形機器人控制動作空間,成功實現高頻率、高維度的輸出控制。

統一的模型權重系統

現有的VLA系統通常需要專門的微調或專用的動作輸出層來優化不同復雜行為的性能。

然而,Helix卻能使用單一統一模型就實現了各種任務的出色表現。

僅使用一組神經網絡權重(System 2使用70億參數,System 1使用8千萬參數),Helix就能夠完成將物品放入各種容器、操作抽屜和冰箱、協調精確的多機器人交接,以及操作數千種全新物體等多樣化任務。

結論

Helix是首個能夠通過自然語言直接控制整個人形機器人上半身的視覺-語言-動作模型(Vision-Language-Action model)。

與早期的機器人系統相比,Helix能夠實時完成持續性、需要配合的精密操作,而無需任何特定任務示范或大量手動編程。

Helix展現出卓越的物體適應能力,只需通過自然語言指令,就能拾取數千種在訓練中從未接觸過的家居物品,這些物品具有各種不同的形狀、尺寸、顏色和材料特性。

這標志著Figure在拓展人形機器人行為能力方面取得了突破性進展——研究人員相信,隨著機器人在日常家居環境中的應用日益廣泛,這一進展將發揮重要的推動作用。

盡管這些初步成果令人振奮,但這僅僅是揭開了可能性的冰山一角。研究人員熱切期待著將Helix的規模擴大至現有規模的千倍乃至更多時會帶來怎樣的突破。

參考資料:HNYZs

https://www.figure.ai/news/helix

責任編輯:武曉燕 來源: 新智元
相關推薦

2025-06-06 14:21:45

Figure機器人快遞

2025-02-05 09:02:49

2025-02-21 14:53:40

2022-08-05 14:59:21

iOS漏洞測試

2025-02-05 14:16:55

OpenAI人形機器人Figure

2017-03-07 16:10:36

腦控機器人糾錯

2021-07-19 09:11:05

機器人人工智能算法

2023-12-31 12:28:57

2013-02-01 12:48:41

iOS開發者安卓

2021-07-21 17:24:28

OpenAI機器人AI

2022-03-04 10:14:46

機器人

2023-03-28 07:49:38

2025-02-05 11:04:34

2015-09-23 17:56:34

擬腦機器人

2024-12-25 11:30:43

2024-09-18 13:30:00

2017-05-27 09:35:56

康復機器人兒童福利院

2025-03-20 12:11:42

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产成人精品久久 | 中文无吗 | 日韩欧美操 | 中文字幕一区二区三区四区五区 | 自拍偷拍中文字幕 | 伊人中文字幕 | 天天拍天天射 | 久久精品一区二区三区四区 | 欧美精品福利 | 亚洲一区国产 | 中文字幕av免费 | 99久久免费精品国产男女高不卡 | 久久国产成人 | 国产成人高清成人av片在线看 | 精品国产免费一区二区三区演员表 | 亚洲综合一区二区三区 | 高清视频一区二区三区 | 天堂一区二区三区四区 | 午夜精品久久久久99蜜 | 欧美综合一区 | 国产成人精品一区二区三区 | 久久久99精品免费观看 | 亚洲一区不卡 | 男人久久天堂 | 在线色网 | 福利社午夜影院 | 欧美99| 中文字幕在线观 | 久久av一区二区三区 | 欧美成人一区二免费视频软件 | 国产免费视频在线 | 性色网站 | 国产精品久久久久久久午夜 | 国产一区二区观看 | 欧美日韩a | 免费在线看a | 国产成人综合在线 | 91成人 | 亚洲天堂色 | 久久久久黑人 | 亚洲伊人a |