成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

李飛飛團隊提出ReKep,讓機器人具備空間智能,還能整合GPT-4o

人工智能 新聞
近日,李飛飛團隊在這一研究方向取得了一個突破,提出了關系關鍵點約束(ReKep/Relational Keypoint Constraints)。

當兩只機器手絲滑地互相合作疊衣服、倒茶、將鞋子打包時,加上最近老上頭條的 1X 人形機器人 NEO,你可能會產生一種感覺:我們似乎開始進入機器人時代了。

事實上,這些絲滑動作正是先進機器人技術 + 精妙框架設計 + 多模態大模型的產物。

我們知道,有用的機器人往往需要與環境進行復雜精妙的交互,而環境則可被表示成空間域和時間域上的約束。

舉個例子,如果要讓機器人倒茶,那么機器人首先需要抓住茶壺手柄并使之保持直立,不潑灑出茶水,然后平穩移動,一直到讓壺口與杯口對齊,之后以一定角度傾斜茶壺。這里,約束條件不僅包含中間目標(如對齊壺口與杯口),還包括過渡狀態(如保持茶壺直立);它們共同決定了機器人相對于環境的動作的空間、時間和其它組合要求。

然而,現實世界紛繁復雜,如何構建這些約束是一個極具挑戰性的問題。

近日,李飛飛團隊在這一研究方向取得了一個突破,提出了關系關鍵點約束(ReKep/Relational Keypoint Constraints)。簡單來說,該方法就是將任務表示成一個關系關鍵點序列。并且,這套框架還能很好地與 GPT-4o 等多模態大模型很好地整合。從演示視頻來看,這種方法的表現相當不錯。該團隊也已發布相關代碼。本文一作為 Wenlong Huang。

圖片


  • 論文標題:ReKep: Spatio-Temporal Reasoning of Relational Keypoint Constraints for Robotic Manipulation
  • 論文地址:https://rekep-robot.github.io/rekep.pdf
  • 項目網站:https://rekep-robot.github.io
  • 代碼地址:https://github.com/huangwl18/ReKep

李飛飛表示,該工作展示了視覺與機器人學習的更深層次融合!雖然論文中沒有提及李飛飛在今年 5 年初創立的專注空間智能的 AI 公司 World Labs,但 ReKep 顯然在空間智能方面大有潛力。

圖片

方法

圖片

關系關鍵點約束(ReKep)

首先,我們先看一個 ReKep 實例。這里先假設已經指定了一組 K 個關鍵點。具體來說,每個關鍵點 k_i ∈ ?^3 都是在具有笛卡爾坐標的場景表面上的一個 3D 點。

一個 ReKep 實例便是一個這樣的函數:??: ?^{K×3}→?;其可將一組關鍵點(記為 ??)映射成一個無界成本(unbounded cost),當 ??(??) ≤ 0 時即表示滿足約束。至于具體實現,該團隊將函數 ?? 實現為了一個無狀態 Python 函數,其中包含對關鍵點的 NumPy 操作,這些操作可能是非線性的和非凸的。本質上講,一個 ReKep 實例編碼了關鍵點之間的一個所需空間關系。

但是,一個操作任務通常涉及多個空間關系,并且可能具有多個與時間有關的階段,其中每個階段都需要不同的空間關系。為此,該團隊的做法是將一個任務分解成 N 個階段并使用 ReKep 為每個階段 i ∈ {1, ..., N } 指定兩類約束:

圖片

  • 一組子目標約束 

圖片

  • 一組路徑約束

其中 圖片編碼了階段 i 結束時要實現的一個關鍵點關系,而 圖片編碼了階段 i 內每個狀態要滿足的一個關鍵點關系。以圖 2 的倒茶任務為例,其包含三個階段:抓拿、對齊、倒茶。

階段 1 子目標約束是將末端執行器伸向茶壺把手。階段 2 子目標約束是讓茶壺口位于杯口上方。此外,階段 2 路徑約束是保持茶壺直立,避免茶水灑出。最后的階段 3 子目標約束是到達指定的倒茶角度。

使用 ReKep 將操作任務定義成一個約束優化問題

使用 ReKep,可將機器人操作任務轉換成一個涉及子目標和路徑的約束優化問題。這里將末端執行器姿勢記為 ?? ∈ SE (3)。為了執行操作任務,這里的目標是獲取整體的離散時間軌跡 ??_{1:T}:

圖片

也就是說,對于每個階段 i,該優化問題的目標是:基于給定的 ReKep 約束集和輔助成本,找到一個末端執行器姿勢作為下一個子目標(及其相關時間),以及實現該子目標的姿勢序列。該公式可被視為軌跡優化中的 direct shooting。

分解和算法實例化

為了能實時地求解上述公式 1,該團隊選擇對整體問題進行分解,僅針對下一個子目標和達成該子目標的相應路徑進行優化。算法 1 給出了該過程的偽代碼。

圖片

其中子目標問題的求解公式為:

圖片

路徑問題的求解公式為:

圖片

回溯

現實環境復雜多變,有時候在任務進行過程中,上一階段的子目標約束可能不再成立(比如倒茶時茶杯被拿走了),這時候需要重新規劃。該團隊的做法是檢查路徑是否出現問題。如果發現問題,就迭代式地回溯到前一階段。

圖片

關鍵點的前向模型

為了求解 2 和 3 式,該團隊使用了一個前向模型 h,其可在優化過程中根據 ??? 估計 ???。具體來說,給定末端執行器姿勢 ??? 的變化,通過應用相同的相對剛性變換 ??′[grasped] = T_{???}???[grasped] 來計算關鍵點位置的變化,同時假設其它關鍵點保持靜止。

關鍵點提議和 ReKep 生成

為了讓該系統能在實際情況下自由地執行各種任務,該團隊還用上了大模型!具體來說,他們使用大型視覺模型和視覺 - 語言模型設計了一套管道流程來實現關鍵點提議和 ReKep 生成。

關鍵點提議

給定一張 RGB 圖像,首先用 DINOv2 提取圖塊層面的特征 F_patch。然后執行雙線性插值以將特征上采樣到原始圖像大小,F_interp。為了確保提議涵蓋場景中的所有相關物體,他們使用了 Segment Anything(SAM)來提取場景中的所有掩碼 M = {m_1, m_2, ... , m_n}。

對于每個掩碼 j,使用 k 均值(k = 5)和余弦相似度度量對掩碼特征 F_interp [m_j] 進行聚類。聚類的質心用作候選關鍵點,再使用經過校準的 RGB-D 相機將其投影到世界坐標 ?^3。距離候選關鍵點 8cm 以內的其它候選將被過濾掉。總體而言,該團隊發現此過程可以識別大量細粒度且語義上有意義的對象區域。

ReKep 生成

獲得候選關鍵點后,再將它們疊加在原始 RGB 圖像上,并標注數字。結合具體任務的語言指令,再查詢 GPT-4o 以生成所需階段的數量以及每個階段 i 對應的子目標約束和路徑約束。

實驗

該團隊通過實驗對這套約束設計進行了驗證,并嘗試解答了以下三個問題:

1. 該框架自動構建和合成操作行為的表現如何?

2. 該系統泛化到新物體和操作策略的效果如何?

3. 各個組件可能如何導致系統故障?

使用 ReKep 操作兩臺機器臂

他們通過一系列任務檢查了該系統的多階段(m)、野外 / 實用場景(w)、雙手(b)和反應(r)行為。這些任務包括倒茶 (m, w, r)、擺放書本 (w)、回收罐子 (w)、給盒子貼膠帶 (w, r)、疊衣服 (b)、裝鞋子 (b) 和協作折疊 (b, r)。

結果見表 1,這里報告的是成功率數據。

圖片

整體而言,就算沒有提供特定于任務的數據或環境模型,新提出的系統也能夠構建出正確的約束并在非結構化環境中執行它們。值得注意的是,ReKep 可以有效地處理每個任務的核心難題。

下面是一些實際執行過程的動畫:

圖片

操作策略的泛化

該團隊基于疊衣服任務探索了新策略的泛化性能。簡而言之,就是看這套系統能不能疊不一樣的衣服 —— 這需要幾何和常識推理。

這里使用了 GPT-4o,提詞僅包含通用指令,沒有上下文示例。「策略成功」是指生成的 ReKep 可行,「執行成功」則衡量的是每種衣服的給定可行策略的系統成功率。

結果很有趣。可以看到該系統為不同衣服采用了不同的策略,其中一些疊衣服方法與人類常用的方法一樣。

圖片

圖片

分析系統錯誤

該框架的設計是模塊化的,因此很方便分析系統錯誤。該團隊以人工方式檢查了表 1 實驗中遇到的故障案例,然后基于此計算了模塊導致錯誤的可能性,同時考慮了它們在管道流程中的時間依賴關系。結果見圖 5。

圖片

可以看到,在不同模塊中,關鍵點跟蹤器產生的錯誤最多,因為頻繁和間或出現的遮擋讓系統很難進行準確跟蹤。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-11-10 12:58:00

模型數據

2024-06-28 18:13:05

2024-11-11 08:30:00

2024-08-07 13:00:00

2025-03-12 08:54:46

2024-07-04 15:26:56

2024-12-13 14:20:00

AI模型訓練

2024-05-17 09:35:55

GPT-4o模型OpenAI

2023-11-08 13:20:00

模型數據

2024-05-21 12:23:17

2024-06-05 08:29:35

2024-10-14 14:30:00

2023-07-11 10:07:10

機器人智能

2017-03-28 17:18:20

2024-11-22 14:10:00

AI智能體

2025-06-04 09:05:18

2024-05-24 14:04:04

2024-05-14 19:16:52

ChatGPTGPT-4oOpenAI

2025-04-15 08:01:12

2025-04-08 02:26:00

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品精品视频 | www.日日操 | 欧美性极品xxxx做受 | 91精品综合久久久久久五月天 | 国产区在线 | 国产亚洲一区二区三区在线观看 | 视频一区在线 | 亚洲欧美精品国产一级在线 | 国产精品成人品 | 国产精品九九 | 日韩一区二区av | 91亚洲精品在线 | 成人av免费在线观看 | 丁香综合| 欧美日韩一区二区视频在线观看 | 久色一区 | 欧美自拍网站 | 日韩一区二区三区视频 | 欧美精品久久久久 | 欧美激情综合色综合啪啪五月 | 国产精品久久久久久久午夜片 | 日本黄色不卡视频 | 狠狠的日 | 午夜视频在线观看视频 | 天天拍天天操 | 国产成人精品一区二区三区视频 | 色婷婷亚洲 | 国产在线精品一区二区 | www国产亚洲精品 | 三级免费网 | 成人福利在线 | 一级毛片色一级 | 免费视频一区二区 | 国产在线第一页 | 成人精品一区 | 羞羞视频网站免费看 | 国产精品久久久久久福利一牛影视 | 中文字幕一区在线观看视频 | 久久精品国产99国产精品亚洲 | 欧美一区二区久久 | 国产精品国产a |