成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

把大象裝冰箱總共要幾步?英偉達發(fā)布ProgPrompt,讓語言模型給機器人安排計劃

人工智能 新聞
一條命令,讓機器人幫你把大象裝冰箱里!

對于機器人來說,任務規(guī)劃(Task Planning)是一個繞不過去的難題。

想要完成一個真實世界的任務,首先你得知道把大象裝冰箱總共要幾步

即便是比較簡單的扔蘋果任務也包含多個子步驟,機器人得先觀察蘋果的位置,如果沒有看到蘋果就要持續(xù)尋找,然后靠近蘋果,把蘋果抓起來找到并靠近垃圾桶

如果垃圾桶關著的,還得先把它打開,然后再把蘋果扔進去關上垃圾桶

但每個任務的具體實施細節(jié)不可能都由人來設計,如何通過一句命令來生成動作序列就成了難題。

命令生成序列?這不正是語言模型的工作么?

過去有研究人員使用大型語言模型(LLMs)根據(jù)輸入的任務指令對潛在的下一步行動空間進行評分,然后生成行動序列。指令由自然語言進行描述,不包含額外的領域信息。

但這類方法要么需要列舉所有可能的下一步行動進行評分,要么生成的文本在形式上沒有任何限制,其中可能包含在當前環(huán)境下特定機器人不可能采取的行動

最近南加州大學和英偉達聯(lián)合推出了一個新模型ProgPrompt,同樣使用語言模型對輸入指令進行任務規(guī)劃,其中包含了一個程序化的提示結構,使得生成的計劃在不同的環(huán)境、具有不同能力的機器人、不同的任務中都能發(fā)揮作用。

圖片

在保證任務的規(guī)范性上,研究人員采用生成python風格代碼的形式來提示語言模型哪些動作是可用的、環(huán)境中有哪些物體以及哪些程序是可執(zhí)行的。

比如輸入「扔蘋果」命令就可以生成如下程序。

圖片

ProgPrompt模型在虛擬家庭任務中達到了sota性能,研究人員還將該模型部署在一個用于桌面任務的物理機器人手臂上。

妙用語言模型

想要完成日常家庭任務(everyday household tasks)既需要對世界具有常識性理解,也需要當前環(huán)境的情景知識。

為了創(chuàng)建一個「做晚飯」的任務計劃,智能體最起碼需要知道的常識包括:物體的功能,如爐子和微波爐可以用來加熱;行動的邏輯順序,在添加食物之前必須先預熱烤箱;以及物體和行動的任務相關性,例如加熱和尋找食材首先是與「晚飯」相關的行動。

但如果沒有狀態(tài)反饋(state feedback),這種推理就無法進行。

智能體需要知道當前環(huán)境中哪里有食物,例如冰箱里是否有魚,或者冰箱里是否有雞肉。

在大型語料庫上訓練的自回歸大型語言模型可以在輸入提示的條件下生成文本序列,具有顯著的多任務泛化能力。

比如輸入「做晚飯」,語言模型可以生成后續(xù)序列,如打開冰箱、拿起雞肉、拿起蘇打水、關閉冰箱、打開電燈開關等。

生成的文本序列需要映射到智能體的行動空間中,比如生成的指令是「伸手拿起一罐泡菜」,對應的可執(zhí)行動作可能就是「拿起罐子」,然后模型會計算出一個行動的概率評分值。

但缺少環(huán)境反饋的情況下,如果冰箱里沒有雞肉,卻仍然選擇「拿起雞肉」行動,就會導致任務失敗,因為「做晚飯」并沒有包含任何關于世界狀態(tài)的信息。

ProgPrompt模型在任務規(guī)劃中巧妙地利用了編程語言結構,因為現(xiàn)有的大規(guī)模語言模型通常都在編程教程和代碼文檔的語料中進行過預訓練

ProgPrompt為語言模型提供了一個Pythonic的程序頭部作為提示,導入了可用的動作空間、預期參數(shù)和環(huán)境中可用的物體。

圖片

然后定義了諸如make_dinner, throw_away_banana等函數(shù),其主體是對物體進行操作的動作序列,然后通過斷言計劃的先決條件,例如在試圖打開冰箱之前靠近冰箱,以及用恢復行動來應對斷言失敗的情況,以此納入環(huán)境的狀態(tài)反饋

最重要的是,ProgPrompt程序中還包括了自然語言編寫的注釋,用以解釋行動的目標,從而提高了生成的計劃程序執(zhí)行任務的成功率。

ProgPrompt

有了完整的想法,ProgPrompt的整體工作流程就清晰了,主要包括三部分Pythonic函數(shù)構建構造編程語言提示任務計劃的生成和執(zhí)行

圖片

1、將機器人計劃表述為Pythonic函數(shù)

計劃函數(shù)包括對動作原語(action primitive)的API調用,總結動作并添加注釋,以及跟蹤執(zhí)行的斷言。

每個動作原語需要一個物體作為參數(shù),比如「把三文魚放進微波爐」任務中,包括對find(salmon)的調用,其中find就是一個動作原語。

圖片

利用代碼中的注釋來為后續(xù)的動作序列提供自然語言的總結,注釋有助于將高層次的任務分解成合乎邏輯的子任務,即「抓取三文魚」和「把三文魚放進微波爐」。

注釋也可以讓語言模型了解當前的目標,減少不連貫、不一致或重復輸出的可能性,類似于思維鏈(chain of thought)生成中間結果。

斷言(assertions)提供了一個環(huán)境反饋機制,以確保前提條件成立,并在不成立時實現(xiàn)錯誤恢復,比如在抓取行動之前,計劃斷言智能體已經(jīng)接近了三文魚,否則智能體需要先執(zhí)行find行動。

2、構造編程語言prompt

prompt需要向語言模型提供關于環(huán)境和主要行動的信息,包括觀察、行動原語、例子,并生成了一個Pythonic提示,供語言模型補全。

圖片

然后,語言模型將<next task>預測為一個可執(zhí)行的函數(shù),即microwave_salmon()

在微波爐三文魚這個任務中,LLM可以生成的且合理的第一步是取出三文魚,但負責執(zhí)行計劃的智能體可能沒有這樣一個動作原語。

為了讓語言模型了解智能體的動作原語,將其在prompt中通過import語句導入,也就將輸出限制為在當前環(huán)境下可用的函數(shù)上。

要改變智能體的行為空間,只需要更新import的函數(shù)列表即可。

變量objects以一個字符串列表的形式提供了環(huán)境中的所有可用物體

prompt還包括一些完全可執(zhí)行的程序計劃作為示例,每個示例任務都演示了如何使用給定環(huán)境中的可用動作和目標來完成一個給定的任務,如throw_away_lime

3、任務計劃的生成和執(zhí)行

給定任務之后,計劃完全是由語言模型根據(jù)ProgPrompt提示推斷出來的,然后可以將生成的計劃在虛擬智能體或物理機器人系統(tǒng)上執(zhí)行,需要用到一個解釋器,針對環(huán)境執(zhí)行每個行動命令。

在執(zhí)行過程中,斷言檢查以閉環(huán)的方式進行,并根據(jù)當前環(huán)境狀態(tài)提供反饋。

在實驗部分,研究人員在虛擬家庭(VH)仿真平臺評估了該方法。

VH的狀態(tài)包括一組物體和相應的屬性,比如三文魚在微波爐內部(in),或者靠近(agent_close_to)等。

行動空間包括抓取(grab)、放入(putin)、放回(putback)、行走(walk),尋找(find)、打開(open)、關閉(close)等。

最終實驗了3個VH環(huán)境,每個環(huán)境包括115種不同的物體,研究人員創(chuàng)建了一個包含70個家務任務的數(shù)據(jù)集,抽象程度很高,命令都是「微波三文魚」這類的,并為之創(chuàng)建一個ground-truth的行動序列。

在虛擬家庭上對生成的程序進行評估后,評估指標包括成功率(SR),目標條件召回(GCR)和可執(zhí)行性(Exec),從結果上可以看到ProgPrompt明顯優(yōu)于基線和LangPrompt,表格中還展示了每個特征是如何提升性能的。

圖片

研究人員同樣在真實世界進行了實驗,使用一個帶有平行爪子的Franka-Emika熊貓機器人,并假設可以獲得一個拾取和放置(pick-and-place)的策略。

該策略將目標物體和目標容器的兩個點云作為輸入,并執(zhí)行拾取和放置操作,將物體放在容器上或里面。

系統(tǒng)實現(xiàn)引入一個開放詞匯的物體檢測模型ViLD來識別和分割場景中的物體,并構建prompt中的可用物體列表。

與在虛擬環(huán)境中不同的是,這里物體列表是每個計劃函數(shù)的局部變量,這樣可以更靈活地適應新對象。

語言模型輸出的計劃中包含形式為grab和putin等函數(shù)調用。

由于現(xiàn)實世界的不確定性,實驗設置中沒有實施基于斷言的閉環(huán)選項

圖片

可以看到,機器人在分類任務中,能夠識別出香蕉和草莓是水果,并生成計劃步驟,將它們放在盤子里,而將瓶子放在盒子里。

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-03-19 10:05:02

2024-12-30 14:10:00

英偉達AI機器人

2025-05-22 09:06:00

2024-08-22 18:58:27

英偉達微軟小語言模型

2023-10-31 19:20:29

語言模型英偉達芯片

2023-02-27 15:36:37

2024-10-31 14:10:00

機器人神經(jīng)網(wǎng)絡

2024-11-25 08:20:00

2024-06-19 13:02:01

2022-04-18 14:29:57

人工智能強化學習機器人

2023-10-23 13:31:37

GPT-4語言模型

2020-12-31 06:55:37

機器人自然語言人工智能

2025-03-24 08:06:00

2023-02-10 15:12:34

特斯拉電動汽車

2024-11-22 14:24:24

機器人AI

2024-12-19 14:44:22

2020-09-14 14:32:06

AI機器人人工智能

2023-05-23 09:56:14

機器人谷歌

2011-08-30 17:33:50

AndroidifyAndroid機器人游戲

2023-03-08 10:07:20

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 一级在线观看 | 黄色精品 | 中文字幕一区二区三区四区 | 日本在线一区二区 | 免费观看日韩精品 | 91亚洲国产成人久久精品网站 | 欧美日韩视频在线第一区 | 欧美成人一区二区三区 | 亚洲一区二区三区免费视频 | 国产精品久久久久久久7电影 | 天天操伊人 | 亚洲一区二区久久 | 中文字幕国产精品 | 欧美日韩在线综合 | 国产精品视频偷伦精品视频 | 亚洲最大福利网 | 免费成人高清 | 久久久久久99 | 一区二区在线不卡 | а_天堂中文最新版地址 | 国产成人短视频在线观看 | 国产91在线 | 中日 | 网站国产 | 亚洲区一区二区 | 久久精品国产一区二区三区不卡 | 视频1区2区 | 久久在线视频 | 国产香蕉视频在线播放 | 精品一区二区三区在线观看 | 久久国产精品免费一区二区三区 | 亚洲欧美视频 | 中国毛片免费 | 99久久婷婷国产综合精品 | 在线观看久草 | 中文字幕av一区二区三区 | 久久久性色精品国产免费观看 | 色婷婷av777| 国产精品7777777 | 欧美精品一区二区在线观看 | 黄色三级毛片 | 欧美综合一区 |