成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

讓大模型操縱無人機,北航團隊提出具身智能新架構

人工智能 新聞
北京航空航天大學智能無人機團隊周堯明教授團隊等研究人員,提出了一種基于多模態大模型的具身智能體架構。

進入多模態時代,大模型也會操縱無人機了!

只要視覺模塊捕捉到啟動條件,大模型這個“大腦”就會生成動作指令,接著無人機便能迅速準確地執行。

圖片

北京航空航天大學智能無人機團隊周堯明教授團隊等研究人員,提出了一種基于多模態大模型的具身智能體架構。

目前,這種架構已被應用于無人機的操控。

圖片

那么這種新的智能體表現如何,又有哪些技術細節呢?

“智能體即大腦”

研究團隊利用大模型對多模態數據的理解能力,將真實物理世界的照片、聲音、傳感器數據等多源信息融合成能體的感知,將對于真實世界的執行器的操作作為智能體的行為。

同時,團隊提出了一套“Agent as Cerebrum,Controller as Cerebellum”(智能體即大腦,控制器即小腦)的控制架構:

智能體作為大腦這一決策生成器,專注于生成高層級的行為;

控制器作為小腦這一運動控制器,專注于將高層級的行為(如期望目標點)轉換成低層級的系統命令(如旋翼轉速)。

具體來說,研究團隊認為這一成果主要有三項貢獻。

應用于實際的新型系統架構

研究團隊提出了一種應用于實際機器人的新的系統架構,將基于多模態大模型的智能體具象化為大腦。

而機器人運動規劃器與控制器則被具象化為小腦,機器人的感知系統類比為人的眼、耳等信息收集器,機器人的執行機構類比為人的手等執行器。

圖片

△圖1 硬件系統架構

這些節點通過ROS相連,通過ROS中消息的訂閱與發布或服務的請求與響應實現通信,區別于傳統的端到端的機器人大模型控制。

這一架構使得Agent可以專注于高層級命令的產生,對于高層級任務具備更強的智能性,對于實際的執行具備更好的魯棒性和可靠性。

圖片

△圖2 軟件系統架構

新型智能體

在這一架構下,作者構建了作為大腦的一種智能體AeroAgent。

該智能體主要包括三個部分:

  • 一個自動計劃生成模塊,具有多模態感知監測能力,同時擅長進行待機模式下的應急突發事件處理。
  • 一個多模態數據記憶模塊,可以用于多模態記憶檢索和反思,為智能體賦予少樣本學習能力。
  • 一個具身智能動作模塊,可以建立具身智能體與ROS上其他模塊進行穩定控制的橋梁,這一模塊提供了對于ROS上其他節點以操作為橋梁進行訪問的能力。

同時,一個動作的完成,可能需要多次操作的交互以從傳感器獲取動作的執行所必需的參數,確保智能體可以根據綜合態勢感知及所具備的執行器來進行穩定的embodied action的輸出。

圖片

△圖3 AeroAgent模塊架構

連接大模型和ROS的橋梁

為了給具身智能體和ROS機器人系統建立橋梁,讓Agent產生的操作能夠正確地、穩定地發送給ROS并被其他節點成功執行,同時讓其他節點所提供的信息讓LMM能夠讀取與理解,團隊設計了了ROSchain——

一個連接LLMs/LMMs與ROS的橋梁。

ROSchain通過一套模塊和應用程序接口(APIs)簡化了大型模型與機器人傳感裝置、執行單元和控制機制的集成,為智能體接入ROS系統提供了一個穩定的中間件。

為什么選擇無人機

至于為什么選擇無人機進行該系統架構的測試與模擬,研究團隊也做了解釋,這主要有三個原因。

首先,如今LMMs中所蘊含的web-scale的世界知識,多為第三人稱視角,人型機器人等領域的具身智能是類似于以人類為主體出發的第一人稱視角。

而無人機掛載的相機(尤其是下視相機)更加類似于第三人稱視角(上帝視角)的具身智能;

另一方面,現階段的LMMs無論是模型部署還是API服務,通常受限于計算資源導致響應有一定的延遲。

這對于自動駕駛等領域是一個應用的障礙,而無人機的任務規劃由于其可以懸停,具備應對延遲的能力。

這兩點都導致目前技術發展水平下無人機適合作為先驅進行相關理論與應用的驗證。

第二,目前工業無人機領域,如山火救援、農林植保、無人放牧、電力巡檢等,多由飛手與專家配合實際操作,智能化任務執行具有工業需求。

第三,從未來發展看,多智能體協同合作在物流、建筑、工廠等領域具備較為明顯的需求。

而在這種領域中,無人機作為“上帝視角”的具身智能體,適合作為中央節點的領導者進行任務的分配,其他機器人可看作無人機的執行器的一環,所以這一研究也具有未來的發展前景。

團隊在airgen的仿真器上進行了模擬實驗,同時選用了DRL等方式作為對照組。結果如下:

圖片

在野外火災搜救的場景中,AeroAgent獲得了100分(標準化分數,下同)的成績,平均每步為2.04分。

而單純調用LLM或基于DRL的智能體都只獲得了29.4分,平均每步0.2,不足AeroAgent的十分之一。

圖片

△圖4-1山火救援場景

在著陸任務中,AeroAgent也以97.4的總分和48.7的每步平均分超過了其他模型。

圖片

△圖4-2 海上機坪著陸場景

而在風機巡檢的測試中,AeroAgent直接成為了唯一能完成該任務的模型。

圖片

△圖4-3 風力電機巡檢場景

導航任務上,AeroAgent 4.44的每步均分,分別是DRL和純LLM的40倍和近10倍。

圖片

△圖4-4 Airgen仿真實驗

團隊還在真實場景中進行了無人機系統的測試,以一個簡單的受困群眾引導實驗為例進行了案例研究。

圖片

△圖5 受困群眾引導案例實驗

團隊目前正以這一工作為基礎,在某高原牦牛牧場進行無人放牧智能無人機的實驗,探索其實際應用的可能性,并將以“予智能以具身”為目標,進行其他機器人/多機器人合作的智能體落地應用探索。

論文地址:https://arxiv.org/abs/2311.15033

責任編輯:張燕妮 來源: 量子位
相關推薦

2021-10-17 21:43:55

人工智能無人機網絡安全

2021-04-19 16:39:59

無人機人工智能AI

2024-12-06 15:12:07

2017-06-30 15:45:33

消費

2023-08-31 13:37:00

訓練模型

2020-07-27 19:23:03

安全漏洞數據

2020-08-10 08:04:06

無人機5G技術

2019-11-19 17:03:05

無人機人工智能AI

2021-09-07 18:32:25

無人機農業人工智能

2020-11-25 10:01:07

HarmonyOS

2015-10-26 00:08:02

2021-01-11 13:27:55

無人機通信技術

2023-03-24 10:26:54

無人機人工智能智慧城市

2023-08-08 14:36:11

模型AI

2021-12-23 10:38:00

人工智能AI無人機

2023-05-04 11:35:15

無人機

2015-05-25 16:35:22

CES

2015-06-23 14:57:08

深圳市國通廣告有限公司

2021-01-03 20:05:02

美國無人機牌照
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲综合久久久 | 久久av在线播放 | 国产一区不卡在线观看 | 性福视频在线观看 | 亚洲国产精品久久久 | 国产午夜高清 | 高清欧美性猛交xxxx黑人猛交 | 免费看黄色小视频 | 免费av电影网站 | 精品欧美一区二区在线观看视频 | 欧美日韩精品一区二区三区四区 | 91精品在线播放 | 欧美三级视频 | 国产精品久久久久婷婷二区次 | 国产成人午夜精品影院游乐网 | 福利社午夜影院 | 免费av一区二区三区 | 特级黄色毛片 | 欧美精品久久久久久久久久 | 国产精品久久久久久影视 | 久久久久久蜜桃一区二区 | 国产午夜高清 | 99re在线免费视频 | 人成精品| 亚洲精品国产a久久久久久 中文字幕一区二区三区四区五区 | 国产999在线观看 | 精品久久久久久亚洲综合网 | 亚洲日本一区二区 | 日本欧美国产在线观看 | 精品欧美色视频网站在线观看 | 91精品入口蜜桃 | 日韩一级免费 | 婷婷色国产偷v国产偷v小说 | 国产高清在线观看 | 91av视频在线免费观看 | 激情久久网 | 亚洲+变态+欧美+另类+精品 | 狠狠综合网 | 久色网 | 国产91在线播放精品91 | 中文字幕高清一区 |