成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

用多模態LLM做自動駕駛決策器,可解釋性有了!比純端到端更擅長處理特殊場景,來自商湯

人工智能
來自商湯的最新自動駕駛大模型DriveMLM,直接在閉環測試最權威榜單CARLA上取得了SOTA成績——跑分比基線Apollo還要高4.7,令一眾傳統模塊化和端到端方法全都黯然失色。

用多模態大模型做自動駕駛的決策器,效果居然這么好?

來自商湯的最新自動駕駛大模型DriveMLM,直接在閉環測試最權威榜單CARLA上取得了SOTA成績——

跑分比基線Apollo還要高4.7,令一眾傳統模塊化和端到端方法全都黯然失色。

圖片

對于該模型,我們只需將圖像、激光雷達信息、交通規則甚至是乘客需求“一股腦”丟給它,它就能給出駕駛方案——直接能夠控制車輛的那種,并告訴你為什么要這么開。

這不僅讓駕駛邏輯可控、過程具備可解釋性,且更擅長解決特殊和復雜情況。

像什么給緊急車輛讓行?小case:

圖片

你說你著急能不能超車?它也能靈活處理(a為超車成功,b為車道不空,拒絕超車):

圖片

簡直不要太驚艷~

具體怎么實現,我們扒開論文來看。

多模態LLM破解自動駕駛難題

目前,自動駕駛系統主要有兩種方案,模塊化和端到端。

模塊化方案顧名思義,把自動駕駛任務拆解為感知、定位和規控三個模塊,各模塊各自完成任務,最后輸出車輛控制信號。

圖片

而端到端則是一個整體的模型,包含了上述感知、定位等等所有模塊的功能, 最后同樣輸出車輛控制信號。

但這兩種方案,各有各的缺點。

模塊化方案的算法依賴專家知識,所有規則都需要提前手寫、定義。如果在實際駕駛場景中碰到沒有提前寫入的情況,很可能導致系統失效。比如救護車、消防車這種不會按照交通規則行駛的車輛,讓自動駕駛系統自己去處理就很容易出錯。

端到端方案則是依賴數據驅動,雖然靠大量、真實情況下的駕駛數據,可以不斷驅動系統能力進行迭代,但這同樣對輸入的數據要求很高,需要大量的標注數據,這無異增加系統訓練和迭代的成本。

同時,至今為止,端到端方案的神經網絡還是一個“黑盒”,決策規劃都在系統內部完成,缺乏可解釋性。萬一有問題,很難像模塊化方案那樣發現到底是哪一部分出了問題。

圖片

而對于增強端到端方案的可解釋性,近年來也有許多研究將大語言模型(LLM)引入自動駕駛系統中,但缺點是LLM輸出主要是語言,無法進一步用于車輛控制。

對此,商湯提出了DriveMLM模型,它和現有自動駕駛系統行為規劃模塊中的決策狀態對齊,可實現閉環測試中操控車輛,超過之前的端到端和基于規則的自動駕駛系統方法。

和開環測試中,通過給定圖片進行軌跡預測相比,閉環測試能模擬真實環境和場景,更接近真實駕駛效果。

具體來看,其整體框架如圖所示。

圖片

首先它將LLM的語言決策輸出,和成熟模塊化方案中規控部分的決策狀態對齊,由此LLM輸出的語言信號就可轉化為車輛控制信號。

其次,DriveMLM的MLLM planner模塊,包含多模態分詞器(Multi-modal tokenizer)和MLLM解碼器兩個部分。

前者負責將攝像頭、激光雷達、用戶語言需求、交通規則等各種輸入轉化為統一的token embedding;后者,即MLLM解碼器則基于這里生成的token,再生成圖片描述、駕駛決策和決策解釋等內容。

訓練上,DriveMLM在280小時長的駕駛數據上進行完成(共包含50000條路線、30種不同天氣和照明條件的場景)。

所有這些數據全部收集自CARLA仿真器,也就是目前自動駕駛領域被使用最多的開源仿真工具和閉環測試基準。

格式如下:每幀都包含對應的圖片描述、駕駛決策和決策解釋三部分。

圖片
△數據案例

相比現有自動駕駛數據,DriveMLM的數據有兩個不同之處:

一是決策部分能夠與實際行為決策模塊對齊,方便我們將MLLM規劃器的輸出轉換為控制信號,直接控制閉環駕駛中的車輛;

二是包含與人類的交互數據,可以提高系統理解人類指令并做出反應的能力。

圖片

那么,基于以上一切實現,DriveMLM的具體效果如何?

能真正跑起來且具備可解釋性

首先,和業內的其他駕駛方法相比,DriveMLM實現了閉環測試的SOTA成績。

圖片

在CARLA中廣泛使用的Town05Long基準上,它的駕駛得分(Driving Score)和路線完成度(Route Completion)明顯比Apollo等非大模型方法都要高。

唯一惜敗的是違規得分(Infraction Score),但也跟Apollo相差無幾。

這表明,DriveMLM可以在遵守交規的同時做出更好的決定。

除此之外,DriveMLM (Miles Per Intervention)在MPI指標上也具備相當大的領先優勢,說明它在相同里程內更少被人為接管,更為可靠。

從下面的演示來看,DriveMLM能夠處理各種復雜情況,比如繞過未知障礙物:

圖片

比如給緊急車輛讓行:

圖片

特別值得一提的是,大模型的自然語言處理能力讓它更具人性化,通過語言指令,還能處理來自人類乘客的特殊需求,進一步更改MLLM規劃器的決策。

例如有人表示“我著急能不能開快點”,它完全能夠根據實際路況靈活處理,能超就超,不能超便拒絕,相當“貼心”。

其次,和其他多模態大模型例如GPT-4V相比,DriveMLM也表現亮眼:具備更高的決策準確率和解釋合理性。

如下圖所示,GPT-4V解釋了一大堆,卻沒有看到紅燈(a)/前方車輛(b),給出了錯誤的建議,而DriveMLM在這兩個場景中都簡單干脆、直擊重點,給出了正確的駕駛方法。

圖片

最后,DriveMLM還在真實駕駛場景上展現出了零樣本能力(基于nuScenes驗證集)。

如下圖所示, DriveMLM能夠識別現實環境中的紅燈并停車(左)、推斷現實十字路口的位置并提前減速(右)。

圖片

總的來看,以上測試證明,借助多模態大模型的能力,商湯提出的DriveMLM確實展現出了巨大的智駕潛力。

而相比此前的一系列傳統方法,它的最大優勢和價值主要包含三個方面:

一是一致的決策指令設置使得DriveMLM可以直接與現有的模塊化AD系統(如Apollo)進行對接,無需任何重大更改就能夠實現閉環駕駛,讓車真的跑起來。

二是可以直接輸入自然語言指令傳達乘客需求或高級系統消息,交給模型來處理。

這樣一來,自動駕駛系統便能適應越發多樣、高階的駕駛場景。

三是基于大模型不光輸出結果還能給出邏輯推理過程的特性,DriveMLM作出的每一個行為和選擇都會跟有詳細的說明來解釋它為什么要這么做。

可解釋性和安全之間的強關聯關系不用多說,DriveMLM的高可解釋性,將有助于我們不斷開發更為安全透明的自動駕駛系統。

自動駕駛的未來,就靠大模型了

有觀點云:自動駕駛一定有ChatGPT時刻,且最快就在今年到來。

如何到來?

業內普遍將目光投向了大模型。

商湯聯合創始人、首席科學家王曉剛最近就發表觀點稱:

接下來的一到兩年,是智能汽車關鍵突破的時間點。

無論是端到端數據驅動的自動駕駛、還是智能座艙大腦等等,都將以大模型為基礎。

他指出:其中在智能駕駛方面,大模型將包攬并連通感知、融合、定位、決策、規控等一系列模塊的功能并進行連通,來真正解決各種Corner Case。

而商湯的這次成果就讓我們看到,用大模型,特別是能處理多種類型數據的多模態LLM來做決策,對自動駕駛能力確實有很大提升。

其中最關鍵的,就是自動駕駛系統能更像人類,具備一定的常識,對駕駛環境、規則有相應的理解。

所以可以擺脫對手寫規則的依賴,在遇見沒有碰到過的駕駛場景時,比如上面提到的前方道路轉彎、需要提前減速的情況,系統能夠自己處理。

并且除了以往的傳感器數據,人類的語言輸入也能夠參與車輛控制的流程中,同時系統能夠理解意圖,并根據實際情況做出駕駛決策。

其實要說將大模型應用于自動駕駛,商湯DriveMLM并非行業先例。

但它作為業內首個將大模型應用于駕駛決策的方案,實現了對車輛的實際控制,更容易在車端構建端到端的解決方案,讓我們看到了大模型這一新解法的巨大潛力,所以值得關注。

此外,說起商湯,它本身在自動駕駛方面也有積淀。

不久前,他們的感知決策一體化自動駕駛通用大模型還入選了CVPR 2023最佳論文:《Planning-oriented Autonomous Driving》,DriveMLM正是在這個成果上進行的后續研究。

圖片

最后,我們也不由地期待,DriveMLM真正落地量產車的那一天。

所以,你看好大模型這一新解法嗎?你認為還有哪些挑戰需要解決?

責任編輯:姜華 來源: 量子位
相關推薦

2023-10-10 09:31:35

自動駕駛技術

2023-10-30 09:47:00

自動駕駛技術

2023-12-18 10:15:30

自動駕駛自然語言

2022-04-25 15:13:03

自動駕駛傳感器

2024-04-15 11:40:37

自動駕駛端到端

2025-02-10 10:35:00

自動駕駛端到端模型

2023-08-24 09:52:44

自動駕駛設計

2024-12-16 07:30:00

2024-02-21 09:14:32

端到端自動駕駛

2023-10-13 09:43:36

自動駕駛數據

2023-03-07 16:48:54

算法可解釋性

2022-02-25 10:56:08

自動駕駛傳感器技術

2022-04-06 11:05:25

自動駕駛商業化馬斯克

2024-04-17 09:50:28

自動駕駛端到端

2024-01-04 09:35:41

自動駕駛端到端

2024-08-13 12:39:23

2024-10-11 09:32:48

2024-03-13 09:39:45

端到端自動駕駛

2024-05-08 11:32:24

端到端自動駕駛

2023-12-11 10:29:11

自動駕駛系統
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩电影中文字幕在线观看 | 综合精品久久久 | 日韩三| 欧美日韩视频在线播放 | aaaaa毛片| 女同久久另类99精品国产 | 美女视频h | 国产一区视频在线 | 久久亚洲天堂 | 成人av免费在线观看 | 男女羞羞视频免费看 | 久久久久国产精品午夜一区 | 网站黄色在线免费观看 | 99在线资源 | 日韩精品一区二区三区视频播放 | 日韩一区二区三区视频 | 日韩超碰在线 | 国产男女视频网站 | 欧美亚洲激情 | 国产精品无码专区在线观看 | 欧美日本一区 | 一级免费a | 欧美久久不卡 | 日韩欧美在线不卡 | 欧美日韩视频一区二区 | 国产一区二区三区四区在线观看 | 久久久久久久久蜜桃 | 91久久国产综合久久91精品网站 | 97精品国产97久久久久久免费 | 成人影院在线 | 欧美mv日韩mv国产网站91进入 | 久久免费视频网 | 在线观看免费毛片 | 超碰免费观看 | 99视频在线播放 | 欧美综合一区 | 久久精品a| 国产一区二区在线91 | 久久久九九九九 | 久久精品国产一区二区三区不卡 | 国产免费自拍 |