Think2Drive:首個用于自動駕駛的基于模型的RL方法(上海交大)
本文經自動駕駛之心公眾號授權轉載,轉載請聯系出處。
在CARLA v2中以專家級的熟練程度運行。
題目:Think2Drive: Efficient Reinforcement Learning by Thinking in Latent World Model for Quasi-Realistic Autonomous Driving (in CARLA-v2)
作者單位:上海交通大學
現實世界中的自動駕駛(AD),尤其是城市駕駛,涉及許多corner case。最近發布的AD仿真器CARLA v2在駕駛場景中增加了39個常見事件,并提供了比CARLA v1更接近真實的測試平臺。這給社區帶來了新的挑戰,到目前為止,還沒有文獻報告CARLA v2中的新場景取得了任何成功,因為現有的工作大多都必須依賴于特定規則進行規劃,但它們無法涵蓋CARLA v2中更復雜的情況。這項工作主動直接訓練一個規劃器,希望能夠靈活有效地處理corner case,認為這也是AD的未來方向。據我們所知,我們開發了第一個基于模型的強化學習方法,名為Think2Drive,用于AD,具有一個世界模型來學習環境的轉變,然后它充當神經仿真器來訓練規劃器。這種范式極大地提高了訓練效率,因為世界模型中的低維狀態空間和張量的并行計算。
結果,Think2Drive能夠在單個A6000 GPU上進行3天的訓練后,在CARLA v2中以專家級的熟練程度運行,據我們所知,迄今為止尚未報告有關CARLA v2的成功(100%的路線完成)。還提出了CornerCase-Repository,這是一個支持通過場景評估駕駛模型的基準。此外,提出了一個新的平衡指標來評估性能,包括路線完成、違規次數和場景密度,以便駕駛分數可以提供更多關于實際駕駛表現的信息。
實驗結果
寫在最后
歡迎star和follow我們的倉庫,里面包含了BEV/多模態融合/Occupancy/毫米波雷達視覺感知/車道線檢測/3D感知/多模態融合/在線地圖/多傳感器標定/Nerf/大模型/規劃控制/軌跡預測等眾多技術綜述與論文;