新基準!威斯康星大學開源Ultra-AV:統一自動駕駛縱向軌跡數據集
摘要
自動駕駛車輛在交通運輸領域展現出巨大潛力,而理解其縱向駕駛行為是實現安全高效自動駕駛的關鍵。現有的開源AV軌跡數據集在數據精煉、可靠性和完整性方面存在不足,從而限制了有效的性能度量分析和模型開發。
本研究針對這些挑戰,構建了一個(Ultra-AV),用于分析自動駕駛汽車的微觀縱向駕駛行為。該數據集整合了來自14 個的數據,涵蓋多種自動駕駛汽車類型、測試場景和實驗環境。我們提出了一種數據處理框架,以獲得高質量的縱向軌跡數據和跟馳軌跡數據。最后,本研究通過對安全性、通行效率、穩定性和可持續性等多個性能維度的評估,以及對跟馳模型變量之間關系的分析,驗證了數據的有效性。我們的工作不僅為研究人員提供了標準化的數據和指標,用于分析自動駕駛汽車的縱向行為,還為數據采集和模型開發提供了指導方法**。
介紹
理解自動駕駛汽車的縱向駕駛行為對于確保其安全性和優化交通流至關重要。然而,現有的開源自動駕駛汽車軌跡數據集缺乏精細的數據清理和標準化,導致:
- 數據質量不均,影響模型開發和性能評估。
- 缺乏完整性和可靠性,難以進行跨數據集研究。
- 分析效率低,影響AV安全測試和仿真研究。
本研究提出了一種統一的自動駕駛汽車縱向軌跡數據集(Ultra-AV),有以下特點:
- 大規模數據集: 數據總量 2.6GB,涵蓋 14 個不同的自動駕駛數據源,涉及 30 多種測試和實驗場景,包含 超過 1000 萬個數據點,相當于 280 小時以上的行駛數據。
- 標準化數據格式: 統一不同數據源的數據格式,使其適用于跨數據集研究。
- 數據處理框架: 提供一種高效的數據處理方法,提高數據的可用性,支持自動駕駛仿真測試和行為建模。
方法
如圖所示,我們的統一數據集涵蓋了14個不同來源的數據集。這些數據集收集自美國和歐洲的多個城市,確保了所選城市的多樣性和代表性,使研究具備更廣泛的適用性。
此外,大多數被整合的數據集都包含自動駕駛汽車的長時間軌跡,這些數據廣泛應用于自動駕駛行為分析。然而,一些特定數據集,如 Waymo Open Dataset中的 Waymo Motion Dataset 和Argoverse 2 Motion Forecasting Dataset,其軌跡時間較短,分別為9.1 秒和11 秒(采樣頻率為 10Hz)。這些數據集主要用于Motion Forecasting領域的研究,盡管軌跡較短,但其采集地點通常位于復雜交通環境中的市區,能夠提供在復雜場景下分析自動駕駛行為的機會。因此,本研究特別包含了對這兩個數據集的分析,以確保數據集的全面性和適用性。
本研究提出了一種數據處理框架,用于標準化并清理自動駕駛汽車軌跡數據。該框架包含以下三步。
Step 1: 軌跡數據提取
從多個AV數據集中提取統一格式的縱向軌跡數據,包括汽車位置、速度、車頭時距等關鍵變量。關鍵變量如下:
變量 | 描述 |
Trajectory ID | 軌跡數據的唯一標識 |
Time Index | 軌跡數據時間索引 |
LV Position | 領航車(LV)位置 |
LV Speed | 領航車速度 |
FAV Position | 跟馳車(FAV)位置 |
FAV Speed | 跟馳車速度 |
Space Headway | 車頭間距 |
Speed Difference | 車速差 |
針對處理過后的數據,我們通過三個方面對數據進行驗證分析。
Step 2: 通用數據清理
為了提高數據的可靠性,采用以下清理策略:
- 移除異常值: 刪除超過 均值 ± 標準差 的數據點。
- 缺失值填補: 刪除時間戳不連續的數據點,并采用線性插值補全缺失數據。
- 軌跡數據重構: 重新整理數據結構,確保數據的可解釋性。
Step 3: 數據特定清理
針對車隊跟馳場景,設定閾值去除異常數據,以提高分析準確性。下圖展示了處理后的數據分布。其中分別代表車頭間距,車速,車速差,和加速度。
數據采集
結合作者所在課題組的數據方案和文獻,我們認為目前自動駕駛汽車的數據采集通常來自多種高精度傳感器的數據整合,包括LiDAR(激光雷達),*GPS(全球定位系統),DSRC(車載通信單元),高清攝像頭等。圖中顯示了作者課題組基于Lincoln MKZ的自動駕駛汽車測試平臺。
關鍵性能指標
為評估自動駕駛汽車的性能,我們采用以下性能指標:
- 安全性指標: Time-to-Collision ()。
- 穩定性指標: 加速度變化率()。
- 可持續性指標: 燃油消耗()。
- 通行效率指標: 車頭時距()。
分析結果如圖所示。
跟馳模型開發
最后,為了分析自動駕駛汽車的縱向行為,本研究探討了加速度與輸入變量(車頭間距、車速和車速差)之間的關系。下圖繪制了這些變量之間的散點圖,其中y軸是加速度,綠/黃/橙色圖片的橫軸分別代表車頭間距,車速,以及車速差。可以看出,車頭間距和車速差對加速度的影響顯著,而加速度與車速之間無明顯線性關系。其中,加速度與車頭間距呈非線性正相關,與車速差呈線性負相關。
結論
本研究回顧了多個自動駕駛軌跡數據集,并開發了統一自動駕駛縱向軌跡數據集,主要貢獻包括:
- 標準化縱向軌跡數據集 - 統一并清理不同數據源的數據,提高數據可用性。
- 高質量的跟馳數據集 - 通過去噪和數據清理,保證數據分析的準確性。
- 跟馳行為分析 - 研究加速度與輸入變量之間的非線性關系。
本文的連接和相關代碼、數據可以在以下鏈接里找到:
- Ultra-AV 數據集論文 - Scientific Data
- GitHub 代碼倉庫 - Ultra-AV Dataset