百度發布了一個“超同類10倍”數據量的自動駕駛數據集,有哪些亮點
一向講究開放、不斷吸吸納新成員加入的百度 Apollo 自動駕駛平臺,最近「一反常態」,主動宣布加入加州大學伯克利 DeepDrive 自動駕駛產業聯盟。
美國時間 3 月 8 日,百度方面宣布 Apollo 自動駕駛開放平臺正式加入 DeepDrive 深度學習自動駕駛產業聯盟,并發布了 Apollo 自動駕駛數據集 ApolloScape。
如此吸引百度 Apollo 平臺主動加入這個產業聯盟,恐怕是后者更為豐富的自動駕駛學術成果和產業資源。
如果你對 UC Berkeley(加州大學伯克利分校)足夠了解,就知道 DeepDrive 是 UC Berkeley 兩大與汽車智能化相關的實驗室之一(另一個是 InterACT)。
DeepDrive 的研究成果并非停留在實驗室,而是與產業界結合緊密,目前合作伙伴有諸如博世、采埃孚等一級供應商,大眾、本田、現代等車企,恩智浦、英偉達等芯片廠商,以及華為、馭勢等中國公司均是其合作對象。
*Deep Drive 研究項目的合作伙伴
而 DeepDrive 深度學習自動駕駛產業聯盟則是由加州大學伯克利分校領導的研究應用于汽車領域的計算機視覺和機器學習前沿技術的產業聯盟。
它的成員包括:英偉達、高通、通用、福特等 20 家全球自動駕駛領域***企業,研究項目覆蓋感知、規劃決策、深度學習等自動駕駛關鍵領域。
百度加入這個聯盟的目的,是希望通過攜手全球自動駕駛領先企業以及***學術研究機構,共享研究成果、加速自動駕駛的技術創新和落地應用進程,以此來壯大自動駕駛研發力量。
ApolloScape:數據量是同類數據集 10 倍以上
這次發布的另一個看點是百度開放的 ApolloScape 數據集。
數據集一般分為兩類:一類是通用數據集,這是由純計算機視覺領域提出的數據集,這類數據集僅僅因為有“車”的元素;另一類是自動駕駛數據集,不光包括計算機視覺信息,還有 IMU、GPS 等信息。例如 KITTI,這是目前國際上***的自動駕駛場景下的計算機視覺算法評測數據集,地位不可小覷。
顯然,百度也希望將 ApolloScape 打造成為這樣一個數據集。那么,ApolloScape 數據集有哪些亮點呢?
百度認為,海量、高質的真實數據是自動駕駛開發測試中必不可缺的「原料」,因此 ApolloScape 的數據量是同類數據集(如 Cityscapes )的 10 倍以上。
其中,數據量內容包括:感知、仿真場景、路網數據等數十萬幀逐像素語義分割標注的高分辨率圖像數據。百度方面介紹,從數據難度維度看,ApolloScape 數據集涵蓋了更復雜的道路狀況。一個例子是單張圖像中多達 162 輛交通工具或 80 名行人。
除此之外,這個開放數據集采用了逐像素語義分割標注的方式,百度稱這是「目前環境最復雜、標注最精準、數據量***的自動駕駛數據集?!?/p>
ApolloScape 標注數據示例
ApolloScape 深度數據示例
Kitti,CityScapes 和 ApolloScape 關于數據實例的對比
ApolloScape 另一個特點是包含了數十萬幀逐像素語義分割標注的高分辨率圖像數據。
為便于研究人員更好的利用數據集的價值,百度在數據集中定義了共 26 個不同語義項的數據實例(例如汽車、自行車、行人、建筑、路燈等),并將進一步涵蓋更復雜的環境、天氣和交通狀況等。
數據中包含的各類實例的信息
仿真也是這個數據集的一個重點項目。百度的目標是打造真實世界還原度***、場景最豐富的仿真平臺。
據雷鋒網了解,基于 Apollo 仿真平臺,ApolloScape 計劃將數十輛自動駕駛車輛投入到同一個路網中行駛,通過模擬真實復雜駕駛場景和多車博弈過程,幫助研發人員有效檢驗并優化預測、決策和路徑規劃等算法,提升自動駕駛測試的多樣性。
為了盤活這個數據集,吸引更多開發者使用 ApolloScape 數據集,在今年的 CVPR 期間,百度 Apollo 將聯合加州大學伯克利分校舉辦自動駕駛研討會(Workshop on Autonomous Driving),希望借此為全球自動駕駛開發者和研究人員提供一個技術突破和應用創新平臺。
「大系統」與「小模塊」
在過去,計算機視覺一直面臨的一個通病是舊的算法在新的數據集上不起作用。
「我們號稱解決了一個問題,只不過是解決了一個數據集,并不能說明我們真正解決了這個問題,而這種情況經常發生。」國內某家自動駕駛公司 CTO 對雷鋒網(公眾號:雷鋒網)表示。
舉例而言,我們可以將自動駕駛這個「大系統」拆成 100 個小的計算機視覺問題。
但這里就存在值得深思的兩點:***,我們不知道這 100 個問題中哪個問題更重要;第二,我們不知道在解決了哪個問題、解決到何種程度以后,就能號稱我們完全解決了自動駕駛問題。
所以,如何解決自動駕駛「大系統」和自動駕駛「小模塊」之間的問題,這才是百度 ApolloScape 數據集需要建立的下一步優勢,也是從業者和開發者們需要的自動駕駛數據集。