毫末智行發布中國首個自動駕駛數據智能體系——MANA
原創【51CTO.com原創稿件】 在自動駕駛領域,數據智能是AI自動駕駛技術的“明珠”,是最終成為勝利者的成功要素。完善的數據智能體系是AI自動駕駛科技公司成功的基石。在業內,誰能高效低成本的挖掘數據價值,誰就能成為競爭的王者。
12月23日,毫末智行(以下簡稱毫末)發布了中國首個自動駕駛數據智能體系MANA,中文名雪湖。毫末喜歡借助《三體》命名,雪湖就來自《三體》第二部《黑暗森林》,這個名字代表了毫末以AI通向自動駕駛夢想的思考。
AI DAY前一日,毫末剛剛宣布完成A輪近10億元融資,成為中國第一家實現規模量產的自動駕駛獨角獸公司。投資方為美團、高瓴創投、高通創投、首程控股、九智資本等。
目前,毫末的小魔盒平臺輔助駕駛里程已經突破400萬公里,在2年內有5款乘用車、5款無人物流車、2款無人跟隨設備搭載了毫末的產品。毫末計劃在未來三年,將有超過100萬輛乘用車搭載毫末智行輔助駕駛系統。
MANA體系的構成
毫末通過對400萬公里用戶行駛里程數的沉淀與思考,總結出與數據規模相關的函數:F(x)=Z+M(x),它展示出一條代表自動駕駛能力發展的曲線。
F代表產品力,Z0代表毫末第一代產品,M是一個把數據轉化為知識的函數,包括數據獲取、表達、存儲、傳輸、計算、驗證,以及對成本和速度的影響。
MANA就是這個最核心的M。MANA由TARS(數據原型系統)、LUCAS(數據泛化系統)、VENUS(數據可視化平臺)、BASE(底層系統)四個子系統組成。
具體來看:
BASE包括了數據的獲取,傳輸,存儲,計算,以及新的數據分析和數據服務;
TARS是一些關于計算的核心算法原型,用于感知、認知、車端建圖和驗證的實踐;
LUCAS是對算法在應用場景上的實踐,包括高性能計算、診斷、驗證、轉化等核心能力;
VENUS是數據可視化化系統,包括軟件和算法的執行情況,對場景的還原,以及數據洞察等能力。
而MANA將是毫末AI的底層系統,作為毫末自動駕駛能力進化的核心動力。
數據在MANA中的實踐
毫末CEO顧維灝從感知、認知、標注、仿真、計算五個方面,對毫末如何實踐作出進一步的分享。
毫末智行CEO顧維灝
感知
目前毫末核心的感知設備是車載攝像頭和激光雷達,核心問題是如何實現1+1≧4的效果。相較于過往標準的結果融合方法,毫末做兩種數據源的過程融合,這種方法更高效。
系統中,首先把攝像頭和激光雷達的數據在backbone中進行計算,然后經過Transformer的多模態融合,把數據映射到tensor space中。再經過一層特征提取后,加入時間的特征,在這個過程中使用RNN和光流SLAM進行時空融合。這樣就有了時空一體的模型,在此基礎上再進行多Head的計算,計算出所需要的結果。
這種多數據源的時空融合,會快速拉升感知能力,讓自動駕駛系統能夠更準確的刻畫現實世界。
認知
感知要解決的是從傳感器信號中重建客觀世界的問題,而認知要解決的是從客觀世界到駕駛動作的映射問題。
顧維灝提出認知三要素:安全、舒適、高效。安全上,毫末擁有全棧自研安全認知模型CSS,其核心是自動駕駛系統不只局限在從純機械的角度保證自己不主動犯錯,而是充分考慮從數據中學習到的對其他交通參與者行為的理解和超時空的歷史經驗;
在安全底線之上,從數據中學習舒適和更高效的量化標準,以及這三要素之間的制約關系,讓自動駕駛算法可以更好的處理復雜的駕駛場景,制定更符合用戶喜好的駕駛策略。
具體方法是把影響我們駕駛行為的細節,從宏觀上分成幾個影響因素:天氣、道路結構、交通參與者、交通流密度、彼此方位、主車路線、碰撞風險和碰撞時距。毫末從已有的數據中挖掘和表達這些屬性,然后在進行聚類和分類,形成下圖這個結果。它們將駕駛場景做出宏觀維度的劃分。
將駕駛場景做宏觀維度的劃分
毫末正在研究一種端到端的模擬學習,就是以過往的事例為指導,從數字化的場景中得到具體的本車動作。模擬學習,需要更大的數據樣本,特別是標注好的數據,然后從數據中學習得到規律。
模擬學習是自動駕駛的最好的認知學習方式,最為直接,因為所有的場景都可以被數字化感知,所有的標注都已經在我們自己開車的過程中自動被標注。我們需要做的,就是挑選更符合要求的駕駛行為,并在不同場景下持續的訓練。
毫末首先定義好能夠得分的目標函數,它是一個概率函數,表征了在某個場景下人類動作和交通規則約束下該做的動作的概率。
根據前面提到的細分場景分類,訓練自車動作和全局最優的網絡。毫末實踐了6種強化深度學習的算法(下圖),發現RSAC算法更適用于我們研究的場景,能夠更快收斂,得分最高,走的更遠。
圖右上為6種強化算法
標注
感知的進步需要很多標注的數據。面對大規模量產,尤其要關注這個問題。比如,Tesla標注了60億個物體,包括精準的3D信息、深度、速度。毫末現在也有幾百人在幫助我們做標注,但是如果做到這60億,達到如此的精度,按照今天的市場價格,這樣的方法并不高效也不經濟。
所以毫末要做一個高效的標注系統。毫末把閉環的思路用上,把無監督自動標注算法用上。比如車道線識別,目前大部分是通過自動標注完成的,目前性能是市場上其它很多家的幾倍。
驗證
驗證現在有種流行的說法叫自動駕駛元宇宙。毫末的主要方法就是通過仿真制造訓練數據,在仿真世界中整個世界的數據都是被標注好的,是天然的數字世界。在仿真世界中可以呼風喚雨,在不同的光照,天氣、道路摩擦系數下,也可以快速完善算法的迭代。
MANA超算中心和HSD
人類的數據規模在從文本向圖像轉變,其規模非常龐大。因此毫末MANA超算中心正在籌備中,主要用于自動駕駛的數據處理、訓練、推理和驗證等需求。
此外,顧維灝表示,2022年年中,毫末輔助駕駛系統HPilot即將推出“城市NOH”這一全新功能。2022年下半年,毫末將計劃交付全場景NOH,并在2023年推出擁有HSD(HAOMO Self-Driving)的車隊。
隨著毫末智行MANA——中國第一個自動駕駛數據智能體系的建立,相信國內自動駕駛核心技術將迎來更快、更好的發展。相信未來毫末能夠在乘用車、無人物流車等領域成為行業的領導者。
【51CTO原創稿件,合作站點轉載請注明原文作者和出處為51CTO.com】