一篇文章討論單目圖像中保持拓撲的局部道路網絡估計
arXiv上2021年12月19日上傳論文“Topology Preserving Local Road Network Estimation from Single Onboard Camera Image“,作者來自瑞士ETH和比利時魯汶大學。
道路網絡拓撲知識對于自主規劃和導航至關重要。然而,從一張圖像恢復這樣的拓撲結構只是部分探索。此外,需要參考一下地平面,在上面會執行駕駛動作。本文旨在直接在鳥瞰圖(BEV)提取復雜城市環境的局部道路網絡拓撲。唯一的輸入由單個車載前視攝像頭圖像組成。用一組有向車道曲線表示道路拓撲,其交互是交點來捕獲。為了更好地捕捉拓撲信息,引入最小循環(minimal cycles)及其覆蓋(cover)的概念。最小循環是由有向曲線段(兩個交點之間)形成的最小循環。覆蓋是形成最小循環的一組曲線。首先證明覆蓋足以唯一地表示道路拓撲,然后與車道曲線監控一起用于監督深層神經網絡,學習從單個輸入圖像去預測道路拓撲。在NuScenes和Argoverse做了基準測試,源代碼將公開。
如圖所示:道路網絡和生成的封閉區域(最小循環,以不同顏色顯示)。在道路網中,交通流從綠點流向紅點,黃點是兩條中心線的連接點。要學習保持包含最小循環的中心線本身。一些有趣的區域在彩色圖像上以白圈顯示。
如圖是最小循環及其覆蓋的定義示意:c)和d)
如圖所示是一個訓練程序:其生成中心線曲線估計值以及最小循環和覆蓋;曲線和循環之間的映射提供了一致和更高級的監督,得到對場景拓撲的理解;將連接步用于每對選定曲線,估計連接性概率,其中修改連接的中心線使其對應端點重合。
用神經網絡預測固定數量的曲線和最小循環,其大于場景中的實際曲線數和循環數。因此,假設有一個函數U接受輸入(相機圖像)并輸出兩個矩陣,一個是所有N條曲線候選的D維嵌入,另一個是所有M個最小循環候選的E維嵌入。這兩個嵌入矩陣分別由函數F(Vc)和H(Vm)處理。F(Vc)處理嵌入Vc的候選曲線并生成矩陣輸出,其包含N條曲線的參數和曲線存在的概率。H(Vm)處理最小循環候選嵌入,并生成三個輸出,每個輸出描述最小循環的屬性。第一是M條候選曲線中每一條的估計最小覆蓋,描述N條候選曲線和K個FOV邊界曲線之一屬于該覆蓋的概率;第二是可能存在最小循環的概率,最后是輔助輸出,估計候選最小循環的中心。因此,該網絡最后生成一組曲線和最小循環候選。
訓練中用基于匹配的方法,對曲線很簡單,控制點之間L1差采用匈牙利匹配;然而,對最小循環來說,更為復雜;其中基本的一點是,真實拓撲和估計拓撲之間的匹配是一致的。
設有N′個真曲線和帶K邊界曲線的M′個真最小循環。同樣,記錄真曲線參數、真曲線的最小覆蓋和真的最小循環中心。由于真值(GT)最小循環定義在真曲線上,而檢測到的最小循環定義在估計曲線上,因此必須首先在估計曲線和真曲線之間形成匹配。匈牙利匹配是不理想的,因為它不考慮估計曲線的碎片化。碎片是指多條相連的估計曲線代表一條真曲線的情況。因此,通常情況下,估計的候選最小循環比真的最小循環有更多的候選曲線。
由于匈牙利算法的“一對一”匹配特性,一條長真曲線只能與一條短片段曲線匹配,即使估計片段的組合可以得到更接近的近似。因此,將每個候選曲線與其最近的真曲線進行匹配,這意味著每一條候選曲線只匹配一條真曲線,而真曲線可以匹配任意數量(包括零個)的候選曲線。
將所有匹配的估計曲線設置為一,如果它們對應的真實曲線存在于最小循環中。鑒于此修正的真最小循環標簽和估計的最小循環,運行匈牙利匹配可以找到用于損失計算的那對,這使得估計的拓撲得到一致的訓練。
最后,為了監控曲線的連通性,顯式地估計網絡中V(G,E)的關聯矩陣A。為每個候選中心線提取一個特征向量并構建一個分類器實現這個估計,該分類器采用屬于一對曲線的兩個特征向量,并輸出它們的關聯概率。
訓練中使用匈牙利算法匹配的曲線建立正確的順序。估計的關聯矩陣還允許在測試期間進行合并后處理,其中會修改曲線的端點,以便使相連接的曲線重合在一起。
中心線的樣條曲線控制點和最小循環中心使用L1 -loss進行訓練,同時用中心線和最小循環概率的二元交叉熵。二元交叉熵計算最小循環的membership-loss以及連通性。
如圖是設計的網絡架構:(a)最小循環Transformer網絡和(b)最小循環多邊形RNN網絡;第一個聯合處理兩組查詢(曲線和最小循環)以生成相應的特征向量。然后將這些向量饋送給MLP進行最終估計;第二個是三部分組成:1)初始點估計,2)給定初始點,可以輸出曲線后續控制點的多邊形RNN,以及 3)最小循環的解碼器。
提出了道路拓撲準確性的兩個測度:Minimal-Cycle Minimal Cover (B) 和Intersection Order。
實驗結果如下;
局限性:對于大多數現代道路網絡,這里的理論假設都是溫和的。然而,有可能存在違反這些假設的情況,這樣的道路網對網絡進行訓練非常困難。此外,提取用于訓練的最小循環是一個耗時的過程,并會阻止使用數據增強技術。