成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

云上智能駕駛三維重建優秀實踐

人工智能 云計算
本文重點介紹火山引擎多媒體實驗室三維重建技術在動態、靜態場景的以及結合先進光場重建技術的原理與實踐,幫助大家能更好的了解和認識云上智能三維重建如何服務智能駕駛領域,助力行業發展。

智能駕駛技術的不斷發展,正在改變著我們的出行方式和交通系統。作為其中的一個關鍵技術,三維重建在智能駕駛系統中起著重要的作用。除去車端本身的感知、重建算法,自動駕駛技術的落地與發展需要龐大的云端重建能力支撐,火山引擎多媒體實驗室通過行業領先的自研三維重建技術,結合強大的云平臺資源與能力,助力相關技術在云端大規模重建、自動標注、真實感仿真等場景的落地與應用。

本文重點介紹火山引擎多媒體實驗室三維重建技術在動態、靜態場景的以及結合先進光場重建技術的原理與實踐,幫助大家能更好的了解和認識云上智能三維重建如何服務智能駕駛領域,助力行業發展。

一、技術挑戰與難點

駕駛場景重建需要對道路環境做點云級別的三維重建,與傳統的三維重建技術應用場景相比,駕駛場景重建技術有以下難點:

  1. 車輛運行過程中的環境因素復雜且不可控,不同天氣、光照、車速、路況等均會對車載傳感器采集到的數據造成影響,這對重建技術的魯棒性帶來了挑戰。
  2. 道路場景中經常會出現特征退化和紋理缺失的情況,例如相機獲取到視覺特征不豐富的圖像信息,或者激光雷達獲取到相似性較高的場景結構信息,同時,路面作為重建中的關鍵要素之一,色彩單一且缺少足夠的紋理信息,這對重建技術提出了更高的要求。
  3. 車載傳感器數量較多,常見的有相機、激光雷達、毫米波雷達、慣導、GPS定位系統、輪速計等等,如何將多傳感器的數據融合起來得到更精確的重建結果,對重建技術提出了挑戰。
  4. 道路中存在運動車輛、非機動車、行人等動態物體,會對傳統重建算法帶來挑戰,如何剔除動態物體對靜態場景重建帶來干擾,同時對動態物體的位置、大小、速度進行估計,也是項目的難點之一。

二、駕駛場景重建技術介紹

自動駕駛領域的重建算法通常會采用激光雷達、相機為主,GPS、慣導為輔的技術路線。激光雷達可以直接獲取高精度的測距信息,能夠快速得到場景結構,通過預先進行的激光雷達-相機聯合標定,相機獲取到的圖像能夠為激光點云賦予色彩、語義等信息。同時,GPS和慣導可以進行輔助定位,減少重建過程中因為特征退化而出現的漂移現象。但是,由于多線激光雷達售價較高,通常用于工程車輛,而在量產車上很難得到規模化的使用。

對此,火山引擎多媒體實驗室自研了一套純視覺的駕駛場景重建技術,包括靜態場景重建、動態物體重建和神經輻射場重建技術,能夠區分場景中的動靜態物體,還原出靜態場景的稠密點云,并突出路面、指示牌、紅綠燈等關鍵要素;能夠對場景中運動物體的位置、大小、朝向和速度進行有效的估計,用于后續的4D標注;能夠在靜態場景重建的基礎上,使用神經輻射場對場景進行重建和復現,實現自由視角的漫游,可用于場景編輯和仿真渲染。這套技術解決方案不依賴激光雷達,且能夠達到分米級的相對誤差,用最小的硬件成本實現接近激光雷達的重建效果。

2.1 靜態場景重建技術:剔除動態干擾、還原靜態場景

視覺重建技術以多視角幾何作為基礎的理論依據,要求待重建的場景或者物體具有幀間一致性,即在不同圖像幀中處在靜止狀態,因此需要在重建過程中剔除動態物體。根據場景中的不同要素的重要性,稠密點云中需要去除無關緊要的點云,而保留一些關鍵要素點云,因此需要事先對圖像進行語義分割。對此, 火山引擎 多媒體實驗室結合AI技術與多視角幾何基本原理,搭建了一套先進的魯棒、精確完整視覺重建算法框架。重建過程包括三個關鍵步驟 :圖像預處理、稀疏重建和稠密重建 

圖片

車載相機拍攝過程中處在運動狀態,由于曝光時間的存在,采集到的圖像中會隨著車速提高而出現嚴重的運動模糊現象。另外,出于節約帶寬和存儲空間考慮,傳輸過程中會對圖像進行不可逆的有損壓縮,造成畫質的進一步降低。為此, 火山引擎多媒體實驗室使用了端到端的神經網絡對圖像進行去模糊處理,能夠在抑制運動模糊現象的同時對圖像質量進行提升。去模糊前后的對比如下圖所示。

圖片

去模糊前(左) 去模糊后(右)

為了區分出動態物體,火山引擎多媒體實驗室使用了基于光流的動態物體識別技術,能夠得到像素級別的動態物體掩膜。在之后的靜態場景重建過程中,落在動態物區域上的特征點將被剔除,只有靜態的場景和物體將得到保留。

圖片

光流(左) 運動物體(右)

稀疏重建過程中需要同時計算相機的位置、朝向和場景點云,常用的有SLAM算法(Simultaneous localization and mapping)和SFM算法(Structure from Motion,簡稱SfM)。在不要求實時性的情況下,SFM算法能夠得到更高的重建精度。但是,傳統的SFM算法通常將每個相機當作獨立相機來進行處理,而車輛上通常會在前后左右不同方向布置多個相機,這些相機之間的相對位置其實是固定不變的(忽略車輛振動帶來的細微變化)。如果忽視相機與相機之間的相對位置約束,計算出來的各相機位姿誤差會比較大。另外,當遮擋比較嚴重時,個別相機的位姿會難以計算。對此,火山引擎多媒體實驗室自研了基于相機組整體的SFM算法,能夠利用相機之間的先驗相對位姿約束,以相機組作為整體來計算位姿,同時使用了GPS加慣導的融合定位結果對相機組中心位置進行約束,可有效地提高位姿估計的成功率和準確率,并能改善不同相機之間的點云不一致現象,減少點云分層現象。

圖片

圖片

傳統SFM(左) 相機組SFM(右)

由于地面色彩單一、紋理缺失,傳統的視覺重建很難還原出完整的地面,但是地面上存在車道線、箭頭、文字/標識等關鍵要素,因此火山引擎多媒體實驗室采用了二次曲面來擬合地面,輔助進行地面區域的深度估計和點云融合。和平面擬合相比,二次曲面更貼合實際道路場景,因為實際的路面往往并不是一個理想平面。以下是分別用平面方程和二次曲面方程來擬合地面的效果對比。

圖片

平面方程(左) 二次曲面方程(右)

將激光點云視作真值,并將視覺重建結果與之疊加,可以直觀地衡量重建點云的準確性。從下圖中可以看到,重建點云和真值點云貼合度非常高,經過測量得到重建結果的相對誤差在15cm左右。

圖片

火山引擎多媒體實驗室重建結果(彩色)與真值點云(白色)

以下是火山引擎多媒體實驗室視覺重建算法和某主流商業重建軟件的效果對比。可以看到,和商業軟件相比,火山引擎多媒體實驗室的自研算法重建效果更好、更完整,場景中的路牌、紅綠燈、電線桿,以及路面上車道線、箭頭等還原度非常高,而商業軟件的重建點云非常稀疏,且路面大范圍缺失。

圖片

某主流商業軟件(左) 火山引擎多媒體實驗室算法(右)

2.2 動態重建技術

在圖像上對物體進行3d標注十分困難,需要借助于點云,當車輛只有視覺傳感器時,獲取場景中目標物體的完整點云十分困難。特別是動態物體,無法使用傳統的三維重建技術獲取其稠密點云。為提供運動物體的表達,服務于4d標注,使用3d bounding box(以下簡稱3d bbox)對動態物體進行表示,通過自研動態重建算法獲取每一時刻場景中動態物體的3d bbox姿態、大小、速度等,從而補全動態物體重建能力。

圖片

動態重建pipeline

對車輛采集的每一幀圖像,首先提取場景中的動態目標,生成3d bbox的初始提議,提供兩種方式:使用2d目標檢測,通過相機位姿估計對應的3d bbox;直接使用3d目標檢測。兩種方式針對不同數據可以靈活進行選擇,2d檢測泛化性好,3d檢測可以獲得更好的初值。同時,對圖像動態區域內部的特征點進行提取。獲取單幀圖像初始3d bbox提議及特征點后,建立多幀間數據關聯:通過自研多目標跟蹤算法建立物體匹配,并通過特征匹配技術對圖像特征進行匹配。獲取匹配關系后,將有共視關系的圖像幀創建為局部地圖,構建優化問題求解全局一致的目標bbox估計。具體地,通過特征點的匹配以及動態三角化技術,恢復動態3d點;對車輛運動建模,聯合優化物體、3d點、相機之間的觀測,從而獲得最優估計的動態物體3d bbox。

圖片

2d生成3d(左二) 3d目標檢測示例

2.3 NeRF 重建:真實感渲染、自由視角

使用神經網絡進行隱式重建,利用可微渲染模型,從已有視圖中學習如何渲染新視角下的圖像,從而實現照片級逼真的圖像渲染, 即神經輻射場(NeRF)技術。同時,隱式重建具有可編輯、查詢連續空間的特性,可以用于自動駕駛場景中自動標注、仿真數據構建等任務。使用NeRF技術對場景進行重建是非常有價值的。

圖片

火山引擎多媒體實驗室融合神經輻射場技術與大場景建模技術。在具體實踐中,首先針對數據進行處理,場景中的動態物體會使NeRF重建出現偽影,借助自研動靜態分割、影子檢測等算法,對場景中和幾何不一致的區域進行提取,生成mask,同時利用視頻inpainting算法,對剔除掉的區域進行修復。借助自研三維重建能力,對場景進行高精度的幾何重建,包括相機參數估計以及稀疏、稠密點云生成。另外,對場景進行拆分以減小單次訓練資源消耗,并可做分布式訓練、維護。在神經輻射場訓練過程中,針對室外無邊界大場景,團隊通過一些優化策略以提升該場景下的新視角生成效果,如通過在訓練中同時優化位姿提高重建精度,基于哈希編碼的層次化表達提升模型訓練速度,借助外觀編碼提升不同時間采集場景的外觀一致性等,借助mvs稠密深度信息提升幾何精度等。團隊同毫末智行合作,完成單路采集以及多路合并的NeRF重建,相關成果已在毫末AI Day發布。

圖片

動態物/影子剔除,填補

責任編輯:龐桂玉 來源: 字節跳動技術團隊
相關推薦

2023-06-02 14:10:05

三維重建

2023-12-13 10:14:00

機器視覺技術

2021-03-16 09:53:35

人工智能機器學習技術

2023-10-16 09:51:47

模型視覺

2021-11-10 10:10:18

智能自動駕駛汽車

2021-10-09 15:36:31

技術研發三維

2022-09-26 15:18:15

3D智能

2024-02-20 09:46:00

模型技術

2025-05-13 16:57:18

2024-06-19 11:30:36

2023-02-09 15:18:37

智能駕駛ChatGPT

2024-09-04 09:38:02

2023-01-04 11:12:17

紫光云

2023-04-03 11:52:51

6D英偉達

2023-02-07 15:33:16

云遷移數據中心云計算

2025-06-11 14:08:30

2024-12-12 08:28:11

2019-11-27 10:55:36

云遷移云計算云平臺

2019-04-25 09:33:04

新華三
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩一区中文字幕 | 日韩一区二区三区在线视频 | 成人小视频在线免费观看 | 99免费在线 | 日韩爱爱网 | 久久新| 阿v视频在线观看 | 蜜臀网站 | 国产精品久久久久无码av | 麻豆国产一区二区三区四区 | 一区在线播放 | 欧美一级视频 | 国产精品视频一二三区 | 欧美一区视频在线 | 欧美一区二区在线看 | 狠狠干天天干 | 玖玖综合在线 | 精品日韩一区 | 亚洲精品一区二区三区蜜桃久 | 国产97久久| 欧美精品一区二区三区在线播放 | 夜夜爽99久久国产综合精品女不卡 | 国产在线一区观看 | 色综合99 | 91久久国产综合久久 | 国产一区二区精品在线观看 | 亚洲精品一区二区在线观看 | 久久久久久网 | 日本 欧美 国产 | 亚洲成人久久久 | 国产精品一区二区免费 | 欧美精品一区二区三区蜜桃视频 | 成人一区二区在线 | 成人在线电影在线观看 | 欧美999 | 91网站在线播放 | 国产婷婷 | 91精品久久久 | 国产精选一区 | 成人美女免费网站视频 | 国产一区二区久久 |