成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

北航&清華聯(lián)合發(fā)力!Stag-1:視頻生成模型實(shí)現(xiàn)超逼真的4D駕駛場景算法!

人工智能 智能汽車
今天為大家分享北航&清華等團(tuán)隊(duì)最新的生成算法—Stag-1!性能完爆各大重建算法,生成亦有閉環(huán)仿真未來。

寫在前面&筆者的個(gè)人理解

近年來,隨著自動(dòng)駕駛在感知、預(yù)測和規(guī)劃方面取得的重大進(jìn)步,端到端算法網(wǎng)絡(luò)也取得了重大進(jìn)展。隨著現(xiàn)如今這些技術(shù)的飛速進(jìn)步,自動(dòng)駕駛汽車的全面測試和驗(yàn)證也變得越來越重要。然而,真實(shí)世界的車輛測試仍然耗時(shí)、費(fèi)用昂貴,并且場景的覆蓋范圍也非常有限。

現(xiàn)在,主流研究越來越依賴仿真軟件進(jìn)行廣泛的算法測試和驗(yàn)證。然而,基于 3D 建模的仿真難以準(zhǔn)確復(fù)制真實(shí)的駕駛場景,從而導(dǎo)致合成環(huán)境與現(xiàn)實(shí)世界之間存在巨大的差距。為了解決這個(gè)問題,當(dāng)前的自動(dòng)駕駛測試解決方案力求構(gòu)建高度逼真的場景來驗(yàn)證駕駛算法。隨著文本到圖像和文本到視頻生成模型的快速發(fā)展,一些研究集中于生成軌跡可控的圖像或視頻來模擬自動(dòng)駕駛場景,并以地圖和周圍車輛位姿為指導(dǎo),以提高場景的準(zhǔn)確性。然而,現(xiàn)實(shí)世界的駕駛涉及不斷移動(dòng)的行人、車輛和物體,這些都會(huì)給環(huán)境帶來結(jié)構(gòu)性的變化。視頻生成方法通常難以捕捉這些動(dòng)態(tài)變化或元素之間的密切相互作用,從而導(dǎo)致場景連續(xù)性不一致,例如背景和車輛類型變化,這使保持時(shí)序一致性變得非常復(fù)雜。

最近,基于 NeRF 和 3DGS 的方法旨在通過渲染和建模 3D 場景來更精確地捕捉動(dòng)態(tài)元素。盡管如此,這些方法在從任意視角重建 4D 場景、處理具有顯著相機(jī)移動(dòng)的廣泛動(dòng)態(tài)視圖變化以及管理靜態(tài)視圖下的長期時(shí)序變換方面仍然面臨挑戰(zhàn)。

針對上述提到的相關(guān)挑戰(zhàn),為了實(shí)現(xiàn)更真實(shí)的自動(dòng)駕駛測試,我們提出了一個(gè)基于真實(shí)世界自動(dòng)駕駛場景的可控 4D 模擬框架,稱之為Stag-1。

圖片

經(jīng)過大量的多級(jí)場景訓(xùn)練后,我們提出的Stag-1可以從任何需要的視角進(jìn)行仿真,并且可以在靜態(tài)的時(shí)間和空間條件下實(shí)現(xiàn)對于場景演變的深入理解。與現(xiàn)有方法相比,我們的方法在多視角場景一致性、背景連貫性和準(zhǔn)確性方面表現(xiàn)出色,并為現(xiàn)實(shí)自動(dòng)駕駛模擬的持續(xù)進(jìn)步做出了貢獻(xiàn)。

論文鏈接:https://arxiv.org/pdf/2412.05280

網(wǎng)絡(luò)模型的結(jié)構(gòu)&技術(shù)細(xì)節(jié)

4D Autonomous Driving Simulation

生成式4D自動(dòng)駕駛仿真旨在解決傳統(tǒng)自動(dòng)駕駛仿真場景缺乏真實(shí)感的問題,并克服圖像生成模型在場景質(zhì)量和控制能力方面的限制。

形式上來看,生成式 4D 自動(dòng)駕駛仿真會(huì)根據(jù)真實(shí)世界場景和一組控制信號(hào)生成一個(gè)場景,如下公式所示。

圖片

圖片

然而,傳統(tǒng)的方法往往不能有效捕捉場景中真實(shí)的時(shí)間和空間關(guān)系,導(dǎo)致生成的場景出現(xiàn)時(shí)間跳躍和可控性不足的問題。因此,我們需要探索4D場景點(diǎn)云重建,以便使用生成模型實(shí)現(xiàn)真實(shí)的場景理解和高質(zhì)量的圖像生成。該方法結(jié)合4D點(diǎn)云、相機(jī)參數(shù)和時(shí)間信息,利用生成框架有效捕捉時(shí)間和空間的獨(dú)立變化,實(shí)現(xiàn)更自然、更精確的自動(dòng)駕駛仿真,可表示為如下的公式形式:

圖片

通過上述的這種方式,我們就可以生成與控制信號(hào)一致的逼真的模擬場景。

為了準(zhǔn)確控制場景,我們從當(dāng)前場景中提取 4D 點(diǎn)云信息,并將點(diǎn)云投影到連續(xù)的 2D 圖像上從而形成一組關(guān)鍵幀視頻。然后,我們使用視頻生成網(wǎng)絡(luò)生成連續(xù)、準(zhǔn)確、可控的4D自動(dòng)駕駛仿真場景。

Spatial-Temporal Aligned Reconstruction

生成式4D自動(dòng)駕駛仿真場景的構(gòu)建依賴于精確的4D點(diǎn)云數(shù)據(jù)信息。根據(jù)自動(dòng)駕駛的實(shí)際需求,我們采用了如下的三種原則來定義點(diǎn)云的形式。

  • 真實(shí)性:4D點(diǎn)云數(shù)據(jù)必須用真實(shí)的參數(shù)進(jìn)行構(gòu)建,需要知道準(zhǔn)確的場景大小和范圍,而不僅僅是相對的比例大小。
  • 準(zhǔn)確性:場景應(yīng)精確估計(jì)物體的位置和距離,以提高 3D 點(diǎn)云的精度。
  • 一致性:每個(gè)場景幀應(yīng)與車輛或相機(jī)的參數(shù)保持一致,以保持一致性。

遵循以上提到的這些原則,我們首先估計(jì)并使用環(huán)視攝像頭參數(shù)來生成環(huán)視 3D 點(diǎn)云數(shù)據(jù)信息。我們進(jìn)一步使用自車參數(shù)進(jìn)行點(diǎn)云對齊,并對其進(jìn)行迭代細(xì)化,以構(gòu)建精確的 4D 點(diǎn)云場景。

單幀的3D點(diǎn)云重建

為了從單幀當(dāng)中重建3D場景,我們對每一幅圖像進(jìn)行了處理。然后,我們使用相應(yīng)的相機(jī)位姿來獲得準(zhǔn)確的環(huán)視點(diǎn)云。通過組合所有視角的點(diǎn)云,我們得到 了在時(shí)刻t的環(huán)視點(diǎn)云,其整體流程可以用如下的公式進(jìn)行表述。

圖片

連續(xù)幀4D點(diǎn)云的粗糙對齊

對于每一個(gè)時(shí)刻的點(diǎn)云數(shù)據(jù)信息,我們還會(huì)采用如下的公式實(shí)現(xiàn)連續(xù)幀的4D點(diǎn)云對齊。

圖片

然后,為了構(gòu)建完整的4D點(diǎn)云數(shù)據(jù),我們在時(shí)間戳上對齊4D 點(diǎn)云序列,記作如下的形式。

圖片

連續(xù)幀4D點(diǎn)云的精修對齊

鑒于3D點(diǎn)云是通過深度估計(jì)的方式得到的,缺乏精確的真值,僅基于參數(shù)的對齊方式并不能保證完全的對齊精度。因此,我們引入了一種精細(xì)對齊方法,該方法通過多次迭代來完善對齊過程。在每次迭代的過程中,旋轉(zhuǎn)和平移都會(huì)根據(jù)點(diǎn)云對齊誤差進(jìn)行更新,該誤差測量了變換點(diǎn)與參考對齊點(diǎn)之間的差異。通過最小化對齊誤差來更新變換參數(shù)。

圖片

通過將此過程迭代應(yīng)用于每一幀,我們生成一系列的3D點(diǎn)云數(shù)據(jù)。最后,我們獲得對齊的點(diǎn)云 ,用于支持后續(xù)的時(shí)空場景解耦。

Point-Conditioned Video Generation

實(shí)現(xiàn)時(shí)空解耦是自動(dòng)駕駛模擬的關(guān)鍵方面。然而,現(xiàn)有模型由于結(jié)構(gòu)限制,在單獨(dú)捕捉場景中的空間和時(shí)間變化方面存在著不少的挑戰(zhàn),因此很難在同一環(huán)境中將空間和時(shí)間進(jìn)行解耦。為了解決這個(gè)問題,我們提出的Stag-1 處理一系列連續(xù)的 4D 稀疏點(diǎn)云數(shù)據(jù)以生成 2D 稀疏關(guān)鍵幀視頻,如下公式所示。

圖片

時(shí)間解耦關(guān)鍵幀

在固定相機(jī)位姿的情況下,我們提出了一種有效的時(shí)空解耦關(guān)鍵幀建模方法,通過提取每個(gè)關(guān)鍵幀的 3D 點(diǎn)云數(shù)據(jù)并將其投影到 2D 圖像中。具體來說,對于每個(gè)時(shí)間戳,我們選擇與當(dāng)前幀對應(yīng)的 3D 點(diǎn)云。隨后,我們使用相機(jī)矩陣以及當(dāng)前時(shí)間戳的旋轉(zhuǎn)矩陣和平移向量來投影每個(gè)關(guān)鍵幀的3D點(diǎn)云數(shù)據(jù),用于實(shí)現(xiàn)獲取圖像中的稀疏二維點(diǎn)云。

圖片

通過這種方法,動(dòng)態(tài)點(diǎn)云數(shù)據(jù)可以從固定的視點(diǎn)準(zhǔn)確地投影到二維圖像中。

空間解耦關(guān)鍵幀

在空間解耦關(guān)鍵幀建模中,我們使用對齊的空間信息將當(dāng)前幀的 3D 點(diǎn)云投影到 2D 圖像平面上。通過透視投影,我們將 3D 點(diǎn)云映射到 2D 圖像平面。

圖片

通過使用對齊的空間信息,我們精確地將當(dāng)前幀的 3D 點(diǎn)云轉(zhuǎn)換為其 2D 投影。該方法有效地利用了空間信息,將其轉(zhuǎn)換為 2D 點(diǎn)云表示,同時(shí)減輕了時(shí)間變化對關(guān)鍵幀提取的影響。

4D Spatial-Temporal Simulation

下圖展示了我們提出的自動(dòng)駕駛 4D 生成仿真模型的整體訓(xùn)練框架。具體而言,我們的訓(xùn)練整體過程遵循兩階段的方法:Time-Focused Stage階段在時(shí)間背景下訓(xùn)練單視圖場景,而The Spatial-Focused Stage階段整合環(huán)視信息來捕捉空間和時(shí)間關(guān)系。

圖片

The Time-Focused Stage

我們使用奇數(shù)幀連續(xù)圖像作為真值數(shù)據(jù),并根據(jù)奇數(shù)幀的位姿和相機(jī)內(nèi)參將偶數(shù)幀 3D 點(diǎn)云投影到圖像平面上。

圖片

我們通過創(chuàng)建投影的 3D 點(diǎn)云序列及其對應(yīng)的真實(shí)圖像來生成配對訓(xùn)練數(shù)據(jù)。為了提高訓(xùn)練效率,我們將條件信號(hào)編碼到潛在空間中,并在其中進(jìn)行優(yōu)化。為了確保準(zhǔn)確對齊和有效的模型學(xué)習(xí)過程,我們定義了一個(gè)自定義損失函數(shù)來指導(dǎo)優(yōu)化過程。損失函數(shù)定義如下。

圖片

The Spatial-Focused Stage

我們使用與Time-Focused Stage階段相同的輸入方法。為了利用自動(dòng)駕駛中環(huán)視圖像之間的重疊信息和交互,我們引入了一種用于跨圖像信息交換的注意機(jī)制

,如下圖所示。

圖片

我們的方法捕捉了每幀內(nèi)不同視角的空間關(guān)系,同時(shí)也考慮了連續(xù)時(shí)間步驟之間的時(shí)間聯(lián)系。

實(shí)驗(yàn)結(jié)果&評(píng)價(jià)指標(biāo)

4D重建與合成效果分析

為了評(píng)估我們的方法在 4D 重建方面的能力,我們在 Waymo-NOTR 數(shù)據(jù)集上進(jìn)行了零樣本評(píng)估的相關(guān)實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如下表所示。

圖片

通過相關(guān)的實(shí)驗(yàn)結(jié)果可以看出,與現(xiàn)有方法相比,我們的方法在場景重建和新穎視圖合成方面表現(xiàn)出色。

對于static-32數(shù)據(jù)集,我們遵循傳統(tǒng)指標(biāo),使用 PSNR、SSIM 和 LPIPS 來評(píng)估渲染質(zhì)量,對于動(dòng)態(tài)數(shù)據(jù),我們使用 PSNR* 和 SSIM* 來關(guān)注動(dòng)態(tài)對象。我們的結(jié)果優(yōu)于其他方法,展示了該模型在零樣本條件下的泛化能力及其對靜態(tài)場景和動(dòng)態(tài)對象進(jìn)行建模的能力。為了更加直觀的展現(xiàn)我們算法的效果,我們也對相關(guān)的實(shí)驗(yàn)結(jié)果進(jìn)行了可視化,如下圖所示。從質(zhì)量上講,我們的方法在單目場景重建和多視圖合成方面表現(xiàn)出色。

圖片

此外,我們對Street Gaussian數(shù)據(jù)集上的場景重建進(jìn)行了定量和定性評(píng)估,其中相關(guān)的實(shí)驗(yàn)結(jié)果如下表。

圖片

更加直觀的可視化效果如下圖所示。

圖片

為了準(zhǔn)確地將我們的方法與最新方法進(jìn)行比較,我們Waymo Open Dataset數(shù)據(jù)集下進(jìn)行了定量分析。相關(guān)的實(shí)驗(yàn)結(jié)果如下表所示,我們的方法在重建方面優(yōu)于其他方法。因此,在三種不同實(shí)驗(yàn)條件下的定量比較結(jié)果表明,我們提出的重建和新穎的視圖合成方法優(yōu)于其他相關(guān)方法。

圖片

4D駕駛仿真

基于真實(shí)場景的自動(dòng)駕駛生成式 4D 仿真需要能夠解耦時(shí)空關(guān)系。這涉及根據(jù)當(dāng)前時(shí)間狀態(tài)從不同的攝像機(jī)視角觀察場景,或根據(jù)固定的空間狀態(tài)分解時(shí)間運(yùn)動(dòng)。我們在 NuScenes 和 Waymo 數(shù)據(jù)集上進(jìn)行了定量和定性比較實(shí)驗(yàn),以證明所提方法的能力和有效性。

自動(dòng)駕駛 4D 仿真的一個(gè)關(guān)鍵方面是在凍結(jié)時(shí)間條件下實(shí)現(xiàn)動(dòng)態(tài)視角變化的能力。我們將我們提出的方法與現(xiàn)有方法進(jìn)行了比較,可視化結(jié)果表明我們的方法成功實(shí)現(xiàn)了所需的任務(wù),如下圖所示。

圖片

可視化的相關(guān)結(jié)果表明我們的方法可以實(shí)現(xiàn)準(zhǔn)確的變換。為了與基于 3DGS 的方法進(jìn)行公平的比較,我們在 Waymo 數(shù)據(jù)集上進(jìn)行了類似的測試。如下圖所示,我們的方法在圖像精度方面優(yōu)于其他方法。

圖片

此外,我們也實(shí)現(xiàn)了視角的轉(zhuǎn)換以測試模型處理各種相機(jī)變換的能力。相關(guān)的可視化結(jié)果如下圖所示,通過可視化的結(jié)果可以看出,我們的模型成功完成了這項(xiàng)任務(wù)。

圖片

4D仿真的另一個(gè)關(guān)鍵方面是它能夠在保持相機(jī)位置固定的同時(shí)改變時(shí)間范圍,從而實(shí)現(xiàn)多種功能。我們通過在凍結(jié)空間的條件下模擬時(shí)間運(yùn)動(dòng)來展示這種能力,如下圖的左側(cè)所示。該圖顯示了相對于真值的移動(dòng)車輛,而背景保持穩(wěn)定,驗(yàn)證了該方法在固定空間環(huán)境中模擬時(shí)間變化的能力。

圖片

結(jié)論

本文提出了一種用于自動(dòng)駕駛的生成式 4D 仿真模型,旨在編輯真實(shí)場景以實(shí)現(xiàn)可控的自動(dòng)駕駛仿真。可視化和定量結(jié)果均表明,所提出的方法可以提取真實(shí)場景中的關(guān)鍵元素以進(jìn)行可控仿真,為自動(dòng)駕駛測試和驗(yàn)證提供了可行的解決方案。

責(zé)任編輯:張燕妮 來源: 自動(dòng)駕駛之心
相關(guān)推薦

2024-06-12 09:48:39

2024-10-22 09:40:00

模型生成

2025-04-16 09:20:00

虛擬模型數(shù)字

2025-04-03 10:12:30

2024-10-28 13:30:00

2024-04-12 10:46:26

2024-12-16 14:40:00

AI模型訓(xùn)練

2021-08-13 15:07:02

模型人工智能深度學(xué)習(xí)

2024-01-19 16:35:00

模型動(dòng)畫

2025-04-09 13:11:27

2024-01-04 17:21:08

訓(xùn)練數(shù)據(jù)

2025-06-13 14:13:26

3D場景生成模型

2023-12-26 09:29:12

自動(dòng)駕駛數(shù)據(jù)

2023-04-03 10:04:44

開源模型

2023-10-23 10:11:36

自動(dòng)駕駛技術(shù)

2023-11-27 13:48:00

模型數(shù)據(jù)

2022-06-25 21:26:45

自動(dòng)駕駛技術(shù)

2023-08-15 08:36:20

ChatGPT模型

2024-10-30 09:26:41

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 午夜免费网 | 91视在线国内在线播放酒店 | 波多野结衣二区 | 黄色片av| 久久99精品国产麻豆婷婷 | 成人亚洲片 | 午夜噜噜噜 | 欧美久久久久 | 国产一区二区欧美 | 国产欧美一区二区三区日本久久久 | 日本人做爰大片免费观看一老师 | 久久国内精品 | 国内精品一区二区 | 99精品福利视频 | 天天干天天玩天天操 | 国产伦精品一区二区三区精品视频 | 成年人黄色小视频 | 中文字幕在线观 | 罗宾被扒开腿做同人网站 | 免费看日韩视频 | 亚洲人在线| 精品久久一区 | 亚洲精品国产一区 | 亚洲精品国产第一综合99久久 | 成人福利在线 | 国产欧美一区二区三区国产幕精品 | 亚洲在线 | 二区三区视频 | 亚洲人成人一区二区在线观看 | 色视频网站免费 | 一级视频黄色 | 国产小视频在线 | 日韩中文字幕在线视频观看 | www国产成人免费观看视频,深夜成人网 | 欧美日本一区二区 | 欧美一区二区免费 | 成人av看片 | 亚洲在线久久 | 欧美日产国产成人免费图片 | 亚洲国产精品视频一区 | 欧美aaa|