成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

CVPR 2025 | GaussianCity: 60倍加速,讓3D城市瞬間生成

人工智能 新聞
新加坡南洋理工大學 S-Lab 的研究者們提出了 GaussianCity,該工作重新定義了無界 3D 城市生成,讓它變得 60 倍更快。

想象一下,一座生機勃勃的 3D 城市在你眼前瞬間成型 —— 沒有漫長的計算,沒有龐大的存儲需求,只有極速的生成和驚人的細節。

然而,現實卻遠非如此。現有的 3D 城市生成方法,如基于 NeRF 的 CityDreamer [1],雖然能夠生成逼真的城市場景,但渲染速度較慢,難以滿足游戲、虛擬現實和自動駕駛模擬對實時性的需求。而自動駕駛的 World Models [2],本應在虛擬城市中訓練 AI 駕駛員,卻因無法保持多視角一致性而步履維艱。

現在,新加坡南洋理工大學 S-Lab 的研究者們提出了 GaussianCity,該工作重新定義了無界 3D 城市生成,讓它變得 60 倍更快。過去,你需要數小時才能渲染一片城區,現在,僅需一次前向傳播,一座完整的 3D 城市便躍然眼前。無論是游戲開發者、電影制作者,還是自動駕駛研究者,GaussianCity 都能讓他們以秒級的速度構建世界。

城市不該等待生成,未來應該即刻抵達。

??觀看Demo,發現GaussianCity與其他方法的顯著差異!

閱讀論文,深入了解GaussianCity的技術細節。

圖片

  • Paper:https://arxiv.org/abs/2406.06526
  • Code:https://github.com/hzxie/GaussianCity
  • Project Page:https://haozhexie.com/project/gaussian-city
  • Live Demo: https://huggingface.co/spaces/hzxie/gaussian-city

引言

3D 城市生成的探索正面臨著一個關鍵挑戰:如何在無限擴展的城市場景中實現高效渲染與逼真細節的兼得?現有基于 NeRF 的方法雖能生成細膩的城市景觀,但其計算成本極高,難以滿足大規模、實時生成的需求。近年來,3D Gaussian Splatting(3D-GS)[3] 憑借其極高的渲染速度和優異的細節表現,成為對象級 3D 生成的新寵。然而,當嘗試將 3D-GS 擴展至無界 3D 城市時,面臨了存儲瓶頸和內存爆炸的問題:數十億個高斯點的計算需求輕易耗盡上百 GB 的顯存,使得城市級別的 3D-GS 生成幾乎無法實現。

為了解決這一難題,GaussianCity 應運而生,首個用于無邊界 3D 城市生成的生成式 3D Gaussian Splatting 框架。它的貢獻可以被歸納為:

  • 通過創新性的 BEV-Point 表示,它將 3D 城市的復雜信息高度壓縮,使得顯存占用不再隨場景規模增長,從而避免了 3D-GS 中的內存瓶頸。
  • 借助空間感知 BEV-Point 解碼器,它能夠精準推測 3D 高斯屬性,高效生成復雜城市結構。
  • 實驗表明,GaussianCity 不僅在街景視角和無人機視角下實現了更高質量的 3D 城市生成,還在推理速度上比 CityDreamer 快 60 倍,大幅提高了生成效率。

具體來說,得益于 BEV-Point 的緊湊表示,GaussianCity 可以在生成無界 3D 城市時保持顯存占用的恒定,而傳統 3D-GS 方法在點數增加時顯存使用大幅上升(如下圖(b)所示)。同時,BEV-Point 在文件存儲增長上也遠遠低于傳統方法(如下圖(c)所示)。不僅如此,GaussianCity 在生成質量和效率上都優于現有的 3D 城市生成方法,展現了其在大規模 3D 城市合成中的巨大潛力(如下圖(d)所示)。

圖片

方法

圖片

如上圖所示,GaussianCity 將 3D 城市生成過程分為三個主要階段:BEV-Point的初始化、特征生成和解碼。

BEV-Point 初始化

在 3D-GS 中,所有 3D 高斯點在優化過程中都會使用一組預定義的參數進行初始化。然而,隨著場景規模的增加,顯存需求急劇上升,導致生成大規模場景變得不可行。為此,GaussianCity 采用 BEV-Point 進行優化,以緩解這一問題。

BEV 圖 是生成 BEV-Point 的基礎,包含三個核心圖像:高度圖(Height Map)、語義圖(Semantic Map)和 密度圖(Density Map)。從 BEV 圖 中,BEV-Point 被生成:

  • 高度圖 決定每個點在空間中的 3D 坐標。
  • 語義圖 提供每個點的語義標簽,如建筑、道路等。
  • 密度圖 調整采樣密度,根據不同區域的特征決定是否增加或減少采樣點。

BEV-Point 通過只保留可見點大幅減少計算量。由于相機視角固定,場景中不可見的點不影響渲染結果,因而不占用顯存。這樣,隨著場景擴展,顯存使用量保持恒定。

為了優化計算,二值密度圖根據語義類別調整采樣密度。對于簡單紋理(如道路、水域)減少密度,復雜紋理(如建筑物)則增加密度。

通過射線交點(Ray Intersection)方法篩選出可見的 BEV-Point,確保僅這些點參與后續渲染和優化,進一步提升計算效率。

BEV-Point 特征生成

在 BEV-Point 表示中,特征可分為三大類:實例屬性、BEV-Point 屬性和樣式查找表。

1.實例屬性

實例屬性包括每個實例的基本信息,如實例標簽、大小和中心坐標等。語義圖提供了每個 BEV 點的語義標簽。為了處理城市環境中建筑物和車輛的多樣性,引入了實例圖來區分不同的實例。通過檢測連接組件(Connected Components)的方式,將語義圖進行實例化,從而得到每個實例的標簽、大小和邊界框的中心坐標。

2.BEV-Point 屬性

在 BEV-Point 初始化時,生成了每個點的絕對坐標,并設定其原點在世界坐標系的中心。為了更精確地描述每個實例的相對位置,相對坐標系被引入。其原點設置在每個實例的中心,并通過標準化的方式來計算相對坐標。

為了融入更多的上下文信息,場景特征圖片從 BEV 圖中提取,并通過點的絕對坐標進行索引,進一步為每個 BEV 點提供更豐富的上下文信息。

3.樣式查找表(Style Look-up Table)

在 3D-GS 中,每個 3D 高斯點的外觀都由其自身的屬性決定,導致存儲開銷隨著高斯點數量的增加而顯著增長,使得大規模場景的生成變得不可行。為了解決這一問題,BEV-Point 采用隱向量(Latent Vector)來編碼實例的外觀,使得相同的實例共享同一個隱向量,并通過樣式查找表圖片為不同實例分配樣式,從而減少計算與存儲開銷。

BEV-Point 解碼

BEV-Point 解碼器用于從 BEV-Point 特征生成高斯點屬性,主要包括五個模塊:位置編碼器、點序列化器、Point Transformer、Modulated MLPs、以及高斯光柵化器。

1.位置編碼器(Positional Encoder)

為了更好地表達空間信息,BEV-Point 坐標和特征不會直接輸入網絡,而是經過位置編碼轉換為高維嵌入,從而提供更豐富的表征能力。

2.點序列化器(Point Serializer)

BEV-Point 是無序點云,直接用 MLP 可能無法充分利用其結構信息。因此,我們引入點序列化方法,將點坐標轉換為整數索引,使相鄰點在數據結構中更具空間連續性,優化信息組織方式。

3.Point Transformer

序列化后的點特征經過 Point Transformer V3 [10] 進一步提取上下文信息,增強 BEV-Point 的全局和局部關系建模能力。

4.Modulated MLPs

在生成 3D 高斯點屬性時,MLP 結合 BEV-Point 特征、Point Transformer 提取的特征、實例的樣式編碼及標簽,以確保生成的高斯點具有一致的外觀和風格。

5.高斯光柵化器(Gaussian Rasterizer)

最終,結合相機參數,BEV-Point 生成的 3D 高斯點屬性通過高斯光柵化器進行渲染。對于未生成的某些屬性,如尺度、旋轉、透明度,則使用默認值填充。

實驗

下圖展示了 GaussianCity 和其他 SOTA 方法的對比,這些方法包括 PersistentNature [4]、SceneDreamer [5] 、InfiniCity [6] 和 CityDreamer [1]。實驗結果表明,GaussianCity 的效果明顯優于其他方法,相比于 CityDreamer 更是取得了 60 倍的加速。

圖片

在街景圖生成上,GaussianCity 在 KITTI-360 [7] 數據集上進行訓練,其生成效果超越了 GSN [8] 和 UrbanGIRAFFE [9] 等多種方法。

圖片

總結

本研究提出了 GaussianCity,首個針對無邊界 3D 城市生成的生成式 3D Gaussian Splatting 框架。通過引入創新性的 BEV-Point 表示,GaussianCity 在保證高效生成的同時,克服了傳統 3D-GS 方法在大規模場景生成中面臨的顯存瓶頸和存儲挑戰。該方法不僅實現了在街景和無人機視角下的高質量城市生成,還在推理速度上相比 CityDreamer 提升了 60 倍,顯著提高了生成效率。實驗結果表明,GaussianCity 能夠在確保細節還原的同時,高效處理無邊界 3D 城市生成,為大規模虛擬城市的實時合成開辟了新路徑。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-12-06 13:36:00

模型數據

2024-07-03 14:29:38

2024-07-04 09:26:16

2025-05-06 08:50:00

2025-03-21 09:30:42

2023-10-15 12:57:38

數據訓練

2025-01-07 13:19:48

模型AI訓練

2018-11-26 14:56:15

云計算UCloud云主機

2025-04-11 09:44:23

2021-03-18 15:29:10

人工智能機器學習技術

2025-05-23 09:12:00

2024-07-16 12:02:11

2025-03-24 13:32:43

2025-03-31 08:52:00

AI模型研究

2025-03-14 10:26:58

2025-04-15 08:57:00

3D生成AI

2009-02-02 08:50:42

SilverlightRIA3D圖像

2023-10-25 14:17:00

2021-10-25 17:57:08

數據技術架構

2025-02-19 14:10:00

AI3D生成
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 中文字幕av亚洲精品一部二部 | 午夜精品久久久久久久久久久久 | 亚洲香蕉 | 国产精品一区二区av | 久久视频一区 | 亚洲成人精品在线 | 久久久久久久久久久一区二区 | 91九色在线观看 | 黄色一级毛片 | 国产麻豆一区二区三区 | 国产精品伦一区二区三级视频 | 精品国产欧美在线 | 91新视频| 亚洲男人网 | 久久精品小视频 | 日韩精品在线观看一区二区三区 | 免费视频99 | 成人午夜免费在线视频 | 在线一区二区三区 | 久草久草久草 | 日日碰狠狠躁久久躁96avv | 九九热在线视频免费观看 | 日韩精品一区二区三区中文在线 | 亚洲第一福利网 | 国产一级毛片视频 | 欧美日韩在线观看一区二区三区 | 日本欧美国产在线 | 综合精品久久久 | 欧美日韩综合 | 99草免费视频 | 日韩成人免费在线视频 | 国产精品免费大片 | 午夜激情在线视频 | 亚洲中午字幕 | 国产高清自拍视频在线观看 | 韩日一区二区 | 国产精品日韩欧美一区二区三区 | 亚洲一二三区精品 | 国产小视频在线看 | 国产精品久久视频 | 久久天堂 |