CVPR 2025高分論文:從照片重建3D矢量,告別模糊渲染,重建邊緣更清晰
三維高斯潑濺(3D Gaussian Splatting, 3DGS)技術基于高斯分布的概率模型疊加來表征場景,但其重建結果在幾何和紋理邊界處往往存在模糊問題。這種模糊效應會隨著重建過程中不確定性的累積而愈發顯著。如圖 1 所示,通過提高渲染分辨率可以明顯觀察到這種邊界模糊現象。
圖 1:BG-Triangle 的樣例結果展示和對比
針對這一技術瓶頸,由比利時魯汶大學吳旻燁與上??萍即髮W戴海釗等研究人員組成的團隊在 CVPR 2025 上提出了創新性的解決方案 ——Bézier Gaussian Triangle(BG-Triangle)三維表征方法。該方法巧妙融合了 Bézier 三角形的矢量圖形特性與高斯概率模型,不僅實現了 3D 場景的精確重建,還支持分辨率無關的可微渲染。通過引入不連續感知渲染技術,BG-Triangle 有效降低了物體邊界的不確定性,從而獲得更加銳利的渲染效果。與現有算法相比,該方法還具有參數量更少的顯著優勢。
- 論文題目:BG-Triangle: Bézier Gaussian Triangle for 3D Vectorization and Rendering
- 作者:吳旻燁、戴海釗、姚凱欣、Tinne Tuytelaars、虞晶怡
- 論文鏈接:https://arxiv.org/abs/2503.13961
- 項目主頁和代碼:https://wuminye.github.io/projects/BGTriangle/
背景介紹
在計算機圖形學和 3D 計算機視覺的發展過程中,場景表示經歷了從傳統的離散幾何表示到連續表示的演變。
早期,網格(meshes)、點云(point clouds)和體素(voxels)等傳統方法被廣泛應用于 3D 重建和渲染。這些方法能顯式地精確建模場景,但難以實現基于圖片的端到端的重建優化。
輻射場(Radiance Fields)這種 3D 表征的興起,使得可微渲染(differentiable rendering)更加靈活,優化算法能夠直接基于渲染圖像的誤差來更新 3D 表示。
Neural Radiance Fields (NeRF) 通過神經網絡隱式編碼輻射場和密度場,實現了高質量的新視角合成,但由于其連續體積表示的特性,難以精確捕捉物體的邊界和幾何細節。
隨后,3D Gaussian Splatting (3DGS) 通過顯式的高斯點云表示,提高了渲染效率和準確性,并利用連續的高斯分布實現了靈活的表征優化,適用于復雜場景的建模。
然而,這些方法在處理物體的銳利邊緣時仍然存在局限性,尤其是在近距離觀察時,由于漸變分布的疊加容易出現模糊或過渡不清的現象。
因此,本研究提出了一種介于離散和連續之間的三維混合表示方法,在可微渲染的框架下結合矢量圖形和概率建模,利用矢量表達的靈活高效性以更少的圖元數量實現更精確的幾何和邊界建模,為 3D 場景表示提供了一種新的解決方案。
基本原理
1. 基本元素:BG-Triangle 圖元
BG-Triangle 是一種融合了貝塞爾三角形與 3D 高斯模型的場景表征方法。該方法將每個貝塞爾三角形視為一個圖元,通過一組控制點參數化定義場景的局部曲面區域。作為顯式幾何表示,貝塞爾三角形能夠清晰確定渲染視角下的圖元輪廓范圍。此外,通過靈活調整控制點位置,可以生成不同彎曲程度的曲面和邊界。
圖 2:貝塞爾三角圖元通過控制點來改變幾何形狀
BG-Triangle 圖元還編碼了高斯的參數屬性,包括形狀、大小和顏色等信息。利用這些屬性,可以在圖元內自由生成用于渲染的高斯分布。這些高斯的位置與控制點相綁定,從而使圖元具備可微特性。
圖 3:貝塞爾三角形圖元中編碼的參數屬性可以構造生成出任意一點的高斯分布的形狀和顏色
2. 不連續感知渲染
高斯雖然提供了可微的性質,但是其連續的分布無法表達不連續的紋理和幾何邊界。為此,研究者們使用貝塞爾三角形的渲染輪廓來對高斯的分布進行約束。具體來說,渲染算法會重新計算輪廓邊界(圖中的白色實線)周圍區域(圖中虛線之間的區域)的高斯權重,從而降低高斯分布對圖元外部區域的影響效果。
圖 4:BG-Triangle 使用圖元的邊界對高斯重新計算權重
通過調整邊界寬度(即兩條虛線之間的距離),可以精確控制渲染效果的銳利程度,實現不連續的邊界渲染效果。
圖 5:調整邊界的寬度可以控制邊界的銳利程度。當使用極小邊界寬度時,就型成了不連續的高斯權重
3. 渲染管線與重建優化
圖 6:BG-Triangle 的渲染管線
BG-Triangle 的渲染管線分為兩個部分。第一部分將圖元渲染為目標視角下的圖形緩沖區,該緩沖區包含非連續感知渲染所需的信息。這一部分可通過現有的圖形光柵化管線實現。第二部分利用緩沖區信息生成像素對齊的高斯分布,并根據邊界進行渲染。在此過程中,梯度通過第二部分的高斯生成模塊直接傳遞到貝塞爾三角形圖元上。具體的梯度公式推導詳見原文附件,供感興趣的讀者參考。
在實現過程中,研究者首先使用粗糙的點云初始化圖元位置,隨后通過動態分裂和刪除算法在優化過程中調整圖元數量,以適應不同復雜度的場景。這種設計使得信息量較少的區域僅需少量圖元即可表達,從而顯著提升了信息利用效率。
圖 7:組成場景的圖元邊界示意圖。不同區域使用不同大小的圖元進行自適應的表示。
實驗結果
實驗結果表明,BG-Triangle 在邊界清晰度 和 參數效率 方面表現優越。相比 3D Gaussian Splatting(3DGS)、Mip-Splatting、Mini-Splatting 和 Scaffold-GS,能以 極少的圖元數量 實現更高質量的渲染。在相似參數規模下,BG-Triangle 在 LPIPS 評分(感知質量)上顯著優于其他方法,且在放大渲染中仍可保持清晰的物體邊界,而 3DGS 及相關方法在近距離觀察時會產生模糊或偽影。
同時,通過對貝塞爾三角形矢量線段的提取,可以組成三維的線條,用于描述場景的幾何特征,如圖所示:
研究者們在 CUDA 中高效地實現了本文的算法,達成了實時渲染的效果。并且在 NVIDIA 3090GPU 單卡上可以半小時左右完成場景的重建。
結論
這篇研究創新性地提出了一種基于貝塞爾三角形矢量曲面的三維場景表征方法,并提供了一種有效的端到端的可微渲染和訓練框架。
在渲染質量上,BG-Triangle 能夠保留銳利的邊界,比 3DGS 具有更好的幾何精度。同時,BG-Triangle 使用更少的圖元,在參數效率和渲染清晰度之間達到了更好的平衡。
BG-Triangle 在較小的參數量下有渲染質量優勢,尤其是在感知質量(LPIPS 評價)上優勢顯著。