ICLR2025 | MIT何愷明團(tuán)隊(duì)提出TetSphere:拉格朗日體積網(wǎng)格精準(zhǔn)還原高質(zhì)量3D形狀!
1. 一眼概覽
TetSphere Splatting提出了一種基于四面體球體(TetSpheres)的拉格朗日表示方法,可生成高質(zhì)量3D網(wǎng)格,兼具高幾何保真度和結(jié)構(gòu)完整性,在多視圖重建和圖像/文本到3D生成任務(wù)中均表現(xiàn)出色。
2. 核心問題
當(dāng)前主流3D建模方法(如基于點(diǎn)云或神經(jīng)隱式表示)難以同時(shí)兼顧高質(zhì)量網(wǎng)格結(jié)構(gòu)與幾何表達(dá)能力,尤其在處理復(fù)雜形狀時(shí),常出現(xiàn)非流形、退化三角面等問題。論文關(guān)注的核心問題是:如何以結(jié)構(gòu)合理、幾何一致的方式重建高質(zhì)量3D網(wǎng)格,同時(shí)保持高效計(jì)算和良好可擴(kuò)展性。
3. 技術(shù)亮點(diǎn)
- 創(chuàng)新性幾何單元:引入四面體球體(TetSpheres)作為基本單元,通過變形形成復(fù)雜形狀,實(shí)現(xiàn)結(jié)構(gòu)約束與幾何自由的統(tǒng)一;
- 能量優(yōu)化框架:將幾何變形建模為能量最小化問題,結(jié)合雙調(diào)和能量與非翻轉(zhuǎn)約束,確保網(wǎng)格平滑性與可渲染性;
- 多任務(wù)通用性:方法可無縫應(yīng)用于多視圖重建、單圖重建、圖像到3D、文本到3D等任務(wù),具備良好的擴(kuò)展性與應(yīng)用前景。
4. 方法框架
TetSphere Splatting方法流程如下:
- 初始化:根據(jù)輸入圖像輪廓自適應(yīng)生成TetSphere集合,并覆蓋目標(biāo)3D區(qū)域;
- 網(wǎng)格變形:每個(gè)TetSphere通過優(yōu)化其頂點(diǎn)位置以擬合目標(biāo)形狀,過程受雙調(diào)和能量和平滑約束引導(dǎo);
- 差分渲染損失:使用可微渲染計(jì)算形狀與多視圖圖像之間的差異,聯(lián)合優(yōu)化形狀變形;
- 紋理可選優(yōu)化:支持對變形后網(wǎng)格進(jìn)行紋理映射和材質(zhì)賦予,但非核心目標(biāo)。
5. 實(shí)驗(yàn)結(jié)果速覽
在多項(xiàng)任務(wù)中,TetSphere均展現(xiàn)出卓越的網(wǎng)格質(zhì)量與較強(qiáng)的幾何重建性能:
? 多視圖重建(Chamfer ↓ / Volume IoU ↑):
Chamfer Distance:0.0184
Volume IoU:0.6844
面積長度比(ALR):0.6602(三角形更規(guī)整)
Manifoldness Rate:100%(無非流形)
Connected Component Discrepancy:0.0(無漂浮結(jié)構(gòu))
? 單圖重建:相比Magic123、DreamGaussian等方法,TetSphere在網(wǎng)格規(guī)整性、連通性、重建精度等方面更勝一籌。
? 速度與效率:圖像到3D任務(wù)中支持最大batch size 120(在40GB A100 GPU上),訓(xùn)練速度最快(6.59 iter/s)。
6. 實(shí)用價(jià)值與應(yīng)用
TetSphere Splatting適用于3D重建、虛擬現(xiàn)實(shí)、動(dòng)畫制作、3D內(nèi)容生成等應(yīng)用場景。其高質(zhì)量網(wǎng)格輸出可直接服務(wù)于仿真、渲染、3D打印等下游任務(wù),尤其在稀疏輸入、高質(zhì)量輸出需求強(qiáng)烈的生成式任務(wù)中具有重要價(jià)值。
7. 開放問題
? 如何在保持網(wǎng)格質(zhì)量的同時(shí)進(jìn)一步提升拓?fù)湟恢滦耘c全局連通性?
? TetSphere是否適合與大規(guī)模擴(kuò)散模型或物理仿真引擎深度集成?
? 面向工業(yè)應(yīng)用,TetSphere框架是否可在實(shí)時(shí)性場景中部署?