成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

5秒內快速生成、直出工業級PBR資產,三維擴散模型3DTopia-XL開源

人工智能 新聞
最近,上海人工智能實驗室(Shanghai AI Lab)與南洋理工大學(NTU)共同推出了新一代的三維生成大模型 3DTopia-XL,能夠從圖片或文字單階段直出具有 PBR(物理渲染)材質的高質量三維數字資產。

是否還在苦惱于開源圖生 / 文生三維模型無法直接嵌入到 CG 工作流中?是否在尋找具備高質量幾何與物理材質的三維生成大模型?

最近,上海人工智能實驗室(Shanghai AI Lab)南洋理工大學(NTU)共同推出了新一代的三維生成大模型 3DTopia-XL,能夠從圖片或文字單階段直出具有 PBR(物理渲染)材質的高質量三維數字資產。

圖片

在技術細節上,通過采用全新的三維表征 PrimX 以及基于 DiT 的生成架構,具有 10 億規模參數的 3DTopia-XL 能夠在 5 秒內完成從圖像或文本生成具有物理材質屬性的超寫實三維模型,生成結果作為 GLB 格式的三維資產可以無縫導入到主流游戲引擎和工業設計軟件的管線中服務于下游應用。

圖片

3DTopia-XL 已將代碼、預訓練模型和技術報告開源,并且近期還會持續更新其他模態作為輸入的預訓練模型。

  • 代碼鏈接:https://github.com/3DTopia/3DTopia-XL
  • 在線 Demo:https://huggingface.co/spaces/FrozenBurning/3DTopia-XL
  • 技術報告:https://arxiv.org/abs/2409.12957
  • 論文標題:3DTopia-XL: Scaling High-quality 3D Asset Generation via Primitive Diffusion

在項目開源的這幾天,廣大網友也是第一時間涌入官方提供的在線 Demo,上傳自己的圖片進行試玩。其中 Huggingface 的產品設計總監 Victor 更是第一時間就進行了嘗試,他隨意上傳了一張圖片給 3DTopia-XL,模型經過處理返回給他了一個高質量的三維模型,同時還是帶材質的那種!他也將試玩錄屏上傳到 X 上分享給廣大網友:

圖片

小編也嘗試了一下在線 demo,比如輸入一張橘子做的小象的創意圖片,生成的三維物體幾何質量很高,同時右下角的交互視窗能夠支持更換不同環境光照圖來渲染輸出的 GLB 格式資產:

圖片

技術概覽

通過深扒技術報告,小編發現 3DTopia-XL 的核心技術是一種被稱為 PrimX 的全新三維表征,彌補了三維數據沒有高效張量化表征的空白,從而實現對最具可擴展性的擴散模型框架 DiT 的支持。

具體而言,3DTopia-XL 采用的是一種創新的三維擴散大模型直出技術,可實現超寫實工業級三維資產的秒級生成。3DTopia-XL 采用 PrimX 作為一種符號距離場的高效幾何表征方式,將三維物體表征為若干個 Primitive 的集合。每個 Primitive 僅在形狀邊界鄰域內對局部幾何、紋理和材質進行聯合建模,從而將一個三維資產的所有信息(幾何、紋理、材質)表示為若干個固定長度的 token,完成了三維數據的高質量結構化。

這樣的方法不僅大幅減少了表示三維物體所需的參數量,提高了參數利用效率,而且還便于 DiT 基模型的規模擴展。

圖片

在基模型層面,為了實現高質量的三維生成能力,3DTopia-XL 提出了一個包含 10 億參數且計算高效的三維擴散模型。其中 PrimX 作為將三維物體高效地轉化為基于符號距離場的表達,會進一步通過變分自編碼器對每個體積基元進行壓縮編碼。通過 DiT 架構的引入,使得模型能夠在隱空間中進行大規模可擴展的訓練(Latent Primitive Diffusion),從而實現通過單張圖像輸入生成三維物體的通用能力。

得益于符號距離場的良好性質,3DTopia-XL 生成的三維內容具備光滑的表面、精細的結構以及良好的拓撲,接近手工建模質量。通過 DDIM 采樣策略,3DTopia-XL 可以實現 5s 內完成去噪過程。

圖片

實驗結果

定量對比上,3DTopia-XL 在三維生成標準評測指標超越現有的開源模型,CLIP score 上取得 24.33,超越 ShapE(21.98),也高于 3DTopia 第一版的 22.54,展現出了三維內容創作方面的巨大潛力。

同時,作者從四個維度(整體質量、幾何平滑度、輸入相關度和渲染正確性)對于圖生三維模型輸出的數字資產在工業管線中進行了用戶評測(如下圖所示),3D-Topia-XL 在各維度上均超越了 InstantMesh、LGM、CRM 等基于重建的主流方法。

圖片

定性對比上,作者對比了主流的基于重建的方法(標紅)以及原生三維擴散模型(標黃),并在對比策略上采用直接將 mesh 導入渲染引擎進行對應環境下的渲染,來驗證三維生成模型的實際可用性。如下圖所示,得益于 3DTopia-XL 的高質量幾何以及材質建模,其展示出的渲染效果和生成質量都超過一系列基線方法。

圖片

同時作者還驗證了三維生成模型上的尺度定律(Scaling Law),增加訓練計算量和增大模型尺寸都會帶來生成性能的進一步提升(以 FID 下降為趨勢特征)。

圖片

得益于 PrimX 表征的通用性,使得模型能夠同時編碼幾何、紋理及材質,完成一站式三維生成引擎可用的數字資產,擺脫了多階段獨立建模的繁瑣步驟。我們發現,3DTopia-XL 生成的數字資產可以直接導入 Blender,UE 等圖形引擎在任意環境下進行渲染。其高質量 PBR 建模使得生成的數字資產展示出高質量反光效果,實現了與環境的無縫融合。

圖片

除了圖生三維模型以外,3DTopia-XL 還會在不久的未來提供多模態輸入支持,包括文生三維模型和多視角重建模型,為三維內容創作提供了全面的解決方案套裝。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-03-24 09:41:22

2024-11-08 17:34:38

2023-04-27 13:06:46

AI手機模型

2023-04-27 15:32:48

谷歌模型

2022-08-10 10:00:00

人工智能三維模型編程技術

2025-01-26 14:13:28

2021-08-31 10:39:52

語音克隆MockingBird合成器

2022-12-21 17:12:24

模型3D

2025-01-10 14:00:00

3D模型生成

2025-05-12 01:00:00

2025-02-27 13:45:00

2024-05-06 10:11:51

2024-12-31 07:15:00

2009-11-10 12:48:17

VB.NET三維模型

2015-08-14 13:37:46

DEFCON磁盤安全

2009-11-10 12:55:26

VB.NET三維模型

2021-12-22 10:04:11

模型人工智能3D

2018-01-26 10:10:45

Linux服務器性能

2023-08-01 14:14:14

2022-11-01 09:26:55

模型三維
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩精品一区二区三区在线观看 | 亚洲第一成人av | 男人的天堂在线视频 | 伊人激情网 | 91中文视频 | 羞羞的视频在线看 | 欧美一级片在线观看 | 色综合av | 久久精品中文字幕 | 天天干夜夜 | aacc678成免费人电影网站 | 精品久久久久久久久久久久久久 | 亚洲精品成人av | 久久精品国产一区二区三区不卡 | 男女午夜免费视频 | 久久69精品久久久久久久电影好 | 99精品免费久久久久久久久日本 | 国产一区三区在线 | 日韩精品一区二区三区免费视频 | 婷婷色网 | 亚洲一区二区久久 | 国产精品成人国产乱 | 国产精品99一区二区 | 久久精品男人的天堂 | 九九久久这里只有精品 | 精品国产伦一区二区三区观看体验 | av一区二区三区在线观看 | 成人特级毛片 | 911精品美国片911久久久 | 青青久久 | 日韩一二三区 | 欧美亚洲日本 | 两性午夜视频 | 精品欧美乱码久久久久久 | 国产精品久久久久久久久免费丝袜 | 亚洲免费精品 | 亚洲第一女人av | 免费精品久久久久久中文字幕 | 免费观看一级特黄欧美大片 | 久久精品一区 | 国产精品一区一区 |