成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

OpenAI文本生成3D模型再升級,數秒完成建模,比Point·E更好用

人工智能 新聞
此次,與點云顯式生成模型 Point?E 相比,OpenAI 新推出的條件生成式 3D 模型 Shap-E 建模了高維、多表示的輸出空間,收斂更快,并且達到了相當或更好的樣本質量。

生成式 AI 大模型是 OpenAI 發力的重點,目前已經推出過文本生成圖像模型 DALL-E 和 DALL-E 2,以及今年初基于文本生成 3D 模型的 POINT-E。

近日,OpenAI 研究團隊升級了 3D 生成模型,全新推出了 Shap?E,它是一個用于合成 3D 資產的條件生成式模型。目前相關模型權重、推理代碼和樣本已開源。

圖片


  • 論文地址:https://arxiv.org/abs/2305.02463
  • 項目地址:https://github.com/openai/shap-e

我們先來看一下生成效果。與根據文字生成圖像類似,Shap?E 生成的 3D 物體模型主打一個「天馬行空」。例如,一個看起來像香蕉的飛機:

圖片

看起來像一棵樹的椅子:

圖片

還有經典例子,像牛油果的椅子:

圖片

當然也可以生成一些常見物體的三維模型,例如一碗蔬菜:

圖片

甜甜圈:

圖片

本文提出的 Shap?E 是一種在 3D 隱式函數空間上的潛擴散模型,可以渲染成 NeRF 和紋理網格。在給定相同的數據集、模型架構和訓練計算的情況下,Shap?E 更優于同類顯式生成模型。研究者發現純文本條件模型可以生成多樣化、有趣的物體,更彰顯了生成隱式表征的潛力。

圖片

不同于 3D 生成模型上產生單一輸出表示的工作,Shap-E 能夠直接生成隱式函數的參數。訓練 Shap-E 分為兩個階段:首先訓練編碼器,該編碼器將 3D 資產確定性地映射到隱式函數的參數中;其次在編碼器的輸出上訓練條件擴散模型。當在配對 3D 和文本數據的大型數據集上進行訓練時, 該模型能夠在幾秒鐘內生成復雜而多樣的 3D 資產。與點云顯式生成模型 Point?E 相比,Shap-E 建模了高維、多表示的輸出空間,收斂更快,并且達到了相當或更好的樣本質量

研究背景

本文聚焦兩種用于 3D 表示的隱式神經表示(INR):

  • NeRF 一個 INR,它將 3D 場景表示為將坐標和視向映射到密度和 RGB 顏色的函數;
  • DMTet 及其擴展 GET3D 表示一個紋理 3D 網格,它作為函數將坐標映射到顏色、符號距離和頂點偏移的。這種 INR 能夠以可微的方式構建 3D 三角網格,然后渲染為可微的柵格化庫。

雖然 INR 靈活而富有表現力,但為數據集中每個樣本獲取 INR 的成本高昂。此外每個 INR 可能有許多數值參數,在訓練下游生成模型時可能會帶來難題。通過使用帶有隱式解碼器的自動編碼器來解決這些問題,可以獲得較小的潛在表示,它們直接用現有生成技術進行建模。另外還有一種替代方法,就是使用元學習創建一個共享大部分參數的 INR 數據集,然后在這些 INR 的自由參數上訓練擴散模型或歸一化流。也有人提出,基于梯度的元學習可能并不必要,相反應該直接訓練 Transformer 編碼器,產生以 3D 對象多個視圖為條件的 NeRF 參數。

研究者將上述幾種方法結合并拓展,最終得到了 Shap?E,并成為用于各種復雜 3D 隱式表示的條件生成模型。首先通過訓練基于 Transformer 的編碼器來為 3D 資產生成 INR 參數,然后在編碼器的輸出上訓練擴散模型。與先前的方式不同,生成同時表示 NeRF 和網格的 INR,允許它們以多種方式渲染或導入下游 3D 應用。

當在數百萬個 3D 資產的數據集上訓練時,本文模型能夠在文本 prompt 的條件下產生多種可識別的樣本。與最近提出的顯式 3D 生成模型 Point?E 相比,Shap-E 收斂得更快。在相同的模型架構、數據集和條件作用機制的情況下,它能獲得相當或更好的結果。

方法概覽

研究者首先訓練編碼器產生隱式表示,然后在編碼器產生的潛在表示上訓練擴散模型,主要分為以下兩步完成:

1. 訓練一個編碼器,在給定已知 3D 資產的密集顯式表示的情況下,產生隱式函數的參數。編碼器產生 3D 資產的潛在表示后線性投影,以獲得多層感知器(MLP)的權重;

2. 將編碼器應用于數據集,然后在潛在數據集上訓練擴散先驗。該模型以圖像或文本描述為條件。

研究者在一個大型的 3D 資產數據集上使用相應的渲染、點云和文本標題訓練所有模型。

3D 編碼器

編碼器架構如下圖 2 所示。

潛在擴散

生成模型采用基于 transformer 的 Point?E 擴散架構,但是使用潛在向量序列取代點云。潛在函數形狀序列為 1024×1024,并作為 1024 個 token 序列輸入 transformer,其中每個 token 對應于 MLP 權重矩陣的不同行。因此,該模型在計算上大致相當于基礎 Point?E 模型(即具有相同的上下文長度和寬度)。在此基礎上增加了輸入和輸出通道,能在更高維度的空間中生成樣本。

實驗結果

編碼器評估

研究者在整個編碼器訓練過程中跟蹤兩個基于渲染的指標。首先評估重建圖像和真實渲染圖像之間的峰值信噪比(PSNR)。此外,為了衡量編碼器捕獲 3D 資產語義相關細節的能力,對最大 Point?E 模型產生的網格進行編碼,重新評估重建 NeRF 和 STF 渲染的 CLIP R-Precision。

下表 1 跟蹤了這兩個指標在不同訓練階段的結果。可以發現,蒸餾損害了 NeRF 重建質量,而微調不僅恢復還略微提高了 NeRF 質量,同時大幅提高了 STF 渲染質量。

圖片

對比 Point?E

研究者提出的潛在擴散模型與 Point?E. 具有相同架構、訓練數據集和條件模式。與 Point?E 進行比較更有利于區分生成隱式神經表示而不是顯式表示的影響。下圖 4 在基于樣本的評估指標上對這些方法進行了比較。

下圖 5 中顯示了定性樣本,可以看到這些模型通常為相同的文本 prompt 生成質量不同的樣本。在訓練結束之前,文本條件 Shap?E 在評估中開始變差。

圖片

研究者發現 Shap?E 和 Point?E 傾向于共享相似的失敗案例,如下圖 6 (a) 所示。這表明訓練數據、模型架構和條件圖像對生成樣本的影響大于選擇的表示空間。

我們可以觀察到兩個圖像條件模型之間仍然存在一些定性差異,例如在下圖 6 (b) 的第一行中,Point?E 忽略了長凳上的小縫隙,而 Shap?E 試圖對它們進行建模。本文假設會出現這種特殊的差異,因為點云不能很好地表示薄特征或間隙。此外在表 1 中觀察發現,當應用于 Point?E 樣本時,3D 編碼器略微降低了 CLIP R-Precision。

圖片

與其他方法比較

下表 2 中,研究者在 CLIP R-Precision 度量標準上將 shape?E 與更廣泛的 3D 生成技術進行了比較。

圖片

局限與展望

雖然 Shap-E 可以理解許多具有簡單屬性的單個對象 prompt,但它在組合概念方面的能力有限。下圖 7 中可發現,這個模型很難將多個屬性綁定到不同的對象,并且當請求兩個以上的對象時,無法有效生成正確的對象數量。這可能是配對訓練數據不足導致的結果,通過收集或生成更大的標注 3D 數據集或許可以解決。

圖片

此外,Shap?E 產生可識別的 3D 資產,但這些通常看起來粗糙或缺乏細節。下圖 3 顯示編碼器有時會丟失詳細的紋理(例如仙人掌上的條紋),這表明改進的編碼器可能會恢復一些損失的生成質量。

圖片

更多技術和實驗細節請參閱原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-05-09 09:35:22

2022-12-21 17:12:24

模型3D

2023-05-12 14:13:23

3D建模OpenAI

2024-02-19 09:19:54

OpenAIAI模型人工智能

2023-05-29 10:39:00

AI算法

2022-08-03 13:52:22

AI建筑師

2021-12-23 09:54:02

AI模型人工智能

2021-09-14 10:11:46

谷歌3D舞蹈生成模型FACT

2023-07-20 09:58:47

模型3D

2011-02-14 10:35:58

2022-04-20 12:17:50

命令Batcat

2022-04-25 10:04:56

df命令Linux

2023-02-06 10:12:04

人工智能文本生成工具

2023-10-10 12:31:26

AI數據

2023-07-14 09:41:01

3DAI

2024-03-20 15:51:00

AI數據

2024-01-29 06:50:00

3D模型
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 午夜影院黄| 欧美一级久久久猛烈a大片 日韩av免费在线观看 | 成人自拍av | 精品久久久一区二区 | 国产一区二区免费 | 日韩精品中文字幕一区二区三区 | 天天操 夜夜操 | 91av在线免费播放 | 羞羞免费网站 | 免费不卡一区 | 国产91网站在线观看 | 精品二区 | 国产精品a级| 青青草一区| 久www| 中文字幕欧美一区 | 久久综合久色欧美综合狠狠 | 欧美福利 | 三级免费av| 日韩精品网站 | 中文字幕不卡在线88 | 激情欧美日韩一区二区 | 欧美一卡二卡在线 | 国产日韩精品一区二区 | 91精品午夜窝窝看片 | 色婷婷av久久久久久久 | 久久网国产 | 91免费入口| 精品久久久久久国产 | 日韩中文字幕 | 亚洲36d大奶网 | 国产在线精品一区二区 | 亚洲国产精品99久久久久久久久 | 中文字幕在线网 | 午夜在线视频 | 国产精品亚洲精品日韩已方 | 国产视频久久 | 国产精品久久久久影院色老大 | 中文字幕日韩一区 | 欧美大片一区二区 | 欧美一二三四成人免费视频 |