成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<form id="61166"><tr id="61166"><source id="61166"></source></tr></form>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

5秒完成3D生成，真香合成數據集已開源，上交港中文新框架超越Instant3D

發布于 2024-6-11 12:05

瀏覽

0收藏

使用大模型合成的數據，就能顯著提升3D生成能力？

來自上海交大、香港中文大學等團隊還真做到了。

5秒完成3D生成，真香合成數據集已開源，上交港中文新框架超越Instant3D-AI.x社區

他們推出Bootstrap3D框架，結合微調的具備3D感知能力的多模態大模型。這個框架能夠自動生成任意數量的高質量的多視角圖片數據，助力多視圖擴散模型的訓練。

結果表明，新的合成數據能夠顯著提高現有3D生成模型的生成物體的美學質量和文本prompt的控制能力。

目前，Bootstrap3D的數據集已經全面開源。

用大模型合成數據

近年來，3D內容生成技術迎來了飛速發展。然而，相對于2D圖片生成，生成高質量的3D物體仍面臨諸多挑戰。

其中核心的瓶頸即在于3D數據，尤其是高質量數據的不足。

為了解決這一問題，研究團隊推出Bootstrap3D框架，通過自動生成多視圖圖像數據來解決3D內容生成中高質量數據不足的問題。

5秒完成3D生成，真香合成數據集已開源，上交港中文新框架超越Instant3D-AI.x社區

具體來說，這個框架采用了2D和視頻擴散模型來生成多視圖圖像，并利用一個經過微調的3D多模態大模型對生成的數據進行質量篩選和描述重寫。

通過這種方式，Bootstrap3D能夠自動產生大量高質量的3D圖像數據，從而“自舉”出一個足夠大的數據集，輔助訓練更優秀的多視圖擴散模型。

這里插一嘴，在計算機科學和機器學習領域，“Bootstrap”通常指的是一種通過自舉方法解決問題的技術。

數據構建Pipeline

?

具體來說，數據構建Pipeline是本次框架的核心創新之一，旨在自動生成高質量的多視圖圖像數據，并附帶詳細的描述文本。

5秒完成3D生成，真香合成數據集已開源，上交港中文新框架超越Instant3D-AI.x社區

主要分為以下幾個步驟：

文本提示生成：首先，使用強大的大語言模型（如GPT-4）生成大量富有創意和多樣化的文本提示。這些文本提示涵蓋了各種場景和物體，為后續的圖像生成提供了豐富的素材。

圖像生成：利用2D擴散模型和視頻擴散模型，根據生成的文本提示創建單視圖圖像。通過結合2D和視頻擴散模型的優勢，生成的圖像具有更高的初始質量和多樣性。

多視圖合成：使用視頻擴散模型將單視圖圖像擴展為多視圖圖像，生成不同角度的視圖。這一步驟確保了每個對象在不同視角下的一致性，解決了傳統方法中視圖不一致的問題。

質量篩選和描述重寫：通過我們微調的3D感知模型MV-LLaVA，對生成的多視圖圖像進行嚴格的質量篩選。篩選過程不僅過濾掉低質量的數據，還重寫描述文本，使其更加準確和詳細。

通過這個數據構建Pipeline，Bootstrap3D能夠生成大量高質量的3D圖像數據，為多視圖擴散模型的訓練提供了堅實的基礎。

這一創新不僅解決了3D數據稀缺的問題，還顯著提升了模型的生成效果和對文本提示的響應能力。

訓練timestep重安排（TTR）

?

團隊還提出了一種創新的訓練timestep重新安排策略（TTR），以解決多視圖擴散模型訓練中的圖像質量和視圖一致性問題。

TTR策略的核心理念是在訓練過程中靈活調整合成數據和真實數據的訓練時間步，從而優化去噪過程的不同階段。

5秒完成3D生成，真香合成數據集已開源，上交港中文新框架超越Instant3D-AI.x社區

去噪過程的階段性特征：在擴散模型中，去噪過程通常分為不同的時間步。在早期時間步，去噪過程主要關注圖像的整體結構和形狀（低頻成分）；在后期時間步，則主要生成圖像的細節和紋理（高頻成分）。這種階段性特征為我們提供了調整訓練策略的機會。

限制合成數據的訓練時間步：由于合成數據可能存在一些模糊和失真，我們在訓練時限制其時間步范圍。具體來說，我們讓合成數據主要參與早期的去噪階段，確保它們對整體結構的貢獻，而將后期的細節生成留給質量更高的真實數據。

分階段訓練策略：通過將合成數據限制在較大的時間步范圍內（如200到1000步），我們確保這些數據在去噪過程中主要影響圖像的低頻成分，從而保持視圖一致性。同時，真實數據則參與所有時間步的訓練，以提供高頻細節和真實感。這樣的分階段訓練策略有效平衡了圖像質量和視圖一致性。

實驗證明效果顯著：廣泛的實驗結果表明，使用TTR策略的多視圖擴散模型在圖像-文本對齊、圖像質量和視圖一致性方面均表現優異。該策略不僅保留了原始2D擴散模型的優點，還顯著提升了多視圖生成的效果。

通過訓練時間步重新安排策略（TTR），Bootstrap3D框架成功解決了合成數據質量參差不齊的問題，顯著提升了多視圖擴散模型的性能，為高質量3D內容生成奠定了堅實基礎。

好了，Bootstrap3D生成的數據集已經全面開源，任何研究人員和開發者都可以免費訪問和使用。

論文地址：
???https://arxiv.org/abs/2406.00093/???
項目主頁：
???https://sunzey.github.io/Bootstrap3D/???
數據集地址：
???https://huggingface.co/datasets/Zery/BS-Objaverse/??

本文轉自量子位，作者：量子位

原文鏈接:??https://mp.weixin.qq.com/s/m7f1myu0eSZqGvZ8mbJcLg??

標簽

贊

收藏

回復

舉報

回復

相關推薦

騰訊、上海科大開源InstantMesh，圖片直接生成3D模型

Aceryt ? 4344瀏覽 ? 0回復
無需3D數據也能訓練，港科&港中文聯手華為推出3D自動駕駛場景生成模型

Crystalcxt ? 3124瀏覽 ? 0回復
高質量3D生成最有希望的一集？GaussianCube在三維生成中全面超越NeRF

輕薄滴假象 ? 2947瀏覽 ? 0回復
DreamTech聯合南大和牛津發布最強3D內容生成大模型——Direct3D

angel ? 3329瀏覽 ? 0回復
僅需1分鐘，文本生成高質量3D模型—Meta 3D-Gen

Aceryt ? 3400瀏覽 ? 0回復
3D版"裁縫"開源來襲！Tailor3D:自定義3D編輯和資產生成（港大&上海AI-Lab&港中文）

angel ? 2734瀏覽 ? 0回復
北航&谷歌&曠視等開源Chat-Edit-3D: 3D 場景編輯新范式！

angel ? 2623瀏覽 ? 0回復
ECCV`24 | 首次解決文本到3D NeRFs分解問題！港中文等提出DreamDissector

angel ? 2621瀏覽 ? 0回復
Stability.ai開源3D模型，僅需0.5秒就能快速生成

Aceryt ? 3523瀏覽 ? 0回復
ECCV 2024 | 引入DiT的原生3D通用框架，適用任意神經場、秒級生成

輕薄滴假象 ? 2707瀏覽 ? 0回復
英偉達提出LATTE3D：大規模高質量的Amortized文本到增強3D 合成

angel ? 2988瀏覽 ? 0回復
精準可控新視角視頻生成+場景級3D生成！北大&港中文&騰訊等開源ViewCrafter

angel ? 2904瀏覽 ? 0回復
3D生成基礎模型來了！只需5秒，高質量3D資產規模化生成！南洋理工等重磅開源3DTopia-XL

angel ? 2689瀏覽 ? 0回復
生成任意3D和4D場景！GenXD：通用3D-4D聯合生成框架 | 新加坡國立&微軟

angel ? 2522瀏覽 ? 0回復
實現任意3D/4D場景生成！港科大&清華&生數發布DimensionX

angel ? 4852瀏覽 ? 0回復
革新3D材質生成！Material Anything：端到端打造任意3D物體的高質量材質！

angel ? 3018瀏覽 ? 0回復
從2D到3D：北大等開源Lift3D，助力精準具身智能操作！

angel ? 2987瀏覽 ? 0回復
首篇2D/視頻/3D/4D統一生成框架全景綜述(港科大&中山等)

angel ? 2375瀏覽 ? 0回復
1秒炸裂3D藝術圈！浙大&西湖突破3D風格化瓶頸：Styl3R引領3D場景風格化新紀元

zhangyannni ? 1037瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

何愷明開辟分形圖像生成新范式！計算效率提高4000倍，首次實現高分辨率逐像素生成 2025-02-26 11:59:41發布
達摩院開源VideoLLaMA3：僅7B大小，視頻理解拿下SOTA | 在線可玩 2025-02-14 13:02:21發布

熱門推薦

AI Agents開源工具棧全解析~ 1回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當，實測來了 0回復

上一篇：量化大模型退化嚴重？ETH北航字節推出LoRA新范式 | ICML 2024

下一篇：庫里杜蘭特“合舞”科目三，騰訊混元團隊全新圖生視頻模型來了

社區精華內容

目錄

主站蜘蛛池模板：成人在线观看免费 | 中文字幕精品一区二区三区精品 | 福利网站导航 | www久久久| 亚洲精品在线视频 | 伦理午夜电影免费观看 | 在线免费观看a级片 | 国产精品www| 影音av | av 一区二区三区 | 成人欧美一区二区三区在线播放 | 国产在线视频一区二区董小宛性色 | 欧美a∨ | 国产亚洲欧美在线视频 | 久久成人精品视频 | 亚洲视频在线观看 | 午夜电影网站 | 国产激情在线观看视频 | 麻豆精品久久久 | 精品伊人 | 毛片免费观看 | www.亚洲 | 国产精品国产三级国产aⅴ中文 | 亚洲一区 | 欧美天堂| 亚洲国产精品一区二区久久 | 久久久久国产一区二区三区 | 日本精品视频 | 久久久久久国产精品免费免费 | 91在线视频播放 | 精品一区二区av | 在线观看黄视频 | 天天久久 | 久久国产视频一区 | 天天干在线播放 | 欧美一区二区三区在线看 | 久久伦理中文字幕 | 成人在线免费视频 | 一区二区三区中文 | 一区二区三区在线观看视频 | 久久久新视频 |

<form id="61616"></form>