成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

一張圖生成高質量廣視野3D場景,還可控制攝像軌跡

人工智能
這就是來自多倫多大學、Snap和UCLA的研究團隊推出的全新模型——Wonderland。他們首次證明,三維重建模型可以有效地建立在擴散模型的潛在空間上,進而實現高效的三維場景生成,是單視圖3D場景生成領域的一次突破性進展。

只需一張圖,就能生成高質量、廣范圍的3D場景!

泰迪熊、花園、山谷都從平面圖片變成了仿佛觸手可及的立體物品。

圖片

這就是來自多倫多大學、Snap和UCLA的研究團隊推出的全新模型——Wonderland。

圖片

他們首次證明,三維重建模型可以有效地建立在擴散模型的潛在空間上,進而實現高效的三維場景生成,是單視圖3D場景生成領域的一次突破性進展。

具體來說,團隊引入了一種大規模重建模型,該模型使用視頻擴散模型中的潛在信息,以前饋方式預測場景的3D表示(3DGS)。

視頻擴散模型可以精確地按照指定的相機軌跡創建視頻,生成包含多視角信息的潛在特征,同時保持三維一致性。

三維重建模型則通過漸進式訓練策略在視頻潛在空間進行訓練,高效地生成高質量、大范圍和通用的三維場景。

圖片

這樣一來,機器就可以高效地模擬人類從單張圖像中感知并想象三維世界的能力了。

技術突破:從單張圖像到三維世界的關鍵創新

傳統的3D重建技術往往依賴于多視角數據逐個場景(per-scene)的優化,且在處理背景和不可見區域時容易失真。

為解決這些問題,Wonderland創新性地結合視頻生成模型大規模3D重建模型,實現了高效高質量的大規模3D場景生成:

  • 向視頻擴散模型中嵌入3D意識

通過向視頻擴散模型中引入相機位姿控制,Wonderland在視頻latent空間中嵌入了場景的多視角信息,并能保證3D一致性。視頻生成模型在相機運動軌跡的精準控制下,將單張圖像擴展為包含豐富空間關系的多視角視頻。

  • 雙分支相機控制機制

利用ControlNet和LoRA模塊,Wonderland實現了在視頻生成過程中對于豐富的相機視角變化的精確控制,顯著提升了多視角生成的視頻質量、幾何一致性和靜態特征。

  • 大規模latent-based 3D重建模型(LaLRM)

Wonderland創新地引入了3D重建模型LaLRM,利用視頻生成模型生成的latent直接重構3D場景(feed-forward reconstruction)。重建模型的訓練采用了高效的逐步訓練策略,將視頻latent空間中的信息轉化為3D高斯點分布(3D Gaussian Splatting, 3DGS),顯著降低了內存需求和重建時間成本。憑借這種設計,LaLRM能夠有效地將生成和重建任務對齊,同時在圖像空間與三維空間之間建立了橋梁,實現了更加高效且一致的廣闊3D場景構建。

效果展示:視頻生成

基于單張圖和camera condition,實現視頻生成的精準視角控制:

Input Image and Camera Trajectory

圖片

圖片

Input Image and Camera Trajectory

圖片

圖片

Camera-guided視頻生成模型可以精確地遵循軌跡的條件,生成3D-geometry一致的高質量視頻,并具有很強的泛化性,可以遵循各種復雜的軌跡,并適用于各種風格的輸入圖片。

一起來看看更多的例子:

不同的輸入圖片,同樣的三條相機軌跡,生成的視頻:

圖片圖片

圖片

圖片

圖片

給定輸入圖片和多條相機軌跡,生成視頻可以深度地探索場景:

圖片

圖片

圖片

圖片

圖片

效果展示:3D場景生成

基于單張圖,利用LaLRM, Wonderland 可以生成高質量的、廣闊的3D場景:

圖片

圖片

圖片

圖片

圖片

基于單張圖和多條相機軌跡,Wonderland 可以深度探索和生成高質量的、廣闊的3D場景:

圖片

圖片

圖片

圖片

圖片

卓越性能:在視覺質量和生成效率等多個維度上表現卓越

Wonderland的主要特點在于其精確的視角控制、卓越的場景生成質量、生成的高效性和廣泛的適用性

實驗結果顯示,該模型在多個數據集上的表現超越現有方法,包括視頻生成的視角控制、視頻生成的視覺質量、3D重建的幾何一致性和渲染的圖像質量、以及端到端的生成速度均取得了優異的表現:

  • 雙分支相機條件策略:通過引入雙分支相機條件控制策略,視頻擴散模型能夠生成3D-geometry一致的多視圖場景捕捉,且相較于現有方法達到了更精確的姿態控制。
  • Zero-shot 3D 場景生成:在單圖像輸入的前提下,Wonderland可進行高效的3D場景前向重建,在多個基準數據集(例如RealEstate10K、DL3DV 和Tanks-and-Temples)上的3D場景重建質量均優于現有方法。
  • 廣覆蓋場景生成能力: 與過去的3D 前向重建通常受限于小視角范圍或者物體級別的重建不同,Wonderland能夠高效生成廣范圍的復雜場景。其生成的3D場景不僅具備高度的幾何一致性,還具有很強的泛化性,能處理out-of-domain的場景。
  • 超高效率: 在單張圖像輸入的問題設定下,利用單張A100,Wonderland僅需約5分鐘即可生成完整的3D場景。這一速度相比需要16分鐘的Cat3D提升了3.2倍,相較需要3小時的ZeroNVS更是提升了36倍。

應用場景:視頻和3D場景內容創作的新工具

Wonderland的出現為視頻和3D場景的創作提供了一種嶄新的解決方案。

在建筑設計、虛擬現實、影視特效以及游戲開發等領域,該技術展現了廣闊的應用潛力。

通過其精準的視頻位姿控制和具備廣視角、高清晰度的3D場景生成能力,Wonderland能夠滿足復雜場景中對高質量內容的需求,為創作者帶來更多可能性。

盡管模型表現優異,Wonderland研發團隊深知仍有許多值得提升和探索的方向。

例如,進一步優化對動態場景的適配能力、提升對真實場景細節的還原度等,都是未來努力的重點。

希望通過不斷改進和完善,讓這一研發思路不僅推動單視圖3D場景生成技術的進步,也能為視頻生成與3D技術在實際應用中的廣泛普及貢獻力量。

論文: https://arxiv.org/abs/2412.12091項目主頁:https://snap-research.github.io/wonderland/。

責任編輯:姜華 來源: 量子位
相關推薦

2023-08-21 10:57:17

3D模型

2025-01-14 09:24:46

2025-01-07 13:19:48

模型AI訓練

2024-07-16 12:02:11

2024-10-08 09:25:00

3D模型生成

2023-12-10 15:17:59

開源模型3D

2024-09-30 09:35:55

圖像生成AI

2023-05-09 09:35:22

2025-02-08 09:23:08

2023-05-29 10:39:00

AI算法

2023-12-07 10:37:55

3D框架AI

2024-07-31 15:30:05

2025-03-21 09:30:42

2025-01-14 14:02:05

2024-06-11 07:02:00

大模型3D內容生成技術

2024-02-20 13:44:00

AI數據

2025-04-01 05:10:00

2024-01-18 12:37:31

SOTA3D方法

2023-07-23 19:18:50

3DGitHub

2024-01-11 09:55:00

AI訓練
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久精品视频99 | 久草视频观看 | 一区二区三区精品在线 | 日韩一级电影免费观看 | 日日综合| 亚洲成人精选 | 精品亚洲一区二区三区 | 国产精品视频在线观看 | 青青草一区二区三区 | 拍拍无遮挡人做人爱视频免费观看 | 亚洲色图综合网 | 欧美激情久久久 | 日韩一二区在线观看 | 天天影视网天天综合色在线播放 | 一级免费视频 | av一区二区三区四区 | 玖玖色在线视频 | 国产精品日韩一区二区 | 国产一区二区激情视频 | 夜夜爽99久久国产综合精品女不卡 | 韩日精品在线观看 | 欧美精品在线一区二区三区 | 观看av| 中日字幕大片在线播放 | 伦理午夜电影免费观看 | 偷拍第一页 | 久久久久久99 | 日本久久网| 亚洲va在线va天堂va狼色在线 | 国产日韩一区 | 一区二区三区四区不卡 | 亚洲美乳中文字幕 | 日日天天| 中文字幕免费视频 | 国产精品久久久久久久久久免费看 | 久久99精品久久久 | 在线观看av网站永久 | 国产福利资源 | 午夜视频免费在线观看 | 羞羞视频网站免费观看 | 狠狠操操 |