成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

單圖就能解鎖全景視角!北大/港中文/騰訊等推出ViewCrafter | 已開源

人工智能 新聞
來自ViewCrafter,由北大、港中文、騰訊等機構的研究人員提出,可以從單張或稀疏輸入圖像生成精確相機可控的新視角視頻。

隨便給張圖就能從更多視角查看全景了?!

話不多說,先看一波效果,單視角輸入be like:

圖片

圖片

難度升級,接下來換成雙視角,看起來銜接也非常絲滑。

圖片

圖片

以上來自ViewCrafter,由北大、港中文、騰訊等機構的研究人員提出,可以從單張或稀疏輸入圖像生成精確相機可控的新視角視頻。

圖片

還支持場景級文生3D圖生3D、以及稀疏視角重建等應用。

圖片

圖片

目前論文和代碼均已開源,并提供了在線Huggingface demo供用戶使用。

ViewCrafter:一種新視角生成方法

傳統的新視角生成方法,如NeRF和3D-GS等技術,存在一個痛點

依賴于密集的多視角訓練數據

這限制了它們在僅有稀疏(輸入圖像數量有限,不能提供完整視角或詳盡場景信息)甚至單張輸入視角的情況下的應用。

同時,傳統方法對訓練資源的需求較高,且不具備泛化能力,這限制了它們在訓練資源受限場景下的應用。

因此,ViewCrafter最終想實現:

從稀疏視角圖像甚至單張輸入圖像中生成任意規模場景的新視角。

這需要模型對3D物理世界有全面的理解。

接下來一起康康具體咋實現的。

概括而言,ViewCrafter是基于點云先驗的可控視角視頻生成。

首先,快速多視圖/單視圖stereo技術的發展,使得從單張或稀疏圖像中快速重建點云表征成為可能。

點云表征能夠提供3D場景的粗略信息,支持精確的相機位置控制以實現自由視角渲染。

然而,由于點云的表示能力較弱,加之極其稀疏的輸入圖像只能提供有限的3D線索,重建出的點云存在大面積的遮擋和缺失區域,并可能面臨幾何形變和點云噪聲。

這些問題限制了其在新視角合成上的應用。

與此同時,在大規模視頻數據集上訓練的視頻擴散模型能夠深入理解3D物理世界,支持從單張圖像或文本提示中生成符合物理規律和現實世界規則的視頻內容。

然而,現有的視頻擴散模型缺乏顯式的場景3D信息,因此在視頻生成過程中難以實現精確的相機視角控制。

針對這些優缺點,團隊提出將視頻擴散模型的生成能力與點云表征提供的顯式3D先驗相結合,以實現相機精準可控的任意場景高保真度新視角視頻生成。

圖片

具體而言,給定單張或稀疏視角輸入圖像,團隊首先使用快速多視圖stereo方法構建其點云表征,以實現精準地移動相機進行自由視角渲染。

隨后,為了解決點云渲染結果中存在的大面積缺失區域、幾何失真和點云偽影,團隊訓練了一個以點云渲染結果為控制信號的視頻擴散模型作為增強渲染器

這一渲染器能在粗糙的點云渲染結果的基礎上進一步生成具有高保真度和3D一致性的新視角。

通過結合點云提供的顯式3D信息以及視頻擴散模型的強大生成能力,新方法能夠在視頻生成過程中實現6自由度的精準相機位姿控制,并生成高保真度、一致性強的新視角視頻。

圖片△相機軌跡規劃算法

此外,現有的視頻擴散模型難以生成長視頻,因為長視頻推理會造成巨大的計算開銷。

為了解決這一問題,研究采用了一種迭代式的新視角生成策略,并提出了一種內容自適應的像機軌跡規劃算法,以逐步擴展新視角覆蓋的區域和重建的點云。

具體來說,從初始輸入圖像構建的點云開始,團隊首先利用相機軌跡規劃算法,從當前點云預測一段相機軌跡,以有效揭示遮擋和確實區域。

接著,團隊根據預測的軌跡渲染點云,并利用ViewCrafter根據渲染的點云生成高質量的新視角。

隨后利用生成的新視角更新點云,以擴展全局點云表征。

通過迭代執行這些步驟,最終可以獲得覆蓋大視場范圍和擴展點云的高保真新視圖,并支持高斯重建等下游任務。

具體應用上,基于ViewCrafter和提出的迭代式新視角生成算法,可以從單張圖像/稀疏視角甚至一段文字描述中進行3D高斯重建,以支持實時渲染和沉浸式3D體驗。

圖片

對比實驗

團隊從多個角度對比了新方法。

新視角生成來看,團隊在Tanks-and-Temples,CO3D, RealEstate10K這三個真實世界數據集上與SOTA方法進行了定量和定性比較。

實驗結果證明,ViewCrafter在相機位姿控制的精準程度,以及生成新視角的視覺質量上都優于對比方法

圖片
圖片

場景重建方面,團隊在Tanks-and-Temples數據集上與稀疏視角重建領域的SOTA方法進行了定量和定性比較。

結果證明,ViewCrafter在3D高斯重建渲染出的新視角的視覺質量上也超過了對比方法。

圖片
圖片

文生3D結果如下。左邊顯示了文本提示以及文生圖效果,后面是最終的3D效果。

圖片

當然,團隊也進行了消融實驗

比如利用點云先驗作為視頻擴散模型控制信號的有效性。

具體而言,一些同期工作采用普呂克坐標作為視頻生成模型的控制信號,以實現相機可控的新視角生成。

作為對比,為了驗證點云控制信號的優越性,團隊訓練了一個以普呂克坐標為控制信號的新視角生成模型,并進行控制變量實驗,保證除了控制信號外其他模型結構與ViewCrafter一致。

兩個模型在新視角生成任務上對比結果如下所示:

圖片
圖片
圖片

實驗結果證明,不管是在新視角生成質量還是在相機控制的精準程度上,團隊使用的基于點云的控制信號都要優于基于普呂克坐標的控制信號

另外,團隊驗證了模型對粗糙點云的魯棒性

如圖所示,對于作為控制信號的點云具有嚴重幾何形變的情況,模型依然能夠有效地進行幾何糾錯和空洞修補。

這證明了新方法對點云控制信號的魯棒性。

圖片

概括下來,團隊驗證了ViewCrafter對于靜態場景的強大新視角生成能力。

接下來,團隊計劃探索和單目視頻深度估計方法結合,實現單目動態視頻的新視角生成和4D重建。

更多細節歡迎查閱原論文。

GitHub:https://github.com/Drexubery/ViewCrafter
項目主頁:https://drexubery.github.io/ViewCrafter/
論文:https://arxiv.org/abs/2409.02048
Huggingface Demo:https://huggingface.co/spaces/Doubiiu/ViewCrafter

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-09-30 09:35:55

圖像生成AI

2024-07-03 12:05:06

Llama模型架構

2025-05-19 08:37:00

2024-12-20 09:30:00

模型訓練數據

2019-12-11 18:38:56

騰訊云數據智能

2025-06-20 09:06:00

2012-05-29 09:04:30

騰訊云計算微云

2024-11-04 09:35:00

2025-01-07 08:40:00

視頻生成AI

2022-07-17 13:07:26

模型開源

2023-04-13 15:40:59

模型論文

2022-12-26 13:55:31

模型框架

2023-10-17 13:27:49

自動駕駛數據

2021-06-09 14:01:13

騰訊云云簽約

2023-12-28 09:49:19

AI工具模型

2025-03-19 10:41:11

2023-05-19 13:24:20

模型AI

2024-08-29 14:05:00

數據模型

2010-05-09 23:22:26

云計算騰訊

2023-08-09 17:10:01

論文獲獎
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久精品毛片 | 亚洲国产精品一区二区三区 | 激情久久网 | 国产美女网站 | 日日操av | 精彩视频一区二区三区 | av超碰| 国产有码 | 黄色片视频免费 | 成人av高清 | 91久久北条麻妃一区二区三区 | 精品视频一二区 | 欧美日本亚洲 | 一区二区三区在线播放视频 | 国产精品乱码一区二区三区 | 二区av | 99热在这里只有精品 | 成人免费网视频 | 国产免费观看一区 | 国产一区二区三区日韩 | 欧美韩一区二区 | 蜜月aⅴ免费一区二区三区 99re在线视频 | 亚洲高清视频一区二区 | 人人叉 | 一区二区三区免费 | 亚洲三级av | 午夜视频一区 | 国产精品毛片一区二区在线看 | 日屁视频| 一a级片| 国产福利网站 | 国产91精品久久久久久久网曝门 | 亚洲成人免费视频在线 | 国产精品久久毛片av大全日韩 | 一区二区三区av | 中文字幕一区二区三 | 午夜欧美 | 欧美性jizz18性欧美 | 亚洲精品日韩综合观看成人91 | 国产精品日女人 | 欧美精品一区二区三区在线 |