成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

港理工&OPPO&Stability AI聯合發布一致且高效的3D場景編輯方法——SyncNoise

發布于 2024-9-2 10:48
瀏覽
0收藏

港理工&OPPO&Stability AI聯合發布一致且高效的3D場景編輯方法——SyncNoise-AI.x社區

文章鏈接:https://arxiv.org/pdf/2406.17396
項目鏈接:https://lslrh.github.io/syncnoise.github.io/

?

一句話亮點直擊

  • SyncNoise能夠實現一致且高效的3D編輯,符合文本指令并保留編輯場景中的更多細節。


今天和大家一起學習港理工、OPPO和Stability AI聯合發的一篇關于3D場景編輯的工作,主打一個一致且高效,視頻demo非常贊,可以看看!基于文本的2D擴散模型在圖像生成和編輯方面展示了令人印象深刻的能力。同時,這些2D擴散模型在3D編輯任務中也表現出相當大的潛力。然而,實現多個視圖之間的一致編輯仍然是一個挑戰。盡管迭代數據集更新方法能夠實現全局一致性,但其收斂速度緩慢且紋理過于平滑。本文提出了SyncNoise,一種新穎的幾何引導多視圖一致噪聲編輯方法,用于高保真3D場景編輯。SyncNoise在編輯多個視圖時同步使用2D擴散模型,同時強制多視圖噪聲預測在幾何上保持一致,從而確保語義結構和低頻外觀的全局一致性。為了進一步增強高頻細節的局部一致性,本文設置了一組anchor視圖,并通過跨視圖重投影將它們傳播到相鄰幀。為了提高多視圖對應的可靠性,本文在訓練過程中引入深度監督,以增強精確幾何結構的重建。通過在噪聲和像素級別增強幾何一致性,本文的方法實現了高質量的3D編輯效果,能夠很好地遵循文本指令,尤其是在具有復雜紋理的場景中。

港理工&OPPO&Stability AI聯合發布一致且高效的3D場景編輯方法——SyncNoise-AI.x社區

demo視頻展示

港理工&OPPO&Stability AI聯合發布一致且高效的3D場景編輯方法——SyncNoise-AI.x社區

港理工&OPPO&Stability AI聯合發布一致且高效的3D場景編輯方法——SyncNoise-AI.x社區

港理工&OPPO&Stability AI聯合發布一致且高效的3D場景編輯方法——SyncNoise-AI.x社區

港理工&OPPO&Stability AI聯合發布一致且高效的3D場景編輯方法——SyncNoise-AI.x社區

方法

在這項工作中,通過借助2D擴散模型,專注于基于文本的3D場景編輯。給定原始3D表示(如NeRF或Gaussian Splatting)、多視圖圖像及其對應的相機姿態,本文旨在根據自然語言指令生成編輯后的場景。


如下圖2所示,本文利用基于指令的2D擴散模型來編輯多視圖圖像,隨后使用編輯后的視圖作為監督來優化原始3D表示。確保多視圖一致編輯至關重要,因為視圖之間紋理的不一致可能會導致不理想的平滑效果。為此,本文首先利用3D幾何建立精確的多視圖對應關系。其次在整個去噪(編輯)過程中對噪聲預測施加多視圖一致性約束,以增強視圖間的語義和外觀一致性。此外,為了保留更多的高頻細節,本文采用跨視圖投影,將編輯效果從anchor視圖傳播到其鄰近視圖,以實現像素級的多視圖一致編輯。

港理工&OPPO&Stability AI聯合發布一致且高效的3D場景編輯方法——SyncNoise-AI.x社區

可靠的幾何引導對應關系

為了在多個視圖之間建立可靠的對應關系,本文引入了深度監督來增強重建的幾何形狀。此外,本文利用重新投影的深度和循環一致性約束來過濾掉不可靠的匹配點,確保匹配的準確性。


深度監督。隱式3D表示(例如 NeRF)在擬合幾何形狀方面表現有限,特別是在視圖稀疏的情況下。因此,NeRF 預測的深度往往不可靠。如下圖 3(a) 所示,從參考視圖重新投影到其他視圖時存在顯著偏差。為了解決這一限制,本文在 NeRF 的訓練過程中引入深度監督。具體來說,從通過運行 Structure-from-Motion (SfM) 解算器獲得的 3D 關鍵點派生深度監督,并添加深度損失以強制估計的深度匹配關鍵點的深度。如下圖 3(b) 所示,通過添加深度監督,能夠估計出更精確的深度,從而能夠在不同視圖之間建立密集且準確的對應關系。

港理工&OPPO&Stability AI聯合發布一致且高效的3D場景編輯方法——SyncNoise-AI.x社區

港理工&OPPO&Stability AI聯合發布一致且高效的3D場景編輯方法——SyncNoise-AI.x社區

幾何一致的噪聲預測

在上一章節構建的精確幾何對應關系的基礎上,本節旨在確保從T到 0 步的整個去噪過程中多視圖的編輯結果是一致的。實現這一目標的一個簡單有效的方法是對多視圖之間的對應潛在特征進行平均。然而,這種方法有兩個主要局限性。一方面,直接操作潛在圖會導致生成圖像出現平滑的結果,如下圖 4(b) 所示。另一方面,由于視圖之間的匹配點質量不一,對不同視圖賦予相同的權重是不合理的,這會使模型偏向于質量較差的視圖。

港理工&OPPO&Stability AI聯合發布一致且高效的3D場景編輯方法——SyncNoise-AI.x社區

先前的研究已經表明,噪聲預測器(U-Net)的中間特征不僅捕捉語義信息,還影響圖像的最終外觀。這啟發本文在 U-Net 特征而不是潛在圖上增強多視圖一致性。如上圖 4(d) 所示,通過在 U-Net 的中間解碼器特征上強制一致性,可以實現多視圖一致的編輯結果而不會引入模糊偽影。當將約束應用于跳躍特征時,影響相對較小,如上圖 4(c) 所示。有關 U-Net 結構和對齊 U-Net 不同層效果的詳細信息,請參考原文附錄。


港理工&OPPO&Stability AI聯合發布一致且高效的3D場景編輯方法——SyncNoise-AI.x社區

港理工&OPPO&Stability AI聯合發布一致且高效的3D場景編輯方法——SyncNoise-AI.x社區

港理工&OPPO&Stability AI聯合發布一致且高效的3D場景編輯方法——SyncNoise-AI.x社區

港理工&OPPO&Stability AI聯合發布一致且高效的3D場景編輯方法——SyncNoise-AI.x社區

港理工&OPPO&Stability AI聯合發布一致且高效的3D場景編輯方法——SyncNoise-AI.x社區

港理工&OPPO&Stability AI聯合發布一致且高效的3D場景編輯方法——SyncNoise-AI.x社區

此外,為了在不修改無關區域的情況下實現更精確的前景編輯,本文引入了掩碼來限制匹配和編輯的區域。本文只保留掩碼內的對應關系,并過濾掉來自不相關區域的多余關聯。此外,在每個去噪步驟中應用一個掩碼來限制文本指導的區域,并修改噪聲估計方程如下:

港理工&OPPO&Stability AI聯合發布一致且高效的3D場景編輯方法——SyncNoise-AI.x社區

港理工&OPPO&Stability AI聯合發布一致且高效的3D場景編輯方法——SyncNoise-AI.x社區

跨視角像素級投影

本文已經對來自多個視角的初始噪聲和U-Net的噪聲預測進行了對齊,這種方法可以比迭代細化策略更有效地實現全局一致的編輯。然而,如下圖5(b)所示,噪聲級別的對齊只能確保語義結構和低頻紋理的一致性,但無法保證高頻細節的一致性。即使在這些細節上的輕微不對齊最終也會導致3D編輯中的平滑紋理。

港理工&OPPO&Stability AI聯合發布一致且高效的3D場景編輯方法——SyncNoise-AI.x社區

港理工&OPPO&Stability AI聯合發布一致且高效的3D場景編輯方法——SyncNoise-AI.x社區

3D表示優化

多視角同步噪聲預測在結構和外觀上實現了一致的編輯,而跨視角像素級投影進一步增強了相鄰視角之間的一致性。基于所有視角的編輯結果,本文首先對3D模型進行1000-2000次迭代的訓練,具體取決于場景的復雜性,以將2D編輯注入到3D表示中。隨后采用一個迭代的細化方法進一步增強3D表示。需要注意的是,本文的方法在一個關鍵方面與IN2N 不同。在 IN2N 中,在早期的優化步驟中,多視角圖像編輯顯示出顯著的不一致性,導致3D編輯過度平滑。相反,本文的方法首先生成多視角一致的2D編輯,以確保3D幾何和外觀的整體一致性,然后采用迭代細化過程來調整更精細的細節。

實驗

實現細節。在編輯過程中,本文首先編輯80個多視角圖像,同時強制保持在U-Net的第5層和第8層特征上的一致性(詳見文章最后的圖10)。隨后,在anchor視角選擇方面,本文每隔10個相鄰視角選擇具有最高CLIP方向分數的視角作為anchor視圖,并將它們重新投影到大約80%重疊的相鄰視角上。


評估。本文使用三個指標來衡量與文本指令的對齊度,即 CLIP相似性分數,CLIP文本-圖像方向相似性,以及CLIP時間方向相似性。此外,本文還使用兩個無參考圖像質量評估指標,即CLIP-IQA 和MUSIQ 。

定性結果

在圖1中,本文展示了使用不同文本提示進行的一些編輯結果。從“Batman”和“Robot”提示的編輯中可以觀察到,即使原始場景的幾何形狀發生明顯變化,本文的方法仍然展現出多視角一致性。此外,本文可以在“Hulk”的頭發、“Spiderman”的手臂和“Thor”的服裝中看到更精細的細節。這是因為本文通過像素級投影在相鄰幀之間強制實現了一致性。


在下圖6中,本文針對提出的 SyncNoise 與兩種代表性的基于指令的方法,InstructNerf2Nerf 和GaussianEditor 進行了比較。本文使用它們的官方代碼和默認參數重現了這些方法的結果。本文的 SyncNoise 實現了符合輸入文本指令的逼真和一致的編輯。在“Turn the table into a rainbow table”的示例中,本文的編輯展示了比其他兩種方法更好的多視角一致性。IN2N 由于每次迭代中的不一致編輯而出現了顏色混合問題。對于指令“turn him into a wood carving”,本文的 SyncNoise 成功地編輯了頭發并產生了細膩的紋理。此外,本文的結果嚴格遵循了編輯提示“turn him into Iron Man wearing the helmet”,并生成了高度逼真的頭盔。然而,GaussianEditor幾乎沒有改變人臉的外觀,因為它限制了舊高斯點的更新,從而影響了它們對文本的編輯保真度。本文的方法通過在噪聲級別實現全局結構和外觀一致性,并在像素級別改善局部紋理一致性,實現了更優越的編輯效果。詳細的定性結果請參考原文附錄。

港理工&OPPO&Stability AI聯合發布一致且高效的3D場景編輯方法——SyncNoise-AI.x社區

定量比較

如下表1所示,本文提供了 SyncNoise 與 Instruct-Nerf2Nerf (IN2N) 、Efficient-Nerf2Nerf (EN2N) 和GaussianEditor 的定量比較結果。本文在總共四個場景(即“bear”、“face”、“fangzhou”和“person”)和10個不同的文本提示上評估了所有比較方法。可以看出,本文的方法不僅在編輯保真度上表現出色,而且在視覺質量上也表現優異。與 IN2N 相比,本文的方法在編輯指令遵循性和時間一致性上表現更好,而且編輯時間僅需一半。此外,本文的方法在 CLIP 文本-圖像方向相似度分數和 MUSIQ 指標上分別比 GaussianEditor 高出了1.27%和2.243,表明本文生成的編輯圖像更加忠實于給定的指令,同時不犧牲視覺質量。由于 GaussianEditor限制了原始場景部分3D高斯點的更新,因此它無法很好地遵循指令。此外,通過引入像素級一致性,SyncNoise 進一步提高了對指令的忠實度和視覺質量,在不同視角下實現了更精細的編輯細節。

港理工&OPPO&Stability AI聯合發布一致且高效的3D場景編輯方法——SyncNoise-AI.x社區

消融研究

本文研究了pipeline 中兩個關鍵組件的作用,即噪聲對齊和跨視圖重投影。如下圖7所示,僅使用噪聲對齊時,編輯在幾何上對齊,但丟失了一些細節。僅使用跨視圖重投影時,保持了相鄰幀的局部一致性,但編輯缺乏全面的覆蓋和完整性。例如,蝙蝠俠的角很小,骷髏的角沒有被編輯。通過將這兩個組件結合在一起,本文在全局結構和局部紋理上實現了更好的一致性。

港理工&OPPO&Stability AI聯合發布一致且高效的3D場景編輯方法——SyncNoise-AI.x社區

結論

今天分享的這篇工作專注于實現3D場景編輯中的多視角一致性編輯。提出了一種名為SyncNoise的新方法,利用幾何引導的多視角一致性來增強編輯場景的連貫性。通過使用2D擴散模型同步編輯多個視角,并在噪聲預測器的特征上強制執行幾何一致性,避免了模糊的結果。鄰近視角之間的像素級重投影進一步幫助生成更精細的細節。本文的實驗結果表明,SyncNoise在實現高質量的3D編輯并遵循文本指令方面優于現有方法。


局限性。本文的方法嚴重依賴于2D擴散模型,這限制了3D編輯的質量和提示的靈活性。此外,SyncNoise在編輯外觀方面表現出色,但在修改3D形狀和幾何方面的能力有限。這一限制也存在于IN2N中。此外,SyncNoise可能在復雜場景中遇到困難,特別是那些具有復雜幾何結構的場景。需要進一步的研究來解決這些挑戰,這將是本文未來的重點關注。

港理工&OPPO&Stability AI聯合發布一致且高效的3D場景編輯方法——SyncNoise-AI.x社區

本文轉自   AI生成未來 ,作者:Ruihuang Li等


原文鏈接:??https://mp.weixin.qq.com/s/yLOzWXTNMwlXuuXGpRDkrg??

標簽
收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 黄免费观看视频 | 蜜桃一区二区三区在线 | 天堂一区二区三区四区 | 女女百合av大片一区二区三区九县 | 国产精品中文字幕在线播放 | 99久久精品免费看国产小宝寻花 | 天天夜夜操 | 日韩午夜一区二区三区 | 日韩精品久久一区二区三区 | 日韩成人在线免费观看 | 国产精品1区 | 国产精品视频999 | 国产一级淫片免费视频 | 99精品九九 | 一区二区国产在线观看 | 久久se精品一区精品二区 | 免费欧美视频 | 国产欧美日韩一区二区三区在线观看 | 精品亚洲一区二区三区四区五区 | 综合久久一区 | 亚洲国产精品成人 | 欧美视频二区 | 国产一区二区 | 成人国产精品久久久 | 久久精品亚洲精品国产欧美 | 国产一区影院 | 99热激情 | 免费看一级毛片 | 国产精品小视频在线观看 | 亚洲一区二区三区桃乃木香奈 | 国产一在线观看 | 免费大黄视频 | 婷婷桃色网 | 日本在线中文 | 日日艹夜夜艹 | 日本一区二区三区在线观看 | 国产一区二区三区在线 | 中文字幕在线观看精品 | 欧美国产日韩一区二区三区 | 青青操av | 中文字幕 国产 |