成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

真實性驚人,谷歌、康奈爾提出真實的圖像補全技術RealFill

人工智能 新聞
在一個涵蓋了一系列多樣化且具有挑戰性的場景的新的圖像補全基準測試中,RealFill 的表現大大超過了現有的方法。

假期出游,肯定少不了拍照留念。不過,大部分在景區拍攝的照片或多或少都有些遺憾,背景里不是多了些什么,就是少了些什么。

獲得一張「完美」的圖像,是 CV 研究人員長期以來努力的目標之一。日前,Google Research 和康奈爾大學的研究人員合作,提出了一種「真實的圖像補全」(Authentic Image Completion)技術——用于圖像補全的生成模型 RealFill。

RealFill 模型的優勢是可以使用少量的場景參考圖像進行個性化設置,而這些參考圖像無須與目標圖像對齊,甚至可以在視角、光線條件、相機光圈或圖像風格等方面有極大的差異。一旦完成個性化設置,RealFill 就能夠以忠實于原始場景的方式,用視覺上引人入勝的內容來補全目標圖像。

圖片


  • 論文鏈接:https://arxiv.org/abs/2309.16668
  • 項目頁面:https://realfill.github.io/

補畫(inpainting)和擴畫(outpainting)模型是能夠在圖像的未知區域生成高質量、合理的圖像內容的技術,但這些模型生成的內容必然是不真實的,因為這些模型在真實場景的上下文信息方面存在不足。相比之下,RealFill 能夠生成「應該」出現在那里的內容,從而使圖像補全的結果更為真實。

作者在論文中指出,他們定義了一個新的圖像補全問題——「真實圖像補全」(Authentic Image Completion)。不同于傳統的生成型圖像修復(替代缺失區域的內容可能與原始場景不一致),真實圖像補全的目標是使補全的內容盡可能忠實于原始場景,用「應該出現在那里」的內容來補全目標圖像,而不是用「可能在那里」的內容。

作者表示,RealFill 是首個通過在過程中添加更多的條件(即添加參考圖像)來擴展生成型圖像修復模型表達力的方法。

在一個涵蓋了一系列多樣化且具有挑戰性的場景的新的圖像補全基準測試中,RealFill 的表現大大超過了現有的方法。

方法

RealFill 的目標是在盡可能保持真實性的前提下,使用少量的參考圖像來補全給定目標圖像的缺失部分。具體說,給定最多 5 張參考圖像,和一張大致捕捉到相同場景(但布局或外觀可能不同)的目標圖像。

對于給定的場景,研究人員首先通過在參考圖像和目標圖像上微調一個預訓練的 inpainting 擴散模型,創建一個個性化的生成模型。這個微調過程被設計成讓微調后的模型不僅保持良好的圖像先驗,還能學習輸入圖像中的場景內容、光照和風格。然后,使用這個微調過的模型,通過標準的擴散采樣過程來填充目標圖像中的缺失區域。

值得注意的是,為了實際的應用價值,該模型特別關注更具挑戰性、無約束的情況,即目標圖像和參考圖像可能有非常不同的視點、環境條件、相機光圈、圖像風格,甚至包括移動的對象。

實驗結果

根據左側的參考圖像,RealFill 能夠對右側的目標圖像進行擴展(uncrop)或修復(inpaint),生成的結果不僅視覺上吸引人,而且與參考圖像保持一致,即使參考圖像和目標圖像在視點、光圈、光照、圖像風格和物體運動等方面存在較大差異。

圖片

圖片

圖片

圖片

RealFill 模型的輸出效果。給定左側的參考圖像,RealFill 能夠擴畫出對應的右側目標圖像。白色框內的區域被提供給網絡作為已知的像素,而白色框外的區域都是生成的。結果顯示,即使參考圖像和目標圖像之間存在包括視點、光圈、光照、圖像風格和物體運動等巨大差異,RealFill 也能生成高質量且忠實于參考圖像的圖像。來源:論文

對照實驗

研究人員比較了 RealFill 模型和其他的基準方法。相比之下,RealFill 生成的結果質量高,在場景保真度和與參考圖像的一致性方面,RealFill的表現更好。

Paint-by-Example 無法實現高度的場景保真,因為它依賴于 CLIP 嵌入,而 CLIP 嵌入只能捕獲高級語義信息。

Stable Diffusion Inpainting 雖然可以產生看似合理的結果,但由于 prompt 的表達能力有限,所以最終生成結果與參考圖像并不一致。

圖片

RealFill 與其他兩種基線方法的比較。覆蓋了一層透明白色掩碼的區域是目標圖像未修改的部分。來源:realfill.github.io

局限

研究人員也討論了 RealFill 模型的一些潛在的問題和限制,包括處理速度、對視點變化的處理能力,以及對基礎模型具有挑戰性的情況的處理能力。具體說:

RealFill 需要對輸入圖像進行基于梯度的微調過程,這使得它的運行速度相對較慢。

當參考圖像和目標圖像之間的視點變化非常大時,RealFill 往往無法恢復 3D 場景,特別是當只有一張參考圖像的時候。

由于 RealFill 主要依賴于從基礎的預訓練模型繼承的圖像先驗,因此它無法處理那些對基礎模型來說具有挑戰性的情況,例如 stable diffusion 模型無法處理好文本。

圖片

最后,作者對合作者表示了感謝:

我們要感謝 Rundi Wu、Qianqian Wang、Viraj Shah、Ethan Weber、Zhengqi Li、Kyle Genova、Boyang Deng、Maya Goldenberg、Noah Snavely、Ben Poole、Ben Mildenhall、Alex Rav-Acha、Pratul Srinivasan、Dor Verbin 和 Jon Barron 的寶貴討論和反饋,同時也感謝 Zeya Peng、Rundi Wu、Shan Nan 對評估數據集的貢獻。我們特別感謝 Jason Baldridge、Kihyuk Sohn、Kathy Meier-Hellstern 和 Nicole Brichtova 對項目的反饋和支持。

了解更多可閱讀原論文并訪問項目主頁。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2019-03-13 11:23:29

區塊鏈區塊鏈技術身份驗證

2015-06-09 11:13:18

2023-11-20 10:34:09

語言

2014-11-05 11:08:55

2023-06-25 09:41:52

GPTAI

2022-06-14 14:48:09

AI圖像GAN

2009-11-25 10:29:41

袁萌谷歌Chrome OS

2013-02-18 13:28:19

谷歌Gmail

2015-12-17 18:57:06

京東大數據

2011-11-15 08:53:52

用戶

2025-04-09 13:25:34

2024-11-21 12:43:06

2018-05-09 10:59:55

軟件定義存儲

2011-05-31 09:38:48

OracleDUAL

2013-01-17 09:26:41

云可擴展性云應用

2009-10-09 23:03:45

2010-07-06 16:36:22

唐駿

2013-01-07 09:22:02

DLP數據丟失防護

2025-01-03 10:30:00

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 一级毛片在线视频 | 久久久精品一区二区三区 | 成人av片在线观看 | 国产在线播 | 在线播放国产一区二区三区 | 99免费视频 | 黄网站在线播放 | 又爽又黄axxx片免费观看 | 成人一区二区三区在线观看 | 日韩毛片免费视频 | 91在线免费视频 | 性生生活大片免费看视频 | 99视频精品| 欧美精品一区二区三区四区 | 精品国产91乱码一区二区三区 | 午夜日韩视频 | 亚洲欧洲精品成人久久奇米网 | 欧美日韩精品区 | 成人在线一区二区 | 国产又爽又黄的视频 | 欧美日韩专区 | 国产第一页在线观看 | 国产视频第一页 | a在线观看| 久久久精品一区二区三区 | 国产欧美久久精品 | 一区二区三区四区电影视频在线观看 | 99国产精品久久久 | 91精品国产高清一区二区三区 | 国产福利视频在线观看 | 国产精品久久久久久婷婷天堂 | 91精品国产91久久久久青草 | 日本免费在线 | 久久精品国产一区二区电影 | 亚洲成人自拍 | 色桃网 | 国产精品美女久久久久aⅴ国产馆 | 日韩免费一级 | 男女羞羞网站 | 久久aⅴ乱码一区二区三区 91综合网 | 成人免费xxxxx在线视频 |