成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

NeurIPS 2024|浙大 & 微信 & 清華:徹底解決擴散模型反演問題

人工智能 新聞
本研究提出的雙向顯式線性多步法采樣器從理論上分析并徹底解決了現有擴散生成模型中的反演問題,進一步拓寬了擴散模型在計算機視覺領域的能力邊界。在圖像和視頻的編輯任務上有巨大的應用前景。

本篇論文已經被NeurIPS 2024接收。第一作者王方懿康是微信視覺團隊實習生,同時也是浙江大學一年級碩士研究生。共同一作是微信高級研究員Hubery。通訊作者是浙江大學助理教授張超。其他作者包括來自清華大學的董玥江,來自浙江大學的朱胡旻昊,趙涵斌助理教授和錢徽教授,以及微信基礎視覺和視覺生成技術負責人李琛。

隨著擴散生成模型的發展,人工智能步入了屬于 AIGC 的新紀元。擴散生成模型可以對初始高斯噪聲進行逐步去噪而得到高質量的采樣。當前,許多應用都涉及擴散模型的反演,即找到一個生成樣本對應的初始噪聲。當前的采樣器不能兼顧反演的準確性和采樣的質量。

為徹底解決這一問題,微信視覺團隊與浙江大學和清華大學聯手提出了基于雙向顯式線性多步法的擴散模型精確反演采樣器(BELM)這一通用算法,并通過截斷誤差分析確定了最優的 BELM 采樣器系數。此方法在確保精確反演的同時還提升了生成樣本的質量,在圖像與視頻的編輯、插值等下游任務中有廣泛的應用前景。這一研究成果已被 NeurIPS 2024 會議接收。

當前,擴散模型在圖像生成、文字生成、音頻生成等多個領域得到了廣泛應用,表現出了卓越的性能。擴散模型的反演操作,即找到一個生成樣本對應的初始噪聲,對若干下游任務起到關鍵的作用。傳統的 DDIM 反演會造成嚴重的不一致問題,即原始圖片加噪再去噪的結果與原圖相差甚遠。

近期,研究者們提出了多種啟發式的精確反演采樣器來解決 DDIM 反演的不一致問題。然而,這些啟發式的精確反演采樣器的理論特性尚不明確,且采樣質量常常不盡如人意,這在一定程度上限制了它們的應用。

為此,本研究引入了一種通用的精確反演采樣器范式 —— 雙向顯式線性多步(BELM)采樣器,該范式包含了上文提到的啟發式精確反演采樣器。該團隊在 BELM 范式內系統地研究了局部截斷誤差(LTE),發現現有的精確反演采樣器的 LTE 并非最優。

因此,研究團隊通過 LTE 最小化方法提出了最優的 BELM(Optimal-BELM,O-BELM)采樣器。實驗表明,O-BELM 采樣器在實現精確反演的同時,也提升了采樣的質量。

圖片

  • 論文題目:BELM: Bidirectional Explicit Linear Multi-step Sampler for Exact Inversion in Diffusion Models
  • 論文鏈接:https://arxiv.org/abs/2410.07273
  • 項目地址:https://github.com/zituitui/BELM

背景:DDIM 反演造成的不一致問題

由于 DDIM 的正向過程和反演過程使用的迭代式并不相同,所以 DDIM 的反演重構樣本與初始的樣本存在較大差別。

實際使用中,DDIM 的反演有顯著的不一致問題:

圖片

圖片

現有精確反演方法

Null-text-inversion

以 Null-tex-inversion 為代表的方法對 unconditional 占位符進行 fine-tune,以達到精確反演。

問題:這類方法局限于 text-classifier-free-guidance 場景下的擴散模型;需要額外訓練,低效。

圖片

EDICT

EDICT 是基于 DDIM 的啟發式算法,借鑒了可逆網絡的做法,有兩個相互糅合的采樣鏈。

圖片

其逆過程如下,精確可逆:

圖片

問題:需要兩倍計算量;超參數 p 不魯棒,導致采樣質量不可控。

BDIA

BDIA 改進了 EDICT,使用 x_i 的速度,x_i 和 x_{i+1} 的位置,通過下述公式實現精確可逆:

圖片

問題:超參數 gamma 不魯棒,導致采樣質量不佳。

EDICT 和 BDIA 參數的不魯棒:

EDICT 和 BDIA 超參數的意義不明,沒有理論指導如何調整,導致不同情形下超參數的選擇差別巨大。使用起來極為不便。

圖片

圖片

雙向顯式線性多步法(BELM)框架

思路起源:DDIM 的正向過程(由藍線表示)與反演過程(由紅線表示)是兩種不同的關系,這導致了 DDIM 的反演不準確。如果強制正過程與反過程使用相同關系,又會引入隱式方法,大大增加計算復雜度。如果多引入一個點,不用隱式方法也可逆(由綠線表示)。

圖片

該論文中的算法,正向和反演過程都服從相同的關系,因此能夠精確反演。具體來說,為了系統地設計這種采樣器,首先要將擴散模型的采樣過程建模為一個 IVP(Initial Value Problem,初值問題):

圖片

以下是 IVP 的一般形式,這實際上是一個變步長變公式線性多步方法(VSVFM):

圖片

為了避免隱式方法的復雜計算,上式需要在正向和反向都是顯式的,該團隊稱這一性質為雙向顯性(bidirectional explicit)。

圖片

代入雙向顯性條件,可以得到一般的 k 步 BELM 采樣器:

圖片

最簡單的形式是 k=2,稱為 2-BELM,其表達式如下:

圖片

據此很容易證明,一個滿足雙向顯性性質的線性多步法采樣器擁有精確反演性質:

圖片

研究團隊還發現,前文提到的 EDICT 和 BDIA 都是 BELM 框架的特例:

圖片

這也解釋了 EDICT 和 BDIA 能夠精確反演的原因。

最優雙向顯式線性多步(O-BELM)采樣器

研究團隊在推導 BELM 框架暫時沒有給出具體的系數選擇,而啟發式的系數選擇(如 EDICT 和 BDIA)會造成采樣質量的退化。因此,他們提出使用局部截斷誤差(LTE)來獲取最優系數。

首先分析 BELM 的局部截斷誤差:

圖片

通過對局部截斷誤差的最小化,我們得到了最優的 BELM 系數,我們稱此系數下的 BELM 采樣器為最優 BELM(O-BELM):

圖片

O-BELM 的正向過程表達式如下:

圖片

O-BELM 的反演過程表達式如下:

圖片

此外,研究團隊還證明了 O-BELM 滿足穩定性和全局收斂性:

圖片

至此,可以對比幾種不同反演采樣器的性質:

圖片

可見,O-BELM 是第一種在嚴格的理論保證下兼顧精確反演性質和采樣質量的采樣器。

實驗

重建實驗(驗證 O-BELM 精確反演性質)

latent 空間上的 O-BELM 的重建誤差為 0,這表明 O-BELM 具有精確反演的性質:

圖片

圖片

采樣實驗(驗證 O-BELM 的高質量采樣性質)

不論在無條件生成還是條件生成中,O-BELM 都表現出了高于 DDIM,EDICT 和 BDIA 的采樣質量:

圖片

下游任務 —— 圖像編輯

圖像編輯實驗體現了:

1. 由于 DDIM 不具有精確反演性質,編輯的結果中存在不一致問題(紅色框);

2. 由于 EDICT 和 BDIA 具有較大的采樣誤差,編輯的結果出現了不真實區域(黃色框);

3.O-BELM 在保持圖像一致的條件下完成了高質量的編輯。

圖片

圖片

由于 O-BELM 是一個采樣方法,因此可以無縫地與 controlNet 結合,編輯效果也優于其他方法:

圖片

下游任務 —— 圖像插值

由于 O-BELM 精確地建立了噪聲和生成樣本的對應關系,這個關系是 probability flow ODE 的近似,因此 O-BELM 也使得圖像插值更符合人的直覺:

圖片

結語

本研究提出的雙向顯式線性多步法采樣器從理論上分析并徹底解決了現有擴散生成模型中的反演問題,進一步拓寬了擴散模型在計算機視覺領域的能力邊界。在圖像和視頻的編輯任務上有巨大的應用前景。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2021-12-03 12:15:01

QT中文亂碼Windows

2009-11-27 10:31:02

GPRS路由

2023-02-27 08:08:54

Pulsar源碼重復消費

2010-01-11 18:05:24

VB.NET窗體繼承

2025-03-03 00:13:50

2024-03-28 13:19:05

AI數據

2010-01-04 15:05:53

2023-11-28 08:36:16

Spring中Body讀取

2009-12-25 09:39:08

ADSL MODEM

2010-01-14 10:19:05

2025-06-17 06:40:45

DockerDocker鏡像

2009-11-24 19:50:10

2009-12-03 18:45:41

2022-10-08 23:55:58

iOS蘋果開發

2018-08-14 11:44:23

數據庫MySQLMySQL 8.0

2024-10-24 10:15:00

AI模型

2020-09-28 14:41:24

Event Loop

2009-12-03 16:54:04

無線寬帶路由器

2009-12-04 16:25:24

2009-12-21 14:12:30

路由器配置故障
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 在线观看免费福利 | 久久国产婷婷国产香蕉 | 国产伊人精品 | 国产精品久久久久久久久久三级 | 欧洲免费视频 | 亚洲一区二区久久久 | 亚洲美女视频 | 看av电影 | 北条麻妃99精品青青久久主播 | 亚洲精品欧美 | 亚洲欧美日韩在线一区二区 | 国产精品久久久久久久7777 | 日韩精品一区二 | 精品久久久网站 | 成人精品国产一区二区4080 | 久久精品国产免费一区二区三区 | 翔田千里一区二区 | 天天干干| 亚洲一区二区在线电影 | 国产 日韩 欧美 中文 在线播放 | 亚洲成人福利在线观看 | 国产一级一级 | 精品国产乱码久久久久久a丨 | 午夜资源| 久久久久久久一区二区 | 欧美四虎 | 国产高清无av久久 | 色婷婷在线视频 | 久久久人成影片免费观看 | 日本不卡一区 | 精品亚洲一区二区三区 | 草草影院ccyy | 999久久久久久久久6666 | 亚洲一区视频 | 狠狠干夜夜草 | 一区影视| 最新av中文字幕 | 国产在线91 | 五月网婷婷 | 色婷婷婷婷色 | 毛色毛片免费看 |