成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

擴散模型就是自動編碼器!DeepMind研究學者提出新觀點并論證

人工智能 深度學習 新聞
劍橋大學的學者David Krueger提出,自動編碼器會不會卷土重來成為研究熱潮。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

由于在圖像生成效果上可以與GAN媲美,擴散模型最近成為了AI界關注的焦點。

谷歌、OpenAI過去一年都提出了自家的擴散模型,效果也都非常驚艷。

另一邊,劍橋大學的學者David Krueger提出,自動編碼器會不會卷土重來成為研究熱潮。

就在最近,DeepMind的一位研究科學家Sander Dieleman基于以上兩股熱潮,提出了自己的觀點:

擴散模型就是自動編碼器啊!

這一觀點立刻引起了不少網友的注意,大家看了Sander的闡述,都覺得說得很有道理,并且給了自己不少啟發。

那么,他到底是如何論證自己這一觀點的呢?

我們一起來看。

去噪自動編碼器=擴散模型

想要看透這二者之間的聯系,首先要看看它們自身的特點。

擴散模型是一種新的圖像生成方法,其名字中的“擴散”本質上是一個迭代過程。

它最早于2015提出,是定義了一個馬爾可夫鏈,用于在擴散步驟中緩慢地向數據添加隨機噪聲,然后通過學習逆轉擴散過程從噪聲中構建所需的數據樣本。

相比GAN、VAE和基于流的生成模型,擴散模型在性能上有不錯的權衡,最近已被證明在圖像生成方面有很大的潛力,尤其是與引導結合來兼得保真度和多樣性。

比如去年谷歌提出的級聯(Cacade)擴散模型SR3,就是以低分辨率圖像為輸入,從純噪聲中構建出對應的高分辨率圖像。

OpenAI的GLIDE、ADM-G也是用上了擴散模型,以此能生成更加更真實、多樣、復雜的圖像。

△GLIDE模型效果

接下來,再來看自動編碼器原理。

自動編碼器可以理解為一個試圖去還原原始輸入的系統,模型如下所示:

它的主要目的是將輸入轉換為中間變量,然后再將中間變量轉化為輸出,最后對比輸入和輸出,使它們二者之間無限接近。

當模型框架中存在瓶頸層或者輸入被損壞時,自動編碼器能夠學習輸入本質特征的特性,就可以大顯身手了。

在這里,作者主要拿來和擴散模型對比的,便是去噪自動編碼器

它可以將損壞數據作為輸入,通過訓練來預測未損壞的原始數據作為輸出。

看到這里是不是有點眼熟了?

向輸入中加入噪聲,不就是一種破壞輸入的方法嗎?

那么,去噪自動編碼器和擴散模型,原理上不就是有著異曲同工之妙嗎?

二者是如何等價的?

為了驗證自己的這一想法,作者從原理方面對擴散模型進行了拆解。

擴散模型的關鍵,在于一個分數函數 (?score function)

需要注意的是,這和

不同。(求梯度的參數不同)

通過后者,我們可以知道如何改變模型參數來增加向下輸入的可能性,而前者能夠讓我們知道如何改變輸入本身來增加可能性。

在訓練過程中,希望在去噪中的每一點都使用相同的網絡。

為了實現這個,需要引入一個額外的輸入

,由此可以看到在去噪中進行到了哪一部分

當t=0時,對應無噪聲數據;t=1時,對應純噪聲數據。

訓練這個網絡的方法,就是用添加噪聲

來破壞輸入x。然后

中預測

需要注意的是,在這里方差大小取決于t,因為它可以對應特定點的噪聲水平。損失函數通常使用均方誤差(MSE),有時會用 λ(t)進行加權,因此某些噪聲水平會優先于其他噪聲水平:

假設λ(t)=1時,一個關鍵的觀測值為

或 x(它們二者是等價的),在這里可以用公式:

為了確保它們是等價的,可以考慮使用訓練模型

來預測

,并加上一個新的殘差連接。從輸入到輸出的比例系數均為-1,這個調整后的模型則實現了:

由此,一個擴散模型便逐漸變成一個去噪自動編碼器了!

One More Thing

不過博客的作者也強調,雖然擴散模型和去噪自動編碼器的效果等價,但是二者之間不可完全互換

并且以上得到的這個去噪自動編碼器,和傳統類型也有不同:

  • 第一,附加輸入t可以使單個模型用一組共用參數來處理噪聲級別不同的情況;
  • 第二,因為更加關注模型的輸出,所以內部沒有瓶頸層,這可能會導致“弊大于利”的結果。

而作者更想強調的是這二者之間存在的聯系。

此外他還表示,模型效果好的關鍵應該在于共用參數,這種方法已經被廣泛應用在表示學習上。

從這些成果中也能發現一個規律:

  • 噪聲含量越高的模型,往往更容易學習到圖像的特征;?
  • 噪聲含量越低的模型,則會更專注于細節。

作者認為以上規律值得進一步研究:

這意味著隨著噪聲水平逐步降低,擴散模型能夠補充圖像細節也就越來越多。

最后,我們再來介紹一下這一發現的提出者——Sander Dieleman。

他現在是DeepMind的一位研究科學家,主要研究領域為生成模型和音樂合成。

參與的主要研究工作有Spotify音樂平臺的內容推薦模型。

責任編輯:張燕妮 來源: 量子位
相關推薦

2021-12-17 10:09:47

編碼器語言模型DeepMind

2017-09-24 12:13:52

深度學習自動編碼器機器學習

2019-05-22 17:34:16

代碼開發工具

2023-08-14 08:30:32

2017-08-16 21:58:05

自動編碼器DeepCoder深度學習

2024-02-07 12:33:00

AI訓練

2017-07-10 13:45:33

自動編碼數據生成GAN

2025-04-10 06:30:00

2022-06-06 10:58:52

訓練DeepMind研究

2024-07-08 08:47:00

2024-03-12 13:33:40

2022-03-02 13:44:10

3D模型數據

2023-03-28 16:05:01

2023-10-08 13:44:00

數據研究

2023-06-25 10:01:29

2025-04-08 04:20:00

2021-11-02 20:44:47

數字化

2021-03-29 11:37:50

人工智能深度學習

2021-03-22 10:52:13

人工智能深度學習自編碼器

2025-04-10 11:52:55

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久精品国产一区二区电影 | 亚洲精品久久视频 | 精品久久久久香蕉网 | 色就是色欧美 | 国产成人福利 | 亚洲精品成人 | 综合久久99 | 亚洲一区二区在线视频 | 成人av网站在线观看 | 最新黄色毛片 | 久久久精品视频免费 | 日韩欧美电影在线 | 国产精品一区二区在线 | 中文字幕乱码亚洲精品一区 | 最近中文字幕免费 | 精品一二三 | 日日草天天干 | 日韩国产精品一区二区三区 | 久久成人一区 | 亚洲三级av | 精品久久精品 | 国产精品美女久久久久久久网站 | 黄色大片免费观看 | 伊大人久久 | 久久久久久高潮国产精品视 | 久久免费高清 | 亚洲成人精 | 二区视频| 国产视频一区二区在线观看 | 91免费高清视频 | 中文字幕在线精品 | 香蕉视频一区二区 | 亚洲午夜视频在线观看 | 亚洲一区中文字幕 | 日韩在线播放一区 | 日本一二三区在线观看 | 精品久久久久久久久久久久久久 | 欧美日韩视频在线播放 | 日本免费一区二区三区视频 | 日韩激情视频一区 | 亚洲精品乱码久久久久久蜜桃91 |