成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

人臉合成效果媲美StyleGAN,而它是個自編碼器

新聞 機器學習
自編碼器(AE)與生成對抗網絡(GAN)是復雜分布上無監督學習最具前景的兩類方法,它們也經常被拿來比較。

 自編碼器(AE)與生成對抗網絡(GAN)是復雜分布上無監督學習最具前景的兩類方法,它們也經常被拿來比較。人們通常認為自編碼器在圖像生成上的應用范圍比 GAN 窄,那么自編碼器到底能不能具備與 GAN 同等的生成能力呢?這篇研究提出的新型自編碼器 ALAE 可以給你答案。目前,該論文已被 CVPR 2020 會議接收。

  • 論文地址:https://arxiv.org/pdf/2004.04467.pdf
  • GitHub 地址:https://github.com/podgorskiy/ALAE

自編碼器是一種無監督方法,它通過同時學習編碼器-生成器圖將「生成性」和「表征性」結合起來。關于自編碼器有兩個疑問尚未得到解決:

  • 自編碼器是否具備和 GAN 同等的生成能力?
  • 自編碼器能否學習解耦表征(disentangled representation)?

最近,來自美國西弗吉尼亞大學的研究者提出一種新型自編碼器 Adversarial Latent Autoencoder (ALAE),試圖解決以上問題。ALAE 是一個通用架構,它能夠利用近期 GAN 在訓練方面的改進。研究者表示 ALAE 具備與 GAN 相當的生成能力,且能夠學習解耦表征。

利用 ALAE 通用架構,該研究設計了兩個自編碼器:一種基于 MLP 編碼器,另一種基于 StyleGAN 生成器,即 StyleALAE。

研究者對這兩個架構的解耦能力進行了驗證,發現 StyleALAE 不僅能夠生成與 StyleGAN 生成質量相當的 1024x1024 人臉圖像,在同樣分辨率條件下,它還可以基于真實圖像生成人臉重建和操縱結果。

研究者認為,ALAE 是首個性能匹配甚至超過生成器架構的自編碼器。

ALAE 到底效果如何呢?我們來看展示圖: 

 StyleALAE 的風格混合效果。

感興趣的讀者可以自己運行 demo,不過你需要 CUDA capable GPU、v1.3.1 及以上版本的 PyTorch 和 cuda/cuDNN 驅動,詳情參見 GitHub 地址。

新型通用自編碼器 ALAE

研究者觀察到每個 AE 方法都使用同樣的假設:潛在空間的概率分布應與先驗相關,自編碼器應該與之匹配。而 StyleGAN 相關論文證明,中間潛在空間應當具備更好的解耦能力。

于是研究者通過修改原始 GAN 范式設計了一種新型 AE 架構:

允許基于數據學得的潛在分布解決耦合問題 (A),并使用對抗策略學習輸出數據分布 (B),以保留 GAN 的生成能力;為了實現 (A) 和 (B),該研究提出將 AE reciprocity 置于潛在空間中 (C),以避免使用在數據空間中運行的基于簡單 l_2 范數的重建損失(對于圖像空間來說它們通常是次優選擇)。

如下圖 1 所示,研究者將生成器 G 和判別器 D 分別分解成兩個網絡:F、G 和 E、D。

 äººè„¸åˆæˆæ•ˆæžœåª²ç¾ŽStyleGAN,而它是个自编码器

圖 1:ALAE 架構。

此外,研究者還展示了 ALAE 與其他自編碼器的關聯,詳見下表:

StyleALAE

研究者使用 ALAE 構建了一個自編碼器,該自編碼器使用的是基于 StyleGAN 的生成器。具體架構如下圖 2 所示:

圖 2:StyleALAE 架構。StyleALAE 編碼器中的實例歸一化(IN)層用來提取多尺度風格信息,并通過可學習的多重線性映射(multilinear map)將它們組合成為一個潛在代碼 w。

實現

ALAE 的算法訓練過程參見下圖:

ALAE 效果如何?

該研究在多個數據集上評估了 ALAE 的性能,實驗代碼和數據參見 GitHub 地址。

在 MNIST 上的性能

研究者使用 MNIST 數據集訓練 ALAE,并使用特征表示來執行分類、重建和分析解耦能力的任務。

表 2:不同方法在 MNIST 分類任務上的性能。

圖 3:MNIST 重建效果。

StyleALAE 學習風格表征的能力

研究者在 FFHQ、LSUN 和 CelebA-HQ 數據集上評估 StyleALAE 的性能。

表 3:不同方法在 FFHQ 和 LSUN 數據集上的 FID 分數。

表 4:不同方法的感知路徑長度(PPL),表示表征解耦程度。

 

圖 5:FFHQ 重建結果。StyleALAE 對未見過的圖像的 1024×1024 重建結果。

圖 6:StyleALAE 的 FFHQ 生成結果(1024 × 1024 分辨率)。

圖 9:StyleALAE 的風格混合效果。「coarse styles」從 Source 圖像中復制了高級特征,如姿勢、大致發型和臉型,從 Destination 圖像中復制了所有顏色(眸色、發色和光照);「middle styles」從 Source 圖像中復制了較小型的面部特征例如發式、眼睛睜/閉,從 Destination 圖像中復制了臉型;「fine styles」從 Source 圖像中復制了顏色和微結構。

圖 8:不同方法在 CelebA-HQ 數據集上的重建結果。第一行是真實圖像;第二行:StyleALAE;第三行:Balanced PIONEER;第四行:PIONEER。

從圖中可以看出,StyleALAE 的生成結果更加清晰,失真度也最低。

 

 

責任編輯:張燕妮 來源: 機器之心
相關推薦

2021-03-22 10:52:13

人工智能深度學習自編碼器

2021-03-29 11:37:50

人工智能深度學習

2021-02-20 20:57:16

深度學習編程人工智能

2025-04-10 11:52:55

2025-04-10 06:30:00

2017-07-19 13:40:42

卷積自編碼器降噪

2024-10-21 16:47:56

2024-06-18 08:52:50

LLM算法深度學習

2017-11-10 12:45:16

TensorFlowPython神經網絡

2017-07-03 07:14:49

深度學習無監督學習稀疏編碼

2022-04-02 21:46:27

深度學習編碼器圖像修復

2018-05-21 08:22:14

自編碼器協同過濾深度學習

2017-12-26 10:48:37

深度學習原始數據

2023-08-14 08:30:32

2022-09-13 15:26:40

機器學習算法數據

2021-11-02 20:44:47

數字化

2024-11-13 16:24:33

ViT架構PyTorch

2012-04-01 16:40:45

編碼器

2012-04-10 16:55:22

PowerSmart編碼器

2017-08-16 21:58:05

自動編碼器DeepCoder深度學習
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲精品久久久一区二区三区 | 国产精品揄拍一区二区 | 日本视频一区二区三区 | 男人av网| 青青草视频免费观看 | 久久久91精品国产一区二区精品 | 青青艹在线视频 | 91一区二区在线观看 | 国产三区av | 成人免费观看男女羞羞视频 | 欧美精品中文字幕久久二区 | 伊人久久综合影院 | 九九热在线视频免费观看 | 青春草在线| 色香婷婷 | 蜜臀久久 | 国产在线精品一区二区 | 欧美一区二区三区,视频 | 国产视频精品在线观看 | 国产四虎 | 中文字幕国产视频 | 美人の美乳で授乳プレイ | 日韩高清中文字幕 | 欧美性tv | 粉嫩一区二区三区四区公司1 | 一级欧美 | 99国产精品99久久久久久 | 超碰成人av | 黄色片免费看 | 亚洲福利在线视频 | 欧美在线观看一区二区 | 免费二区| 91一区 | 亚洲欧美日韩在线不卡 | 在线免费观看成人 | 一级欧美一级日韩片免费观看 | 五月婷婷视频 | 一级大片网站 | 欧美亚洲一级 | 在线电影日韩 | 男人影音 |