成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

解決VAE表示學習問題,北海道大學提出新型生成模型GWAE

人工智能 新聞
日本北海道大學提出 Gromov-Wasserstein Autoencoders(GWAE),將變分自編碼器 Variational Autoencoder (VAE) 重寫為數據和表示之間的最優傳輸的靈活表征學習框架。

學習高維數據的低維表示是無監督學習中的基本任務,因為這種表示簡明地捕捉了數據的本質,并且使得執行以低維輸入為基礎的下游任務成為可能。變分自編碼器(VAE)是一種重要的表示學習方法,然而由于其目標控制表示學習仍然是一個具有挑戰性的任務。雖然 VAE 的證據下界(ELBO)目標進行了生成建模,但學習表示并不是直接針對該目標的,這需要對表示學習任務進行特定的修改,如解糾纏。這些修改有時會導致模型的隱式和不可取的變化,使得控制表示學習成為一個具有挑戰性的任務。

為了解決變分自編碼器中的表示學習問題,本文提出了一種稱為 Gromov-Wasserstein Autoencoders(GWAE)的新型生成模型。GWAE 提供了一種基于變分自編碼器(VAE)模型架構的表示學習新框架。與傳統基于 VAE 的表示學習方法針對數據變量的生成建模不同,GWAE 通過數據和潛在變量之間的最優傳輸獲得有益的表示。Gromov-Wasserstein(GW)度量使得在不可比變量之間(例如具有不同維度的變量)進行這種最優傳輸成為可能,其側重于所考慮的變量的距離結構。通過用 GW 度量替換 ELBO 目標,GWAE 在數據和潛在空間之間執行比較,直接針對變分自編碼器中的表示學習(如圖 1)。這種表示學習的表述允許學習到的表示具有特定的被認為有益的屬性(例如分解性),這些屬性被稱為元先驗。

圖片

圖 1 VAE 與 GWAE 的區別

本研究目前已被 ICLR 2023 接受。

  • 論文鏈接:https://arxiv.org/abs/2209.07007
  • ?代碼鏈接:https://github.com/ganmodokix/gwae

方法介紹

數據分布和潛在先驗分布之間的GW目標定義如下 :

圖片

這種最優傳輸代價的公式可以衡量不可比空間中分布的不一致性;然而對于連續分布,由于需要對所有耦合進行下確界,計算精確的 GW 值是不切實際的。為了解決這個問題,GWAE 解決了一個松弛的優化問題,以此來估計和最小化 GW 估計量,其梯度可以通過自動微分進行計算。松弛目標是估計的 GW 度量和三個正則化損失的總和,可以在可微編程框架(如 PyTorch)中全部實現。該松弛目標由一個主要損失和三個正則化損失組成,即主要估計的 GW 損失,基于 WAE 的重構損失,合并的充分條件損失以及熵正則化損失。

這個方案還可以靈活地定制先驗分布,以將有益的特征引入到低維表示中。具體而言,該論文引入了三種先驗族群,分別是:

神經先驗 (NP) 在具有 NP 的 GWAEs 中,使用全連接的神經網絡構建先驗采樣器。該先驗分布族群在潛在變量方面做出了更少的假設,適用于一般情況。

因子化神經先驗 (FNP)在具有 FNP 的 GWAEs 中,使用本地連接的神經網絡構建采樣器,其中每個潛在變量的條目獨立生成。這種采樣器產生一個因子化的先驗和一個逐項獨立的表示,這是代表性元先驗、解糾纏的一種突出方法。

高斯混合先驗 (GMP) 在 GMP 中,定義為幾個高斯分布的混合物,其采樣器可以使用重參數化技巧和 Gumbel-Max 技巧來實現。GMP 允許在表示中假設簇,其中先驗的每個高斯組件都預計捕捉一個簇。

實驗及結果

該研究對 GWAE 進行了兩種主要元先驗的經驗評估解糾纏和聚類

解糾纏 研究使用了 3D Shapes 數據集和 DCI 指標來衡量 GWAE 的解糾纏能力。結果表明,使用 FNP 的 GWAE 能夠在單個軸上學習對象色調因素,這表明了 GWAE 的解糾纏能力。定量評估也展示了 GWAE 的解糾纏表現。

圖片

聚類 為了評估基于聚類元先驗獲得的表征,該研究進行了一項 Out-of-Distribution(OoD)檢測。MNIST 數據集被用作 In-Distribution(ID)數據,Omniglot 數據集被用作 OoD 數據。雖然 MNIST 包含手寫數字,但 Omniglot 包含不同字母的手寫字母。在這個實驗中,ID 和 OoD 數據集共享手寫圖像領域,但它們包含不同的字符。模型在 ID 數據上進行訓練,然后使用它們學到的表征來檢測 ID 或 OoD 數據。在 VAE 和 DAGMM 中,用于 OoD 檢測的變量是先驗的對數似然,而在 GWAE 中,它是 Kantorovich potential。GWAE 的先驗是用 GMP 構建的,以捕捉 MNIST 的簇。ROC 曲線顯示了模型的 OoD 檢測性能,其中所有三個模型都實現了近乎完美的性能;然而,使用 GMP 構建的 GWAE 在曲線下面積(AUC)方面表現最佳。

圖片

此外該研究對 GWAE 進行了生成能力的評估。

作為基于自動編碼器的生成模型的性能 為了評估 GWAE 在沒有特定元先驗的情況下對一般情況的處理能力,使用 CelebA 數據集進行了生成性能的評估。實驗使用 FID 評估模型的生成性能,使用 PSNR 評估自編碼性能。GWAE 使用 NP 獲得了第二好的生成性能和最佳的自編碼性能,這表明其能夠在其模型中捕捉數據分布并在其表示中捕捉數據信息的能力。

圖片

總結

  • GWAE 是基于 Gromov-Wasserstein 度量構建的變分自編碼器生成模型,旨在直接進行表示學習。
  • 由于先驗僅需要可微分樣本,因此可以構建各種先驗分布設置來假設元先驗(表示的理想特性)。
  • 在主要元先驗上的實驗以及作為變分自編碼器的性能評估表明了 GWAE 公式的靈活性和 GWAE 的表示學習能力。
  • 第一作者 Nao Nakagawa 個人主頁:https://ganmodokix.com/note/cv
  • 日本北海道大學多媒體實驗室主頁:https://www-lmd.ist.hokudai.ac.jp/
責任編輯:張燕妮 來源: 機器之心
相關推薦

2021-08-03 11:54:40

新華三

2022-10-09 17:55:50

數據代碼

2020-06-09 10:15:21

模型人工智能自然語言

2025-05-23 10:04:25

2010-04-28 22:40:40

云計算日本

2017-08-07 11:09:19

機器學習用戶推薦轉化率

2015-08-06 14:02:31

數據分析

2010-07-07 20:23:57

思科云計算

2025-01-26 13:20:49

谷歌AI模型Titans

2022-02-24 13:36:21

3D模型AI

2022-10-09 15:26:45

人工智能ML機器學習

2019-10-12 11:10:32

AI 數據人工智能

2018-08-29 08:13:22

Google 學習框架技術

2024-05-06 12:24:00

模型訓練

2021-09-10 16:24:00

框架AI開發

2025-02-26 10:14:12

2024-12-06 18:48:39

2022-01-05 10:42:12

AI 數據人工智能

2024-11-01 16:46:48

2015-01-14 10:33:20

瞻博網絡
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产ts人妖系列高潮 | 欧美精品一二区 | 亚洲视频在线观看一区二区三区 | 久久国产精品无码网站 | 日本久久精品 | 国产目拍亚洲精品99久久精品 | 久久成人免费视频 | 97精品超碰一区二区三区 | 视频在线一区二区 | 9久久精品 | 中文字幕一区二区三区乱码在线 | 亚洲国产精品人人爽夜夜爽 | 亚洲精品在线播放 | 国产亚洲精品精品国产亚洲综合 | 日韩精品久久久久 | 性色网站 | 宅男噜噜噜66一区二区 | 亚洲成人一级 | 中文字幕亚洲精品在线观看 | 日本成人免费观看 | 人人爽人人爽人人片av | 黄网在线观看 | 久久综合色综合 | 国产精品污www一区二区三区 | 女朋友的闺蜜3韩国三级 | 久久男人 | 日日摸日日碰夜夜爽亚洲精品蜜乳 | 中文在线а√在线8 | 精品国产一区二区三区久久久蜜月 | 特级黄一级播放 | 国产精品日本一区二区在线播放 | 欧美一级片在线观看 | 亚洲一区二区三区在线视频 | 国产成人精品高清久久 | 中文字幕久久久 | 久久国产美女视频 | 日韩欧美一区二区三区在线播放 | 精品久久久网站 | 国产精品国产三级国产播12软件 | 亚洲九色 | 欧美精品一区二区三区在线 |