成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

T2I與StlyeGAN2首次聯手!PreciseControl:單肖像生成精細個性化圖像!

發布于 2024-9-2 11:07
瀏覽
0收藏

T2I與StlyeGAN2首次聯手!PreciseControl:單肖像生成精細個性化圖像!-AI.x社區

論文鏈接:https://arxiv.org/pdf/2408.05083
工程主頁:https://rishubhpar.github.io/PreciseControl.home/
git鏈接:https://github.com/rishubhpar/PreciseControl

T2I與StlyeGAN2首次聯手!PreciseControl:單肖像生成精細個性化圖像!-AI.x社區

亮點直擊

  • 首次提出將大型文本到圖像(T2I)模型與StyleGAN2結合的方法,通過將T2I模型條件化在豐富的潛在空間上實現。
  • 使用單張肖像圖像進行有效個性化的方法,使得在空間中進行細粒度的屬性編輯,并通過文本提示實現粗略編輯。
  • 引入了一種通過鏈式擴散過程融合多個個性化模型的新方法,用于多人合成。


最近,大家看到了一波針對文本到圖像(T2I)擴散模型的個性化方法的興起,這些方法通過少量圖像來學習一個概念。現有的方法在用于人臉個性化時,難以實現具有身份保留的令人信服的反演,并依賴于對生成的人臉進行語義文本編輯。然而,人們希望對面部屬性進行更細粒度的控制,這僅靠文本提示是難以實現的。


相比之下,StyleGAN模型學習了豐富的人臉先驗,并通過潛在空間的操控實現了對細粒度屬性編輯的平滑控制。本文利用了StyleGANs的解耦的W+空間來對T2I模型進行條件化。這種方法使我們能夠精確地操控面部屬性,例如平滑地引入微笑,同時保留T2I模型中固有的粗粒度文本控制。為了使T2I模型能夠在W+空間上進行條件化,本文訓練了一個潛在映射器,將W+中的潛在編碼翻譯到T2I模型的token embedding空間。所提出的方法在實現面部圖像的精確反演和屬性保留方面表現出色,并促進了對細粒度屬性編輯的連續控制。此外,本文的方法可以很容易地擴展到生成涉及多個個體的合成圖像。本文進行了廣泛的實驗,以驗證本文的方法在面部個性化和細粒度屬性編輯方面的有效性。

方法

提要

文本到圖像擴散模型。 本研究使用StableDiffusion-v2.1作為代表性的文本到圖像(T2I)擴散模型。Stable Diffusion 基于潛在擴散模型,它在潛在空間中應用擴散過程。其訓練包括兩個階段:a)訓練一個VAE或VQ-VAE自編碼器,將圖像映射到壓縮的潛在空間;b)在潛在空間中訓練一個擴散模型,以文本為條件引導生成。這個框架將自編碼器中細粒度細節的學習與擴散模型中的語義特征學習分離開來,從而使得擴展更加容易。


基于風格的GAN, [6, 17, 18]已經被廣泛應用于生成逼真的特定對象圖像,如人臉。此外,這些模型具有解耦的潛在空間W/W+,使得圖像之間的平滑插值和細粒度屬性編輯成為可能。這些特性是通過將高斯潛在空間映射到一個學習的潛在空間  并使用映射網絡實現的。此外,GAN編碼器模型可以對真實圖像進行編碼和編輯,將給定圖像反演到W+空間,從而允許對真實圖像進行細粒度編輯。

概覽

T2I與StlyeGAN2首次聯手!PreciseControl:單肖像生成精細個性化圖像!-AI.x社區

T2I與StlyeGAN2首次聯手!PreciseControl:單肖像生成精細個性化圖像!-AI.x社區

潛在適配器 M

T2I與StlyeGAN2首次聯手!PreciseControl:單肖像生成精細個性化圖像!-AI.x社區

T2I與StlyeGAN2首次聯手!PreciseControl:單肖像生成精細個性化圖像!-AI.x社區

訓練

T2I與StlyeGAN2首次聯手!PreciseControl:單肖像生成精細個性化圖像!-AI.x社區

T2I與StlyeGAN2首次聯手!PreciseControl:單肖像生成精細個性化圖像!-AI.x社區

T2I與StlyeGAN2首次聯手!PreciseControl:單肖像生成精細個性化圖像!-AI.x社區

推理

T2I與StlyeGAN2首次聯手!PreciseControl:單肖像生成精細個性化圖像!-AI.x社區

T2I與StlyeGAN2首次聯手!PreciseControl:單肖像生成精細個性化圖像!-AI.x社區

人臉屬性的細粒度控制

T2I與StlyeGAN2首次聯手!PreciseControl:單肖像生成精細個性化圖像!-AI.x社區

T2I與StlyeGAN2首次聯手!PreciseControl:單肖像生成精細個性化圖像!-AI.x社區

T2I與StlyeGAN2首次聯手!PreciseControl:單肖像生成精細個性化圖像!-AI.x社區

多人組成

本文的方法可以擴展到在單個場景中組合多個主體身份。簡單地在文本提示中 embedding多個令牌 embedding(每個主體一個),而不進行主體特定的調整,會導致身份失真(如下圖5a所示)。聯合進行主體特定調整可以改善身份識別,但會出現屬性混合的問題,即一個主體的面部屬性被轉移到另一個主體上,如下圖5b中的年齡和頭發。這是文本到圖像(T2I)生成中的一個常見問題,模型在處理場景中的多個對象時,容易綁定錯誤的屬性。本文采用了一種不同的方法,靈感來自于MultiDiffusion,在這個方法中,本文運行多個串聯的擴散過程,每個主體和背景各一個。在每一步的去噪過程中,將這些過程的輸出進行組合。

T2I與StlyeGAN2首次聯手!PreciseControl:單肖像生成精細個性化圖像!-AI.x社區

本文使用實例分割mask來進行處理。對于每個主體,本文通過其對應的主體特定微調模型運行擴散過程。這種方法能夠保留每個微調模型學習到的主體細節,并實現多個人物的高保真組合,而不會出現屬性混合的問題。為了獲得實例分割mask,本文使用包含兩個人物的提示運行單個擴散過程,并在生成的圖像上應用現成的分割模型SAM。此外,本文可以在W+空間中通過潛在變量操控對單個主體進行細粒度的屬性編輯,同時保留其他主體的完整性,如上圖1所示。

實驗

本文在StableDiffusion-v2.1上進行所有實驗,將其作為代表性的文本到圖像(T2I)模型。對于反演,本文使用在面部數據集上訓練的預訓練StyleGAN2 e4e編碼器,將圖像映射到W+空間。在接下來的章節中,本文首先討論數據集和指標,然后是單主體和多主體個性化的結果、細粒度屬性編輯以及消融研究。

數據集 & 評估指標

數據集:潛在適配器的訓練使用了由StyleGAN2生成的合成圖像和來自FFHQ數據集的真實圖像的組合。數據集包含了70,000張圖像及其對應的通過e4e獲得的w潛在代碼。本文收集了一個包含30個主體的評估數據集,其中包括科學家、名人、運動員和科技高管。本文還在補充材料中對“非名人”身份和合成面孔進行了評估。本文使用了一組25種多樣化的文本提示,包括用于風格化、背景更改和執行特定動作的文本。


評估指標:本文使用兩個廣泛使用的指標來評估個性化性能:提示相似性(Prompt similarity)——使用CLIP來測量提示與生成圖像的對齊程度;身份相似性(Identity similarity, CS)——通過計算來自面部 embedding的余弦相似度來測量輸入圖像與生成圖像之間的身份相似性。為了評估細粒度屬性編輯,本文計算屬性提示(例如,“一個微笑的人”)編輯前后的提示相似性變化(? CLIP)。此外,本文使用LPIPS和身份相似性來測量編輯過程中圖像的變化。對于理想的細粒度屬性編輯,較高的? CLIP表示有意義的編輯,而較低的LPIPS和較高的身份相似性表示源身份的保留。

與個性化方法的比較。

單主體個性化。  本文在評估集中使用多樣化的文本提示進行單圖像個性化,如下圖7、13所示。本文與以下基于微調的個性化方法進行比較:Custom Diffusion、Dreambooth、Dreambooth+LoRA(即通過低秩更新來避免過擬合的Dreambooth)、Textual Inversion 和 Celeb Basis。除了Celeb Basis和本文的方法外,所有方法都使用每個主體的5張圖像進行訓練,而Celeb Basis和本文的方法僅使用單張輸入圖像。關于競爭方法的超參數細節在補充材料中提供。

T2I與StlyeGAN2首次聯手!PreciseControl:單肖像生成精細個性化圖像!-AI.x社區

T2I與StlyeGAN2首次聯手!PreciseControl:單肖像生成精細個性化圖像!-AI.x社區

Custom Diffusion能夠 embedding主體并保持其身份;然而,它主要生成特寫面孔,并且不根據文本提示對主體進行風格化或使其執行動作。Dreambooth無法忠實地 embedding主體的身份,而通過LoRA訓練,身份保留得到改善,同時文本對齊性提高,這有助于避免過擬合。Textual Inversion和Celeb Basis的身份保留效果較差,因為它們僅微調token embedding而不是U-Net。


這段文字討論了Celeb Basis方法在文本對齊方面的表現。由于Celeb Basis方法在跨越名人姓名的基礎上施加了強有力的正則化,因此在文本對齊上表現最佳。本文的方法在文本對齊和身份保留之間找到了完美的平衡。需要注意的是,本文的方法和Celeb Basis都只使用1張輸入圖像,這在一定程度上會影響身份識別,而Custom-diffusion方法需要5張圖像。本文還在補充材料中提供了與基于編碼器的模型以及最近的IP-adaptor方法的額外比較。


這段文字討論了多主體個性化的生成結果。本文在下圖8、14中展示了 embedding多人物組合的結果,具體來說,本文在生成過程中結合了主體特定調優模型的中間輸出。本文與多概念個性化方法、Textual Inversion、Custom Diffusion和Celeb Basis進行了比較。

T2I與StlyeGAN2首次聯手!PreciseControl:單肖像生成精細個性化圖像!-AI.x社區

T2I與StlyeGAN2首次聯手!PreciseControl:單肖像生成精細個性化圖像!-AI.x社區

對于Textual Inversion和Celeb Basis,本文為每個主體分別學習了兩個不同的token embedding。對于Custom Diffusion,本文對兩個主體的投影矩陣進行了聯合微調。Textual Inversion無法在場景中生成兩個主體。Celeb Basis和Custom Diffusion能夠生成兩個主體,但存在屬性混合的問題(例如,v4的眼鏡被轉移到了v3上)。如前所述,Celeb Basis大多數情況下會生成卡通化的面孔。


本文的方法通過運行多個主體特定的擴散過程解決了屬性混合問題,并生成了高度逼真的組合。

通過潛在操縱進行細粒度控制

提出的方法將StyleGAN的解耦W+潛空間與T2I模型的token embedding空間匹配,通過潛空間操作實現對圖像屬性的連續控制。本文展示了由StyleGAN解耦潛空間驅動的兩個重要圖像編輯應用:1)細粒度屬性編輯和2)平滑身份插值。此外,本文的模型還可以恢復受損的人臉圖像,如低分辨率或修復被遮蓋的面部特征。


細粒度屬性編輯。本文通過在輸入圖像的w編碼中添加一個全局潛在編輯方向來執行屬性編輯。為了對所有屬性采用統一的方法,本文采取了一種簡化的方法來獲取編輯方向,收集了一小組(<20)的在屬性編輯前后的配對人像圖像(使用現成的屬性編輯方法生成)。接下來,本文計算對應配對的w潛向量之間的差異,并對其進行平均以獲得全局編輯方向。


T2I與StlyeGAN2首次聯手!PreciseControl:單肖像生成精細個性化圖像!-AI.x社區

T2I與StlyeGAN2首次聯手!PreciseControl:單肖像生成精細個性化圖像!-AI.x社區

身份插值。W+空間還允許在兩個身份之間進行平滑插值。給定兩個輸入圖像,本文獲得它們對應的w潛向量,并進行線性插值以獲得中間潛向量。當通過潛在適配器作為條件使用時,這些潛向量會產生逼真的人臉插值,面部之間的變化平滑,同時保留背景,如圖9底部所示。

消融實驗

T2I與StlyeGAN2首次聯手!PreciseControl:單肖像生成精細個性化圖像!-AI.x社區

結論

本文提出了一種新穎的框架,將T2I擴散模型與StyleGAN2模型的W+空間結合,用于細粒度屬性控制。具體來說,本文學習了一種潛在映射器,將來自W+的潛在代碼投射到通過去噪、正則化和身份保留損失學習的T2I模型的輸入token embedding空間。這個框架提供了一種自然的方法,通過使用GAN編碼器模型獲取潛在代碼來 embedding真實的人臉圖像。然后可以通過兩種方式編輯 embedding的人臉——粗略的基于文本的編輯和通過在W+中進行潛在操控的細粒度屬性編輯。


本文轉自 AI生成未來,作者:IISc 


原文鏈接:??https://mp.weixin.qq.com/s/Iu9LDpkg83P_6rXLBFFi5w??

收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 国产精品五区 | 91啪亚洲精品 | 国产成人精品一区二区三区网站观看 | 日本中出视频 | 国产精品久久视频 | 亚洲午夜在线 | 国产精品久久久久久久久久尿 | 国产精品不卡 | 成人一区在线观看 | 91国内精品久久 | 精品久久久久久久久久久久久久 | caoporn地址| 伦理一区二区 | 久久久久国产 | 国产精品久久国产精品久久 | 国产成人久久av免费高清密臂 | 亚洲一区二区精品视频 | 99在线精品视频 | 97色综合 | 午夜免费在线 | 国产一区二区三区视频免费观看 | 国产三级电影网站 | 日韩视频专区 | 日韩国产高清在线观看 | 国产在线精品一区二区 | av 一区二区三区 | 男女又爽又黄视频 | 狠狠色综合欧美激情 | 精品乱码一区二区三四区视频 | 古装人性做爰av网站 | 精品国产一区二区三区观看不卡 | 欧美日韩专区 | 欧美视频二区 | 91视在线国内在线播放酒店 | 欧美日韩电影一区二区 | 日韩欧美不卡 | 久久久免费 | 美国a级毛片免费视频 | 亚洲伊人精品酒店 | 99精品国产一区二区青青牛奶 | av永久|