成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

風格控制水平創新高!南理工&InstantX&小紅書發布CSGO:簡單高效的端到端風格遷移框架

發布于 2024-9-9 10:34
瀏覽
0收藏

風格控制水平創新高!南理工&InstantX&小紅書發布CSGO:簡單高效的端到端風格遷移框架-AI.x社區

風格控制水平創新高!南理工&InstantX&小紅書發布CSGO:簡單高效的端到端風格遷移框架-AI.x社區

論文鏈接:https://arxiv.org/pdf/2408.16766
項目鏈接:https://csgo-gen.github.io/

亮點直擊

  • 構建了一個專門用于風格遷移的數據集
  • 設計了一個簡單但有效的端到端訓練的風格遷移框架CSGO框架,以驗證這個大規模數據集在風格遷移中的有益效果。
  • 引入了內容對齊評分(Content Alignment Score,簡稱CAS)來評估風格遷移的質量,有效衡量遷移后內容損失的程度。
  • 大量的定性和定量研究驗證了本文提出的方法在零樣本風格遷移方面取得了先進的成果。

擴散模型在受控圖像生成方面展示了卓越的能力,這進一步激發了對圖像風格遷移的興趣?,F有的工作主要集中在基于訓練自由的方法(例如圖像反演),這是由于特定數據的稀缺。在本研究中,本文提出了一種用于內容-風格-風格化圖像三元組的數據構建pipeline,該pipeline生成并自動清理風格化數據三元組。基于此pipeline,本文構建了IMAGStyle數據集,這是第一個包含21萬圖像三元組的大規模風格遷移數據集,供社區探索和研究。配備IMAGStyle數據集,本文提出了CSGO,一種基于端到端訓練的風格遷移模型,該模型通過獨立特征注入顯式解耦內容和風格特征。統一的CSGO實現了圖像驅動的風格遷移、文本驅動的風格化合成以及文本編輯驅動的風格化合成。大量實驗表明,本文的方法在增強圖像生成中的風格控制能力方面是有效的。

數據 pipeline

在本節中,本文首先介紹用于構建內容-風格-風格化圖像三元組的提議pipeline。然后,本文詳細描述構建的IMAGStyle數據集。

構建內容-風格-風格化圖像三元組的pipeline

風格控制水平創新高!南理工&InstantX&小紅書發布CSGO:簡單高效的端到端風格遷移框架-AI.x社區

風格控制水平創新高!南理工&InstantX&小紅書發布CSGO:簡單高效的端到端風格遷移框架-AI.x社區

風格化圖像清理。 通過人工參與的慢速數據清理方法對于構建大規模風格化數據三元組是不可接受的。為此,本文開發了一種自動清理方法,以高效地獲得理想且高質量的風格化圖像T 。首先,本文提出了一個內容對齊評分(CAS),它有效地衡量生成圖像與內容圖像的內容對齊情況。它被定義為生成圖像和原始內容圖像的內容語義特征(不包含風格信息)之間的特征距離。其表示如下:

風格控制水平創新高!南理工&InstantX&小紅書發布CSGO:簡單高效的端到端風格遷移框架-AI.x社區

風格控制水平創新高!南理工&InstantX&小紅書發布CSGO:簡單高效的端到端風格遷移框架-AI.x社區

風格控制水平創新高!南理工&InstantX&小紅書發布CSGO:簡單高效的端到端風格遷移框架-AI.x社區

風格控制水平創新高!南理工&InstantX&小紅書發布CSGO:簡單高效的端到端風格遷移框架-AI.x社區

風格控制水平創新高!南理工&InstantX&小紅書發布CSGO:簡單高效的端到端風格遷移框架-AI.x社區

IMAGSTYLE 數據集詳細信息

內容圖像。 為了確保內容圖像具有清晰的語義信息并在訓練后便于分離,本文使用顯著性檢測數據集 MSRA10K和 MSRA-B作為內容圖像。此外,對于素描風格化,本文從 ImageNet-Sketch中抽取了1000張素描圖像作為內容圖像。內容圖像的類別分布如下圖3所示。本文使用 BLIP(Li 等人,2023)為每個內容圖像生成一個標題。總共訓練了11,000張內容圖像,并用作內容 LoRA。

風格控制水平創新高!南理工&InstantX&小紅書發布CSGO:簡單高效的端到端風格遷移框架-AI.x社區

風格圖像。 為了確保風格多樣性的豐富性,本文從Wikiart數據集中抽取了5000張不同繪畫風格的圖像(歷史畫、肖像畫、風俗畫、風景畫和靜物畫)。此外,本文使用Midjourney生成了5000張涵蓋多種風格的圖像,包括古典、現代、浪漫、現實主義、超現實主義、抽象、未來主義、明亮、黑暗等風格??偣彩褂昧?0,000張風格圖像來訓練風格LoRA。


數據集。 基于前文中描述的pipeline,本文構建了一個風格遷移數據集IMAGStyle,該數據集包含210,000個內容-風格-風格化圖像三元組作為訓練數據集。此外,本文從網絡上收集了248張內容圖像,這些圖像包含真實場景、素描場景、人臉和風格場景的圖像,以及206張不同場景的風格圖像作為測試數據集。在測試中,每張內容圖像會被轉換為206種風格。此數據集將用于社區研究風格遷移和風格化合成。

方法

CSGO框架

所提出的風格遷移模型CSGO,如下圖4所示,旨在實現任意圖像的任意風格化,而無需微調,包括素描和自然圖像驅動的風格遷移、文本驅動的風格化合成以及文本編輯驅動的風格化合成。得益于所提出的IMAGStyle數據集,CSGO支持端到端的風格遷移訓練范式。為了確保有效的風格遷移和準確的內容保留,本文精心設計了內容和風格控制模塊。此外,為了減少內容圖像泄露風格信息或風格圖像泄露內容的風險,內容控制和風格控制模塊被明確解耦,對應的特征被獨立提取。具體來說,本文將CSGO分為兩個主要組件,并詳細描述它們。

風格控制水平創新高!南理工&InstantX&小紅書發布CSGO:簡單高效的端到端風格遷移框架-AI.x社區

風格控制水平創新高!南理工&InstantX&小紅書發布CSGO:簡單高效的端到端風格遷移框架-AI.x社區

模型訓練和推理

風格控制水平創新高!南理工&InstantX&小紅書發布CSGO:簡單高效的端到端風格遷移框架-AI.x社區

推理。 在推理階段,我們采用無分類器指導。時間步t的輸出表示如下:

風格控制水平創新高!南理工&InstantX&小紅書發布CSGO:簡單高效的端到端風格遷移框架-AI.x社區

其中w表示無分類器指導因子(CFG)。

實驗

實驗設置

風格控制水平創新高!南理工&InstantX&小紅書發布CSGO:簡單高效的端到端風格遷移框架-AI.x社區


數據集和評估。 使用提出的IMAGStyle作為訓練數據集,并使用其測試數據集作為評估數據集。我們采用Somepalli等人提出的CSD評分作為評估指標來評估風格相似性。同時,我們使用提出的內容對齊評分(CAS)作為評估指標來評估內容相似性。


基線方法。 比較了最近的幾種先進的基于反演的風格識別方法,包括Chung等人(2024)的StyleID、Hertz等人(2024)的StyleAligned方法,以及基于Transformer結構的StyTR2 Deng等人(2022)。此外,還比較了Wang等人(2024a)的Instantstyle和Junyao等人(2024)的StyleShot(及其細粒度控制方法StyleShot-lineart),這些方法引入了ControlNet和IPAdapter結構作為基線。在文本驅動的風格控制任務中,我們還引入了Qi等人(2024)的DEADiff作為基線。

實驗結果

圖像驅動的風格遷移。 在下表1中,展示了所提出方法在圖像驅動風格遷移任務中與最近先進方法的CSD評分和CAS。就風格控制而言,我們的CSGO獲得了最高的CSD評分,表明CSGO在風格控制方面達到了最先進的水平。由于采用了解耦的風格注入方法,所提出的CSGO能夠有效地提取風格特征并將其與高質量的內容特征融合。如下圖5所示,CSGO在自然、素描、人臉和藝術場景中精確地遷移風格,同時保持內容的語義。

風格控制水平創新高!南理工&InstantX&小紅書發布CSGO:簡單高效的端到端風格遷移框架-AI.x社區

風格控制水平創新高!南理工&InstantX&小紅書發布CSGO:簡單高效的端到端風格遷移框架-AI.x社區

在內容保留方面,可以觀察到基于反演的StyleID和StyleAligned在素描風格遷移場景中過于強烈地保持了原始內容(CAS非常低)。然而,它們無法注入風格信息,因為CSD評分很低。使用線條來控制內容的InstantStyle和StyleShot(包括Lineart)受線條細節水平的影響,在不同程度上會丟失內容(如人臉場景)。所提出的CSGO直接利用內容圖像的所有信息,內容保留效果最佳。上表1中的定量結果也表明,所提出的CSGO在實現精確風格遷移的同時,保持了高質量的內容保留。


文本驅動的風格化合成。 所提出的方法支持文本驅動的風格控制,即給定一個文本提示詞和一個風格圖像,生成具有相似風格的圖像。下圖6展示了所提出的CSGO與最先進方法的生成結果對比。在簡單場景中,很直觀地觀察到我們的CSGO更遵循文本提示。這是因為得益于內容和風格特征的顯式解耦,風格圖像僅注入風格信息而不暴露內容。此外,在復雜場景中,得益于精心設計的風格特征注入模塊,CSGO在轉換文本含義的同時實現了最佳的風格控制。如下圖7所示,展示了更多結果。

風格控制水平創新高!南理工&InstantX&小紅書發布CSGO:簡單高效的端到端風格遷移框架-AI.x社區

風格控制水平創新高!南理工&InstantX&小紅書發布CSGO:簡單高效的端到端風格遷移框架-AI.x社區

文本編輯驅動的風格化合成。 所提出的CSGO支持文本編輯驅動的風格控制。如下圖8所示,在風格遷移過程中,我們保持原始內容圖像的語義和布局,同時允許對文本提示詞進行簡單編輯。上述優秀結果表明,所提出的CSGO是一個強大的風格控制框架。

風格控制水平創新高!南理工&InstantX&小紅書發布CSGO:簡單高效的端到端風格遷移框架-AI.x社區

消融研究

內容控制和風格控制。我們討論了兩種特征注入方法的影響,如下圖9所示。內容圖像必須通過ControlNet注入以保持布局,同時保留語義信息。如果內容特征僅通過IP-Adapter注入到CSGO框架中(下圖9(1)),則內容特征只保留語義信息。

風格控制水平創新高!南理工&InstantX&小紅書發布CSGO:簡單高效的端到端風格遷移框架-AI.x社區

引入ControlNet注入后,內容保留的質量得到了提升,如下圖12所示。然而,如果風格特征僅注入到基礎UNet中而不通過ControlNet注入,這會削弱生成圖像的風格,這可以在上圖9(2)和(3)的對比中觀察到。因此,所提出的CSGO在ControlNet分支中預先注入風格特征,以進一步融合風格特征,從而增強遷移效果。

風格控制水平創新高!南理工&InstantX&小紅書發布CSGO:簡單高效的端到端風格遷移框架-AI.x社區

風格圖像投影層。 風格圖像投影層可以有效地從原始embedding中提取風格特征。我們探索了普通線性層和重采樣器結構,實驗結果如下圖10所示。使用重采樣器結構能夠捕捉到更詳細的風格特征,同時避免內容泄露。

風格控制水平創新高!南理工&InstantX&小紅書發布CSGO:簡單高效的端到端風格遷移框架-AI.x社區

Token數量。 探討了風格投影層中token數量t對風格遷移和文本驅動風格合成結果的影響。實驗結果如上圖10所示,隨著t的增加,風格控制逐漸變得更好。這與我們的預期一致,即t影響特征提取的質量。更大的t意味著投影層能夠提取出更豐富的風格特征。

風格控制水平創新高!南理工&InstantX&小紅書發布CSGO:簡單高效的端到端風格遷移框架-AI.x社區

風格控制水平創新高!南理工&InstantX&小紅書發布CSGO:簡單高效的端到端風格遷移框架-AI.x社區

風格控制水平創新高!南理工&InstantX&小紅書發布CSGO:簡單高效的端到端風格遷移框架-AI.x社區

CFG尺度的影響。 無分類器引導增強了文本到圖像模型的能力。所提出的CSGO同樣受CFG尺度強度的影響。正如上圖13所示,引入CFG增強了風格遷移效果。

風格控制水平創新高!南理工&InstantX&小紅書發布CSGO:簡單高效的端到端風格遷移框架-AI.x社區

結論

首先提出了一個用于構建內容-風格-風格化圖像三元組的流程?;诖肆鞒?,我們構建了第一個大規模風格遷移數據集IMAGStyle,該數據集包含21萬個圖像三元組,涵蓋了廣泛的風格場景。為了驗證IMAGStyle對風格遷移的影響,我們提出了CSGO,這是一種簡單但高度有效的端到端訓練風格遷移框架。我們驗證了所提出的CSGO可以在統一框架下同時執行圖像風格遷移、文本驅動的風格合成和文本編輯驅動的風格合成任務。大量實驗驗證了IMAGStyle和CSGO對風格遷移的有益效果。我們希望我們的工作能夠激勵研究社區進一步探索風格化研究。


未來工作。 盡管所提出的數據集和框架已經取得了非常先進的性能,但仍有改進的空間。由于時間和計算資源的限制,我們僅構建了21萬個數據三元組。我們相信,通過擴大數據集的規模,CSGO的風格遷移質量將會更好。同時,所提出的CSGO框架是一個基礎版本,僅驗證了生成風格化數據集對風格遷移的有益效果。我們認為,通過優化風格和內容特征提取及融合方法,可以進一步提高風格遷移的質量。


本文轉自 AI生成未來 ,作者:Peng Xing等  


原文鏈接:??https://mp.weixin.qq.com/s/OAMl3r676_AZcfi4swi_hA??

收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 亚洲国产精品激情在线观看 | 亚洲每日更新 | 一区视频在线免费观看 | 成人精品国产 | 久久国产精品视频 | 日日艹夜夜艹 | 久久久久久久久久性 | 国产精品久久久久一区二区三区 | 北条麻妃视频在线观看 | 欧日韩在线 | 国产蜜臀97一区二区三区 | 91麻豆精品国产91久久久久久 | 在线观看国产wwwa级羞羞视频 | 国产精品久久久久久婷婷天堂 | 日韩一区二区三区在线观看 | 国产精品久久久久久久久免费高清 | 黄色片视频网站 | 亚洲精品高清视频在线观看 | 成人综合伊人 | 国产区视频在线观看 | 久久毛片| 91精品国产综合久久福利软件 | 欧美综合在线观看 | 亚洲成人综合在线 | 天天拍天天色 | 久久久久久久久久久久久久久久久久久久 | 国产视频精品免费 | 国产中文字幕在线观看 | 久久久精品视频一区二区三区 | 亚洲精品国产成人 | 国产日韩欧美一区二区在线播放 | 久久国产精品一区二区三区 | 欧美一级二级在线观看 | 久久亚洲免费 | 国产免费国产 | 国产一区999 | 成人国内精品久久久久一区 | 九九亚洲精品 | 中文字幕四虎 | 欧美日韩久久精品 | 亚洲综合天堂网 |