成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

港大&Adobe聯(lián)合提出圖像生成模型PixelFlow,可直接在原始像素空間中運(yùn)行,無需VAE即可進(jìn)行端到端訓(xùn)練

人工智能 新聞
論文推出了一種全新的圖像生成模型 PixelFlow,它通過直接在原始像素空間上進(jìn)行操作,重新思考了基于潛在空間的模型的優(yōu)勢(shì)。

香港大學(xué)和Adobe聯(lián)合提出了一種直接在原始像素空間中運(yùn)行的圖像生成模型PixelFlow,這種方法簡(jiǎn)化了圖像生成過程,無需預(yù)先訓(xùn)練的變分自編碼器 (VAE),并使整個(gè)模型能夠端到端訓(xùn)練。通過高效的級(jí)聯(lián)流建模,PixelFlow 在像素空間中實(shí)現(xiàn)了可承受的計(jì)算成本。它在 256x256 ImageNet 類條件圖像生成基準(zhǔn)上實(shí)現(xiàn)了 1.98 的 FID。

圖片

圖片

  • 論文:https://arxiv.org/pdf/2504.07963
  • 代碼:https://gihub.com/ShoufaChen/PixelFlow
  • 試用:https://huggingface.co/spaces/ShoufaChen/PixelFlow

論文介紹

PixelFlow:基于 Flow 的像素空間生成模型PixelFlow是一系列直接在原始像素空間中運(yùn)行的圖像生成模型,與主流的潛在空間模型形成對(duì)比。這種方法簡(jiǎn)化了圖像生成過程,無需預(yù)先訓(xùn)練的變分自編碼器 (VAE),并使整個(gè)模型能夠端到端訓(xùn)練。通過高效的級(jí)聯(lián)流建模,PixelFlow 在像素空間中實(shí)現(xiàn)了可承受的計(jì)算成本。它在 256x256 ImageNet 類條件圖像生成基準(zhǔn)上實(shí)現(xiàn)了 1.98 的 FID。定性的文本轉(zhuǎn)圖像結(jié)果顯示,PixelFlow 在圖像質(zhì)量、藝術(shù)性和語義控制方面表現(xiàn)出色。

方法概述

圖片

基于潛伏層的擴(kuò)散模型 (LDM)、基于像素的擴(kuò)散模型 (PDM) 和 PixelFlow 的設(shè)計(jì)范式比較:(a) LDM 將訓(xùn)練分為兩個(gè)獨(dú)立的階段——首先獨(dú)立訓(xùn)練現(xiàn)成的 VAE,然后基于從預(yù)訓(xùn)練 VAE 中提取的 token 訓(xùn)練擴(kuò)散模型;(b) 之前的 PDM 通常訓(xùn)練兩個(gè)獨(dú)立的模型:一個(gè)用于低分辨率圖像的擴(kuò)散模型和一個(gè)用于高分辨率合成的上采樣器;(c) 相比之下,PixelFlow 為基于像素的生成提供了端到端的解決方案,兼具高效率和強(qiáng)大的生成性能。

圖片

PixelFlow 用于從像素空間進(jìn)行級(jí)聯(lián)圖像生成。將整個(gè)生成過程劃分為一系列分辨率階段。在每個(gè)分辨率階段開始時(shí),我們都會(huì)將前一階段中相對(duì)嘈雜的結(jié)果進(jìn)行放大,并將其作為當(dāng)前階段的起點(diǎn)。因此,隨著分辨率的提高,可以獲得更精細(xì)的樣本。

圖片

級(jí)聯(lián)階段中間結(jié)果的可視化。從四個(gè)階段中提取中間結(jié)果進(jìn)行直接可視化。我們?cè)诟鱾€(gè)分辨率階段觀察到清晰的去噪過程。

實(shí)驗(yàn)結(jié)果

圖片

PixelFlow 類條件圖像生成的定性結(jié)果。所有圖像均為 256×256 分辨率。

圖片

PixelFlow 文本條件生成的定性結(jié)果。所有圖像均為 512×512 分辨率。題目的關(guān)鍵部分以紅色突出顯示。

圖片

PixelFlow 的定性樣本。展示了 1024×1024 分辨率的生成圖像。關(guān)鍵詞以紅色突出顯示。

結(jié)論

論文推出了一種全新的圖像生成模型 PixelFlow,它通過直接在原始像素空間上進(jìn)行操作,重新思考了基于潛在空間的模型的優(yōu)勢(shì)。通過直接在不同分辨率階段之間進(jìn)行轉(zhuǎn)換,該模型在簡(jiǎn)潔性和端到端可訓(xùn)練性方面展現(xiàn)出顯著優(yōu)勢(shì)。在類條件圖像生成和文本到圖像生成基準(zhǔn)測(cè)試中,PixelFlow 已被證明能夠比主流的基于潛在空間的方法展現(xiàn)出更強(qiáng)大的圖像生成能力。

責(zé)任編輯:張燕妮 來源: AIGC Studio
相關(guān)推薦

2024-10-11 09:32:48

2025-01-03 10:30:00

2020-11-16 08:05:26

API調(diào)用VS Code

2025-04-07 03:00:00

自動(dòng)駕駛

2024-10-10 09:37:49

2025-01-16 10:11:58

2011-11-11 11:01:23

Windows 8系統(tǒng)

2025-06-20 09:03:00

2024-09-19 18:49:54

完全同態(tài)加密FHE機(jī)器學(xué)習(xí)

2025-06-20 09:00:00

智能體訓(xùn)練模型

2024-09-10 12:11:18

2012-07-10 11:37:45

Chrome瀏覽器

2025-02-10 08:40:00

訓(xùn)練數(shù)據(jù)模型

2024-07-15 07:30:00

自動(dòng)駕駛AI

2025-03-18 08:19:01

2025-01-15 09:28:42

訓(xùn)練模型圖像生成

2024-10-28 07:30:00

2024-02-19 16:06:53

人工智能AI聲音克隆Python

2023-11-29 15:00:00

數(shù)據(jù)訓(xùn)練
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 日本午夜在线视频 | 欧区一欧区二欧区三免费 | 福利视频一区二区 | 日韩亚洲一区二区 | 国产精品久久久久av | 欧美日韩一二三区 | 欧美一区二区三区 | 999久久久免费精品国产 | 一级毛片色一级 | 在线一区二区观看 | 亚洲成人精品 | 久久久久网站 | 久久av一区二区三区 | 色本道| 91免费视频观看 | 蜜桃视频一区二区三区 | 免费亚洲成人 | 国产午夜精品久久久 | 国产精品jizz在线观看老狼 | 三级av在线| 久久成人精品视频 | 在线永久看片免费的视频 | 日韩在线成人 | 男女精品网站 | 国产亚洲精品精品国产亚洲综合 | 男女视频免费 | 欧美日韩不卡合集视频 | 看真人视频一级毛片 | 在线一区视频 | 91在线一区 | 国产精品久久久久久久久久久久久久 | 国产婷婷色综合av蜜臀av | 日韩av手机在线观看 | 国产日韩欧美激情 | 欧美在线视频二区 | 亚洲视频一区在线观看 | av片免费| 精品无码久久久久久久动漫 | 欧洲妇女成人淫片aaa视频 | 性欧美hd | 日本不卡在线视频 |