成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

多模態生成框架新SOTA:文本+空間+圖像隨意組合,20W+數據開源,復旦騰訊優圖出品

人工智能
團隊提出了SubjectSpatial200K數據集,以彌補當前缺少用于訓練和測試多條件生成模型的公開數據集的不足。團隊相信,該研究將推動可控生成領域的發展。

能處理任意條件組合的新生成框架來了!

復旦大學、騰訊優圖實驗室等機構的研究人員提出UniCombine,一種基于DiT的多條件可控生成框架,能夠處理包括但不限于文本提示、空間映射和主體圖像在內的任意控制條件的任意組合,并保持高度的一致性和出色的和諧性。

具體效果be like:

圖片圖片

據了解,現有的多條件可控生成框架或是只能處理單一種類的多個條件,或是只適用于某種特定的多類別組合,從而普遍缺乏通用性的多類別+多條件的組合式生成能力

而在UniCombine這項工作中,團隊引入了一種新的Conditional MMDiT注意力機制,并結合可訓練的LoRA模塊,從而同時提供了training-free和training-based兩種版本。

此外,團隊構建并開源了首個針對多條件組合式生成任務設計的數據集SubjectSpatial200K,其中涵蓋了subject-driven和spatially-aligned兩大類控制條件。

UniCombine在4項不同的多條件可控生成任務上均達到SOTA,證明了新方法具有卓越的框架通用性和出色的條件一致性。

UniCombine方法

UniCombine框架圖如下:

圖片圖片

(a) 整體框架。團隊將基于MMDiT的擴散模型視為由文本分支和去噪分支組成。在此基礎上,UniCombine引入了多個條件分支來處理輸入條件。

(b) UniCombine的單條件設置。該設置等價于OminiControl,即在單條件設置下,OminiControl是UniCombine框架的特例。

(c) UniCombine的多條件設置。團隊提出的LoRA Switching模塊可根據條件類型自適應激活去噪分支權重上的預訓練Condition-LoRA模塊。此外,團隊引入了Conditional MMDiT Attention機制,以替換原始MMDiT Attention 機制,從而處理統一的多條件輸入序列。是否加載可選的Denoising-LoRA模塊是無訓練版本和基于訓練版本的區別。

SubjectSpatial200K數據集

圖片圖片

團隊的SubjectSpatial200K數據集旨在填補當前多條件生成任務中缺少公開可用數據集的空白。現有數據集未能同時包含主體驅動和空間對齊的標注。

最近,Subjects200K數據集提供了一個面向主體驅動生成的公開數據集。

在此基礎上,團隊構建了SubjectSpatial200K數據集,這是一個高質量的統一數據集,專為訓練和測試多條件可控生成模型設計。該數據集包含全面的標注,包括豐富的Subject Grounding Annotation和Spatial Map Annotation。數據集的構建流程見圖。

實驗結果

(1)對比實驗

圖片圖片

(2)消融實驗:CMMDiT與MMDiT

圖片圖片

(3)消融實驗:Denoising LoRA與Text-LoRA

圖片圖片

(4)消融實驗:DSB+SSB聯合訓練與DSB單獨訓練

圖片圖片

(5)算力開銷分析

圖片

整體而言,研究人員提出了UniCombine,這是一個基于DiT的多條件可控生成框架,能夠處理任意條件組合,包括但不限于文本提示、空間映射和主體圖像。

在主體插入、主體-空間以及多空間等條件生成任務上的大量實驗表明,無論是無訓練還是基于訓練的版本,UniCombine都達到了最先進的性能。

此外,團隊提出了SubjectSpatial200K數據集,以彌補當前缺少用于訓練和測試多條件生成模型的公開數據集的不足。團隊相信,該研究將推動可控生成領域的發展。

論文鏈接:https://arxiv.org/pdf/2503.09277
開源代碼:https://github.com/Xuan-World/UniCombine

責任編輯:武曉燕 來源: 量子位
相關推薦

2024-12-04 09:15:00

AI模型

2025-04-28 14:13:43

開源SOTA多模態

2024-08-14 14:30:00

AI訓練

2024-08-21 10:04:14

2024-03-25 12:40:19

訓練模型

2025-01-07 09:11:07

2025-05-08 09:31:50

2023-10-07 09:29:09

2024-04-02 09:17:50

AI數據開源

2025-06-17 02:25:00

工業異常檢測

2024-12-18 09:34:13

2024-06-28 18:18:22

2022-12-05 10:08:59

2024-03-04 12:32:20

模型訓練

2024-04-01 07:25:00

AI框架

2023-12-08 14:14:00

模型訓練

2018-10-19 12:16:06

開源技術 數據

2024-02-19 00:09:49

開源模型

2025-04-22 09:22:00

模型檢測AI

2023-11-09 15:10:00

訓練數據
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久国产精品一区二区三区 | 中文字幕一二三 | 国内精品伊人久久久久网站 | 久久婷婷国产麻豆91 | 美女逼网站 | 亚洲一区二区免费 | 欧美日韩中文国产一区发布 | 亚州一区二区三区 | 99九九视频 | 亚洲欧美日韩电影 | 性高湖久久久久久久久3小时 | 北条麻妃视频在线观看 | 国产在线成人 | 国产精品国产精品国产专区不蜜 | 精品av| 亚洲精品视频在线 | 国产精品久久久久久久久久了 | 日韩人体视频 | 亚洲欧美在线视频 | 欧美精品一区二区三区在线 | 99精品视频在线 | 欧区一欧区二欧区三免费 | 3级毛片 | 国产一级片一区二区 | 久久久久国产一区二区三区 | 日日骚av | 美女黄网 | 一区二区三区久久久 | 日韩亚洲一区二区 | 国产99久久 | 欧美一级淫片007 | 激情欧美一区二区三区 | 色综合天天综合网国产成人网 | 羞羞视频网站免费观看 | 国产精品久久久久无码av | 黄频免费 | 成人免费在线观看 | 欧美一区二区视频 | 欧美日韩在线观看一区 | 成人精品一区二区三区 | 亚洲一区中文 |