成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

UIUC提出InstructG2I:從多模態屬性圖合成圖像?,結合文本和圖信息生成內容更豐富有趣!

人工智能 新聞
本文確定了多模態屬性圖 (MMAG) 上的圖像合成問題。并提出了一個圖形上下文條件擴散模型。

今天給大家介紹的這項工作是伊利諾伊大學厄巴納-香檳分校的研究者們提出的一個新任務 Graph2Image,其特點是通過調節圖信息來合成圖像,并引入了一種名為InstructG2I的新型圖調節擴散模型來解決這個問題。

在INSTRUCTG2I的工作中,研究者們開發了一種新方法來生成圖像,這種方法不僅依賴于文本描述,還考慮到圖中其他相關信息。想象一下,如果你要畫一幅畫,除了有一個簡單的描述,比如“雪中的房子”,你還可以參考與這個房子相關的其他房子或景物的信息。INSTRUCTG2I首先會找出與目標圖像最相關的鄰居圖像,這些圖像是通過一種叫做個性化頁面排名的技術來選擇的。接著,它會使用一種特殊的模型(Graph-QFormer)來理解這些鄰居圖像與目標圖像之間的關系,然后把這些信息與文本描述結合起來,最終生成一幅新圖像。這樣,生成的圖像不僅能符合描述,還能融入其他相關圖像的風格和特征,確保生成的內容更豐富、更有趣。

圖片

相關鏈接

論文閱讀:http://arxiv.org/abs/2410.07157v1

項目主頁:https://instructg2i.github.io/

論文閱讀

圖片

InstructG2I:從多模態屬性圖合成圖像

摘要

在本文中,我們研究了一個被忽視但關鍵的任務Graph2Image:從多模態屬性圖(MMAG)生成圖像。由于圖大小的爆炸性增長、圖實體之間的依賴關系以及圖條件的可控性需求,該任務提出了重大挑戰。為了解決這些挑戰,我們提出了一種稱為InstructG2I 的圖上下文條件擴散模型 。 InstructG2I首先利用圖結構和多模態信息,通過結合個性化頁面排名和基于視覺語言特征的重新排名來進行信息鄰居采樣。然后,Graph-QFormer 編碼器自適應地將圖節點編碼為輔助圖提示集 ,以指導擴散的去噪過程。最后,我們提出了無圖分類器的指導,通過改變圖指導的強度和節點的多個連接邊來實現可控生成。對來自不同領域的三個數據集進行的廣泛實驗證明了我們方法的有效性和可控性。

方法

圖片InstructG2I 的整體框架。 (a)給定多模態屬性圖 (MMAG) 中帶有文本提示的目標節點(例如,雪中的房子),我們希望為其生成圖像,(b)我們首先執行基于語義 PPR 的鄰居采樣,這涉及結構感知的個性化 PageRank 和基于語義感知的相似性的重新排序,以在圖中采樣信息豐富的鄰居節點。(c)然后將這些鄰居節點輸入到 Graph-QFormer 中,由多個自注意和交叉注意層編碼,表示為圖形標記并與文本提示標記一起用于指導擴散模型的去噪過程。

可控生成

圖片

實驗

定性評價

圖片定性評價。我們的方法通過更好地利用來自相鄰節點(圖中的“采樣鄰居”)的圖形信息,表現出與真實情況更好的一致性。

文字與圖表指導平衡

圖片

InstructG2I平衡文本引導和圖形引導 的能力。

多圖指導研究

圖片

多圖指導研究。根據單個或多個圖形指導(“畢加索”和“庫爾貝”風格)生成帶有輸入文本提示“彈鋼琴的人”的藝術作品。

虛擬藝術家

圖片

虛擬藝術家(我們可以結合任意數量的任何藝術家的風格)。在這個例子中,我們生成了結合巴勃羅·畢加索和我弟弟的風格的圖片。

結論

本文確定了多模態屬性圖 (MMAG) 上的圖像合成問題。并提出了一個圖形上下文條件擴散模型,該模型:

(1)使用基于語義個性化 PageRank 的方法對圖上的相關鄰居進行采樣;

(2)通過使用 Graph-QFormer 考慮它們的依賴性,有效地將圖形信息編碼為圖形提示;

(3)在無圖分類器的指導下生成受控圖像。

在藝術、電子商務和文學領域的 MMAG 上進行了系統實驗,證明了該方法與競爭性基線方法相比的有效性。

責任編輯:張燕妮 來源: AIGC Studio
相關推薦

2025-04-17 02:55:00

2022-06-28 10:18:12

深度學習模型

2024-08-14 14:30:00

AI訓練

2024-06-11 08:17:00

2012-05-15 09:26:09

Google測試

2023-04-03 10:19:49

AI合成圖像

2025-01-02 08:36:25

多模態RAG深度學習自然語言處理

2022-10-27 16:12:58

AI模型

2025-03-27 09:40:59

2023-04-10 16:34:46

模型文本

2022-03-08 09:06:33

模型文本摳圖

2023-01-08 13:15:56

2024-07-01 10:19:22

2023-07-17 11:02:36

模型開源

2023-11-09 15:10:00

訓練數據

2025-02-12 13:31:33

2024-09-12 14:15:00

智能體AI

2025-04-24 10:31:54

2012-05-09 11:31:42

奧圖碼投影機

2010-03-29 09:45:03

思科微軟
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久在线 | 成人国产一区二区三区精品麻豆 | 午夜成人免费视频 | 青娱乐国产 | 免费精品视频 | 99色视频| 淫片一级国产 | 日韩一级欧美一级 | 日本免费黄色一级片 | 日韩中文字幕在线播放 | av中文在线观看 | 中文字幕在线一区 | 国产精品视频一二三区 | 一区二区三区国产视频 | 国产网站久久 | 亚洲91精品 | 亚洲不卡在线视频 | 一区二区三区四区在线 | 91在线视频观看免费 | 中文字幕国产精品 | 天天欧美 | 亚洲成人在线网 | 四虎最新地址 | 黄色精品 | 国产精品久久国产精品 | 国产欧美精品一区二区三区 | 特黄色毛片 | aaa综合国产 | 国产亚洲精品精品国产亚洲综合 | 亚洲欧美在线免费观看 | 天天视频一区二区三区 | 天天玩天天操天天干 | 国产精品久久午夜夜伦鲁鲁 | 国产高清精品一区二区三区 | 亚洲精品免费观看 | 在线国产欧美 | 国产中文字幕在线观看 | 欧美v在线 | 亚洲精品二区 | 免费视频99| 99日韩|