成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

CVPR'24:文生圖提示詞自動優化,還發現三個小竅門,人大度小滿等機構出品

人工智能 新聞
來自中國人大、度小滿等團隊提出了一種全新的自動文本提示優化方法——動態提示自動編輯(Prompt Auto-Editing,PAE)。

文生圖也有自己的prompt優化工具了。

我們都知道,大模型輸出的質量,很大程度上依賴于輸入的prompt。尤其在文生圖領域,對于prompt格外敏感。

來自中國人大、度小滿等團隊提出了一種全新的自動文本提示優化方法——動態提示自動編輯(Prompt Auto-Editing,PAE)。

圖片

它考慮了文本提示中的每個詞在擴散生成過程的權重和注入時間步。

最終在多個公開數據集上進行了實驗驗證,包括Lexica.art、DiffusionDB和COCO。PAE方法不僅提高了圖像的美學質量,還確保了圖像與文本描述的語義一致性。

與傳統方法相比,PAE在控制圖像生成過程中的精確性和靈活性方面表現更優。

圖片

關鍵在動態prompt

當前,盡管用戶可以通過手動修改提示來嘗試生成更優質的圖像,但這一過程不僅效率低下,而且難以精確控制。

為了提高效率并優化生成結果,團隊研發了PAE方法,這一方法的關鍵在于采用了動態提示(Dynamic Prompts)。

首先是為用戶輸入的簡短提示詞擴充出更多修飾詞,其次是通過動態調整新添加的修飾詞的權重和注入時間步,自動細化優化文本提示,從而更精準地控制圖像生成過程。

圖片

1、Dynamic Prompt的定義

具體來說,團隊定義了一種新的提示格式,用以豐富初始提示的信息,命名為動態精細控制提示(DF-Prompt)

文本prompt中的每個token會被拓展成一個三元組,在原有基礎上新添加了用來添加權重的浮點數,以及文本生效的時間步范圍。

DF-Prompt是原本的提示詞和修飾詞的結合。DF-Prompt 的本質在于促進更精確和控制的生成。為了便于演示和代碼實現,我們還定義了一個純文本格式:[token:range:weight]

以portrait of a beautiful forest goddess, beauty, very aesthetic, masterpiece為例,其中beauty拓展成三元組可以表示為[beauty:0.5→0:0.75],其權重為0.75,生效的時間步范圍為后50%的降噪步驟。

2、訓練數據收集

DiffusionDB數據集收集了用戶生成圖像時使用的prompt,其中包含大量的修飾詞、風格描述等,可以幫助我們訓練提示詞拓展與精細優化的自動化模型。

在DiffusionDB等數據集中,一般逗號之前的文本包含主要信息,描述圖像的主題,而逗號之后的文本被視為次要文本,提供補充后綴作為修飾語。

比如“a red horse on the yellow grass, anime style”,主要信息為“a red horse on the yellow grass”,次要文本為“anime style”。

我們把逗號之前的文本作為短提示,剩余的文本(次要文本)形成了修飾詞集合,以此來構建訓練數據中的輸入提示詞和目標提示詞。

最后,我們定義一個置信分數,利用美學指標和CLIP分數來篩選訓練數據,確保用于訓練的提示詞能夠引導生成高美學評分、高圖文對齊度的圖像。

3、訓練階段

如圖所示,使用收集好的訓練數據進行兩階段訓練。

圖片

階段一:監督式微調階段。

在收集好的數據集上對語言模型進行微調,以生成優化后的文本提示。每條訓練數據都包含了短提示詞文本和修飾詞集合,這里的優化目標就是讓語言模型根據短提示詞擴展出更多修飾詞。在這種方式中,訓練好的模型能夠處理簡短的提示,并預測適當的修飾詞,從而提升生成圖像的美學質量。

階段二:強化學習階段。

使用強化學習優化文本提示,通過多維度獎勵系統來指導這一過程,考慮到美學評分、語義一致性和用戶偏好。這一階段的主要目的是為每一個修飾詞添加權重和作用時間步,實現精細化的控制。我們使用 PPO 算法,在訓練集上最大化期望累積獎勵。獎勵函數是在生成的圖像上計算的,考慮了包括CLIP分數、PickScore、美學評分等指標。

通過觀察自動學習到的權重分布、時間步范圍統計信息,我們還有了一些有趣的發現:

圖片

  • 使用藝術家名稱和紋理修飾詞:通過引入藝術家的名字和紋理修飾詞,可以顯著提高生成圖像的藝術質量,并保持語義的準確性。
  • 在擴散過程的后半階段引入風格元素:在圖像生成的擴散過程后半段引入風格化元素,可以更好地融合這些元素,從而提高整體的視覺和藝術效果。
  • 降低復雜術語的權重:對于復雜的術語,適當降低其權重可以確保圖像生成既平衡又具吸引力,避免過分強調某些元素,從而影響圖像的整體美觀。

arxiv鏈接: https://arxiv.org/abs/2404.04095
代碼鏈接: https://github.com/Mowenyii/PAE

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-11-05 14:25:00

AI模型

2009-06-23 13:32:48

JavaScript初竅門

2018-09-11 08:40:00

前端JavaScriptt性能優化

2010-09-26 14:57:40

控制IT預算

2023-11-28 15:21:00

AI模型

2009-10-09 13:33:00

自學CCNACCNA

2020-11-16 09:05:08

Docker架構容器

2022-08-20 19:12:22

編程竅門

2020-07-19 08:11:54

Python代碼開發

2013-07-29 10:39:39

App竅門

2018-11-09 08:12:53

網絡帶寬傳輸

2020-09-13 09:14:35

PythonJSON開發

2010-05-26 10:10:53

openssh

2024-10-10 15:24:50

JSONPython

2009-07-14 10:21:19

Eclipse 3.5

2013-07-05 16:08:40

開發效率

2010-09-29 09:01:10

2012-05-16 11:52:23

虛擬化

2010-10-14 13:31:13

無線IP沖突

2022-06-22 08:50:53

ERP系統CTO
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 色在线看 | 国产日韩一区二区三免费 | 亚洲综合在线视频 | 9久久婷婷国产综合精品性色 | 日韩欧美在线播放 | 一级毛片免费完整视频 | 亚洲97 | 九九热九九 | 久久久婷婷 | 成人黄色av网址 | 色久影院| 欧美日韩成人在线 | 成人在线欧美 | 国产精品一区二区av | 色在线免费 | av免费入口 | 亚洲成av人片在线观看无码 | 在线看无码的免费网站 | 中文字幕免费视频 | 免费看大片bbbb欧美 | 亚洲福利网| 毛片一区二区三区 | 日韩精品在线视频 | 天天草视频 | 日韩精品久久久久久 | 日韩精品一区二区三区视频播放 | 久久精品一级 | 色爱综合网 | 亚洲日日夜夜 | 色综合色综合网色综合 | www.玖玖玖 | 国产成人叼嘿视频在线观看 | 久久亚洲一区 | 国产精品视频网 | 久久久www成人免费无遮挡大片 | 久久精品一区 | 日韩高清一区 | 日韩免费中文字幕 | www.国产一区| 成人在线免费观看 | 91成人精品视频 |