成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

無需點跟蹤,克服DragGAN缺陷!中科大聯合上海AI Lab發布FreeDrag:可穩定拖動語義內容

人工智能 新聞
FreeDrag無需點跟蹤,即可實現更高質量的拖動編輯效果!

近日,在AIGC的廣闊世界里出現了一個火熱的圖像編輯方法—即通過在給定圖像上通過把語義內容從原位置(handle point)拖動到目標位置(target point)的方式進行精細的定制化編輯操作。

比如可以實現「讓貓咪對你wink」的神奇操作:

圖片

這一驚人效果來自于發表在SIGGRAPH 2023會議上的 [Drag Your GAN] 論文(簡稱為DragGAN)。

并且DragGAN的代碼一經發出就在短短幾周內狂攬30K star,引發廣大網友的「Drag熱潮」。

有了DragGAN的加持,各種AI畫圖工具的「阿喀琉斯之踵」再也不是弱點,哪里不滿意就只修哪里!

近日,中科大和上海AI Lab的研究者們又發布了一項相關研究—FreeDrag。

圖片圖片

Paper:https://arxiv.org/abs/2307.04684

Code:https://github.com/LPengYang/FreeDrag

Project Page:https://lin-chen.site/projects/freedrag/

研究結果表明,先前的DragGAN由兩個交替迭代進行的過程構成:

1. 運動監督(motion supervision)過程指導handle point向著對應的target point進行移動;

2. 點跟蹤(point tracking)過程則負責定位移動后handle point的精確位置從而為下次移動提供方向和約束特征。

因此DragGAN 嚴重依賴于點跟蹤的精確性。然而,點跟蹤的策略本質上是不穩定的,因為它隱式地假設每次移動后在默認的搜索區域內有且僅有一個點完美繼承了handle point的特征。

這個假設會在以下兩種情況下失效:

1. 圖像內容發生劇烈變化導致的跟蹤丟失

圖片圖片

DragGAN 由于內容突變發生跟蹤點丟失

2. 搜索區域內的相似點導致的跟蹤錯誤,例如輪廓線和馬腿等。

圖片圖片

DragGAN 由于相似點的存在發生錯誤的點跟蹤

錯誤的點跟蹤會為下一次移動提供錯誤的方向和約束特征,造成誤差累積從而損害編輯的質量。

方法介紹

為了防止不穩定的點跟蹤過程不可避免地損害圖像編輯的質量,中國科學技術大學和上海AI Lab的研究者們共同提出FreeDrag, 一種以特征為導向的基于點的交互式編輯框架。

FreeDrag通過引入自適應更新的模板特征,模糊定位和線性搜索技術,在無需進行精確點跟蹤的情況下即可實現更加穩定可靠的拖動編輯。

圖片 圖 2 FreeDrag 的流程圖


圖片

圖 3 DragGAN的點跟蹤和FreeDrag 點定位的比較。

DragGAN 要求精確定位的位置,而FreeDrag 通過約束特征差異限制定位點在附近,但不要求確定的具體位置。

動態更新的模板特征

圖片圖片

 研究者們首先提出了動態更新的模板特征技術來緩解跟蹤點丟失問題。模板特征通過衡量每次移動的質量來決定是否更新,即通過控制λ的值來決定每次更新的比例。

更大的λ意味著更大的更新程度。移動質量越高更新程度越大。移動質量通過衡量移動結束后圖片處的特征圖片和上一次的模板特征值圖片的 L1 距離 (圖片) 來度量,圖片越小說明移動質量越高。

模板特征的更新過程不依賴于handle point 的位置和特征,從而擺脫了對精確的點跟蹤的負擔,同時自適應的更新策略帶來的平滑性賦予了模板特征更好的魯棒性來克服劇烈的內容變化,避免編輯內容的異常丟失。

模糊定位和線性搜索

緊接著,研究者們提出模糊定位和線性搜索技術來緩解跟蹤點模糊問題。FreeDrag 通過移動距離d和特征差異l來為每次的移動定位適合的目標點,即公式(10)。

定位主要分為三種情況:繼續向target point移動(移動質量高);保持當前位置不動(移動不徹底),點回退(移動異常)。

相比于DragGAN要求的精確的點跟蹤,公式(10)搜尋的定位點是“模糊”因為它并不要求搜尋handle point的準確位置,而是通過約束特征差異確保定位點在handle point附近, 因此擺脫了精確定位的負擔。

此外,公式(10) 只在原始handle point 和 target point 形成的直線上進行點搜索,這種線性搜索策略有效地緩解了相鄰區域內相似點的干擾,保障了運動監督的可靠性,進一步提高點移動的穩定性。 

實驗對比

DragGAN 和 FreeDrag 在各類場景上的對比如下圖(圖4)所示,可以發現FreeDrag可以有效地防止handle point的異常消失(如圖4第一個例子中消失的嘴巴和第二個例子中消失的眼鏡),同時有力地避免了由于內容突變和相似點干擾導致的異常編輯,保障了點移動的可靠性(如圖4第三個例子中大象的眼睛和第四個例子中的馬腿)。

此外,從圖4的(5)-(8)例子可以觀察到FreeDrag 可以通過穩定的點移動更有效更精確地實現預定的編輯目標。進一步的,在各類場景上的大量實驗(圖5) 充分驗證了FreeDrag 可以通過穩定的點移動實現更高的編輯質量,助力交互式的基于點的圖像編輯達到新的高度。

圖片圖片

圖 4 DragGAN 和 FreeDrag 在各類場景上的對比圖


圖片

圖 5 DragGAN 和 FreeDrag 在更多場景下的對比圖

左邊兩張圖分別為原始圖片和編輯目標(紅色為handle point, 藍色為target point),右邊分別為DragGAN 和FreeDrag的處理過程

圖片圖片

圖片圖片

動態過程:https://lin-chen.site/projects/freedrag/

對于拖動大象眼睛的例子,可以觀察到,DragGAN 在移動大象眼睛的過程中發生了圖像布局的突變造成點跟蹤丟失,點跟蹤丟失導致無法為之后的運動提供有效的運動監督,進而無法實現預定的編輯目的。

相比而言,得益于動態更新的模板特征的平滑性,FreeDrag 可以更好地避免圖像內容的急劇變化,從而更可靠地將眼部特征拖向預定的位置。

對于拖動馬腿的例子,可以觀察到, DragGAN在移動馬腿過程中發生了錯誤的點跟蹤,從而為之后的運動監督提供了錯誤的優化方向,進而降低了圖像質量,這種錯誤會在多次迭代中累計導致編輯結果質量的急劇下降。

相比而言, FreeDrag 的模糊定位和線性搜索策略有效地緩解了相似點的干擾,為點移動提供了可靠的監督信號,從而高質量地實現預定的編輯目的。

責任編輯:張燕妮 來源: 新智元
相關推薦

2016-06-14 15:46:33

高德

2025-04-01 09:20:00

模型預測AI

2023-03-17 07:59:57

AI數字化

2025-02-20 13:50:00

AI生成訓練

2023-12-04 13:23:00

數據訓練

2013-06-19 11:32:32

計算性能ISCHPC

2024-12-02 10:40:00

AI模型

2025-03-03 08:00:00

小紅書AI圖像檢測模型AI

2024-09-18 11:00:00

AI工具數據

2025-05-30 15:53:27

智能體模型AI

2024-06-17 07:10:00

2022-03-28 10:32:28

AI功能手勢

2024-04-07 09:00:00

數據模型

2024-11-06 13:03:49

2012-11-23 10:15:55

SCC12全球超級計算大會

2021-05-07 09:34:20

量子芯片計算機

2024-10-16 14:10:00

AI視頻生成

2024-09-26 10:04:20

2017-03-23 17:09:45

2023-08-21 13:49:00

圖像技術
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲午夜av久久乱码 | 91精品国产91久久久久青草 | 在线免费黄色小视频 | 99久久婷婷国产综合精品 | 国产精品精品久久久 | 国产一区二区黑人欧美xxxx | 一区二区三区日韩 | 亚洲成网站 | 欧美一区二区三区视频在线观看 | 中文字幕一区二区三区精彩视频 | 国产一区二区三区久久久久久久久 | 午夜影视网 | 国产精久久久久久 | 中文字幕高清免费日韩视频在线 | 欧美一级大片 | 国产999精品久久久影片官网 | 欧美三区视频 | 狠狠操狠狠干 | 真人一级毛片 | 激情欧美一区二区三区中文字幕 | 国产成人高清 | 蜜臀久久 | 全免费a级毛片免费看视频免费下 | 成人影院在线观看 | 欧美一级免费看 | 国产精品污www一区二区三区 | 天天看天天操 | 久久久精品网 | 人人玩人人添人人澡欧美 | 亚洲三级av| 国产精品毛片无码 | 色爱区综合 | 国产高清在线 | a a毛片 | 久久99一区二区 | 国产91久久精品一区二区 | 国产一区二区精品在线 | 高清一区二区三区 | 欧美一区免费 | 伊人久久麻豆 | 亚洲精品一区二区三区蜜桃久 |