成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

MotionClone:無需訓練,一鍵克隆視頻運動

人工智能 新聞
本文提出了名為 MotionClone 的新框架,給定任意的參考視頻,能夠在不進行模型訓練或微調的情況下提取對應的運動信息。

無需訓練或微調,在提示詞指定的新場景中克隆參考視頻的運動,無論是全局的相機運動還是局部的肢體運動都可以一鍵搞定。

圖片


  • 論文:https://arxiv.org/abs/2406.05338
  • 主頁:https://bujiazi.github.io/motionclone.github.io/
  • 代碼:https://github.com/Bujiazi/MotionClone

本文提出了名為 MotionClone 的新框架,給定任意的參考視頻,能夠在不進行模型訓練或微調的情況下提取對應的運動信息;這種運動信息可以直接和文本提示一起指導新視頻的生成,實現具有定制化運動的文本生成視頻 (text2video)。

圖片

相較于先前的研究,MotionClone 具備如下的優點:

  • 無需訓練或微調:先前的方法通常需要訓練模型來編碼運動線索或微調視頻擴散模型來擬合特定運動模式。訓練模型編碼運動線索對于訓練域之外的運動泛化能力較差,而微調已有的視頻生成模型可能會損害基模型潛在的視頻生成質量。MotionClone 無需引入任何額外的訓練或微調,在提高運動泛化能力的同時最大程度保留了基座模型的生成質量。
  • 更高的運動質量:已有的開源文生視頻模型很難生成大幅度的合理的運動,MotionClone 通過引入主成分時序注意力運動指導在大幅加強生成視頻運動幅度的同時有效保障了運動的合理性。
  • 更好的空間位置關系:為了避免直接的運動克隆可能導致的空間語義錯配,MotionClone 提出了基于交叉注意力掩碼的空間語義信息指導來輔助空間語義信息和時空運動信息的正確耦合。

時序注意力模塊中的運動信息

圖片

在文本生視頻工作中,時序注意力模塊 (Temporal Attention) 被廣泛用于建模視頻的幀間相關性。由于時序注意力模塊中的注意力分數 (attention map score) 表征了幀間的相關性,因此一個直觀的想法是是否可以通過約束完全一致的注意力分數來復制的幀間聯系從而實現運動克隆。

然而,實驗發現直接復制完整的注意力圖 (plain control) 只能實現非常粗糙的運動遷移,這是因為注意力中大多數權重對應的是噪聲或者非常細微的運動信息,這些信息一方面難以和文本指定的新場景相結合,另一方面掩蓋了潛在的有效的運動指導。

為了解決這一問題,MotionClone 引入了主成分時序注意力運動指導機制 (Primary temporal-attention guidance),僅利用時序注意力中的主要成分來對視頻生成進行稀疏指導,從而過濾噪聲和細微運動信息的負面影響,實現運動在文本指定的新場景下的有效克隆。

圖片

空間語義修正

主成分時序注意力運動指導能夠實現對參考視頻的運動克隆,但是無法確保運動的主體和用戶意圖相一致,這會降低視頻生成的質量,在某些情況下甚至會導致運動主體的錯位。

為了解決上述問題,MotionClone 引入空間語義引導機制 (Location-aware semantic guidance),通過交叉注意力掩碼(Cross Attention Mask)劃分視頻的前后背景區域,通過分別約束視頻前后背景的語義信息來保障空間語義的合理布局,促進時序運動和空間語義的正確耦合。

MotionClone 實現細節

圖片

  1. DDIM 反轉:MotionClone 采用 DDIM Inversion 將輸入的參考視頻反轉至 latent space 中,實現對參考視頻的時序注意力主成分提取。
  2. 引導階段:在每次去噪時,MotionClone 同時引入了主成分時序注意力運動指導和空間語義信息指導,它們協同運行,為可控視頻生成提供全面的運動和語義引導。
  3. 高斯掩碼:在空間語義引導機制中,采用高斯核函數對交叉注意力掩碼進行模糊處理,消除潛在的結構信息影響。

DAVIS 數據集中的 30 個視頻被用于測試。實驗結果表明 MotionClone 實現了在文本契合度、時序一致性以及多項用戶調研指標上的顯著提升,超越了以往的運動遷移方法,具體結果如下表所示。

圖片

MotionClone 與已有運動遷移方法的生成結果對比如下圖所示,可見 MotionClone 具有領先的性能。

圖片

綜上所述,MotionClone 是一種新的運動遷移框架,能夠在無需訓練或微調的情況下,有效地將參考視頻中的運動克隆到用戶給定提示詞指定的新場景,為已有的文生視頻模型提供了即插即用的運動定制化方案。

MotionClone 在保留已有基座模型的生成質量的基礎上引入高效的主成分運動信息指導和空間語義引導,在保障和文本的語義對齊能力的同時顯著提高了和參考視頻的運動一致性,實現高質量的可控的視頻生成。

此外,MotionClone 能夠直接適配豐富的社區模型實現多樣化的視頻生成,具備極高的擴展性。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2015-02-09 15:25:52

換膚

2020-03-04 09:35:55

開源技術 軟件

2020-10-10 14:57:16

代碼開發工具

2025-02-20 13:00:00

2013-01-17 10:44:16

飛視美視頻網絡統一通信

2020-02-10 07:45:46

QQ騰訊QQ群

2025-04-01 00:00:22

數據場景競品

2015-11-03 15:29:49

ONOS開放網絡操作系統SDN

2023-03-28 16:37:38

論文視頻

2025-04-17 04:00:00

2023-06-15 10:00:00

Jenkins任務操作

2024-12-26 00:51:38

2025-03-27 09:47:23

訓練模型AI

2025-06-11 09:10:00

2025-02-13 00:00:02

DeepSeek插件API

2022-04-07 13:56:13

前端一鍵換膚

2025-04-02 09:10:00

LinuxShell腳本

2021-12-02 07:50:29

分支服務git worktre

2024-10-17 11:09:46

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品视频网 | 亚洲一区视频 | 国产h视频 | 亚洲精品2 | 国产精品地址 | 欧美在线国产精品 | 精品久久久一区二区 | 午夜看片网站 | 高清人人天天夜夜曰狠狠狠狠 | 日日夜夜精品视频 | 一区二区三区四区在线视频 | 成人在线精品视频 | 欧美jizzhd精品欧美巨大免费 | 日韩视频观看 | 精品国产一区二区国模嫣然 | 成人亚洲视频 | 国产日韩欧美在线观看 | 国产亚洲精品精品国产亚洲综合 | 羞视频在线观看 | 国产2区 | 日韩欧美一区在线 | 欧美日韩福利视频 | 国产精品日韩欧美一区二区 | 日本 欧美 三级 高清 视频 | 国产精品久久久久久久久久妇女 | 久久久亚洲成人 | 超碰在线久| 国产精品视频免费观看 | 精品国产乱码久久久久久闺蜜 | 精品欧美乱码久久久久久 | a级片www| 在线免费观看日本视频 | 三级高清 | 最新国产精品 | 九九九视频在线观看 | 欧美精品一区二区在线观看 | 欧产日产国产精品v | 中国毛片免费 | 国产精品久久久久久吹潮 | 国产69精品久久99不卡免费版 | 在线免费黄色小视频 |