成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

浙大 | 騰訊 | 華為提出視頻生成框架VideoMaker,可由參考圖實現(xiàn)Zero-shot定制化視頻生成

人工智能 新聞
零樣本定制視頻生成因其巨大的應用潛力而備受關(guān)注。現(xiàn)有方法依賴于附加模型來提取和注入?yún)⒖贾黧w特征,認為單靠視頻擴散模型 (VDM) 不足以生成零樣本定制視頻。

本文經(jīng)AIGC Studio公眾號授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

浙大聯(lián)合騰訊和華為提出了一種新的定制化視頻生成框架——VideoMaker,利用VDM的內(nèi)在能力,實現(xiàn)高質(zhì)量的zero-shot定制化視頻生成。該方法通過直接輸入?yún)⒖紙D像到VDM中,利用其固有的特征提取和注入機制,克服了以往方法在特征一致性和多樣性方面的不足。通過對人類和物體視頻生成的實驗驗證了該框架的有效性。

unsetunset相關(guān)鏈接unsetunset

  • 論文:http://arxiv.org/abs/2412.19645v2
  • 主頁:https://wutao-cs.github.io/VideoMaker/

unsetunset論文介紹unsetunset

圖片

零樣本定制視頻生成因其巨大的應用潛力而備受關(guān)注。現(xiàn)有方法依賴于附加模型來提取和注入?yún)⒖贾黧w特征,認為單靠視頻擴散模型 (VDM) 不足以生成零樣本定制視頻。然而,由于特征提取和注入技術(shù)不夠完善,這些方法往往難以保持一致的主體外觀。論文揭示了 VDM 本身具有提取和注入主體特征的能力。與以前的啟發(fā)式方法不同,論文引入了一個新框架,利用 VDM 的固有能力來實現(xiàn)高質(zhì)量的零樣本定制視頻生成。

具體而言,對于特征提取直接將參考圖像輸入 VDM 并使用其固有的特征提取過程,這不僅提供了細粒度的特征,而且與 VDM 的預訓練知識顯著一致。對于特征注入通過 VDM 中的空間自注意力設計了一種創(chuàng)新的主體特征與生成內(nèi)容之間的雙向交互,確保 VDM 具有更好的主體保真度,同時保持生成視頻的多樣性。對定制人物和物體視頻生成的實驗驗證了該框架的有效性。

unsetunset方法unsetunset

圖片VideoMaker 的整體流程。 將參考圖像直接輸入到 VDM 中,并使用 VDM 的模塊進行細粒度的特征提取。論文修改了空間自注意力的計算以實現(xiàn)特征注入。此外,為了區(qū)分參考特征和生成內(nèi)容,論文設計了指導信息識別損失來優(yōu)化訓練策略。該方法基于AnimateDiff實現(xiàn)了高保真零鏡頭定制人物和物體視頻生成。

VideoMaker的兩個關(guān)鍵步驟:

  • 特征提取:直接將無噪聲的參考圖像輸入VDM,視作時間步t=0的特殊情況,VDM能夠有效提取出細粒度的主觀特征。使用VDM的Resblock結(jié)構(gòu)作為特征提取器,提取與參考圖像對應的特征,確保提取的特征與VDM的知識高度一致。
  • 特征注入:通過VDM的空間自注意力機制,將提取的主觀特征與生成內(nèi)容進行交互,確保生成視頻中主觀對象的外觀一致性。設計了一種創(chuàng)新的訓練策略,利用引導信息識別損失,引導模型有效區(qū)分參考信息和生成內(nèi)容,從而提高生成質(zhì)量。

unsetunset結(jié)果unsetunset

定制名人視頻生成結(jié)果

圖片

名人定制人體視頻生成的定性比較。我們選擇 AnimateDiff SD1.5 版本作為基礎視頻傳播模型。由于 PhotoMaker 僅對 SDXL 進行了預訓練權(quán)重,因此我們使用分辨率為 512×512 的 AnimateDiff SDXL 生成的結(jié)果進行比較。

定制非名人視頻生成結(jié)果

圖片

對非名人定制人體視頻生成的定性比較。我們選擇 AnimateDiff SD1.5 版本作為我們的基礎視頻傳播模型。由于 PhotoMaker 僅對 SDXL 進行了預訓練權(quán)重,因此我們使用分辨率為 512×512 的 AnimateDiff SDXL 生成的結(jié)果進行比較。

定制對象視頻生成。

圖片

定制對象視頻生成的定性比較

責任編輯:張燕妮 來源: AIGC Studio
相關(guān)推薦

2024-10-28 07:30:00

2021-08-13 15:07:02

模型人工智能深度學習

2023-04-03 10:04:44

開源模型

2025-03-27 09:24:16

2023-10-20 12:54:00

數(shù)據(jù)訓練

2025-04-18 09:25:00

2025-01-17 09:00:00

2023-08-15 08:36:20

ChatGPT模型

2025-06-12 11:57:56

視頻生成模型AI

2025-05-06 09:41:06

2025-03-27 10:04:27

2023-02-06 09:31:07

視頻圖像

2024-04-03 14:11:49

模型訓練

2024-03-25 00:30:00

AI框架

2025-05-16 13:18:37

2024-04-07 14:56:22

技術(shù)應用

2021-07-09 08:52:19

Python視頻生成神器Python基礎

2023-11-17 22:50:08

模型AI

2024-12-26 00:51:38

2024-12-20 09:30:00

模型訓練數(shù)據(jù)
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 久久久精 | 91免费版在线观看 | 懂色一区二区三区免费观看 | 一区二区视屏 | 日韩久久久久久 | 亚洲天堂中文字幕 | 日韩欧美在线免费观看 | 亚洲欧美一区二区三区国产精品 | 日韩伦理一区二区三区 | 日本超碰 | 99精品久久 | av天空| 欧美不卡一区二区三区 | www.9191| 欧美亚洲国产精品 | 午夜电影网站 | 美女天天操 | 亚洲精品久久视频 | 99精品网| 日韩精品在线免费 | 成人国产精品久久久 | 成人久久18免费网站图片 | 午夜视频导航 | 一区二区三区亚洲 | 搞黄视频免费看 | 国产精品久久久久久久久久久免费看 | 性高湖久久久久久久久3小时 | 久久国产日韩欧美 | 一区二区三区精品视频 | 国产一级影片 | 国产精品久久久久久av公交车 | 久久伊人精品 | sese视频在线观看 | 亚洲精选一区二区 | 亚洲精品4 | 成人精品一区 | 国产欧美日韩在线播放 | 国产成人小视频 | 成人福利电影 | 成人午夜高清 | 日韩中文字幕视频 |