成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

AI視頻生成新突破!字節提出一致性視頻生成方法Phantom:通過跨模態對齊生成主題一致的視頻,超多應用場景

人工智能 新聞
Phantom是一種基于文本-圖像-視頻三元組學習實現跨模態對齊的主體一致性視頻生成方法。通過重新設計聯合文本-圖像注入機制并利用動態特征集成,Phantom 在統一的單/多主體生成和人臉 ID 保存任務中展現出極具競爭力的性能,并在定量評估中超越了商業解決方案。

Phantom 是一個統一的視頻生成框架,適用于單主題和多主題參考,基于現有的文本轉視頻和圖像轉視頻架構構建。它通過重新設計聯合文本-圖像注入模型,利用文本-圖像-視頻三元組數據實現跨模態對齊。此外,它在人物生成中強調主題一致性,同時增強了身份保留視頻生成。

圖片

相關鏈接

  • 論文:https://arxiv.org/abs/2502.11079
  • 代碼:https://github.com/Phantom-video/Phantom
  • 主頁:https://phantom-video.github.io/Phantom/
  • ComfyUI:https://github.com/kijai/ComfyUI-WanVideoWrapper/tree/dev

身份保護視頻生成

使用面部參考圖像生成主體視頻。Phantom嚴格保留參考面部的身份,同時根據提供的提示生成生動的視頻。

圖片

單參考主題到視頻生成

使用單個參考圖像生成主體視頻。Phantom可以保持各種主體的完整性,包括物體、衣服、動物、虛擬角色等。

圖片

多參考主題到視頻的生成

使用多個參考圖像生成主體視頻。Phantom可以實現多個主體之間的逼真互動,例如群體互動、產品演示、虛擬試穿等。

圖片

論文介紹

Phantom:通過跨模態對齊生成主題一致的視頻Phantom:通過跨模態對齊生成主題一致的視頻


視頻生成基礎模型的不斷發展演變,并應用于各種應用,而主題一致的視頻生成仍處于探索階段。這類人物稱為“主題到視頻”(Subject-to-Video),該方法從參考圖像中提取主題元素,并按照文本指令生成主題一致的視頻。作者認為“主題到視頻”的精髓在于平衡文本和圖像的雙模態提示,從而深度同步地對齊文本和視覺內容。為此論文提出了Phantom,一個適用于單主題和多主題參考的統一視頻生成框架。

基于現有的文本到視頻和圖像到視頻架構,作者重新設計了聯合文本-圖像注入模型,并驅動其通過文本-圖像-視頻三元組數據學習跨模態對齊。該方法實現了高保真度的主題一致視頻生成,同時解決了圖像內容泄漏和多主題混淆的問題。評估結果表明,提出的方法優于其他最先進的閉源商業解決方案。特別地,該方法強調人類生成中的主題一致性,這涵蓋了現有的身份保留視頻生成,同時提供了增強的優勢。

方法概述

用于跨模態視頻生成的數據處理流程。該流程包括過濾、添加字幕、檢測和匹配階段,用于從視頻片段中提取主體并將其與文本提示對齊,從而確保視頻生成的一致性。用于跨模態視頻生成的數據處理流程。該流程包括過濾、添加字幕、檢測和匹配階段,用于從視頻片段中提取主體并將其與文本提示對齊,從而確保視頻生成的一致性。Phantom 架構概述。三元組數據在輸入頭處被編碼到潛在空間,組合后,通過改進的 MMDiT 塊進行處理,以學習不同模態的對齊方式。Phantom 架構概述。三元組數據在輸入頭處被編碼到潛在空間,組合后,通過改進的 MMDiT 塊進行處理,以學習不同模態的對齊方式。

每個 MMDiT 塊中針對單個或多個參考對象的動態注入策略和注意力計算

每個 MMDiT 塊中針對單個或多個參考對象的動態注入策略和注意力計算

結果展示

視頻質量評估(左)和多主題一致性的用戶研究結果(右)。視頻質量評估(左)和多主題一致性的用戶研究結果(右)。

身份保護視頻生成

圖片

單一參考主題到視頻生成

圖片

多參考主題到視頻生成

圖片

結論

Phantom是一種基于文本-圖像-視頻三元組學習實現跨模態對齊的主體一致性視頻生成方法。通過重新設計聯合文本-圖像注入機制并利用動態特征集成,Phantom 在統一的單/多主體生成和人臉 ID 保存任務中展現出極具競爭力的性能,并在定量評估中超越了商業解決方案。


責任編輯:張燕妮 來源: AIGC Studio
相關推薦

2025-03-03 08:32:00

模型AI訓練

2024-01-22 08:59:00

AI

2024-09-10 11:21:30

2025-05-09 12:39:08

2024-12-05 14:20:00

模型AI

2025-01-22 10:30:00

圖像生成模型AI

2025-03-20 09:20:00

2024-05-06 12:21:00

AI模型

2025-03-27 09:24:16

2024-11-26 17:56:38

2025-01-26 10:50:00

模型視頻生成

2023-04-03 10:04:44

開源模型

2024-10-28 07:30:00

2025-02-06 10:45:00

2025-06-12 11:57:56

視頻生成模型AI

2021-08-13 15:07:02

模型人工智能深度學習

2024-03-20 00:00:00

StabilityAI開源人工智能

2019-11-21 10:19:45

數據應用場景系統

2017-07-25 14:38:56

數據庫一致性非鎖定讀一致性鎖定讀
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚州激情| 久久人人爽人人爽人人片av免费 | 日韩在线播放视频 | 综合视频在线 | 日本色综合 | 人人鲁人人莫人人爱精品 | 日本不卡免费新一二三区 | 精品久久久久久18免费网站 | 亚洲+变态+欧美+另类+精品 | 在线精品亚洲欧美日韩国产 | 精品国产欧美一区二区 | 午夜天堂精品久久久久 | 激情久久网| 国产精品欧美一区二区三区不卡 | 国产成人免费视频网站高清观看视频 | 欧美国产视频 | 91国产视频在线 | 国产精品久久久久一区二区 | 国内精品视频在线观看 | 北条麻妃一区二区三区在线观看 | 午夜丁香视频在线观看 | 久久伊 | 国产精品福利在线 | 三级视频久久 | 久久伊 | www国产成人 | 久久久精品网站 | 天天干天天操 | 久久久国产一区二区三区 | 狠狠操狠狠操 | 一区欧美 | 精品国产乱码久久久久久牛牛 | 99精品久久 | 亚洲午夜电影 | 国产91在线播放 | 日韩精品在线一区 | 欧美日韩久久 | 91麻豆蜜桃一区二区三区 | 夜夜爽99久久国产综合精品女不卡 | 欧美aⅴ在线观看 | av手机在线免费观看 |