成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<tbody id="4s646"><bdo id="4s646"></bdo></tbody>

<tr id="4s646"><bdo id="4s646"></bdo></tr>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

AI視頻生成新突破！字節提出一致性視頻生成方法Phantom：通過跨模態對齊生成主題一致的視頻，超多應用場景

發布于 2025-4-28 00:29

瀏覽

0收藏

Phantom 是一個統一的視頻生成框架，適用于單主題和多主題參考，基于現有的文本轉視頻和圖像轉視頻架構構建。它通過重新設計聯合文本-圖像注入模型，利用文本-圖像-視頻三元組數據實現跨模態對齊。此外，它在人物生成中強調主題一致性，同時增強了身份保留視頻生成。

AI視頻生成新突破！字節提出一致性視頻生成方法Phantom：通過跨模態對齊生成主題一致的視頻，超多應用場景-AI.x社區

相關鏈接

論文：https://arxiv.org/abs/2502.11079
代碼：https://github.com/Phantom-video/Phantom
主頁：https://phantom-video.github.io/Phantom/
ComfyUI:https://github.com/kijai/ComfyUI-WanVideoWrapper/tree/dev

身份保護視頻生成

使用面部參考圖像生成主體視頻。Phantom嚴格保留參考面部的身份，同時根據提供的提示生成生動的視頻。

AI視頻生成新突破！字節提出一致性視頻生成方法Phantom：通過跨模態對齊生成主題一致的視頻，超多應用場景-AI.x社區

單參考主題到視頻生成

使用單個參考圖像生成主體視頻。Phantom可以保持各種主體的完整性，包括物體、衣服、動物、虛擬角色等。

AI視頻生成新突破！字節提出一致性視頻生成方法Phantom：通過跨模態對齊生成主題一致的視頻，超多應用場景-AI.x社區

多參考主題到視頻的生成

使用多個參考圖像生成主體視頻。Phantom可以實現多個主體之間的逼真互動，例如群體互動、產品演示、虛擬試穿等。

AI視頻生成新突破！字節提出一致性視頻生成方法Phantom：通過跨模態對齊生成主題一致的視頻，超多應用場景-AI.x社區

論文介紹

AI視頻生成新突破！字節提出一致性視頻生成方法Phantom：通過跨模態對齊生成主題一致的視頻，超多應用場景-AI.x社區

Phantom：通過跨模態對齊生成主題一致的視頻

視頻生成基礎模型的不斷發展演變，并應用于各種應用，而主題一致的視頻生成仍處于探索階段。這類人物稱為“主題到視頻”（Subject-to-Video），該方法從參考圖像中提取主題元素，并按照文本指令生成主題一致的視頻。作者認為“主題到視頻”的精髓在于平衡文本和圖像的雙模態提示，從而深度同步地對齊文本和視覺內容。為此論文提出了Phantom，一個適用于單主題和多主題參考的統一視頻生成框架。

基于現有的文本到視頻和圖像到視頻架構，作者重新設計了聯合文本-圖像注入模型，并驅動其通過文本-圖像-視頻三元組數據學習跨模態對齊。該方法實現了高保真度的主題一致視頻生成，同時解決了圖像內容泄漏和多主題混淆的問題。評估結果表明，提出的方法優于其他最先進的閉源商業解決方案。特別地，該方法強調人類生成中的主題一致性，這涵蓋了現有的身份保留視頻生成，同時提供了增強的優勢。

方法概述

AI視頻生成新突破！字節提出一致性視頻生成方法Phantom：通過跨模態對齊生成主題一致的視頻，超多應用場景-AI.x社區

用于跨模態視頻生成的數據處理流程。該流程包括過濾、添加字幕、檢測和匹配階段，用于從視頻片段中提取主體并將其與文本提示對齊，從而確保視頻生成的一致性。

AI視頻生成新突破！字節提出一致性視頻生成方法Phantom：通過跨模態對齊生成主題一致的視頻，超多應用場景-AI.x社區

Phantom 架構概述。三元組數據在輸入頭處被編碼到潛在空間，組合后，通過改進的 MMDiT 塊進行處理，以學習不同模態的對齊方式。

AI視頻生成新突破！字節提出一致性視頻生成方法Phantom：通過跨模態對齊生成主題一致的視頻，超多應用場景-AI.x社區

每個 MMDiT 塊中針對單個或多個參考對象的動態注入策略和注意力計算

結果展示

AI視頻生成新突破！字節提出一致性視頻生成方法Phantom：通過跨模態對齊生成主題一致的視頻，超多應用場景-AI.x社區

視頻質量評估（左）和多主題一致性的用戶研究結果（右）。

身份保護視頻生成

AI視頻生成新突破！字節提出一致性視頻生成方法Phantom：通過跨模態對齊生成主題一致的視頻，超多應用場景-AI.x社區

單一參考主題到視頻生成

AI視頻生成新突破！字節提出一致性視頻生成方法Phantom：通過跨模態對齊生成主題一致的視頻，超多應用場景-AI.x社區

多參考主題到視頻生成

AI視頻生成新突破！字節提出一致性視頻生成方法Phantom：通過跨模態對齊生成主題一致的視頻，超多應用場景-AI.x社區

結論

Phantom是一種基于文本-圖像-視頻三元組學習實現跨模態對齊的主體一致性視頻生成方法。通過重新設計聯合文本-圖像注入機制并利用動態特征集成，Phantom 在統一的單/多主體生成和人臉 ID 保存任務中展現出極具競爭力的性能，并在定量評估中超越了商業解決方案。

本文轉載自????AIGC Studio????，作者：AIGC Studio

標簽

贊

收藏

回復

舉報

回復

相關推薦

AI生成3D主題樂園，角色建筑批量生成，風格保持一致 | SIGGRAPH 2024

Crystalcxt ? 2988瀏覽 ? 0回復
支持合成一分鐘高清視頻，華科等提出人類跳舞視頻生成新框架UniAnimate

輕薄滴假象 ? 2749瀏覽 ? 0回復
CVD：第一個生成具有相機控制的多視圖一致視頻方案！（斯坦福&港中文）

angel ? 2815瀏覽 ? 0回復
自我一致性提升大模型中的思維鏈推理能力

AIRoobt ? 5826瀏覽 ? 0回復
長視頻生成速度提升100倍！新加坡國立提出Video-Infinity：分布式長視頻生成

angel ? 3294瀏覽 ? 0回復
人工智能的一致性推理悖論

xuxiangda ? 3515瀏覽 ? 0回復
多智能體大模型協作中的角色不一致性：一致性、虛構性和模仿性

xuxiangda ? 3470瀏覽 ? 0回復
360發布FancyVideo:通過跨幀文本指導實現動態且一致的視頻生成SOTA！

angel ? 2674瀏覽 ? 0回復
長視頻生成又有重大突破！DreamFactory：一致、連貫且引人入勝的長視頻生成框架

angel ? 1.0w瀏覽 ? 0回復
小紅書開源StoryMaker：個性化圖像生成模型，實現角色一致性與背景變化的完美結合

angel ? 7223瀏覽 ? 0回復
人工智能與人類情感的交匯點：一致性評估方法的探索

xuxiangda ? 6170瀏覽 ? 0回復
阿里商業級視頻生成框架——軌跡控制版視頻生成 Tora 重磅開源！

angel ? 2725瀏覽 ? 0回復
中科大重磅開源StableV2V：專注于「人機交互一致性」的視頻編輯方法

angel ? 2913瀏覽 ? 0回復
超Gemini-1.5-pro 9.5%！字節&上交&北大開源StoryTeller：生成一致性高的長視頻描述

angel ? 2759瀏覽 ? 0回復
從頻率到細節：ConsisID實現無縫身份一致的文本到視頻生成

angel ? 3300瀏覽 ? 0回復
賈佳亞團隊新作MagicMirror：生成身份一致且高質量個性化視頻，效果驚艷！

angel ? 2845瀏覽 ? 0回復
多模態MLLM都是怎么實現的—如何保持text2video的連續一致性

熵減AI ? 1125瀏覽 ? 0回復
真實世界AI造假驚現克星！清華GenWorld：用“物理一致性”讓虛假視頻無處遁形！

zhangyannni ? 823瀏覽 ? 0回復
騰訊開源一致性視頻生成框架HunyuanCustom：可同時實現音頻同步與視頻編輯！

AIGCStudio ? 267瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

熱門推薦

AI Agents開源工具棧全解析~ 1回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當，實測來了 0回復

上一篇：國產大模型崛起！智譜發布GLM-4-32B-0414系列模型，以32B模型參數比肩GPT-4o和DeepSeek V3/R1

下一篇： 3D人臉黑科技！Pixel3DMM：單張RGB圖像秒變3D人臉，姿勢表情精準還原，幾何精度碾壓競品15%！

社區精華內容

目錄

主站蜘蛛池模板：免费一看一级毛片 | 久优草| 99免费在线观看 | 特黄特色大片免费视频观看 | 黄毛片| 国产精品美女久久久久久免费 | 日日操天天射 | 精品成人在线视频 | 欧美性受xxxx白人性爽 | 久热精品在线 | 欧美久久天堂 | 免费高清成人 | caoporn国产精品免费公开 | 午夜小视频免费观看 | 欧美一区二区三区久久精品视 | 日韩在线高清 | 久久久久久久久99精品 | 精品日韩| 免费在线观看一区二区 | 久久久久免费观看 | 亚洲国产一区二区三区四区 | 久www| 性色在线| 91麻豆蜜桃一区二区三区 | 农村妇女毛片精品久久久 | 午夜男人天堂 | 欧美三级电影在线播放 | 精品亚洲永久免费精品 | 成人在线视频观看 | 超碰免费观看 | 欧美精品一区二区三区在线 | 视频一区在线 | 瑟瑟激情| 天堂精品视频 | 国产高潮好爽受不了了夜夜做 | 中文字幕视频在线观看 | 免费激情av | 一区二区三区日 | 日韩在线 | 精品国产免费一区二区三区演员表 | 欧美一区二区三区在线观看视频 |

<tbody id="qsqa4"><bdo id="qsqa4"></bdo></tbody>

<input id="qsqa4"><bdo id="qsqa4"></bdo></input>

<acronym id="qsqa4"><s id="qsqa4"></s></acronym>