成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

14秒就能重建視頻,還能變換角色,Meta讓視頻合成提速44倍

人工智能 新聞
生成式 AI 天賦異稟,能夠毫不費力地創建或修改內容。尤其是圖像編輯,在以十億規模數據集為基礎預訓練的文本到圖像擴散模型的推動下,經歷了重大發展。這股浪潮催生了大量圖像編輯和內容創建應用。

就今天的人工智能發展水平來說,文生圖、圖生視頻、圖像/視頻風格遷移都已經不算什么難事。

生成式 AI 天賦異稟,能夠毫不費力地創建或修改內容。尤其是圖像編輯,在以十億規模數據集為基礎預訓練的文本到圖像擴散模型的推動下,經歷了重大發展。這股浪潮催生了大量圖像編輯和內容創建應用。

基于圖像的生成模型所取得的成就基礎上,下一個挑戰的領域必然是為其增加「時間維度」,從而實現輕松而富有創意的視頻編輯。

一種直接策略是使用圖像模型逐幀處理視頻,然而,生成式圖像編輯本身就具有高變異性—即使根據相同的文本提示,也存在無數種編輯給定圖像的方法。如果每一幀都獨立編輯,很難保持時間上的一致性。

在最近的一篇論文中,來自Meta GenAI團隊的研究者提出了 Fairy——通過對圖像編輯擴散模型進行「簡單的改編」,大大增強了AI在視頻編輯上的表現。

以下是Fairy的編輯視頻效果展示:

圖片

圖片

圖片

Fairy 生成 120 幀 512×384 視頻(4 秒時長,30 FPS)的時間僅為 14 秒,比之前的方法至少快 44 倍。一項涉及 1000 個生成樣本的全面用戶研究證實,該方法生成質量上乘,明顯優于現有方法。

怎么做到的?

據論文介紹,Fairy以基于錨點的跨幀注意力概念為核心,這種機制可隱性地跨幀傳播擴散特征,確保了時間一致和高保真的合成效果。Fairy 不僅解決了以往模型在內存和處理速度等方面的局限性,還通過獨特的數據增強策略提高了時間一致性,這種策略使模型等價于源圖像和目標圖像的仿射變換。

圖片

  • 論文地址:https://arxiv.org/pdf/2312.13834.pdf
  • 項目主頁:https://fairy-video2video.github.io/

方法

Fairy在擴散模型特征的背景下對以前的跟蹤-傳播(tracking-and-propagation)范式進行了重新審視。特別是,該研究用對應估計( correspondence estimation)架起了跨幀注意之間的橋梁,使得模型在擴散模型內可以跟蹤和傳播中間特征。

跨幀的注意力圖可以解釋為一種相似性度量,用來評估各個幀中token之間的對應關系,其中一個語義區域的特征會將更高的注意力分配給其他幀中的相似語義區域,如下圖3所示 。

因此,當前的特征表示通過注意力幀間相似區域的加權和進行細化和傳播,從而有效地最小化幀之間的特征差異。

圖片

一系列操作下來產生了基于錨點的模型,這是 Fairy 的核心組件。

為了確保生成視頻的時間一致性,該研究采樣了K個錨點幀,從而提取擴散特征,并且提取的特征被定義為一組要傳播到連續幀的全局特征。當生成每個新幀時,該研究針對錨點幀的緩存特征將自注意力層替換為跨幀注意力。通過跨幀注意力,每個幀中的 token都采用錨點幀中表現出類似語義內容的特征,從而增強一致性。

圖片

實驗評估

在實驗部分,研究者主要基于指令型圖像編輯模型來實現Fairy,并使用跨幀注意力替換模型的自注意力。他們將錨幀的數量設置為3。模型可以接受不同長寬比的輸入,并將較長尺寸的輸入分辨率重新擴展為512,并保持長寬比不變。研究者對輸入視頻的所有幀進行編輯,而不進行下采樣。所有計算在8塊A100 GPU上分配完成。

定性評估

研究者首先展示了Fairy的定性結果,如下圖5所示,Fairy可以對不同的主題進行編輯。

圖片

圖片

在下圖6中,研究者展示了Fairy可以按照文本指令來進行不同類型的編輯,包括風格化、角色變化、局部編輯、屬性編輯等。

圖片

下圖9展示了Fairy可以根據指令將源角色轉換為不同的目標角色。

圖片

圖片

定量評估

研究者在下圖7中展示了整體質量比較結果,其中Fairy生成的視頻更受歡迎。

圖片

下圖10展示了與基線模型的視覺比較結果。

圖片

更多技術細節和實驗結果參閱原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-04-15 09:08:51

系統數據模型

2016-10-08 16:02:37

WIFIMegaMIMO系統

2013-02-28 10:35:59

hadoop大數據Hortonworks

2016-03-21 10:16:06

RedisSpark大數據處理

2024-12-18 15:02:48

2024-12-20 07:00:00

大模型人工智能AI

2022-07-28 12:18:40

視覺語言模型

2024-01-02 13:18:00

數據視頻

2024-10-05 10:57:21

2024-02-27 13:03:38

前端視頻合成FFmpeg

2023-12-11 15:40:32

PyTorch代碼大模型

2022-01-28 10:26:39

5G運營商數據

2022-02-08 11:21:32

運營商通信技術

2021-02-17 13:20:51

forpandas語言

2023-06-02 14:10:05

三維重建

2025-05-09 08:30:00

2024-03-01 19:45:09

SoraAI網絡安全

2024-11-08 09:30:00

2024-07-01 12:17:54

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 1204国产成人精品视频 | 亚洲精品黄色 | 国产精品乱码一区二三区小蝌蚪 | 国产精品一区二区在线 | 97久久精品午夜一区二区 | 国产精品综合色区在线观看 | 欧美 日韩 国产 一区 | 国际精品鲁一鲁一区二区小说 | 日本又色又爽又黄又高潮 | 国内精品久久久久久久影视简单 | 国产91综合一区在线观看 | 日本综合在线观看 | 九九爱这里只有精品 | 久久久久免费精品国产小说色大师 | 一区二区三区国产精品 | 成人免费网站在线 | 欧美成人hd | 男女免费网站 | 亚洲av毛片 | av一区二区三区在线观看 | 欧美操操操 | 日本免费一区二区三区 | 在线欧美一区二区 | 午夜精品久久久久久久99黑人 | 国产成人免费视频网站视频社区 | 老司机深夜福利网站 | 黄色大片免费网站 | 99re视频在线观看 | 国产91久久久久 | 无码日韩精品一区二区免费 | 羞羞视频免费观 | 国产精品美女久久久久aⅴ国产馆 | 免费成人国产 | 亚洲精品99 | 夜久久| 免费骚视频 | 日韩精品成人免费观看视频 | 久久久天天| 国产资源一区二区三区 | 欧美国产精品一区二区三区 | 亚洲国产精品视频 |