成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

東京大學 | Adobe 提出InstructMove,可通過觀察視頻中的動作來實現基于指令的圖像編輯

人工智能 新聞
文章提出了一種對視頻幀進行采樣并利用 MLLM 生成編輯指令以訓練基于指令的圖像處理模型的方法。

InstructMove是一種基于指令的圖像編輯模型,使用多模態 LLM 生成的指令對視頻中的幀對進行訓練。該模型擅長非剛性編輯,例如調整主體姿勢、表情和改變視點,同時保持內容一致性。此外,該方法通過集成蒙版、人體姿勢和其他控制機制來支持精確的局部編輯。

圖片

相關鏈接

  • 論文:http://arxiv.org/abs/2412.12087v1
  • 主頁:https://ljzycmd.github.io/projects/InstructMove/

論文介紹

圖片

通過觀察事物如何移動的基于指令的圖像操作

摘要

本文介紹了一種新穎的數據集構建流程,該流程從視頻中抽取幀對并使用多模態大型語言模型 (MLLM) 生成編輯指令,以訓練基于指令的圖像處理模型。視頻幀本質上保留了主體和場景的身份,確保在編輯過程中內容保存的一致性。此外,視頻數據捕捉了各種自然動態(例如非剛性主體運動和復雜的相機運動),否則很難建模,使其成為可擴展數據集構建的理想來源。使用這種方法,我們創建了一個新數據集來訓練 InstructMove,該模型能夠進行基于指令的復雜操作,而這些操作很難通過合成生成的數據集實現。我們的模型在調整主體姿勢、重新排列元素和改變相機視角等任務中表現出最先進的性能。

方法

圖片

數據構建管道:

  1. 首先從視頻中采樣合適的幀對,確保轉換逼真且適度。
  2. 這些幀對用于提示多模態大型語言模型 (MLLM) 生成詳細的編輯指令。
  3. 此過程會產生一個具有逼真圖像對和精確編輯指令的大規模數據集。

圖片

基于指令的圖像編輯的模型架構概述。首先使用預訓練編碼器將源圖像和目標圖像編碼為潛在表示 zs和 ze。然后通過前向擴散過程將目標潛在 z e轉換為噪聲潛在 zet。沿寬度維度連接源圖像潛在和噪聲目標潛在以形成模型輸入,該輸入被輸入到去噪 U-Net ?θ 中以預測噪聲圖。輸出的右半部分(對應于噪聲目標輸入)被裁剪并與原始噪聲圖進行比較。

結果

圖片

圖片與最先進的圖像編輯方法進行定性比較,包括基于描述和基于指令的方法。現有方法難以處理復雜的編輯,例如非剛性變換(例如姿勢和表情的變化)、對象重新定位或視點調整。它們通常要么無法遵循編輯說明,要么產生不一致的圖像,例如身份轉變。相比之下,論文的方法在具有自然變換的真實視頻幀上進行訓練,成功處理了這些編輯,同時保持了與原始輸入圖像的一致性。

圖片該方法與附加控制的定性結果。

  1. 模型可以利用掩碼來指定要編輯圖像的哪個部分,從而實現局部調整并解決指令中的歧義。
  2. 與 ControlNet 結合使用時,該模型可以接受其他輸入,例如人體姿勢或草圖,以實現對主體姿勢或物體定位的精確編輯。 以前的方法無法實現這種級別的控制。

結論

文章提出了一種對視頻幀進行采樣并利用 MLLM 生成編輯指令以訓練基于指令的圖像處理模型的方法。與依賴于合成生成的目標圖像的現有數據集不同,該方法利用來自視頻和 MLLM 的監督信號來支持復雜的編輯,例如非剛性變換和視點變化,同時保持內容一致性。未來的工作可以集中在改進過濾技術上,無論是通過改進 MLLM 還是結合人機交互過程,以及將視頻數據與其他數據集集成以進一步增強圖像編輯功能。

責任編輯:張燕妮 來源: AIGC Studio
相關推薦

2025-01-07 11:00:00

AI生成

2023-09-08 08:09:29

項目程序線程

2024-09-04 10:20:00

自動駕駛模型

2010-06-28 09:27:58

Tsubame 2.0超算

2025-01-17 10:30:00

2025-03-31 08:46:00

圖像AI生成

2015-03-27 15:41:42

AdobeAcrobat DC

2024-04-07 00:20:00

智能體技術

2024-12-20 13:50:00

訓練模型AI

2024-11-21 13:40:00

AI數據

2025-02-05 10:15:00

2019-04-03 15:00:47

Python圖像編輯工具

2020-08-22 07:46:58

Photoflare開源圖像編輯器

2025-01-03 10:30:00

2025-01-21 10:45:00

訓練模型架構

2022-12-14 14:55:51

模型數字

2025-01-06 10:30:00

圖像AI模型

2024-03-11 09:37:01

模型圖片編輯

2024-07-01 10:19:22

2023-01-02 13:12:07

模型圖像
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 91久久精品一区二区二区 | 日韩欧美在线免费观看视频 | 久久大香| 精品久久香蕉国产线看观看亚洲 | 天天久| 国产一区不卡 | 国产1区2区3区 | a中文在线视频 | 久久久91精品国产一区二区三区 | 国产精品免费观看视频 | 国产成人99久久亚洲综合精品 | 国产一区999| 国产精品一区二区三区在线播放 | 日韩在线播放一区 | 在线小视频 | 亚洲一区电影 | 日韩中文字幕第一页 | 女生羞羞网站 | 大乳boobs巨大吃奶挤奶 | 一本一道久久a久久精品综合蜜臀 | 精品久久久久久久 | 欧美一区| 久久久久久久一区二区三区 | 国产精品久久7777777 | 久久99国产精品 | 日韩视频免费看 | 亚洲高清一区二区三区 | 国产激情网| 国产黄色小视频在线观看 | avhd101在线成人播放 | 精品国产一区二区三区性色av | 黄色欧美在线 | 国产探花在线精品一区二区 | 免费黄色a视频 | 天天爽夜夜爽精品视频婷婷 | 欧美精品欧美精品系列 | 亚洲日韩视频 | 噜噜噜噜狠狠狠7777视频 | 一区二区三区欧美在线 | 欧美嘿咻 | 欧美精品在线一区二区三区 |