成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

港大阿里「視覺AI任意門」,一鍵向場景中無縫傳送物體

人工智能 新聞
相對于已有的類似模型,AnyDoor具有零樣本操作能力,無需針對具體物品調整模型。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

點兩下鼠標,就能把物體無縫「傳送」到照片場景中,光線角度和透視也能自動適應。

阿里和港大的這個AI版「任意門」,實現了零樣本的圖像嵌入。

有了它,網購衣服也可以直接看上身效果了。

圖片

因為功能和任意門十分相似,所以研發團隊給它起的名字就叫AnyDoor。

AnyDoor一次能夠傳送多個物體。

圖片圖片

不僅如此,它還能移動圖像里的已有物品。

圖片圖片

有網友看了之后贊嘆到,或許接下來就會進化到(把物體傳入到)視頻了。

圖片

零樣本生成逼真效果

相對于已有的類似模型,AnyDoor具有零樣本操作能力,無需針對具體物品調整模型。

圖片

除了這些需要進行參數調節的模型之外,AnyDoor相對于其他Reference類模型也更為準確。

實際上,其他的Reference類模型只能做到保持語義一致性。

通俗地說,如果要傳送的物體是一只貓,其他模型只能保證結果中也有一只貓,但相似度無法保證。

圖片

我們不妨把AnyDoor的效果放大看看,是不是看不出什么破綻?

圖片

圖片

用戶評價的結果也證實,AnyDoor在質量和準確度方面表現均優于現有模型(滿分4分)。

而對于已有圖像中物體的移動、換位,甚至改變姿態,AnyDoor也能出色完成。

圖片

那么,AnyDoor是如何實現這些功能的呢?

工作原理

圖片圖片

要想實現物體的傳送,首先就要對其進行提取。

不過在將包含目標物體的圖像送入提取器之前,AnyDoor首先會對其進行背景消除。

然后,AnyDoor會進行自監督式的物體提取并轉換成token。

這一步使用的編碼器是以目前最好的自監督模型DINO-V2為基礎設計的。

為了適應角度和光線的變化,除了提取物品的整體特征,還需要額外提取細節信息。

這一步中,為了避免過度約束,團隊設計了一種用高頻圖表示特征信息的方式。

圖片

將目標圖像與Sobel算子等高通濾波器進行卷積,可以得到含高頻詳情的圖像。

同時,AnyDoor利用Hadamard對圖像中的RGB色彩信息進行提取。

結合這些信息和過濾邊緣信息的遮罩,得到了只含高頻細節的HF-Map。

圖片

最后一步就是將這些信息進行注入。

利用獲取到的token,AnyDoor通過文生圖模型對圖像進行合成。

具體來說,AnyDoor使用的是帶有ControlNet的Stable Diffusion。

AnyDoor的工作流程大致就是這樣。而在訓練方面,也有一些特殊的策略。

△AnyDoor使用的訓練數據集

盡管AnyDoor針對的是靜態圖像,但有一部分用于訓練的數據是從視頻當中提取出來的。

圖片

對于同一物體,視頻當中可以提取出包含不同背景的圖像。

將物體與背景分離后標注配對,就形成了AnyDoor的訓練數據。

不過雖然視頻數據有利于學習,但還存在質量問題需要解決。

于是團隊設計了自適應時間步采樣策略,在不同時刻分別采集變化和細節信息。

通過消融實驗結果可以看出,隨著這些策略的加入,CLIP和DINO評分均逐漸升高。

圖片

團隊簡介

論文的第一作者是香港大學博士生陳汐(Xi Chen),他曾經是阿里巴巴集團算法工程師。

陳汐的導師Hengshuang Zhao是本文的通訊作者,研究領域包括機器視覺、機器學習等。

此外,阿里方面還有來自達摩院、菜鳥集團的研究人員也參與了這一項目。

論文地址:https://arxiv.org/abs/2307.09481

責任編輯:張燕妮 來源: 量子位
相關推薦

2023-08-28 00:24:59

圖像場景

2024-10-17 11:09:46

2024-08-02 14:50:00

數據AI

2024-04-08 13:59:03

大模型Replicate

2015-02-09 15:25:52

換膚

2022-08-10 10:00:58

AR傳送門

2024-11-25 14:30:00

2025-06-09 08:40:00

2018-12-18 17:25:15

程序員

2021-07-15 16:58:45

數據庫RDS Postgre阿里云

2012-03-11 15:20:36

Android

2024-01-08 00:25:43

AI微軟PC

2025-01-17 10:30:00

Adobe生成式AI工具

2025-04-01 00:00:22

數據場景競品

2024-04-16 07:10:46

大模型AI自動生成視頻

2015-11-03 15:29:49

ONOS開放網絡操作系統SDN
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 五月婷婷丁香婷婷 | av黄色在线 | 亚洲精品二区 | 成人三级在线观看 | 久久综合久久久 | 日本黄色影片在线观看 | 在线观看视频一区 | 国产一区二区精 | 国产高清不卡 | 伊人久久伊人 | 日韩亚洲欧美综合 | www九色 | 宅女噜噜66国产精品观看免费 | 欧美精品成人 | 午夜国产 | 久久久久国产一区二区三区四区 | 亚洲协和影视 | 91精品久久久久久久久中文字幕 | a免费视频 | 男女视频网站 | av香港经典三级级 在线 | 久久成人精品一区二区三区 | 成人免费在线电影 | 国产亚洲精品a | 欧美中文字幕一区 | 欧美日韩第一页 | 精品三区| 国产福利视频网站 | 欧美男人亚洲天堂 | 国产高清在线精品一区二区三区 | 一区视频 | 日本精品视频 | 久久亚洲国产精品 | 欧美一区二区三区电影 | 久久国产区 | 久久久久久九九九九九九 | 在线观看av免费 | 日韩精品免费视频 | 国产一区不卡 | 91精品久久久久久久久久入口 | 九九热精品视频 |