成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

給1萬幀視頻做目標分割,顯存占用還不到1.4GB,代碼已開源

人工智能 新聞
這就是伊利諾伊大學厄巴納-香檳分校學者最新提出的一種長視頻目標分割方法XMem。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

咦,怎么好好的藤原千花,突然變成了“高溫紅色版”?

圖片

這大紫手,難道是滅霸在世??

圖片

如果你以為上面的這些效果只是對物體后期上色了,那還真是被AI給騙到了。

這些奇怪的顏色,其實是對視頻對象分割的表示。

但u1s1,這效果還真是讓人一時間分辨不出。

無論是萌妹子飛舞的發絲:

圖片

還是發生形狀改變的毛巾、物體之間來回遮擋:

圖片

AI對目標的分割都稱得上是嚴絲合縫,仿佛是把顏色“焊”了上去。

不只是高精度分割目標,這種方法還能處理超過10000幀的視頻。

而且分割效果始終保持在同一水平,視頻后半段依舊絲滑精細。

圖片

更意外的是,這種方法對GPU要求不高。

研究人員表示實驗過程中,該方法消耗的GPU內存從來沒超過1.4GB。

要知道,當下基于注意力機制的同類方法,甚至都不能在普通消費級顯卡上處理超過1分鐘的視頻。

這就是伊利諾伊大學厄巴納-香檳分校學者最新提出的一種長視頻目標分割方法XMem

目前已被ECCV 2022接收,代碼也已開源。

如此絲滑的效果,還在Reddit上吸引不少網友圍觀,熱度達到800+。

圖片

網友都在打趣說:

為什么要把你的手涂成紫色?

誰知道滅霸是不是有計算機視覺方面的愛好呢?

圖片

模仿人類記憶法

目前已有的視頻對象分割方法非常多,但是它們要么處理速度比較慢,要么對GPU要求高,要么精度不夠高。

而本文提出的方法,可以說是兼顧了以上三方面。

不僅能對長視頻快速進行對象分割,畫面幀數可達到20FPS,同時在普通GPU上就能完成。

其特別之處在于,它受人類記憶模式所啟發。

1968年,心理學家阿特金森和希夫林提出多重存儲模型(Atkinson-Shiffrin memory model)。

該模型認為,人類記憶可以分為3種模式:瞬時記憶、短期記憶和長期記憶。

參考如上模式,研究人員將AI框架也劃分出3種內存方式。分別是:

  • 及時更新的瞬時內存
  • 高分辨率工作內存
  • 密集長期記憶內存。

圖片

其中,瞬時內存會每幀更新一次,來記錄畫面中的圖像信息。

工作內存從瞬時內存中收集畫面信息,更新頻率為每r幀一次。

當工作內存飽和時,它會被壓縮轉移到長期內存里。

而長期內存也飽和時,會隨著時間推移忘記過時的特征;一般來說這會在處理過數千幀后才會飽和。

這樣一來,GPU內存也就不會因為時間推移而不足了。

通常,對視頻目標進行分割會給定第一幀的圖像和目標對象掩碼,然后模型會跟蹤相關目標,為后續幀生成相應的掩碼。

具體來看,XMem處理單幀畫面的過程如下:

圖片

整個AI框架由3個端到端卷積網絡組成。

一個查詢編碼器(Query encoder)用來追蹤提取查詢特定圖像特征。

一個解碼器(Decoder)負責獲取內存讀取步驟的輸出,以生成對象掩碼。

一個值編碼器(Value encoder)可以將圖像和目標的掩碼相結合,從而來提取新的內存特征值。

最終值編碼器提取到的特征值會添加到工作內存中。

從實驗結果來看,該方法在短視頻和長視頻上,都實現了SOTA。

圖片

在處理長視頻時,隨著幀數的增加,XMem的性能也沒有下降。

圖片

研究團隊

作者之一為華人Ho Kei (Rex) Cheng

圖片

他研究生畢業于香港科技大學,目前在伊利諾伊大學厄巴納-香檳分校讀博。

研究方向為計算機視覺。

他先后有多篇論文被CVPR、NeurIPS、ECCV等頂會接收。

另一位作者是 Alexander G. Schwing。

圖片

他現在是伊利諾伊大學厄巴納-香檳分校的助理教授,博士畢業于蘇黎世聯邦理工學院。

研究方向為機器學習和計算機視覺。

論文地址:
https://arxiv.org/abs/2207.07115

GitHub:
https://github.com/hkchengrex/XMem

責任編輯:張燕妮 來源: 量子位
相關推薦

2019-05-14 09:53:31

代碼開發工具

2021-11-10 15:24:25

AI 數據人工智能

2025-03-07 10:02:10

2021-12-23 10:20:12

Windows 11代碼Windows

2021-11-08 10:15:50

代碼Windows 11Windows

2016-03-07 13:49:19

2020-03-03 11:00:11

代碼開發工具

2024-07-09 09:36:17

2025-06-04 13:51:43

視頻生成模型

2012-03-16 16:22:55

筆記本評測

2025-06-03 14:15:33

視頻生成開源

2011-10-28 15:08:10

喬布斯開源

2024-07-30 10:51:51

2020-09-07 14:25:57

開源技術 數據

2022-05-06 15:14:20

視頻數據

2025-03-27 12:20:25

2019-08-29 11:33:33

無人駕駛谷歌Uber

2019-06-03 11:17:57

靜態頁面項目

2024-06-11 07:40:00

2016-03-25 14:11:29

NVIDIA
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 精品一区二区视频 | 国内精品久久久久 | 高清国产一区二区 | 国产亚洲成av人片在线观看桃 | 欧美成ee人免费视频 | 91精品国产一区二区三区 | 精品九九九 | a级网站 | 久久精品免费 | 91文字幕巨乱亚洲香蕉 | 欧美a在线看 | www.日本三级 | 日韩欧美在线免费 | 亚洲精品一区久久久久久 | 国产成人精品久久二区二区91 | 香蕉一区二区 | 欧美男人天堂 | 91亚洲欧美 | 亚洲欧美日韩高清 | 午夜欧美一区二区三区在线播放 | 欧美亚洲国产一区二区三区 | 日韩精品视频一区二区三区 | 国外激情av | 久久亚洲一区二区三 | 亚洲国产欧美在线 | 欧美精品网 | 草久视频 | 日本不卡免费新一二三区 | 91麻豆精品国产91久久久更新资源速度超快 | 九九热在线免费观看 | 精品免费视频 | 亚洲视频一区在线播放 | 免费一区二区三区 | 亚洲成人999 | 日韩一区二区三区视频 | 黄片毛片免费看 | 国产成人一区在线 | 天天操人人干 | 亚洲在线一区二区 | av 一区二区三区 | 欧美在线a |