成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

完美摳圖王冰冰!字節實習生開發的AI,實現4K60幀視頻實時摳圖

新聞 人工智能
這是AI拿來視頻實時摳圖后的效果。沒想到吧,實時視頻摳圖,現在能精細到每一根發絲。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

看這一頭蓬松的秀發,加上帥氣的動作,你以為是在綠幕前拍大片?

No、No、No

這其實是AI拿來視頻實時摳圖后的效果。

沒想到吧,實時視頻摳圖,現在能精細到每一根發絲

換到alpha通道再看一眼,不用多說,德芙打錢吧(手動狗頭)。

這就是來自字節跳動實習生小哥的最新研究:實時高分辨率視頻摳圖大法。

無需任何輔助輸入,把視頻丟給這個名為RVM的AI,它分分鐘就能幫你把人像高精度摳出,將背景替換成可以任意二次加工的綠幕。

不信有這么絲滑?我們用線上Demo親自嘗試了一波。

相比之下,現在在線會議軟件里的摳圖,一旦頭發遮住臉,人就會消失……

頭發絲更是明顯糊了。

難怪看得網友直言:

不敢想象你們把這只AI塞進手機里的樣子。

目前,這篇論文已經入選WACV 2022。

你也可以上手一試

目前,RVM已經在GitHub上開源,并給出了兩種試玩途徑:

于是我們也趕緊上手試了試。

先來看看效果:

首先來點難度低的。

對于這種人物在畫面中基本不移動的情況,RVM可以說是表現的非常好,和人工摳圖幾乎無差別。

現在,王冰冰進入動森都毫不違和了。

于是開腦洞,也變得簡單了許多……

咳咳,言歸正傳。人物動作幅度加大會怎樣呢?

對于多人舞蹈視頻而言,RVM的表現也很nice。

即便動來動去、頭發亂甩,也沒有影響它的摳圖效果。

只有在人物出現遮擋的情況下,才會出現瑕疵。

對比前輩方法MODNet,確實有不小的進步。

不過我們也發現,如果視頻的背景較暗,就會影響RVM的發揮。

比如在這種背景光線昏暗的情況下,摳圖的效果就非常不盡人意了。

可以看到,博主老哥的頭發完全糊了。

而且身體的邊界線也不夠清晰。

所以,如果你想自己拍視頻試玩,就一定要選擇光線充足的場景。

利用時間信息

那么這樣的“魔法”,具體又是如何實現的?

照例,我們先來扒一扒論文~

實際上,有關視頻摳圖的算法如今已不鮮見,其中大多數采用的是將視頻中的每一幀作為獨立圖像來實現摳圖的方法。

不同與此,在這篇論文中,研究人員構建了一個循環架構,利用上了視頻的時間信息,在時間一致性摳圖質量上取得了明顯改進。

從上圖中可以看出,RVM的網絡架構包括3個部分:

  • 特征提取編碼器,用來提取單幀特征;
  • 循環解碼器,用于匯總時間信息;
  • 深度引導濾波(DGF)模塊,用于高分辨率上采樣。

其中,循環機制的引入使得AI能夠在連續的視頻流中自我學習,從而了解到哪些信息需要保留,哪些信息可以遺忘掉。

具體而言,循環解碼器采用了多尺度ConvGRU來聚合時間信息。其定義如下:

在這個編碼器-解碼器網絡中,AI會完成對高分辨率視頻的下采樣,然后再使用DGF對結果進行上采樣。

除此之外,研究人員還提出了一種新的訓練策略:同時使用摳圖和語義分割目標數據集來訓練網絡。

這樣做到好處在于:

首先,人像摳圖與人像分割任務密切相關,AI必須學會從語義上理解場景,才能在定位人物主體方面具備魯棒性。

其次,現有的大部分摳圖數據集只提供真實的alpha通道和前景信息,所以必須對背景圖像進行合成。但前景和背景的光照往往不同,這就影響了合成的效果。語義分割數據集的引入可以有效防止過擬合。

最后,語義分割數據集擁有更為豐富的訓練數據。

經過這一番調教之后,RVM和前輩們比起來,有怎樣的改進?

從效果對比中就可以明顯感受到了:

另外,與MODNet相比,RVM更輕更快

從下面這張表格中可以看出,在1080p視頻上RVM的處理速度是最快的,在512×288上比BGMv2略慢,在4K視頻上則比帶FGF的MODNet慢一點。研究人員分析,這是因為RVM除了alpha通道外還預判了前景。

更直觀的數據是,在英偉達GTX 1080Ti上,RVM能以76FPS的速度處理4K視頻,以104FPS的速度處理HD視頻。

一作字節跳動實習生

這篇論文是一作林山川在字節跳動實習期間完成的。

[[420430]]

他本科、碩士均畢業于華盛頓大學,曾先后在Adobe、Facebook等大廠實習。

2021年3月-6月,林山川在字節跳動實習。8月剛剛入職微軟。

事實上,林山川此前就曾憑借AI摳圖大法拿下CVPR 2021最佳學生論文榮譽獎

他以一作身份發表論文《Real-Time High-Resolution Background Matting》,提出了Background Matting V2方法。

這一方法能夠以30FPS的速度處理4K視頻,以60FPS的速度處理HD視頻。

值得一提的是,Background Matting這一系列方法不止一次中了CVPR。此前,第一代Background Matting就被CVPR 2020收錄。

兩次論文的通訊作者都是華盛頓大學副教授Ira Kemelmacher-Shlizerman,她的研究方向為計算機視覺、計算機圖形、AR/VR等。

[[420431]]

此外,本次論文的二作為Linjie Yang,他是字節跳動的研究科學家。本科畢業于清華大學,在香港中文大學獲得博士學位。

[[420432]]

對了,除了能在Colab上試用之外,你也可以在網頁版上實時感受一下這只AI的效果,地址拿好:

https://peterl1n.github.io/RobustVideoMatting/#/demo

GitHub地址:
https://github.com/PeterL1n/RobustVideoMatting
論文地址:
https://arxiv.org/abs/2108.11515
參考鏈接:
https://www.reddit.com/r/MachineLearning/comments/pdbpmg/r_robust_highresolution_video_matting_with/

 

 

責任編輯:張燕妮 來源: 量子位
相關推薦

2020-12-16 16:13:49

人工智能機器學習技術

2020-10-23 15:29:48

iPad摳圖PC

2021-09-02 15:25:54

技術視頻摳圖

2020-12-07 17:32:24

AI視頻視頻摳圖

2018-01-03 10:00:39

深度學習摳圖消除背景

2025-04-18 09:21:00

2023-08-02 07:25:52

在線圖片編輯器

2020-04-07 14:45:35

開源摳圖 技術

2012-11-19 13:53:42

職場Google實習生

2021-01-03 17:24:01

人工智能AI

2020-06-18 15:53:06

Python代碼摳圖

2019-10-30 15:05:44

AI 數據人工智能

2024-01-09 15:51:56

Rust開發Trait

2015-04-14 15:05:35

Web前端開發騰訊暑期實習生

2022-03-08 09:06:33

模型文本摳圖

2024-07-11 16:33:50

2010-10-12 11:06:07

招聘

2013-06-07 09:59:40

Google實習面試

2021-11-27 07:09:39

P 圖工具工具應用軟件

2014-01-07 09:23:41

項目管理
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 成人免费小视频 | 在线电影日韩 | 久久国产精99精产国高潮 | 欧美日本在线观看 | 日本在线黄色 | 国产午夜精品视频 | 中文字幕日韩欧美一区二区三区 | 澳门永久av免费网站 | 久久中文字幕一区 | 日韩中文在线观看 | 狠狠艹| 欧洲妇女成人淫片aaa视频 | 午夜天堂| 网站黄色在线 | 伊人久久大香线 | 日本三级全黄三级三级三级口周 | 国产二区三区 | 久久精品视频免费观看 | 国产精品久久久久久久7电影 | 日韩精品一区二区三区在线播放 | 免费观看黄 | 成人综合久久 | 91精品在线播放 | 先锋资源吧 | 少妇特黄a一区二区三区88av | 久久成人一区二区三区 | 日韩欧美精品一区 | 久久国产综合 | 亚洲男人的天堂网站 | 国产美女免费视频 | 一级黄色av电影 | 一区二区三区四区免费在线观看 | 欧洲亚洲一区二区三区 | 亚洲免费视频网址 | 中文字幕免费观看 | 成人三级在线播放 | 久久久久国产精品一区二区 | 亚洲一区二区三区乱码aⅴ 四虎在线视频 | 欧美自拍日韩 | 国产精品精品久久久 | www.久|