成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

分割一切還不夠,還要視頻跟蹤一切,《清明上河圖》也能輕松拿下

人工智能 新聞
南方科技大學鄭鋒團隊的這項研究:Track Anything ,很好的解決了 SAM 在視頻領域的短板。

本月初,Meta 發布「分割一切」AI 模型(Segment Anything Model,簡稱 SAM),可以為任何圖像或視頻中的任何物體生成 mask,甚至包括沒有見過的物體和圖像。有人將這一研究比喻為計算機視覺領域的 GPT-3 時刻之一。

Meta 表示,「SAM 已經學會了關于物體的一般概念,可以為任何圖像或視頻中的任何物體生成 mask,甚至包括在訓練過程中沒有遇到過的物體和圖像類型。SAM 足夠通用,可以涵蓋廣泛的用例,并且可以在新的圖像『領域』即開即用,無需額外的訓練?!?/span>

該模型一經發布,迅速引起計算機視覺領域的轟動,更是有人發出「CV 不存在了」這樣的感慨。

然而目前 SAM 的應用主要集中在圖像領域,在視頻領域的應用仍然未被深入探索,尤其是對視頻目標的跟蹤 / 分割,仍是巨大挑戰。同時,現有的跟蹤模型的局限性也很明顯,如,場景切換在現實視頻中很常見,而現有的跟蹤模型只能在單一場景下實現目標的精準定位;現有的模型要求準確的模版初始化,需要人為提供目標邊界框或精準掩碼,因而可用性被極大限制。

近日,南方科技大學鄭鋒團隊提出了「跟蹤一切」(Track Anything  Model ,TAM)的交互工具,其在視頻中實現高性能的交互式跟蹤和分割。Track Anything 是基于 SAM 的二次創作模型,適用于視頻領域任意目標的跟蹤任務,可以通過簡單的鼠標點擊實現對任意視頻任意目標的像素級跟蹤,實現了目標跟蹤的交互性、靈活性、可用性。

圖片

  • 論文地址:https://arxiv.org/pdf/2304.11968.pdf
  • 項目地址:https://github.com/gaomingqi/Track-Anything
  • Demo 地址:https://huggingface.co/spaces/watchtowerss/Track-Anything

Track Anything:交互式跟蹤任意視頻任意目標

Track Anything 效果到底如何呢?我們先從幾個示例來說明。首先是多目標跟蹤與分割?!肚迕魃虾訄D》大家早已耳聞,畫中人物眾多、形態各異,其間還穿插各種動作等等。想要跟蹤里面的目標難度還是比較大的。下面視頻顯示 Track Anything 很好的跟蹤了物體。

接下來考察 Track Anything 在快速運動場景下的跟蹤能力。眾所周知,打籃球需要動作敏捷、健步如飛…… 用 AI 技術跟蹤一位籃球運動員并不容易,加之運動員動作幅度大、相互之間出現遮擋等,都加大了跟蹤難度,出現錯誤跟蹤、漏跟蹤情況。但從下面展示的效果來看,即便是在瞬息萬變的籃球比賽,Track Anything 跟蹤效果都做的非常好。

接下來,我們在看一個示例。從下面視頻中可以看到,一位身姿矯健的男生靈活的跨越眾多障礙,即便人的運動速度再快、動作再復雜等,Track Anything 都能很好的處理。

由于 Track Anything 跟蹤效果非常好,受到廣大網友的好評。就像下面這位網友所說的:「這項研究給人一種強烈的終結者的感覺。SAM 在分割圖像方面很在行,但在視頻方面卻不出色,而TMA僅通過少量人工輸入,就能很好的實現對視頻中物體的跟蹤與分割。」

圖片

技術介紹

鄭鋒團隊通過以使用者為中介的 SAM 與 VOS 模型的交互式組合,提出了 Track Anything 工具,它擁有強大的視頻目標跟蹤能力,并提供用戶友好的操作界面,只需要簡單的點擊操作,就可以任意地跟蹤用戶感興趣的一個或多個目標區域,還可以根據用戶需求靈活調整目標對象,并自帶用戶糾錯和視頻編輯功能。其技術流程如下:

1 基于 SAM,用戶通過正負樣本點的選取,確定目標對象在視頻中某一幀的空間區域。

2 使用用戶確定的區域作為模板初始化跟蹤模型。跟蹤過程中,通過建立每個視頻幀與模板區域之間的密集關聯,實現將用戶選取信息向整個視頻的傳遞過程,從而實現目標跟蹤。

3 跟蹤過程中,用戶可以隨時暫停,同樣通過正負樣本選取的方式,實現對其他目標的追蹤,或修正當前目標追蹤的結果。

4 基于跟蹤結果,用戶可以使用目標擦除或視頻修復功能,實現在視頻中對特定區域的編輯。

圖片

總之,通過 Track Anything,使用者可以輕松地完成視頻中單個或多個目標的精確標注,視頻特定區域提取及編輯,以及長時 / 轉場視頻中的目標跟蹤。

相關功能陸續上線中,歡迎大家試用!

鄭鋒團隊不僅在視頻領域研發了Track-Anything,還在圖像和語言領域還推出了Caption-Anything系統。它是一個多功能的圖像處理工具,結合了Segment Anything、Visual Captioning和ChatGPT在圖像和語言領域的能力。項目地址:https://github.com/ttengwang/Caption-Anything/。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-07-30 10:51:51

2012-03-16 17:19:28

2016-08-31 17:24:05

大數據分析

2012-12-31 11:22:58

開源開放

2020-09-11 10:55:10

useState組件前端

2014-08-01 09:25:07

2021-02-28 09:47:54

軟件架構軟件開發軟件設計

2012-11-05 15:22:59

康普光纜DCD

2018-11-23 11:17:24

負載均衡分布式系統架構

2021-02-19 23:08:27

軟件測試軟件開發

2021-09-01 07:21:39

Exporter指標監控

2023-05-04 12:19:47

模型AI

2025-03-10 13:11:00

2023-12-07 07:16:57

Meta訓練

2018-02-25 05:45:35

2020-09-16 11:46:05

AI

2020-10-14 08:04:28

JavaScrip

2021-05-28 07:12:59

Python閉包函數

2012-10-31 09:24:07

刀片服務器能效數據中心

2014-03-05 09:29:46

程序員繪畫
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日日人人| 成人美女免费网站视频 | 欧美日韩专区 | 日日爽| 羞羞视频在线观看 | 免费在线观看成人av | 欧美精品一区二区三区在线播放 | 91人人看 | 国产精品99久久久久久久久久久久 | 福利视频网站 | 日本成人在线网址 | 日韩视频精品在线 | 欧洲亚洲一区 | 国产精品久久久久久久午夜 | 国产高清精品一区二区三区 | 欧美国产激情二区三区 | 亚洲精品国产区 | 精品九九久久 | 欧美一级黄视频 | 中文字幕观看 | 欧美综合一区二区 | 国产高清一区二区三区 | 高清视频一区 | 欧美亚洲视频 | 三区在线| www国产成人免费观看视频,深夜成人网 | 亚州综合一区 | 玖玖综合网 | 国产精品一区二区三区免费观看 | 成人三级在线播放 | 亚洲一区综合 | 亚洲国产精品一区二区三区 | 九九热这里只有精品6 | 一区二区三区视频 | 亚洲免费观看视频网站 | 美女一级黄 | 日韩欧美在线不卡 | 国产精品久久久久久久模特 | 亚洲 成人 av | 天天综合网天天综合 | 亚洲国产精品一区二区久久 |