成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

視頻分割大結局!浙大最新發布SAM-Track:通用智能視頻分割一鍵直達

人工智能 新聞
只需要一句話、一個點擊、一支畫筆,就能在任意場景分割追蹤任意物體!

近期,浙江大學ReLER實驗室將SAM與視頻分割進行深度結合,發布Segment-and-Track Anything (SAM-Track)。

SAM-Track賦予了SAM對視頻目標進行跟蹤的能力,并支持多種方式(點、畫筆、文字)進行交互。

在此基礎上,SAM-Track統一了多個傳統視頻分割任務,達成了一鍵分割追蹤任意視頻中的任意目標,將傳統視頻分割外推至通用視頻分割。

SAM-Track具有卓越的性能,在復雜場景下僅需單卡就能高質量地穩定跟蹤數百個目標。

圖片

項目地址:https://github.com/z-x-yang/Segment-and-Track-Anything

論文地址:https://arxiv.org/abs/2305.06558

效果展示

SAM-Track支持語言輸入作為Prompt。比如,給定類別文本「熊貓」,便可一鍵實例級分割追蹤所有屬于「熊貓」這一類別的目標。

圖片

也可進一步給出更詳細的描述,比如輸入文字「最左邊的熊貓」,SAM-Track可以定位至特定目標進行分割追蹤。

圖片

相較于傳統視頻追蹤算法,SAM-Track的另一個強大之處在于可對大量目標同時進行跟蹤分割,并自動檢測新出現的物體。

圖片

SAM-Track還支持多種交互方式組合使用,用戶可根據實際需求搭配。比如使用畫筆來框定與人體緊密連接的滑板,防止分割多余物體,而后使用點擊選擇人體。

全自動視頻目標分割與追蹤自然也不在話下,各種應用場景包括街景、航拍、AR、動畫、醫學圖像等,均可一鍵分割追蹤并自動檢測新出現的物體。

圖片

如果對自動分割結果不滿意,用戶可在此基礎上進行編輯修正,例如使用點擊來修正過分割的電車。

圖片

同時最新版本的SAM-Track支持對追蹤結果進行在線瀏覽,可選擇中間任意一幀的分割結果進行修改和新增目標,并再次追蹤。

圖片

為了方便用戶線上體驗,項目提供了WebUI,可通過Colab一鍵部署:

圖片

模型組成

SAM-Track模型基于ECCV'22 VOT Workshop四個賽道的冠軍方案DeAOT。

DeAOT是一個高效的多目標VOS模型,在給定首幀物體標注的情況下,可以對視頻其余幀中的物體進行追蹤分割。

DeAOT采用一種識別機制,將一個視頻中的多個目標嵌入到同一高維空間中,從而實現了同時對多個物體進行追蹤。

DeAOT在多物體追蹤方面的速度表現能夠與其他針對單個物體追蹤的VOS方法相媲美。

此外,通過基于分層的Transformer的傳播機制,DeAOT更好地聚合了長時序和短時序信息,表現出了優異的追蹤性能。

由于DeAOT需要參考幀的標注來初始化,為了提高便捷性,SAM-Track使用了最近在圖像分割領域大放異彩的Segment Anything Model(SAM)模型來獲取標注信息。

利用SAM出色的零樣本遷移能力,以及多種交互方式,SAM-Track能高效地為DeAOT獲取高質量的參考幀標注信息。

雖然SAM模型在圖像分割領域表現出色,但它無法輸出語義標簽,且文本提示也不能很好地支持Referring Object Segmentation及其他依賴深層語義理解的任務。

因此,SAM-Track模型進一步集成了Grounding-DINO,實現了高精度的語言引導的視頻分割。Grounding DINO是一個開放集合目標檢測模型,具有很好的語言理解能力。

根據輸入的類別或目標對象的詳細描述,Grounding-DINO可以檢測到目標并返回位置框。

SAM-Track模型架構

如下圖所示,SAM-Track模型支持了三種物體跟蹤模式,分別為交互跟蹤模式、自動跟蹤模式以及融合模式。

圖片

對于交互跟蹤模式,SAM-Track模型首先會應用SAM,在參考幀中利用點擊或畫框的方式選中目標,直到得到用戶滿意的交互分割結果。

如果想要實現語言引導的視頻物體分割,SAM-Track則會調用Grounding-DINO根據輸入的文本,先得到目標物體的位置框,并在此基礎上通過SAM得到感興趣物體的分割結果。

最后DeAOT將交互分割結果作為參考幀,對選中的目標進行追蹤。在追蹤的過程中,DeAOT會將過去幀中的視覺嵌入和高維ID嵌入分層傳播到當前幀中,實現逐幀追蹤分割多個目標對象。因此,SAM-Track能過支持多模態的交互方式來追蹤分割視頻中的感興趣物體。

然而,交互跟蹤模式無法處理視頻中出現的新出現的物體。限制了SAM-Track在特定領域的應用,例如,自動駕駛,智慧城市等。

為了進一步拓展SAM-Track的應用范圍和性能,SAM-Track實現了自動跟蹤模式,對視頻中出現的新物體進行追蹤。

自動跟蹤模式通過Segment Everything和Object of Interest Segmentation兩種方式來獲得每n幀中新出現的物體的注釋。對于新出現的物體的ID分配問題,SAM-Track采用了比較掩碼模塊(CMR)來確定新的對象的ID。

融合模式則是把交互跟蹤模式和自動跟蹤模式相結合。通過交互式跟蹤模式用戶可以很方便地獲取視頻中第一幀的注釋,而自動跟蹤模式則可以處理視頻后續幀中出現的未被選中的新對象。追蹤方法的組合擴大了SAM-Track的應用范圍,增加了SAM-Track的實用性。

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-04-23 15:42:18

圖像視頻

2023-04-25 11:36:17

CV模型

2023-03-28 16:37:38

論文視頻

2024-12-18 16:47:31

計算機視覺圖像分割

2024-07-30 10:51:51

2024-07-15 12:27:08

2020-03-04 09:35:55

開源技術 軟件

2023-07-10 15:00:34

圖像模型

2024-01-24 09:24:19

自動駕駛算法

2022-01-21 09:31:37

PythonLinux視頻

2023-04-06 13:44:41

摳圖AI

2013-11-27 10:52:48

360騰訊

2013-01-17 10:44:16

飛視美視頻網絡統一通信

2020-02-10 07:45:46

QQ騰訊QQ群

2025-04-01 00:00:22

數據場景競品

2024-01-04 17:03:48

微軟Windows

2024-08-15 08:31:35

SAM 2LLM大型語言模

2024-11-05 13:40:00

2012-11-06 09:30:28

WebWeb前端
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 天天干免费视频 | 精品一区二区在线观看 | 青青久久 | 91在线电影 | 色婷婷av99xx| 一区二区三区四区免费观看 | 少妇特黄a一区二区三区88av | 一区二区三区中文字幕 | 久久香蕉精品视频 | 尤物在线 | 亚洲一区| av在线天天| 超碰成人免费 | 成人黄色a | 国产一区 | 国产精品一区二区三级 | 午夜免费在线观看 | 亚洲一区二区视频在线播放 | 婷婷福利 | 精品欧美乱码久久久久久1区2区 | 97在线播放| 超碰免费在线 | 国产三级日本三级 | 中文字幕在线电影观看 | 日本精品一区二区三区在线观看 | 欧美日韩国产一区 | 欧美激情99| 亚洲国产成人久久综合一区,久久久国产99 | 四虎影院在线观看免费视频 | 国产精品久久久久久婷婷天堂 | 一区二区三区免费 | 日本一区二区三区免费观看 | 国产精品视频500部 a久久 | 久久久久久久一区 | 国产精品不卡一区 | 九九99靖品 | 狠狠久久 | 日韩精品a在线观看图片 | 成人一区二区三区在线观看 | 欧美一区免费 | 精品亚洲一区二区 |