成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

華人團隊顛覆CV!SEEM完美分割一切爆火,一鍵分割「瞬息全宇宙」

人工智能 新聞
繼SAM之后,威斯康辛麥迪遜、微軟、港科大等機構的研究人員提出SEEM模型,通過不同的視覺提示和語言提示,一鍵分割圖像、視頻。

Meta的「分割一切」的橫空出世,讓許多人驚呼CV不存在了。

基于這一模型,眾網友紛紛做了進一步工作,比如Grounded SAM。

將Stable Diffusion、Whisper、ChatGPT結合使用,就能做到通過語音讓一只狗變成一只猴子。

圖片

而現在,不僅僅是語音,你可以通過多模態提示實現一次性分割所有地方的一切。

具體怎么做?

鼠標點一下,直接選中分割內容。

圖片

張口一句話。

圖片

隨手一涂,完整的表情包就來了。

圖片

甚至,還能分割視頻。

圖片

最新研究SEEM是由威斯康星大學麥迪遜分校、微軟研究院等機構的學者共同完成。

通過SEEM使用不同種類的提示,視覺提示(點、標記、框、涂鴉和圖像片段)、以及語言提示(文本和音頻)輕松分割圖像。

圖片

論文地址:https://arxiv.org/pdf/2304.06718.pdf

這個論文標題有意思的地方在于,與2022年上映的一部美國科幻電影「瞬息全宇宙」(Everything Everywhere All at Once)的名字非常相似。

圖片

英偉達科學家Jim Fan表示,奧斯卡最佳論文標題獎頒給「Segment Everything Everywhere All at Once」

擁有一個統一的、多功能的任務規范界面是擴大大型基礎模型規模的關鍵。多模態提示是未來的方向。

圖片

看過論文后,網友表示,CV現在也要開始擁抱大模型了,研究生未來出路在哪?

圖片

奧斯卡最佳標題論文

正是受到基于提示的LLMs通用接口發展的啟發,研究人員提出了SEEM。

如圖所示,SEEM模型可以在沒有提示的開放集中執行任何分割任務,比如語義分割、實例分割和全景分割。

圖片

此外,它還支持任意組合的視覺,文本和引用區域提示,允許多功能和交互式的引用分割。

在模型架構上,SEEM采用了常見的編碼器-解碼器架構。其獨特的地方在于具有查詢和提示之間復雜的交互。

圖片

特征和提示被相應的編碼器,或采樣器編碼到一個聯合的視覺語義空間。

可學習查詢是隨機初始化,SEEM解碼器接受可學習查詢、圖像特征和文本提示作為輸入和輸出,包括類和掩碼嵌入,用于掩碼和語義預測。

值得一提的是,SEEM模型有多輪交互。每一輪都包含一個人工循環和一個模型循環。

在人工循環中,人工接收上一次迭代的掩碼輸出,并通過視覺提示給出下一輪解碼的正反饋。在模型循環中,模型接收并更新未來預測的記憶提示。

圖片

通過SEEM,給一個擎天柱卡車的圖,就能分割任何目標圖像上的擎天柱。

圖片

通過用戶輸入的文本生成掩模,進行一鍵分割。

圖片

另外,SEEM通過對引用圖像的簡單點擊,或涂鴉,就能夠對目標圖像上有相似語義的對象進行分割。

圖片

此外,SEEM非常了解解空間關系。左上行斑馬被涂鴉后,也會分割出最左邊的斑馬。

圖片

SEEM還可以將圖像引用到視頻掩碼,不需要任何視頻數據訓練,都能完美分割視頻。

圖片

圖片

數據集和設置上,SEEM在三種數據集接受了訓練:全景分割,引用分割和交互式分割。

交互式分割

在交互式分割上,研究者將SEEM與最先進的交互式分割模型進行了比較。

作為一個通用模型,SEEM獲得了RITM,SimpleClick等相當的性能。而且與SAM取得非常相似的性能,SAM還多用了50個分割數據進行訓練。

值得注意的是,與現有的交互式模型不同,SEEM是第一個不僅支持經典的分割任務,而且還支持廣泛的多模態輸入,包括文本、點、涂鴉、邊界框和圖像,提供了強大的組合能力。

圖片

通用分割

通過對所有分割任務預先訓練的一組參數,研究者可以直接評估它在通用分割數據集上的性能。

SEEM實現了比較好的全景視圖,實例和語義分割性能。

圖片

研究人員對SEEM有四個期望目標:

1. 多功能性:通過引入多功能提示引擎處理不同類型的提示,包括點、框、涂鴉、遮罩、文本和另一圖像的引用區域;

2. 復合性:通過學習一個聯合視覺-語義空間,為視覺和文本提示組合即時查詢進行推理;

3. 交互性:通過整合可學習的記憶提示,通過掩碼引導的交叉注意力保留對話歷史信息;

4. 語義感知:通過使用文本編碼器對文本查詢和遮罩標簽進行編碼,實現開放詞匯表的分割。

和SAM區別

Meta提出的SAM模型,可以在一個統一框架prompt encoder內,指定一個點、一個邊界框、一句話,一鍵分割出物體。

圖片

SAM具有廣泛的通用性,即具有了零樣本遷移的能力,足以涵蓋各種用例,不需要額外訓練,就可以開箱即用地用于新的圖像領域,無論是水下照片,還是細胞顯微鏡。

圖片

研究者就三個分割任務(邊緣檢測、開放集和交互式分割)的交互和語義能力對SEEM和SAM進行了比較。

在開放集分割上,同樣需要高水平的語義,并且不需要交互。

與SAM相比,SEEM涵蓋了更廣泛的交互和語義層次。

SAM只支持有限的交互類型,比如點和邊界框,而忽視了高語義任務,因為它本身不輸出語義標簽。

對于SEEM,研究者點出了兩個亮點:

首先,SEEM有一個統一的提示編碼器,將所有的視覺和語言提示編碼到一個聯合表示空間中。因此,SEEM可以支持更通用的用法,它有可能擴展到自定義提示。

其次,SEEM在文本掩碼和輸出語義感知預測方面做得很好。

圖片

作者介紹

論文一作Xueyan Zou

她目前是威斯康星大學麥迪遜分校的計算機科學系博士生,導師是Yong Jae Lee教授。

在此之前,Zou在加州大學戴維斯分校度過了三年時光,由同一位導師指導,并與Fanyi Xiao博士密切合作。

她在香港浸會大學獲得了學士學位,由PC Yuen教授和褚曉文教授指導。

圖片

Jianwei Yang

圖片

Yang是Redmond微軟研究院深度學習組的高級研究員,由高劍峰博士指導。

Yang的研究主要集中在計算機視覺、視覺與語言和機器學習。他主要研究不同層次的結構化視覺理解,以及如何進一步利用它們通過語言和環境的體現與人類進行智能交互。

在2020年3月加入微軟之前,Yang在佐治亞理工學互動計算學院獲得了計算機科學博士學位,他的導師是Devi Parikh教授,他還與Dhruv Batra教授密切合作。

高劍峰

圖片

高劍峰是微軟研究院的杰出科學家和副總裁,IEEE會員,以及ACM杰出會員。

目前,高劍峰領導著深度學習小組。該小組的任務是推動深度學習的最先進技術及其在自然語言和圖像理解方面的應用,并在對話模型和方法方面取得進展。

研究主要包括,用于自然語言理解和生成的神經語言模型、神經符號計算、視覺語言的基礎和理解、對話式人工智能等等。

2014年到2018年,高劍峰在微軟人工智能與研究部和Redmond微軟研究院的深度學習技術中心(DLTC)擔任商業人工智能的合作伙伴研究經理。

2006年到2014年,高劍峰在自然語言處理組擔任首席研究員。

Yong Jae Lee

圖片

Lee是華盛頓大學麥迪遜分校計算機科學系的副教授。

他在2021年秋季加入華盛頓大學麥迪遜分校之前,曾在Cruise擔任過一年的人工智能客座教師,在此之前,他在加州大學戴維斯分校擔任了6年的助理和副教授。

他還曾在卡內基梅隆大學的機器人研究所做了一年的博士后研究員。

他于2012年5月在德克薩斯大學奧斯汀分校獲得博士學位,師從Kristen Grauman,并于2006年5月在伊利諾伊大學厄巴納-香檳分校獲得學士學位。

他還曾作為微軟研究院的暑期實習生與Larry Zitnick和Michael Cohen一起工作。

目前,Lee的研究集中在計算機視覺和機器學習。Lee對創建強大的視覺識別系統格外感興趣,該系統可以在最少的人類監督下理解視覺數據。

目前,SEEM已經開放了演示demo:

https://huggingface.co/spaces/xdecoder/SEEM

快上手試試吧。

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-04-25 11:36:17

CV模型

2023-11-22 11:40:00

Meta模型

2023-04-10 15:52:57

模型樣本

2024-07-30 10:51:51

2023-04-27 09:27:44

視頻AI

2024-03-01 10:04:11

研究訓練編碼器

2021-09-22 09:25:38

AI 數據人工智能

2023-05-04 12:19:47

模型AI

2023-08-09 17:38:47

模型AI

2025-03-10 13:11:00

2015-07-03 10:08:50

Apple Watch市場滯銷

2023-05-19 13:24:20

模型AI

2023-10-05 12:28:41

AI論文

2024-07-30 14:45:08

2025-03-13 11:11:04

2023-09-07 15:11:44

2023-12-07 07:16:57

Meta訓練

2023-04-06 13:44:41

摳圖AI

2023-07-17 13:14:45

模型分割

2023-12-06 13:36:00

模型數據
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 羞羞视频免费观 | 国产精品区一区二 | 久久av.com| 国产精品久久久久永久免费观看 | 久久一 | 久久久久久久一区 | 91在线免费视频 | 国产电影一区二区在线观看 | 国产999精品久久久影片官网 | 久久天堂| 国产精品jizz在线观看老狼 | 在线中文字幕av | 欧美另类视频 | 免费在线观看成年人视频 | 超碰97人人人人人蜜桃 | 国产精品久久久久久久模特 | 欧美美女一区二区 | 亚洲精品一区二区三区在线 | 国产成人久久精品一区二区三区 | 欧美黄在线观看 | 91精品国产乱码久久久 | 亚洲视频国产 | 日韩av成人 | 免费在线国产视频 | 欧美精品一区二区三区四区 在线 | 久久精品亚洲精品国产欧美kt∨ | 欧美日韩成人网 | 色婷婷一区二区三区四区 | 99在线精品视频 | 一级欧美视频 | 亚洲一区二区三区久久久 | 99伊人网| 国产欧美精品一区二区色综合朱莉 | 香蕉久久av | 中文字幕在线观看第一页 | 日本三级在线网站 | av永久免费 | 国产精品一区二区三区在线 | 免费成人高清在线视频 | 亚洲人成在线观看 | 国产激情毛片 |