成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

輕量級(jí)MobileSAM:比FastSAM快4倍,處理一張圖像僅需10ms

人工智能 新聞
今天分享研究了通用的零樣本分割,在不需要任何訓(xùn)練樣本的情況下,實(shí)現(xiàn)新類(lèi)別的全景、實(shí)例和語(yǔ)義分割。

本文經(jīng)計(jì)算機(jī)視覺(jué)研究院公眾號(hào)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。

圖片

論文地址:https://arxiv.org/pdf/2306.14289.pdf

代碼地址:https://github.com/ChaoningZhang/MobileSAM

01  概要簡(jiǎn)介

SAM是一種prompt-guided的視覺(jué)基礎(chǔ)模型,用于從其背景中剪切出感興趣的對(duì)象。自Meta研究團(tuán)隊(duì)發(fā)布SA項(xiàng)目以來(lái),SAM因其令人印象深刻的零樣本傳輸性能和與其他模型兼容的高度通用性而備受關(guān)注,用于高級(jí)視覺(jué)應(yīng)用,如具有細(xì)粒度控制的圖像編輯。

圖片

許多這樣的用例需要在資源受限的邊緣設(shè)備上運(yùn)行,比如移動(dòng)應(yīng)用程序。今天分享中,我們的目標(biāo)是通過(guò)用輕量級(jí)圖像編碼器取代重量級(jí)圖像編碼器,使SAM對(duì)移動(dòng)友好。原始SAM文件中訓(xùn)練這種新SAM的方式會(huì)導(dǎo)致性能不令人滿(mǎn)意,尤其是當(dāng)可用的訓(xùn)練來(lái)源有限時(shí)。

我們發(fā)現(xiàn),這主要是由圖像編碼器和掩模解碼器的耦合優(yōu)化引起的,因此提出了解耦蒸餾。具體地說(shuō),將原始SAM中的圖像編碼器ViT-H的知識(shí)提取到一個(gè)輕量級(jí)的圖像編碼器中,該編碼器可以自動(dòng)與原始SAM中的掩碼解碼器兼容。

圖片

The overview of Segment Anything Model

Parameters SAM with different image encoders

圖片

訓(xùn)練可以在不到一天的時(shí)間內(nèi)在單個(gè)GPU上完成,由此產(chǎn)生的輕量級(jí)SAM被稱(chēng)為MobileSAM,它比原始SAM小60多倍,但性能與原始SAM相當(dāng)。就推理速度而言,MobileSAM每幅圖像運(yùn)行約10ms:圖像編碼器運(yùn)行8ms,掩碼解碼器運(yùn)行2ms。憑借卓越的性能和更高的通用性,我們的MobileSAM比并發(fā)的FastSAM小7倍,快4倍,更適合移動(dòng)應(yīng)用。

02 新框架

Background and Project Goal

  • Background on SAM

在這里,我們首先總結(jié)SAM的結(jié)構(gòu)及其工作原理。SAM由一個(gè)基于ViT的圖像編碼器和一個(gè)提示引導(dǎo)掩碼解碼器組成。圖像編碼器將圖像作為輸入并生成嵌入,然后將嵌入提供給掩碼解碼器。掩碼解碼器生成一個(gè)掩碼,根據(jù)點(diǎn)(或框)等提示從背景中剪切出任何對(duì)象。此外,SAM允許為同一提示生成多個(gè)掩碼,以解決模糊性問(wèn)題,這提供了寶貴的靈活性。考慮到這一點(diǎn),這項(xiàng)工作保持了SAM的流水線(xiàn),首先采用基于ViT的編碼器來(lái)生成圖像嵌入,然后采用提示引導(dǎo)解碼器來(lái)生成所需的掩碼。這條管道是為“分段任何東西”而優(yōu)化設(shè)計(jì)的,可用于“分段所有東西”的下游任務(wù)。

SAM的耦合知識(shí)蒸餾。左圖表示完全耦合蒸餾,右圖表示半耦合蒸餾。

圖片

  • Project goal

該項(xiàng)目的目標(biāo)是生成一個(gè)移動(dòng)友好型SAM(MobileSAM),以輕量級(jí)的方式實(shí)現(xiàn)令人滿(mǎn)意的性能,并且比原始SAM快得多。原始SAM中的提示引導(dǎo)掩碼解碼器的參數(shù)小于4M,因此被認(rèn)為是輕量級(jí)的。給定編碼器處理的圖像嵌入,如他們的公開(kāi)演示中所示,SAM可以在資源受限的設(shè)備中工作,因?yàn)檠诖a解碼器是輕量級(jí)的。然而,原始SAM中的默認(rèn)圖像編碼器是基于ViT-H的,具有超過(guò)600M的參數(shù),這是非常重量級(jí)的,并使整個(gè)SAM管道與移動(dòng)設(shè)備不兼容。因此,獲得移動(dòng)友好SAM的關(guān)鍵在于用輕量級(jí)的圖像編碼器取代重量級(jí)的圖像編碼器,這也自動(dòng)保持了原始SAM的所有功能和特性。

圖片

Decoupled distillation for SAM


圖片

以ViT-B為圖像編碼器的SAM的耦合蒸餾和解耦蒸餾的比較。與耦合蒸餾相比,解耦蒸餾性能更好,所需計(jì)算資源少于1%。

03  實(shí)驗(yàn)

下圖給出了point與bbox提示詞下MobileSAM與原生SAM的結(jié)果對(duì)比,可以看到:MobileSAM可以取得令人滿(mǎn)意的Mask預(yù)測(cè)結(jié)果。

圖片

圖片

下圖從Segment everything角度對(duì)比了SAM、FastSAM以及MobileSAM三個(gè)模型,可以看到:

  • MobileSAM與原生SAM結(jié)果對(duì)齊驚人的好,而FastSAM會(huì)生成一些無(wú)法滿(mǎn)意的結(jié)果
  • FastSAM通常生成非平滑的邊緣,而SAM與MobileSAM并沒(méi)有該問(wèn)題

圖片

圖片

圖片

責(zé)任編輯:張燕妮 來(lái)源: 計(jì)算機(jī)視覺(jué)研究院
相關(guān)推薦

2024-06-18 09:37:56

模型訓(xùn)練

2024-01-03 07:42:49

分割模型高性能

2020-07-27 09:55:10

微信架構(gòu)索引

2023-04-07 08:17:39

fasthttp場(chǎng)景設(shè)計(jì)HTTP

2020-10-19 10:40:45

5G網(wǎng)絡(luò)技術(shù)

2023-01-08 13:22:03

模型

2022-11-02 08:12:47

TurbopackVite

2020-05-26 07:00:00

Windows 10瀏覽器輕量級(jí)

2015-01-16 10:43:09

WiGigWiFi

2022-10-27 08:31:31

架構(gòu)

2011-06-29 09:31:58

3G4G5G

2015-07-29 15:55:53

Windows 10桌面

2024-03-26 10:13:54

日志引擎SigLens

2017-08-25 16:25:43

Linux桌面圖像瀏覽器

2017-08-15 17:39:01

圖像軟件Linux

2021-05-06 10:52:09

Java Spring Bo框架

2022-02-09 17:29:36

Windows 11新系統(tǒng)微軟

2021-03-08 09:05:47

數(shù)據(jù)傳輸新線(xiàn)纜數(shù)據(jù)中心

2015-09-10 11:29:57

5G4G

2019-09-11 10:12:12

華為
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 天天综合网永久 | 免费观看成人性生生活片 | 精品日韩一区二区三区av动图 | 伊人春色成人网 | 在线永久看片免费的视频 | www.日日操| 亚洲第一中文字幕 | 欧美成视频在线观看 | 国产精品一区二区在线 | www国产成人 | 久久久91 | 精品久久九 | 色综合久久天天综合网 | 噜噜噜噜狠狠狠7777视频 | 亚洲精品视频免费观看 | 精品产国自在拍 | 亚洲综合二区 | 久久久精品黄色 | 91porn在线 | 欧美精产国品一二三区 | 福利av在线 | 成人羞羞国产免费视频 | 国产成人免费 | 久久蜜桃资源一区二区老牛 | 欧美在线观看免费观看视频 | 韩日一区二区三区 | 久久久天天 | 成人小视频在线观看 | 亚洲天堂精品久久 | 久久成人在线视频 | 成人精品| 国产精品一区二区福利视频 | 日韩欧美视频免费在线观看 | 成人妇女免费播放久久久 | 精品视频一区二区三区在线观看 | 国产a区| 一本一道久久a久久精品综合蜜臀 | 精品二区 | 国产精品久久国产精品 | 伊人久久成人 | 国产精品久久久一区二区三区 |