成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

無需下游訓練,Tip-Adapter大幅提升CLIP圖像分類準確率

人工智能 新聞
本文提出了 Tip-Adapter,一種可以免于訓練的將 CLIP 用于下游 few-shot 圖像分類的方案。

圖片


  • 論文鏈接:https://arxiv.org/pdf/2207.09519.pdf
  • 代碼鏈接:https://github.com/gaopengcuhk/Tip-Adapter

一.研究背景

對比性圖像語言預訓練模型(CLIP)在近期展現出了強大的視覺領域遷移能力,可以在一個全新的下游數據集上進行 zero-shot 圖像識別。為了進一步提升 CLIP 的遷移性能,現有方法使用了 few-shot 的設置,例如 CoOp 和 CLIP-Adapter,即提供了少量下游數據集的訓練數據,使得 CLIP 能夠更好的針對不同的視覺場景做出調整。但是,這種額外的訓練步驟會帶來不小的時間和空間資源開銷,一定程度上影響了 CLIP 固有的快速知識遷移能力。因此,我們提出了 Tip-Adapter,一種不需要額外下游訓練并且能很大程度提升 CLIP 準確率的 few-shot 圖像分類方法。基于此,我們又提出了一種僅需要少量微調就能達到 state-of-the-art 性能的方案:Tip-Adapter-F,實現了效率和性能的最佳折中。如下表 1 所示,Tip-Adapter 不需要任何訓練時間,即可以將 CLIP 在 ImageNet 數據集提升 + 1.7% 準確率(Accuracy),而 Tip-Adapter-F 僅需要之前方案十分之一的訓練時間(Epochs,Time),就可以實現現有最佳的分類性能。

圖片

表 1:不同方案在 ImageNet 數據集上 16-shot 的圖像分類準確率和訓練時間的比較

二.研究方法

1.Tip-Adapter

Tip-Adapter 的整體網絡結構如下圖 1 所示,對于給定的 few-shot 訓練數據集和標簽,我們借助 CLIP 通過一個非訓練的方案來構建一個緩存模型(Cache Model),它存儲了來自下游訓練數據的分類知識;在測試時,Tip-Adapter 通過將 Cache Model 的預測和原始 CLIP 的預測進行線性加和,來得到更強的最終分類結果。

詳細的來說,我們使用 CLIP 預訓練好的視覺編碼器(Visual Encoder)來提取 few-shot 訓練集所有圖片的特征,作為 Cache Model 的 Keys;并且將對應的圖片標簽轉化為 one-hot 編碼的形式,作為 Cache Model 的 Values。這種 Key-Value Cache Model 的構建方法由于使用的是已經預訓練好的 Visual Encoder,所以不需要任何訓練開銷;并且考慮到 few-shot 訓練集中,每一個類別只含有少量的圖片(1~16 shots),Cache Model 也幾乎不會占用額外的顯存開銷,參考表一中的 GPU Mem. 指標。

對于一張測試圖片,我們首先會利用 CLIP 的 Visual Encoder 來得到它的特征,再將該特征視為 Query 去 Cache Model 中進行下游 few-shot 數據的知識檢索。由于 Keys 也是由 CLIP 的 Visual Encoder 提取得倒,因此和測試圖片特征 Query 同源,我們可以直接計算它們之間的余弦相似度得倒一個 Key-Query 的鄰接矩陣,此矩陣可以看作是每一個對應 Value 的權重。因此,我們可以計算 Values 的加權和來得到該測試圖像通過檢索 Cache Model 得到的分類預測。除此之外,我們還可以通過將測試圖片特征和 CLIP 的 Textual Encoder 文本特征進行匹配,來得到 CLIP 的 zero-shot 預測。通過將兩者進行線性加權求和,我們得到了最終的分類預測,該預測既蘊含了 CLIP 預訓練的圖像語言對比性知識,也結合了下游新數據集的 few-shot 知識,因此可以實現更強的圖像分類準確率。

基于 Tip-Adapter 的網絡結構,我們可以進一步將 Cache Model 中的 Keys 部分變為學習參數,即可以通過訓練來進行更新,該方案為 Tip-Adapter-F。借助已經構建好的 Cache Model,Tip-Adapter-F 僅需要現有 CLIP-Adapter 十分之一的訓練回合數和時間,就可以實現更高的性能,如表一所示。

圖片

圖 1:Tip-Adapter 和 Tip-Adapter-F 的網絡流程圖

2.Tip-Adapter 和現有方案的區別與聯系?

對比 CLIP-Adapter,如圖 2 所示,Tip-Adapter 存儲的 Keys 和 Values 其實可以分別對應于 CLIP-Adapter 中 adapter 結構的兩個線性層,只不過前者是不需要訓練來構建的,后者是隨機初始化,然后需要訓練來學習最佳的參數。

圖片

圖 2:Tip-Adapter 相比于 CLIP-Adapter

對比現有的其他構建 Cache Model 的方案,如圖 3 所示,Tip-Adapter 的 Cache Model 可以看作是一種多模態的視覺語言 Cache。因為 CLIP 的 Textual Encoder 輸出的特征可以看作是文本的 Key-Value,即相當于測試圖片特征作為 Query,分別在視覺和文本的 Cache 中檢索知識,相對于現有的僅含視覺 Cache 的方案,Tip-Adapter 能夠利用多模態知識得到更強的識別性能。

圖片

圖 3:Tip-Adapter 相比于其他構建 Cache Model 的方案

三.實驗結果

1.  在 ImageNet 的分類準確率

圖 4 和表 2 比較了 Tip-Adapter、Tip-Adapter-F 和現有各個方案在 1、2、4、8、16 shots 的 few-shot 圖像分類準確率;表 3 比較了 16-shot ImageNet 數據集上使用不同 CLIP 的 Visual Encoder 的準確率比較。可見,我們的兩種方案都在資源開銷很小的情況下,達到了非常卓越的性能。

圖片

圖片

圖 4 和表 2:ImageNet 數據集上不同方法的 1~16-shot 圖像分類準確率比較


圖片

表 5:16-shot ImageNet 上不同 CLIP 的 Visual Encoder 的圖像分類準確率比較

2.  在另外 10 個圖像分類數據集

如圖 5 所示,我們提供了另外 10 個圖像分類數據集的準確率比較結果,分別是 StandfordCars,UCF101,Caltech101,Flowers102,SUN397,DTD,EuroSAT,FGVCAircraft,OxfordPets 和 Food101。如圖所示,我們的 Tip-Adapter-F 均取得了最高的識別準確率。

圖片

圖片

圖 5:另外 10 個數據集上不同方法的 1~16-shot 圖像分類準確率比較

3.  領域泛化能力的測評

我們也測試了 Tip-Adapter 和 Tip-Adapter-F 在領域泛化(Domain Generalization)方面的表現。如表 6 所示,我們的兩種方案都表現出了很強的魯棒性以及特征遷移能力。

圖片

四.結論

本文提出了 Tip-Adapter,一種可以免于訓練的將 CLIP 用于下游 few-shot 圖像分類的方案。Tip-Adapter 通過構建一個 Key-Value Cache Model,來作為測試圖片 Query 的知識檢索庫,并通過融合 Cache Model 的預測和 CLIP 的 zero-shot 預測,來得到更強的識別性能。我們期望 Tip-Adapter 可以啟發更多預訓練模型高效遷移的后續工作。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2017-09-28 09:40:36

圖像分類準確率

2023-03-03 18:31:23

網絡承運商路由

2022-04-09 10:16:52

神經網絡深度學習AI

2025-04-08 09:00:00

AI模型數據

2020-04-26 15:35:49

神經網絡決策樹ImageNet

2024-03-01 13:31:21

2022-04-13 10:31:04

微軟Jigsaw大型語言模型

2019-07-21 22:22:37

圖像識別AI機器視覺

2021-10-29 14:14:26

AI數據人工智能

2018-06-19 09:38:09

人工智能深度學習圖像處理

2023-02-03 16:31:02

模型

2021-05-23 09:51:29

代碼開發Facebook

2024-07-08 08:39:00

2020-09-14 14:10:04

開發技能代碼

2023-10-28 13:36:48

模型ChatGPT

2025-02-17 10:37:27

2024-08-06 08:43:17

2023-10-14 17:24:49

2024-06-06 10:08:32

2022-10-26 13:36:59

模型計算
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲第一av | 国产欧美一区二区三区在线看 | 久久aⅴ乱码一区二区三区 亚洲欧美综合精品另类天天更新 | 亚洲精品一区二三区不卡 | 免费av毛片| 国产精品亚洲综合 | 国产精品一级 | 精品一区二区三区四区视频 | 欧美一级免费 | 日韩欧美精品一区 | 天天综合天天 | 日韩a在线 | www.久 | 一区二区三区四区在线 | 天天操,夜夜爽 | 色婷婷综合久久久中字幕精品久久 | 亚洲一区二区三区免费在线观看 | 免费国产一区二区 | 国产精品无 | 亚洲成人一二三 | 一区精品视频在线观看 | 午夜黄色影院 | 中文字幕av在线 | 欧美综合久久久 | 久久国产精品久久久久久 | 五月激情婷婷在线 | aaa级片 | 亚洲成人网在线观看 | 欧美福利视频一区 | 在线观看免费高清av | 日本精a在线观看 | 曰批视频在线观看 | 狠狠干网站 | 国产精品成人一区 | 狠狠综合久久av一区二区老牛 | www久久久| 欧美福利视频 | 亚洲免费精品 | 精品久久久久久久人人人人传媒 | 91一区二区 | a在线观看 |