成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Apple:使用語言模型的自回歸方式進行圖像模型預訓練

人工智能
在GPT等大模型出現后,語言模型這種Transformer+自回歸建模的方式,也就是預測next token的預訓練任務,取得了非常大的成功。

1、背景

在GPT等大模型出現后,語言模型這種Transformer+自回歸建模的方式,也就是預測next token的預訓練任務,取得了非常大的成功。那么,這種自回歸建模方式能不能在視覺模型上取得比較好的效果呢?今天介紹的這篇文章,就是Apple近期發表的基于Transformer+自回歸預訓練的方式訓練視覺模型的文章,下面給大家展開介紹一下這篇工作。

圖片圖片

論文標題:Scalable Pre-training of Large Autoregressive Image Models

下載地址:https://arxiv.org/pdf/2401.08541v1.pdf

開源代碼:https://github.com/apple/ml-aim

2、模型結構

模型結構整體采用Transformer,優化目標采用語言模型中的next token prediction。在模型結構上,主要的修改有3個方面。首先是相比ViT這種雙向attention,本文使用的是GPT這種單向attention,即每個位置的元素只能和前面的元素計算attention。

圖片圖片

其次是引入了prefix,在Transformer前面的輸入加了多個prefix token,這部分token使用的是雙向attention。這個主要作用是預訓練和下游應用的一致性,下游都是類似ViT的雙向attention使用方法,預訓練增加prefix雙向attention,可以讓模型適應下游任務。

圖片圖片

最后是在模型最終輸出MLP層的優化。原來的預訓練方法,一般會丟棄掉MLP層,在下游finetune使用一個新的MLP,防止預訓練的MLP過于傾向于預訓練任務導致下游任務效果下降。而本文中,作者采用的方法是每個patch都使用一個獨立的MLP,對于圖像整體的表征,也采用各個patch保證和attention融合的方式,代替一般的pooling,提升預訓練MLP head在下游任務的可用性。

在優化目標上,文中嘗試了兩種方法,第一種是直接擬合patch像素,用MSE進行預測。第二種是提前對圖像patch進行tokenize,轉換成分類任務,用交叉熵損失。不過在文中后續的消融實驗中發現,第二種方法雖然也可以讓模型正常訓練,但是效果并不如基于像素粒度MSE的效果更好。

3、實驗結果

文中的實驗部分詳細分析了這種基于自回歸的圖像模型的效果,以及各個部分對于效果的影響。

首先,隨著訓練的進行,下游的圖像分類任務效果越來越好了,說明這種預訓練方式確實能學到良好的圖像表征信息。

圖片圖片

在訓練數據上,使用小數據集的訓練會導致overfitting,而使用DFN-2B雖然最開始驗證集loss較大,但是沒有明顯的過擬合問題。

圖片圖片

對于模型各個模塊的設計方式,文中也進行了詳細的消融實驗分析。

圖片圖片

在最終的效果對比上,AIM取得了非常不錯的效果,這也驗證了這種自回歸的預訓練方式在圖像上也是可用的,可能會成為后續圖像大模型預訓練的一種主要方式。

圖片 圖片

責任編輯:武曉燕 來源: 圓圓的算法筆記
相關推薦

2017-08-09 10:02:12

NMT神經網絡自然語言處理

2025-06-24 03:00:00

2025-06-19 10:09:55

2023-01-11 07:28:49

TensorFlow分類模型

2023-03-28 16:01:01

PytorchSimCLR算法

2023-02-01 09:46:29

2024-04-26 12:51:48

2022-11-24 17:00:01

模型ARDL開發

2025-04-21 08:20:00

視覺模型訓練

2022-03-04 19:07:03

模型視覺人工智能

2024-01-03 18:53:13

語言模型LLM

2017-12-26 13:53:31

深度學習遷移學習

2024-11-04 00:24:56

2024-11-12 13:10:49

2024-09-26 16:51:23

2023-11-27 15:34:51

大語言模型PubMedBERT

2024-01-18 10:57:35

AIM模型NLP

2023-06-12 07:50:45

2024-05-23 16:56:58

2022-03-14 10:53:12

谷歌模型研究
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲免费一区二区 | 国产精华一区 | 综合一区二区三区 | 亚洲在线观看视频 | 成年人黄色一级片 | 成人免费在线播放 | 日韩成人免费av | 91在线电影 | 国产视频久久 | 国产免费国产 | www.日韩 | julia中文字幕久久一区二区 | 欧美 视频| 国产精品高潮呻吟久久 | 99国产精品久久久 | 中文字幕乱码一区二区三区 | 日韩精品一区二区三区中文字幕 | 在线精品亚洲欧美日韩国产 | 免费看一级毛片 | 欧美国产一区二区三区 | 国产在线永久免费 | 国产乱码精品一区二区三区五月婷 | 国产高清一区二区 | 亚洲 成人 av | 综合久久综合久久 | 成人网av| 中文字幕一区二区三区不卡在线 | 国产精品久久久久一区二区 | 日韩中文字幕一区二区 | 亚洲成人综合在线 | 精品一区二区久久久久久久网站 | 国产人成精品一区二区三 | 中文字幕一区二区三区四区不卡 | 国产精品国产成人国产三级 | 亚洲精品乱码久久久久久久久久 | 亚洲精品一区二区三区免 | 国产成人免费视频 | 91网站在线观看视频 | 欧美高清视频 | 亚洲狠狠丁香婷婷综合久久久 | 最新中文字幕在线 |