成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Meta 推 WebSSL 模型:探索 AI 無語言視覺學(xué)習(xí),純圖訓(xùn)練媲美 OpenAI CLIP

人工智能
Meta 公司發(fā)布 WebSSL 系列模型,參數(shù)規(guī)模從 3 億到 70 億,基于純圖像數(shù)據(jù)訓(xùn)練,旨在探索無語言監(jiān)督的視覺自監(jiān)督學(xué)習(xí)(SSL)的潛力。

科技媒體 marktechpost 發(fā)布博文,報道稱 Meta 公司發(fā)布 WebSSL 系列模型,參數(shù)規(guī)模從 3 億到 70 億,基于純圖像數(shù)據(jù)訓(xùn)練,旨在探索無語言監(jiān)督的視覺自監(jiān)督學(xué)習(xí)(SSL)的潛力。

以 OpenAI 的 CLIP 為代表,對比語言-圖像模型已成為學(xué)習(xí)視覺表征的默認(rèn)選擇,在視覺問答(VQA)和文檔理解等多模態(tài)任務(wù)中表現(xiàn)突出。不過受到數(shù)據(jù)集獲取的復(fù)雜性和數(shù)據(jù)規(guī)模的限制,語言依賴面臨諸多挑戰(zhàn)。

Meta 公司針對上述痛點,在在 Hugging Face 平臺上發(fā)布了 WebSSL 系列模型,涵蓋 DINO 和 Vision Transformer(ViT)架構(gòu),參數(shù)規(guī)模從 3 億到 70 億不等。

這些模型僅使用 MetaCLIP 數(shù)據(jù)集(MC-2B)中的 20 億張圖像子集進(jìn)行訓(xùn)練,排除了語言監(jiān)督的影響。Meta 的目標(biāo)并非取代 CLIP,而是通過控制變量,深入評估在不受數(shù)據(jù)和模型規(guī)模限制下,純視覺自監(jiān)督學(xué)習(xí)(SSL)的表現(xiàn)潛力。

WebSSL 模型采用兩種視覺自監(jiān)督學(xué)習(xí)范式:聯(lián)合嵌入學(xué)習(xí)(DINOv2)和掩碼建模(MAE)。訓(xùn)練統(tǒng)一使用 224×224 分辨率圖像,并凍結(jié)視覺編碼器以確保結(jié)果差異僅源于預(yù)訓(xùn)練策略。

模型在五個容量層級(ViT-1B 至 ViT-7B)上訓(xùn)練,評估基于 Cambrian-1 基準(zhǔn)測試,覆蓋通用視覺理解、知識推理、OCR 和圖表解讀等 16 個 VQA 任務(wù)。此外,模型無縫集成于 Hugging Face 的 transformers 庫,便于研究和應(yīng)用。

實驗揭示了多項關(guān)鍵發(fā)現(xiàn):隨著參數(shù)規(guī)模增加,WebSSL 模型在 VQA 任務(wù)上的表現(xiàn)接近對數(shù)線性提升,而 CLIP 在超過 30 億參數(shù)后性能趨于飽和。

WebSSL 在 OCR 和圖表任務(wù)中表現(xiàn)尤為突出,尤其在數(shù)據(jù)篩選后,僅用 1.3% 的富文本圖像訓(xùn)練即超越 CLIP,在 OCRBench 和 ChartQA 任務(wù)中提升高達(dá) 13.6%。

此外,高分辨率(518px)微調(diào)進(jìn)一步縮小了與 SigLIP 等高分辨率模型的差距,在文檔任務(wù)中表現(xiàn)尤為出色。

WebSSL 模型在無語言監(jiān)督下仍展現(xiàn)出與預(yù)訓(xùn)練語言模型(如 LLaMA-3)的良好對齊性,表明大規(guī)模視覺模型能隱式學(xué)習(xí)與文本語義相關(guān)的特征。

同時,WebSSL 在傳統(tǒng)基準(zhǔn)測試(如 ImageNet-1k 分類、ADE20K 分割)上保持強(qiáng)勁表現(xiàn),部分場景甚至優(yōu)于 MetaCLIP 和 DINOv2。

IT之家附上參考地址

責(zé)任編輯:姜華 來源: IT之家
相關(guān)推薦

2025-04-08 09:10:00

模型訓(xùn)練AI

2022-03-28 09:00:00

SQL數(shù)據(jù)庫機(jī)器學(xué)習(xí)

2022-07-26 15:45:30

AI模型

2025-02-24 09:55:47

2024-05-17 08:33:33

視覺語言模型

2025-04-23 15:25:27

語言模型Eagle 2.5英偉達(dá)

2017-12-26 13:53:31

深度學(xué)習(xí)遷移學(xué)習(xí)

2023-02-28 14:57:02

MetaAI

2022-05-05 09:00:00

AI模型數(shù)據(jù)

2023-10-18 12:50:12

數(shù)據(jù)模型

2025-03-05 10:21:04

DeepSeekLVLM

2022-03-04 19:07:03

模型視覺人工智能

2023-05-25 16:24:13

2023-02-25 16:14:36

AIMeta語言模型

2023-08-02 11:56:58

2022-11-01 13:52:44

AI數(shù)學(xué)

2025-04-10 06:30:00

2024-01-31 09:43:55

模型訓(xùn)練

2023-12-13 15:23:41

點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 欧美日韩福利视频 | 91精品国产综合久久精品 | 久久免费看 | 日本久久久一区二区三区 | 国产精品精品视频一区二区三区 | 日本久久久一区二区三区 | 精品网站999 | 欧美色性| 日韩电影中文字幕在线观看 | 国产精品亚洲精品日韩已方 | 久久国产精品免费视频 | 黑人精品xxx一区一二区 | 久久精品亚洲欧美日韩久久 | 美女视频黄色片 | 亚洲国产精品成人无久久精品 | 7777奇米影视 | 久久久久亚洲视频 | 国产毛片久久久久久久久春天 | 国产成人在线视频 | 婷婷五月色综合 | 手机三级电影 | 国产精品精品久久久 | 亚洲视频免费 | 成人一区二 | 三级av在线 | 精品视频一区二区 | 欧美日韩在线一区 | 国产精彩视频在线观看 | 亚洲视频一区在线观看 | 日韩精品中文字幕在线 | 久久一级免费视频 | 国产成人午夜精品影院游乐网 | 国产精品高清在线 | 国内精品久久精品 | 欧美一级久久 | 国产精品视频网站 | 91九色视频在线 | 97在线观视频免费观看 | 久久爱一区| 日韩视频专区 | 美日韩免费视频 |