成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

CLIP不接地氣?你需要一個(gè)更懂中文的模型

人工智能 新聞
隨著 CLIP 的提出,多模態(tài)預(yù)訓(xùn)練近年來(lái)發(fā)展迅速,但 CLIP 對(duì)于特定語(yǔ)言的理解有比較明顯的欠缺。

本文介紹的是達(dá)摩院魔搭社區(qū) ModelScope 近期開源的中文 CLIP 大規(guī)模預(yù)訓(xùn)練圖文表征模型,更加懂中文和中文互聯(lián)網(wǎng)的圖像,在圖文檢索、零樣本圖片分類等多個(gè)任務(wù)中實(shí)現(xiàn)最優(yōu)效果,同時(shí)代碼和模型已經(jīng)全部開源,用戶能夠使用魔搭快速上手。

圖片

  • 模型使用入口: https://modelscope.cn/models/damo/multi-modal_clip-vit-base-patch16_zh/summary
  • Github: https://github.com/OFA-Sys/Chinese-CLIP
  • 論文: https://arxiv.org/pdf/2211.01335.pdf
  • 圖文檢索 demo: https://modelscope.cn/studios/damo/chinese_clip_applications/summary 

1. 簡(jiǎn)介

在當(dāng)下的互聯(lián)網(wǎng)生態(tài)中,多模態(tài)相關(guān)任務(wù)和場(chǎng)景簡(jiǎn)直數(shù)不勝數(shù),如圖文檢索、圖片分類、視頻和圖文內(nèi)容等場(chǎng)景。近年火爆全網(wǎng)的圖片生成更是熱度躥升,迅速出圈。這些任務(wù)的背后,一個(gè)強(qiáng)大的圖文理解模型顯然是必須的。OpenAI 在 2021 年推出的 CLIP 模型,相信大家都不會(huì)陌生,通過(guò)簡(jiǎn)單的圖文雙塔對(duì)比學(xué)習(xí)和大量的圖文語(yǔ)料,使模型具有了顯著的圖文特征對(duì)齊能力,在零樣本圖像分類、跨模態(tài)檢索中效果拔群,也被作為 DALLE2、Stable Diffusion 等圖片生成模型的關(guān)鍵模塊。

但很可惜的是,OpenAI CLIP 的預(yù)訓(xùn)練主要使用英文世界的圖文數(shù)據(jù),不能天然支持中文。即便是社區(qū)有研究者通過(guò)翻譯的文本,蒸餾出多語(yǔ)言版本的 Multilingual-CLIP (mCLIP),同樣無(wú)法很好滿足中文世界的需求,對(duì)于中文領(lǐng)域的文本理解不很到位,比如搜索“春節(jié)對(duì)聯(lián)”,返回的卻是圣誕相關(guān)的內(nèi)容:

圖片

mCLIP 檢索 demo 搜索 “春節(jié)對(duì)聯(lián)” 返回結(jié)果

這也說(shuō)明,我們需要一個(gè)更懂中文的 CLIP,不僅懂我們的語(yǔ)言,也更懂中文世界的圖像。

2. 方法

達(dá)摩院的研究人員收集了大規(guī)模的中文圖文對(duì)數(shù)據(jù)(約 2 億規(guī)模),其中包括來(lái)自 LAION-5B 中文子集、Wukong 的中文數(shù)據(jù)、以及來(lái)自 COCO、Visual Genome 的翻譯圖文數(shù)據(jù)等。訓(xùn)練圖文絕大部分來(lái)自公開數(shù)據(jù)集,大大降低了復(fù)現(xiàn)難度。而在訓(xùn)練方法上,為了有效提升模型的訓(xùn)練效率和模型效果,研究人員則設(shè)計(jì)了兩階段訓(xùn)練的流程:

圖片

Chinese CLIP 方法示意圖

如圖所示,在第一階段,模型使用已有的圖像預(yù)訓(xùn)練模型和文本預(yù)訓(xùn)練模型分別初始化 Chinese-CLIP 的雙塔,并凍結(jié)圖像側(cè)參數(shù),讓語(yǔ)言模型關(guān)聯(lián)上已有的圖像預(yù)訓(xùn)練表示空間,同時(shí)減小訓(xùn)練開銷。隨后,在第二階段解凍圖像側(cè)參數(shù),讓圖像模型和語(yǔ)言模型關(guān)聯(lián)的同時(shí)并建模中文特色的數(shù)據(jù)分布。研究者發(fā)現(xiàn),相比從頭開始做預(yù)訓(xùn)練,該方法在多個(gè)下游任務(wù)上均展現(xiàn)顯著更優(yōu)的實(shí)驗(yàn)效果,而其顯著更高的收斂效率也意味著更小的訓(xùn)練開銷。相比全程只訓(xùn)練文本側(cè)做一階段訓(xùn)練,加入第二階段訓(xùn)練能有效在圖文下游任務(wù),尤其是中文原生(而非翻譯自英文數(shù)據(jù)集)的圖文任務(wù)上進(jìn)一步提升效果。

圖片

在 MUGE 中文電商圖文檢索、Flickr30K-CN 翻譯版本通用圖文檢索兩個(gè)數(shù)據(jù)集上觀察 zero-shot 隨著預(yù)訓(xùn)練持續(xù)進(jìn)行的效果變化趨勢(shì)

利用這一策略,研究人員訓(xùn)練了多個(gè)規(guī)模的模型,從最小的 ResNet-50、ViT-Base 和 Large,直到 ViT-Huge 應(yīng)有盡有,目前已經(jīng)全部開放,用戶完全可以按需使用最適合自身場(chǎng)景的模型:

圖片

3. 實(shí)驗(yàn)

多項(xiàng)實(shí)驗(yàn)數(shù)據(jù)表明,Chinese-CLIP 可以在中文跨模態(tài)檢索取得最優(yōu)表現(xiàn),其中在中文原生的電商圖像檢索數(shù)據(jù)集 MUGE 上,多個(gè)規(guī)模的 Chinese CLIP 均取得該規(guī)模的最優(yōu)表現(xiàn)。而在英文原生的 Flickr30K-CN 等數(shù)據(jù)集上,不論是零樣本還是微調(diào)的設(shè)定下,Chinese CLIP 均能顯著地超出國(guó)內(nèi) Wukong、Taiyi、R2D2 等基線模型。這在很大程度上歸功于 Chinese-CLIP 更大規(guī)模的中文預(yù)訓(xùn)練圖文語(yǔ)料,以及 Chinese-CLIP 不同于國(guó)內(nèi)現(xiàn)有一些圖文表征模型為了最小化訓(xùn)練成本全程凍結(jié)圖像側(cè),而是采用兩階段的訓(xùn)練策略的做法,以更好適配中文領(lǐng)域:

圖片

MUGE 中文電商圖文檢索數(shù)據(jù)集實(shí)驗(yàn)結(jié)果

圖片

Flickr30K-CN 中文圖文檢索數(shù)據(jù)集實(shí)驗(yàn)結(jié)果

同時(shí),研究人員在零樣本圖像分類數(shù)據(jù)集上驗(yàn)證了中文 CLIP 的效果。由于中文領(lǐng)域比較權(quán)威的零樣本圖像分類任務(wù)并不多,研究人員目前在英文翻譯版本的數(shù)據(jù)集上進(jìn)行了測(cè)試。Chinese-CLIP 在這些任務(wù)上,通過(guò)中文的 prompt 和類別標(biāo)簽,能夠取得和 CLIP 相當(dāng)?shù)谋憩F(xiàn):

圖片

零樣本分類實(shí)驗(yàn)結(jié)果

圖片

零樣本圖片分類示例

4.快速使用

如何才能用上 Chinese-CLIP ?很簡(jiǎn)單,點(diǎn)擊文章開頭的鏈接訪問(wèn)魔搭社區(qū)或使用開源代碼,短短幾行就能完成圖文特征提取和相似度計(jì)算了。如需快速使用和體驗(yàn),魔搭社區(qū)提供了配置好環(huán)境的 Notebook,點(diǎn)擊右上方即可使用。

圖片

Chinese-CLIP 也支持用戶使用自己的數(shù)據(jù)進(jìn)行 finetune,同時(shí)還提供了一個(gè)圖文檢索的 demo,供大家實(shí)際體驗(yàn) Chinese-CLIP 各規(guī)模模型的效果:

圖片

5. 結(jié)語(yǔ)

此次達(dá)魔搭社區(qū)推出 Chinese-CLIP 項(xiàng)目,為廣大中文多模態(tài)研究和產(chǎn)業(yè)界用戶,提供了一個(gè)優(yōu)秀的預(yù)訓(xùn)練圖文理解模型,幫助大家無(wú)門檻快速上手圖文特征 & 相似度計(jì)算、圖文檢索以及零樣本分類,并可嘗試用于搭建像是圖像生成這樣更復(fù)雜的多模態(tài)應(yīng)用。想要在中文多模態(tài)領(lǐng)域一展拳腳的朋友們,請(qǐng)一定不要錯(cuò)過(guò)!而這也僅僅是魔搭社區(qū)的一項(xiàng)應(yīng)用之一,ModelScope 讓眾多 AI 領(lǐng)域的基礎(chǔ)模型扮演應(yīng)用基座的角色,支持更多創(chuàng)新模型、應(yīng)用甚至產(chǎn)品的誕生。

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2014-03-26 15:24:51

Microsoft AWindows Azu微軟

2016-12-09 13:30:44

大數(shù)據(jù)

2013-11-28 16:47:15

通達(dá)OA

2016-04-01 09:29:36

戴爾

2015-08-27 10:50:15

2023-09-29 22:41:26

Kubernetes云原生

2015-02-06 10:36:25

Hadoop

2017-03-01 15:40:18

5GMWC通信

2012-12-11 14:05:26

商務(wù)社交

2020-07-09 07:39:59

人工智能

2022-12-01 15:22:02

AI阿里騰訊

2021-01-06 08:00:00

大數(shù)據(jù)IT安全

2015-04-14 14:34:48

遼寧廣播電視臺(tái)微軟Windows Azu

2014-11-11 13:31:28

云戰(zhàn)略

2022-10-31 07:09:15

拷貝代碼項(xiàng)目

2020-03-08 15:37:01

Android 10谷歌安卓

2023-08-11 08:39:36

工具AI

2024-09-30 14:34:22

2014-08-28 03:44:30

mAPM聽云App移動(dòng)應(yīng)用性能監(jiān)測(cè)

2025-04-25 08:45:00

C++初始化編程
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 免费黄色a视频 | 久久精品在线 | 国产女人第一次做爰毛片 | 999在线精品 | 密室大逃脱第六季大神版在线观看 | 日本久草| 国产精品成人在线播放 | 日本aa毛片a级毛片免费观看 | 国产精品久久二区 | 日本不卡免费新一二三区 | 亚洲成人一区二区三区 | av黄色在线| 久久精品国产精品青草 | 国产精品一区一区 | 中文字幕 在线观看 | 7777奇米影视 | 欧美日韩在线观看一区 | 91中文视频 | 伊人免费在线 | 国产大片一区 | 日韩一区二区久久 | 国产免费观看视频 | 四季久久免费一区二区三区四区 | 成人av片在线观看 | 欧美激情 一区 | 国产精品av久久久久久久久久 | 久久精品国产久精国产 | 国产在线a | 国产99视频精品免视看9 | 国产一区二区三区四区 | 欧美一区二区三区高清视频 | 久久国 | 亚洲乱码国产乱码精品精的特点 | 精品国产欧美一区二区三区成人 | 国产视频三级 | 亚洲手机视频在线 | 91热在线| 欧产日产国产精品国产 | 欧美国产精品一区二区三区 | 久久综合久色欧美综合狠狠 | 99亚洲国产精品 |