成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<rp id="61661"><video id="61661"></video></rp>

<blockquote id="61661"></blockquote>

<noscript id="61661"></noscript>

<cite id="61661"><table id="61661"></table></cite>

<ul id="61661"></ul>

<label id="61661"><table id="61661"></table></label>

<label id="61661"></label>

<menu id="61661"><pre id="61661"></pre></menu>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

賬號(hào)設(shè)置退出

零樣本學(xué)習(xí)超越CLIP！谷歌提出首個(gè)多模態(tài)稀疏化模型LIMoE，還能降低計(jì)算成本

作者：明敏 2022-06-13 11:57:04

人工智能新聞

谷歌帶來最新成果LIMoE，首次將稀疏化方法用在了圖像文本混合模型上。

本文經(jīng)AI新媒體量子位（公眾號(hào)ID:QbitAI）授權(quán)轉(zhuǎn)載，轉(zhuǎn)載請(qǐng)聯(lián)系出處。

多模態(tài)模型常見，但是基于稀疏化的還是頭一個(gè)。

谷歌帶來最新成果LIMoE，首次將稀疏化方法用在了圖像文本混合模型上。

要知道，隨著大模型參數(shù)呈指數(shù)級(jí)增加，訓(xùn)練成本也是一路飆升。

所以如何降低訓(xùn)練成本，成為了目前學(xué)界重點(diǎn)關(guān)注的一個(gè)問題。

谷歌想到的辦法，不是拼硬件，而是從模型本身入手。

利用稀疏化的方法，讓每次輸入只需激活部分網(wǎng)絡(luò)就能完成任務(wù)。

它們?cè)谀Ｐ蛢?nèi)部設(shè)置了很多“專家”，每個(gè)“專家”只需處理對(duì)應(yīng)部分的輸入，根據(jù)任務(wù)情況按需使用“專家”就好。

這樣一來，盡管模型容量很大，但是計(jì)算成本并沒有暴增。

而且還不會(huì)降低性能。

新方法LIMoE零樣本學(xué)習(xí)任務(wù)中，可是直接超越了CLIP。

怪不得網(wǎng)友高呼：

快分享給我們API！

讓不同“專家”處理不同任務(wù)

對(duì)于深度學(xué)習(xí)來說，能同時(shí)處理文本圖像任務(wù)其實(shí)已經(jīng)不稀奇。

不過過去常見的多模態(tài)學(xué)習(xí)方法，往往是單個(gè)輸入就需要激活整個(gè)網(wǎng)絡(luò)。

谷歌這次提出的新方法，最大亮點(diǎn)就是首次在這一領(lǐng)域采用了稀疏化模型。

稀疏化的方法便是無需讓整個(gè)模型來處理所有的輸入。

通過對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行劃分，它讓神經(jīng)網(wǎng)絡(luò)也“專業(yè)對(duì)口”，不同的子模型只處理固定類型的任務(wù)或數(shù)據(jù)。

但也不是完全割裂開來，模型內(nèi)部仍有可共享的部分。

此次基于的模型是MoE（Mixture-of-Experts layer），它被稱為專家混合模型。

也就是在Transformer架構(gòu)的基礎(chǔ)上，加設(shè)了“專家層”。

它是一個(gè)并行的FNN，取代了原本的前饋網(wǎng)絡(luò)。

這里的“專家”，也就是模型內(nèi)部的不同子模型。

每個(gè)子模型專門用于不同的輸入。

每一層中的專家由門控網(wǎng)絡(luò)控制，該網(wǎng)絡(luò)根據(jù)輸入數(shù)據(jù)激活專家。

對(duì)于每個(gè)標(biāo)記，門控網(wǎng)絡(luò)選擇最合適的專家來處理數(shù)據(jù)。

此次新提出的LIMoE，其實(shí)就是讓MoE能同時(shí)處理圖像文本。

具體來看，就是讓LIMoE進(jìn)行對(duì)比學(xué)習(xí)。

在利用大量圖像-文本對(duì)訓(xùn)練時(shí)，網(wǎng)絡(luò)內(nèi)部的圖像模型提取圖像表示，文本模型提取文本表示。

針對(duì)相同的圖像-文本對(duì)，模型會(huì)拉近圖像和文本表示的距離。

反之，對(duì)于不同的圖像-文本對(duì)，則會(huì)讓相應(yīng)的表示彼此遠(yuǎn)離。

這樣一來的直接好處，就是能實(shí)現(xiàn)零樣本學(xué)習(xí)。

比如一張圖像的表示更接近文本“狗”的表示，那么它就會(huì)被歸類為狗。

這種思路可以擴(kuò)展到數(shù)千種情況。

實(shí)際上，CLIP和ALIGAN采用的都是這個(gè)思路，它們?cè)贗mageNet數(shù)據(jù)集上的精度分別是76.2%、76.4%。

而LIMoE-L/16可以達(dá)到78.6%，已經(jīng)超過了CLIP。

未經(jīng)過預(yù)訓(xùn)練的LIMoE H/14則能達(dá)到84.1%的精度。

而在LIMoE的專家層中，谷歌表示還發(fā)現(xiàn)了一些有趣的現(xiàn)象。

比如在訓(xùn)練設(shè)置中，圖像標(biāo)記比文本標(biāo)記要多很多，因此所有專家都會(huì)在在任務(wù)中多少處理些圖像。

只不過有的會(huì)主要處理圖像，有的主要處理文本，或者二者兼具。

還有在大多數(shù)情況下，都會(huì)有一個(gè)專家來處理所有包含文本表示的圖像patch。

除了性能上的提升，使用稀疏化模型的好處還體現(xiàn)在降低計(jì)算成本上。

因?yàn)椤岸鄬＜摇钡哪Ｊ揭馕吨M管多設(shè)了很多子模型，模型容量顯著增加，但是實(shí)際計(jì)算成本并沒有明顯變化。

如果一次任務(wù)中只使用了一個(gè)子模型，那它的成本和標(biāo)準(zhǔn)Transformer的差不多。

比如LIMoE-H/14總共有5.6B參數(shù)，但是通過稀疏化，它只會(huì)使用每個(gè)token的675M參數(shù)。

One More Thing

稀疏化模型一直是谷歌深度研究的一個(gè)方向，已經(jīng)提出了MoE、GLaM在內(nèi)的多個(gè)模型。

這次LIMoE也不是谷歌第一次魔改MoE。

去年6月，他們提出了V-MoE，是一種新型的視覺架構(gòu)，今年已將全部代碼開源。

責(zé)任編輯：張燕妮來源：量子位

谷歌模型計(jì)算

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

主站蜘蛛池模板：国产成人精品久久二区二区 | 一区二区久久 | 黄色一级网 | 亚洲国产一区二区三区 | 亚洲综合一区二区三区 | 久艹网站 | 国产欧美在线 | 男女黄网站 | 久久成人免费 | 国产欧美一区二区三区久久手机版 | 亚洲一在线 | 亚洲国产一区二区视频 | 欧美黄片免费观看 | 欧美一区二区另类 | 欧美中文字幕在线观看 | 日韩网站免费观看 | 精品福利一区二区三区 | 毛片区 | 99久久精品国产麻豆演员表 | 国产亚洲精品久久久久久牛牛 | 播放一级毛片 | 午夜精品久久久久久久久久久久久 | 日本三级播放 | 国产一区二区观看 | 国产成人精品综合 | 中文字幕乱码一区二区三区 | 3级毛片| 欧产日产国产精品国产 | 精品一区二区久久久久久久网站 | 免费在线观看一区二区 | 免费视频成人国产精品网站 | 天天操天天拍 | 国产日韩av一区二区 | 欧美精品一区二区三区视频 | 午夜www| 蜜桃av一区二区三区 | 九九热精品在线 | 看片网站在线 | 每日在线更新av | 国产精品一区三区 | 国产精品123区 |

<tfoot id="16611"></tfoot>

<bdo id="16611"><input id="16611"></input></bdo>

<abbr id="16611"><th id="16611"><optgroup id="16611"></optgroup></th></abbr>

<sup id="16611"><delect id="16611"></delect></sup>