成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

教大模型自己跳過“無用”層,推理速度×3性能不變,谷歌MIT這個新方法火了

人工智能 新聞
谷歌MIT的研究人員提出了一個新框架CALM,讓它自己來決定計算量。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

大語言模型用著爽,但推理速度實在太慢了?

而且,增加模型體積,推理效果也并不一定就比之前更好。

為了解決這一問題,谷歌MIT的研究人員提出了一個新框架CALM,讓它自己來決定計算量。

如果CALM意識到某些層“可有可無”,那么它在計算時就會跳過這些層。

論文被po到網上后,立刻火了一波:

圖片

有網友表示,我們就是需要這樣更智能和自適應的模型,顯然CALM的解碼器已經做到了:

圖片

直接用中間層輸出結果

CALM全稱Confident Adaptive Language Modeling,即置信自適應大語言模型。

這一模型基于Transformer架構,為了加速它的計算,研究人員提出了一個名叫“提前退出(early exiting)的方法,讓模型根據不同的輸入,動態決定要用多少層網絡來計算。

也就是說,在計算的過程中,模型不需要經過每一層計算再輸出結果,而是能直接用中間層的特征輸出token,從而降低模型計算量。

圖片

所以,模型如何決定“退出”的時機呢?

這就需要訓練模型學會自己判斷了。

其中,Yfull是標準模型輸出的結果,Yearly是模型“提前退出”時輸出的結果。為了讓Yearly的效果更好,就需要盡可能讓它與Yfull保持一致。

圖片

當然,不同的任務對于文本輸出一致性也有不同的要求,例如對生成結果要求沒那么嚴格(可以生成更多樣的語句)的任務,對于Yfull和Yearly的一致性要求就沒那么高。

因此作者們也在論文中給出了兩個不同的公式,可根據實際情況選用:

圖片

在實際操作上,論文通過設置一個局部的token置信度,來檢查其對整個生成序列的影響。

模型在解碼過程中,會計算每一層的置信度c,并將它與達到“提前退出”的閾值λ相比,如果c大于λ,則模型“提前退出”。

圖片

所以,這樣的模型實際測試效果究竟如何?

歸納翻譯QA任務表現都不錯

論文在CNN/DM、WMT和SQuAD三個數據集上進行了測試。

圖片

其中,CNN/DM是一個新聞文章數據集,需要輸出一個幾句話概括文章的結果;WMT15 EN-FR是一個機器翻譯數據集,主要是法譯英句子的結果;Open-book SQUAD 1.1則是一個根據維基百科提問的QA數據集。

圖片

據一作Tal Schuster介紹,在保持相同性能的情況下,CALM使用的解碼器層數平均比之前降低了3倍

對于這篇論文,有網友表示贊同:模型確實不需要總是“長時間深入思考”,有時候幾層就能推理出正確答案了。

據作者表示,這一加速解碼的思路,適用于任何Seq2seq模型。

圖片

作者介紹

這篇論文的作者一共有8個人,分別來自谷歌和MIT CSAIL,其中主要負責人有兩位,Tal Schuster和Adam Fisch。

圖片

Tal Schuster博士畢業于MIT,目前是谷歌的高級研究員,研究方向是機器學習模型的魯棒性、可靠性和效率提升。

?圖片

Adam Fisch,MIT在讀博士生,本科畢業于普林斯頓大學,研究方向是機器學習量化不確定性、少樣本學習等。

圖片

對大語言模型推理加速感興趣的小伙伴,可以戳論文地址詳細了解。

論文地址:
https://arxiv.org/abs/2207.07061

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-02-21 12:10:00

模型數據

2023-04-27 13:06:46

AI手機模型

2018-10-07 07:00:59

2025-06-06 09:15:00

2021-09-27 10:12:42

欺騙防御rMTD網絡攻擊

2011-07-15 10:48:20

英特爾谷歌數據中心

2024-09-29 10:40:00

數據模型

2019-12-30 09:41:59

機器學習人工智能計算機

2023-10-05 06:05:54

谷歌時間訓練

2010-04-01 09:30:57

2015-08-21 09:14:40

大數據

2022-10-28 15:16:52

檢測數據

2024-10-08 13:38:56

2022-11-28 07:32:46

迭代器remove數據庫

2019-07-12 13:50:36

物聯網大數據安全

2022-07-07 10:47:16

IngressKubernetes

2020-05-14 14:21:50

谷歌AI數據

2023-12-29 13:18:23

模型NeRFTICD

2021-02-18 14:55:06

FuchsiaAndroidLinux

2021-02-19 18:10:06

微軟WindowsWindows 10
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美日韩在线视频一区 | 2019精品手机国产品在线 | 一级黄色片在线免费观看 | 亚洲va在线va天堂va狼色在线 | 国产精品视频播放 | 日韩中文一区二区 | 国内自拍真实伦在线观看 | 91视频在线 | 国产精品亚洲一区 | 日韩高清三区 | 黄色一级在线播放 | 一区二区中文字幕 | 亚洲视频自拍 | 久久99深爱久久99精品 | 日韩成人在线播放 | 午夜精品久久久久久不卡欧美一级 | 日韩最新网站 | 这里只有精品99re | 欧美色综合一区二区三区 | 最新高清无码专区 | 男女啪啪高潮无遮挡免费动态 | 九九热在线视频 | 日韩欧美在线观看视频 | 久久久久久久久久久久久9999 | 日本不卡一区二区三区在线观看 | 中文字字幕一区二区三区四区五区 | 成人免费淫片aa视频免费 | www.午夜| 亚洲国产日韩欧美 | 欧美一区二区在线观看 | 欧美成人精品一区 | 97精品国产97久久久久久免费 | 91精品久久久久久久久久入口 | 欧美日韩中文字幕在线 | 免费观看的黄色网址 | 中文字幕视频在线观看 | 国产精品海角社区在线观看 | 嫩草视频在线 | 99视频免费在线 | 大吊一区二区 | 91久久精品一区 |