成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

性能提升最高120倍!滴滴實習生提出自動結構化減枝壓縮算法框架

新聞 人工智能 算法
在相同準確率下,實際參數量的壓縮,相對之前方法最大可以提高超120倍。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

在相同準確率下,實際參數量的壓縮,相對之前方法最大可以提高超120倍。

這就是滴滴實習生提出的自動結構化減枝壓縮算法框架帶來的性能提升,名為AutoCompress

核心在于自動化的去尋找深度模型剪枝中的超參數,去除模型中不同層的參數冗余。

在CIFAR和ImageNet數據集的大量測試表明,AutoCompress的效果顯著超過各種神經網絡壓縮方法與框架。

這一研究也被AAAI2020接收。

性能提升最高120倍!滴滴實習生提出自動結構化減枝壓縮算法框架

研究人員表示,這一研究能替代人工設計的過程,并實現超高的壓縮倍率,滿足嵌入式端上運行深度模型的實時性能需求。

他們是如何實現的?我們下面一一解讀。

自動化設置深度模型剪枝中的超參數

近年來,隨著深度神經網絡模型性能不斷刷新,模型的骨干網絡參數量愈發龐大,存儲和計算代價不斷提高,從而導致難以部署在資源受限的嵌入式平臺上。

深度神經網絡模型壓縮技術,成為解決這一問題不可或缺的關鍵,也成為近年來研究熱點之一。

也出現了不少方法,其中之一便是結構化剪枝(structured pruning),能夠在平臺層面上,解決硬件執行效率低,內存訪問效率差,計算平行度不高問題,從而受到了學術界與工業界的重視。

但它也有“硬傷”,在算法實現過程中涉及到到大量的超參數設置。比如如何確定模型的壓縮維度,或者如何確定模型中每層的壓縮比例等等。

這都需要專家們一點點“掉頭發”地去設計指導,而且人工上去設計這些超參數的過程冗長且復雜。

性能提升最高120倍!滴滴實習生提出自動結構化減枝壓縮算法框架

效果也不一定好,畢竟這在很大程度上還依賴于相關人員的參數調節經驗。

然后就有研究人員心思開始活泛起來了,能不能自動設置超參數?如果實現了,將能夠大幅度提高算法實現效率,想想都挺讓人激動。

于是就有人開始干起來了,比如MIT、CMU和谷歌的研究學者們提出了一種名為AMC的方法,利用了深度增強學習(Deep Reinforcement Learning (DRL))的方法去決策每層的剪枝比例。

雖然實現了自動化調參的設想,但也有一些局限性。

一方面,這個研究只采用了單一的輸出通道(filter)剪枝維度;另外一方面,為了得到稀疏化模型,其所采用的剪枝方法僅僅是在模型訓練過程中引入一個靜態的正則項。

但更深層次的局限性在于,其所采用的基于DRL框架的剪枝方法,本質上與剪枝問題難以兼容。在結果中,最高壓縮率只有非結構化(non-structured)的5倍壓縮倍率。

滴滴的研究中,改進了這些不足,提出了一個通用流程(generic flow),專門用于神經網絡權重剪枝問題超參數設置自動化過程。

性能提升最高120倍!滴滴實習生提出自動結構化減枝壓縮算法框架

整體上,一共分為4步。先是行為抽樣(步驟1),然后快速評估(步驟2),接著確定決策(步驟3),最后是剪枝操作(步驟4)。

基于上述通用流程,并針對之前方法的局限性,通過綜合現有的深度神經網絡與機器學習框架,他們實現了目前最高效的深度神經網絡自動化結構化剪枝的通用框架,并命名AutoCompress。

實際參數量的壓縮,最大能提高120多倍

那AutoCompress是如何工作的呢?論文中提到了三大新的設計:

(1)提出混合型的結構化剪枝維度;(2)采用高效強大的神經網絡剪枝算法ADMM(交替乘子優化算法)對訓練過程中的正則項進行動態更新;(3)利用了增強型引導啟發式搜索的方式進行行為抽樣。

基于這些新設計,他們提出的框架是這樣的:

性能提升最高120倍!滴滴實習生提出自動結構化減枝壓縮算法框架

整體上來說,AutoCompress框架進行模型自動化剪枝主要有兩個步驟,先是通過基于ADMM算法的結構化剪枝,得到權重分布結構性稀疏化的模型;

然后通過網絡結構凈化(Purification)操作,將ADMM過程中無法完全刪除的一小部分冗余權重找到并刪除。

值得注意的是,這兩個步驟都是基于相同的啟發式搜索機制。

舉例來講,給定一個原始模型,他們會設置兩種目標函數——根據權重數量設置或根據運算量(FLOPs)設置。

搜索過程進行若干輪,比如第一輪目標為壓縮兩倍權重數量,第二輪為壓縮四倍權重數量。在每一輪搜索過程中,首先初始化一個行為(超參數),然后每次對行為進行一個擾動(超參數的小幅變化)生成新的行為。

根據模擬退火算法原理,評估兩個行為,如果新的行為評估結果優于原結果則接受該行為,如果新的行為評估結果劣于原結果則以一定概率接受該行為。

每一輪算法中的溫度參數T會下降,直到T下降到某個閾值后即停止搜索。最后,根據搜索得到的超參數,對神經網絡進行結構化剪枝操作。

效果如何?他們也進行了測試:

在VGG-16在CIFAR-10數據集上,結構化剪枝壓縮率高達52.2倍,無精度損失,在 Samsung Galaxy S10智能手機上測試(使用代碼生成優化版編譯器),其運行速度為2.7ms。

ResNet-18在CIFAR-10數據集上更是達到了54.2倍結構化剪枝壓縮率無精度損失。

性能提升最高120倍!滴滴實習生提出自動結構化減枝壓縮算法框架

相比之前的方法,如果考慮到ResNet-18與ResNet-50本身的大小差距,可以在準確率有所上升的情況下比之前的方法減小120倍權重參數。

在ImageNet數據集上,VGG-16達到了6.4倍結構化壓縮率,精度損失僅為0.6%,ResNet-18達到了3.3倍的結構化壓縮率,無精度損失。

而且, AutoCompress框架也可以應用于非結構化剪枝,其壓縮結果使ResNet-50在ImageNet數據集上可以做到9.2倍無精度損失的壓縮,更能達到17.4倍的壓縮率,僅損失0.7%的精度。

所以,他們得出結論,與其他方法相比,AutoCompress的效果超過各種神經網絡壓縮方法與框架,得到的高效神經網絡模型可以在嵌入式移動系統中實現實時推理運算。

滴滴AI Lab實習生

研究的第一作者,名為劉寧,是美國東北大學的在讀博士生,師從美國東北大學王言治教授。

高中時曾獲得北京市高中物理競賽二等獎,本科是電子信息工程專業,曾獲得全國大學生物聯網競賽三等獎。

2015年在雪城大學獲得碩士學位。這次介紹的研究,是他2019年在滴滴實習時的成果之一,實習導師是滴滴智能控制首席科學家唐劍。

[[313358]]

在滴滴實習之前,他也在網易、360實習過。

根據滴滴的報道,他也談到了自己的研究規劃:希望繼續在深度學習模型壓縮、設計上深入研究,把學習到的知識和研究成果應用到現實場景。

目前,這個框架已經在滴滴已經得到了實際有效應用。

 

責任編輯:張燕妮 來源: 量子位
相關推薦

2022-03-21 15:06:10

模型字節跳動框架

2022-03-21 17:56:59

大模型訓練訓練框架

2012-11-19 13:53:42

職場Google實習生

2014-01-07 09:23:41

項目管理

2009-09-17 09:35:17

微軟實習生

2010-10-12 11:06:07

招聘

2013-06-07 09:59:40

Google實習面試

2021-12-29 11:06:25

Java代碼技巧

2018-04-03 14:00:03

結構化數據非結構化數據數據庫

2009-03-13 08:58:04

AOL裁員實習

2024-01-09 15:51:56

Rust開發Trait

2020-07-27 08:26:03

數據庫 SQL索引

2015-04-14 15:05:35

Web前端開發騰訊暑期實習生

2021-05-20 19:56:08

泄露密碼數據泄露網絡攻擊

2011-12-07 20:37:42

iOSAndroid谷歌

2021-12-12 08:37:18

結構化數據非結構化數據數據

2021-06-08 14:27:21

非結構化數據存儲管理工具

2023-03-30 16:17:00

神經網絡微軟
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲不卡在线观看 | 在线看免费的a | 日韩精品一区二区三区久久 | 亚洲3级 | 亚州激情 | 久久久国产一区二区三区四区小说 | 国产激情偷乱视频一区二区三区 | 日韩视频在线播放 | 日韩在线免费 | 国产精品123区 | 日韩综合网 | 在线免费观看一区二区 | 亚洲狠狠| 看片wwwwwwwwwww | 亚洲国产一区二区在线 | 亚洲精选一区二区 | 色婷婷综合久久久中字幕精品久久 | 成人免费淫片aa视频免费 | 成人欧美一区二区三区在线播放 | 天天爱天天操 | 人人人干 | 欧美自拍视频 | 免费观看一级视频 | 超碰97在线免费 | 国产在线播放av | 亚洲国产成人一区二区 | 色综合久久久久 | 成人国产精品一级毛片视频毛片 | 日韩91 | 国产在线不卡 | 最新高清无码专区 | 精品无码久久久久久国产 | 欧美日韩精品专区 | 蜜臀网 | 四虎影院美女 | 91精品国产美女在线观看 | 国产精品色 | 日韩一级免费电影 | 成人免费视频网站在线看 | 黄色一级毛片免费看 | 黄色av网站在线观看 |