成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

微軟、浙大研究者提出剪枝框架OTO,無需微調即可獲得輕量級架構

新聞 前端
來自微軟、浙江大學等機構的研究者提出了一種 one-shot DNN 剪枝框架,無需微調即可從大型神經網絡中得到輕量級架構,在保持模型高性能的同時還能顯著降低所需算力。

 [[418048]]

來自微軟、浙江大學等機構的研究者提出了一種 one-shot DNN 剪枝框架,無需微調即可從大型神經網絡中得到輕量級架構,在保持模型高性能的同時還能顯著降低所需算力。

大型神經網絡學習速度很快,性能也往往優于其他較小的模型,但它們對資源的巨大需求限制了其在現實世界的部署。

剪枝是最常見的 DNN 壓縮方法之一,旨在減少冗余結構,給 DNN 模型瘦身的同時提高其可解釋性。然而,現有的剪枝方法通常是啟發式的,而且只針對特定任務,還非常耗時,泛化能力也很差。

在一篇標題為《 Only Train Once: A One-Shot Neural Network Training And Pruning Framework》的論文中,來自微軟、浙江大學等機構的研究者給出了針對上述問題的解決方案,提出了一種 one-shot DNN 剪枝框架。它可以讓開發者無需微調就能從大型神經網絡中得到輕量級架構。這種方法在保持模型高性能的同時顯著降低了其所需的算力。

微軟、浙大研究者提出剪枝框架OTO,無需微調即可獲得輕量級架構

論文鏈接:https://arxiv.org/pdf/2107.07467.pdf

該研究的主要貢獻概括如下:

  1. One-Shot 訓練和剪枝。研究者提出了一個名為 OTO(Only-Train-Once)的 one-shot 訓練和剪枝框架。它可以將一個完整的神經網絡壓縮為輕量級網絡,同時保持較高的性能。OTO 大大簡化了現有剪枝方法復雜的多階段訓練 pipeline,適合各種架構和應用,因此具有通用性和有效性。
  2. Zero-Invariant Group(ZIG)。研究者定義了神經網絡的 zero-invariant group。如果一個框架被劃分為 ZIG,它就允許我們修剪 zero group,同時不影響輸出,這么做的結果是 one-shot 剪枝。這種特性適用于全連接層、殘差塊、多頭注意力等多種流行結構。
  3. 新的結構化稀疏優化算法。研究者提出了 Half-Space Stochastic Projected Gradient(HSPG),這是一種解決引起正則化問題的結構化稀疏的方法。研究團隊在實踐中展示并分析了 HSPG 在促進 zero group 方面表現出的優勢(相對于標準近端方法)。ZIG 和 HSPG 的設計是網絡無關的,因此 OTO 對于很多應用來說都是通用的。
  4. 實驗結果。利用本文中提出的方法,研究者可以從頭、同時訓練和壓縮完整模型,無需為了提高推理速度和減少參數而進行微調。在 VGG for CIFAR10、ResNet50 for CIFAR10/ImageNet 和 Bert for SQuAD 等基準上,該方法都實現了 SOTA 結果。

方法及實驗介紹

微軟、浙大研究者提出剪枝框架OTO,無需微調即可獲得輕量級架構
微軟、浙大研究者提出剪枝框架OTO,無需微調即可獲得輕量級架構

OTO 的結構非常簡單。給定一個完整的模型,首先將可訓練的參數劃分為 ZIG 集,產生了一個結構化稀疏優化問題,通過一個新的隨機優化器 (HSPG) 得出高度組稀疏的解。最后通過剪枝這些 zero group 得到一個壓縮模型。

團隊提出的 HSPG 隨機優化算法是針對非光滑正則化問題而設計的,與經典算法相比,該算法在保持相似收斂性的同時,能夠更有效地增強群體稀疏性搜索。

為了評估 OTO 在未經微調的 one-shot 訓練和剪枝中的性能,研究者在 CNN 的基準壓縮任務進行了實驗,包括 CIFAR10 的 VGG16,CIFAR10 的 ResNet50 和 ImagetNet (ILSVRC2012),研究者比較了 OTO 與其當前各個 SOTA 算法在 Top-1 精度和 Top-5 精度、剩余的 FLOPs 和相應的 baseline 參數。

微軟、浙大研究者提出剪枝框架OTO,無需微調即可獲得輕量級架構

表 1:CIFAR10 中的 VGG16 及 VGG16-BN 模型表現。

在 CIFAR10 的 VGG16 實驗中,OTO 將浮點數減少了 83.7%,將參數量減少了 97.5%,性能表現令人印象深刻。

在 CIFAR10 的 ResNet50 實驗中,OTO 在沒有量化的情況下優于 SOTA 神經網絡壓縮框架 AMC 和 ANNC,僅使用了 12.8% 的 FLOPs 和 8.8% 的參數。

微軟、浙大研究者提出剪枝框架OTO,無需微調即可獲得輕量級架構

表 2:CIFAR10 的 ResNet50 實驗。

在 ResNet50 的 ImageNet 實驗中,OTO 減少了 64.5% 的參數,實現了 65.5% 的浮點數減少,與 baseline 的 Top-1/5 精度相比只有 1.4%/0.8% 的差距 。

微軟、浙大研究者提出剪枝框架OTO,無需微調即可獲得輕量級架構

表 3:ResNet50 的 ImageNet。

總體而言,OTO 在所有的壓縮基準實驗中獲得了 SOTA 結果,展現了模型的巨大潛力。研究者表示,未來的研究將關注合并量化和各種任務的應用上。

 

責任編輯:張燕妮 來源: 機器之心Pro
相關推薦

2021-07-09 06:00:47

Windows 11操作系統微軟

2023-08-28 19:39:21

Windows 11微軟

2021-08-23 15:01:04

零日漏洞漏洞網絡攻擊

2023-03-30 16:17:00

神經網絡微軟

2013-05-02 10:30:48

2014-04-03 09:17:40

2009-08-27 09:47:45

Windows 7上網本升級

2013-10-09 09:27:58

2013-06-20 10:28:39

MVVM框架avalon架構

2024-09-04 14:13:59

2009-11-17 12:21:41

2023-03-20 10:19:25

ChatGPT數學

2023-08-24 22:01:08

2021-08-30 14:45:37

漏洞Windows 10網絡攻擊

2016-07-22 12:51:47

2024-10-23 15:58:17

2021-07-21 20:24:29

Linux內核漏洞權限

2015-03-18 09:08:20

2021-09-02 10:33:18

InsiderWindows 11微軟

2020-11-11 12:13:59

JS
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧洲视频一区二区 | 国产丝袜人妖cd露出 | 性天堂网 | 天天干狠狠操 | 综合色影院 | 欧美高清性xxxxhdvideosex | 91在线精品一区二区 | 国产成人免费 | 中文字幕二区 | 在线免费观看黄色 | 日韩在线播放视频 | 国产精品美女久久久久久免费 | 亚洲精品乱码久久久久久9色 | 欧美性jizz18性欧美 | 精品国产一区二区三区久久 | 欧美国产激情二区三区 | 精品欧美一区免费观看α√ | 一级片网站视频 | 成人无遮挡毛片免费看 | 亚洲一区中文字幕 | 亚洲精品久久久久中文字幕欢迎你 | 婷婷中文在线 | 国产精品免费观看 | 成人一区二区三区在线观看 | 色综合99 | 久久久天堂 | 日本免费在线 | 亚洲精品观看 | 韩日精品一区 | 国产91久久精品一区二区 | 色婷婷在线视频 | 男人电影天堂 | 国产成人综合网 | 国产精品国产a级 | 在线观看电影av | 国产精品久久久久aaaa | 天天干天天爽 | 欧美亚洲国语精品一区二区 | 国产精品黄色 | 一区二区免费高清视频 | 精品伊人久久 |