成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

矩陣乘法無需相乘,速度提升100倍,MIT開源最新近似算法

新聞 人工智能 算法
這是來自MIT的最新研究,他們提出了一種新的近似算法MADDNESS,在確保一定精度的情況下,將速度提升到了現有近似算法的10倍,比精確算法速度快100倍,被ICML 2021收錄。

 [[421266]]

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

在不做乘加操作(multiply-adds)的情況下,能計算矩陣乘法嗎?

矩陣乘法包含大量a+b×c類運算,因此常在運算中將乘法器和加法器進行結合成一個計算單元,進行乘法累加操作。

近似算法的話,確實可以!

這是來自MIT的最新研究,他們提出了一種新的近似算法MADDNESS,在確保一定精度的情況下,將速度提升到了現有近似算法的10倍,比精確算法速度快100倍,被ICML 2021收錄。

矩陣乘法無需相乘,速度提升100倍,MIT開源最新近似算法

研究還認為,新算法可能比最近大火的稀疏化、因子化等操作更有前途。

目前,作者已經開源了算法代碼,感興趣的小伙伴們可以去嘗試一下。

一起來看看。

用K聚類算法搞個查找表

這個算法,借鑒了一種叫做乘積量化(Product Quantization)的方法。

其中,量化本質上是一種近似操作。

由于矩陣乘法中的每個元素,都可以看做是兩個向量的點積,因此可以通過查找相似向量,來近似地估計向量的點積,而無需再進行大量乘法運算。

乘積量化的具體原理如下:

矩陣乘法無需相乘,速度提升100倍,MIT開源最新近似算法

當我們輸入一個要計算的向量a的時候,函數g(·)會對a進行一個近似操作,從一個提前設置好的數值查找表中,找到與它最相近的那個值,并輸出一個近似的向量g(a)。

與此同時,這張表格中的每個值,都已經提前做過點積計算了,因此在輸出g(a)的同時,它與查詢向量(query vector)b對應的近似點積計算結果h(b)也能被查表并輸出。

最后,只需要用f(·,·)函數對g(a)和h(b)做加法運算,而不需要再做乘法計算了。

簡單來說,就是通過近似查表的方法,節省了矩陣乘法中的乘法計算時間。

那么,這樣的數值查找表,究竟要設置什么數值,才能確保在近似計算過程中,損失的計算精度最小呢?

這里借鑒了一下K聚類算法(K-means)的思路,即將數據預分為K組,隨機選取K個對象作為初始聚類中心,再通過訓練迭代,確保在將樣本分到K個類中時,每個樣本與其所屬類中心的距離之和最小。

矩陣乘法無需相乘,速度提升100倍,MIT開源最新近似算法

△可視化的K聚類算法

通過這種方法計算出來的數值查找表,能更準確地近似矩陣乘法的數值計算結果。

根據這樣的思路,作者們提出了一種高效的向量乘積量化函數,能在單CPU中每秒編碼超過100GB的數據;同時,還提出了一種針對低位寬整數的高速求和函數。

然后,基于這兩類函數,整出了一套全新的矩陣乘法算法MADDNESS。

這個近似算法的效果如何呢?

精度保持,效率提升數倍

這個算法所需要的算力并不高,在搭載英特爾酷睿i7-4960HQ(2.6GHz)處理器的Macbook Pro上就能完成。

他們在Keras版本的VGG16模型上進行了測試,所用的數據集是CIFAR-10/100,對一系列最新的近似算法進行了評估:

矩陣乘法無需相乘,速度提升100倍,MIT開源最新近似算法

從圖中來看,在效率提升接近10倍的情況下,采用MADDNESS(圖中紅線)仍然能在CIFAR-10上保持幾乎不變的精度。

即使是在CIFAR-100上,在精度幾乎不變的情況下,MADDNESS和MADDNESS-PQ也同樣實現了效率最大化的結果。

除了最新算法外,與其他的現有算法相比(包括作者們在2017年提出的Bolt算法),效果同樣非常拔尖。

矩陣乘法無需相乘,速度提升100倍,MIT開源最新近似算法

對比計算速度的話,MADDNESS的點積速度就能比現有最快方法快兩倍左右。

矩陣乘法無需相乘,速度提升100倍,MIT開源最新近似算法

當然,也有讀者指出,這篇論文還存在一些待解決的問題:

①論文用的是VGG16模型,但沒有在Transformer等更經典的模型(如BERT)中進行實驗;②雖然對矩陣乘法進行了加速,但畢竟只是近似算法,意味著潛在的精度損失;③沒有在GPU中測試評估結果。

矩陣乘法無需相乘,速度提升100倍,MIT開源最新近似算法

但他仍然認為,這不失為一篇非常有意思的研究。

作者介紹

[[421267]]

Davis Blalock,MIT的計算機系博士生,致力于研發快速機器學習算法,他認為速度是衡量機器學習模型的一個非常重要的因素。

[[421268]]

John Guttag,MIT計算機系教授,研究方向是機器學習、AI和計算機視覺,目前的研究項目集中在醫療AI和醫學成像上。

值得一提的是,這兩位研究人員,此前還炮轟過神經網絡中的剪枝算法

矩陣乘法無需相乘,速度提升100倍,MIT開源最新近似算法

他們針對其中的81種算法進行了橫向對比,發現“沒有明確證據表明,這些算法在10年內,對任務效果有明顯改善”。

研究一作Davis Blalock還認為:

這些改進都是所謂的“微調”,而不是科研人員聲稱的“核心創新”,甚至有些改進方法可能根本就不存在。

在對AI模型進行效率提升上,兩位作者確實是很嚴格了。

項目地址:
https://github.com/dblalock/bolt

論文地址:
https://arxiv.org/abs/2106.10860

 

 

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-05-20 11:54:01

Python管理uv

2024-03-18 09:02:53

AI模型

2021-03-24 15:10:11

算法科學技術

2020-05-28 13:20:49

算法谷歌性能

2023-05-04 07:34:37

Rust代碼CPU

2022-11-27 17:39:06

大數據集群性能

2010-06-03 17:32:34

Tera

2020-12-28 10:28:02

算法應用技術

2022-11-30 16:08:42

2009-03-29 09:47:24

蘋果Iphone移動OS

2024-04-10 08:00:00

PostgresNoSQL

2020-03-26 12:38:15

代碼節點數據

2017-05-11 11:30:43

MySQL查詢速度

2009-12-24 09:30:38

Opera性能測試

2021-04-21 18:57:16

二進制存儲空間

2025-04-07 02:22:00

C#性能優化

2017-05-10 16:09:12

MySQL數據庫查詢

2013-09-26 14:11:23

SQL性能優化

2019-09-26 14:16:21

開源技術 趨勢
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩在线视频观看 | 国产精品久久久久久久久大全 | 欧美成人专区 | 久久成人精品视频 | 91久久夜色精品国产网站 | 日韩精品视频在线观看一区二区三区 | 91麻豆精品国产91久久久资源速度 | 欧美午夜精品 | 免费一级片 | 欧美三级在线 | 亚洲 欧美 在线 一区 | 国产成人高清 | 午夜精品久久久久久久久久久久 | 久久精品性视频 | 亚州中文字幕 | 欧美又大粗又爽又黄大片视频 | 91影视 | 欧美日韩在线观看视频 | 蜜桃一区二区三区在线 | 国产98在线 | 免费, | 成人在线国产 | 人人干人人玩 | 国产精品乱码一二三区的特点 | 国产一区在线免费 | 人人做人人澡人人爽欧美 | 亚洲欧美一区二区三区视频 | 射欧美 | 久久精品欧美一区二区三区不卡 | 亚洲综合日韩精品欧美综合区 | 一区二区三区在线电影 | 欧美成年人视频在线观看 | 国产一极毛片 | 国产激情一区二区三区 | 国产一区欧美 | 一区二区三区回区在观看免费视频 | 国产亚洲一区二区三区 | 欧美精品久久久 | 亚洲欧美中文日韩在线v日本 | 色爱av| 桃花av在线| 一级欧美一级日韩片 |