成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

矩陣乘法可以算得更快了!港中文10頁論文證明:能源、時間均可節省

人工智能 新聞
這項研究對數據分析、芯片設計、無線通信和LLM訓練都有著深遠的影響!

天下苦大模型矩陣乘法久矣。

畢竟不論是訓練還是推理過程,矩陣乘法作為最主要的計算操作之一,往往都需要消耗大量的算力。

那么就沒有一種更“快、好、省”的方法來搞這事兒嗎?

有的,香港中文大學最新一篇僅10頁的論文,便提出了一種新算法:

  • 能源可節?。?%-10%
  • 時間可節?。?%

圖片

論文作者之一的Dmitry Rybin表示:

這項研究對數據分析、芯片設計、無線通信和LLM訓練都有著深遠的影響!

圖片

這么算矩陣乘法,更快!

矩陣乘法是計算機科學和數值線性代數中的核心問題之一。

自從Strassen和Winograd的開創性工作以來,研究者們一直在探索如何減少矩陣乘法所需的計算量。

盡管這類運算在統計、數據分析、深度學習和無線通信等領域有著廣泛應用,例如協方差矩陣的計算和線性回歸中的關鍵步驟,但對于具有特殊結構的矩陣乘法(如計算矩陣與其轉置的乘積XXt)的研究相對較少。

從理論角度看,計算XXt與一般矩陣乘法具有相同的漸近復雜度,因此只能通過常數因子優化來提升速度。

因此,這篇論文《XXt Can Be Faster》提出了一種名為RXTX的新算法,通過結合機器學習搜索方法和組合優化技術,顯著提升了XXt的計算效率。

圖片

我們先來了解一下RXTX。

整體來看,這個基于4×4分塊矩陣的遞歸乘法,通過機器學習搜索與組合優化相結合的方法發現。

算法主要包含以下關鍵步驟:

  1. 分塊與遞歸調用:將矩陣X劃分為16個4×4子塊,通過8次遞歸調用處理子問題,并計算26個一般矩陣乘積m1至m26。

圖片

2.對稱乘積計算:直接計算8個子塊的對稱乘積s1至m8。

3.結果組合:通過線性組合上述乘積結果,得到最終的XXt矩陣各分塊元素C11至C44

圖片圖片

與此前最先進的算法(基 Strassen的遞歸分治)相比,RXTX的遞歸關系式為 R(n)=8R(n/4) + 26M(n/4),而原算法為 S(n) = 4S(n/2) + 2M(n/2)。

這一設計使得RXTX的漸近乘法常數為 26/41≈0.6341,比原算法的2/3≈0.6667降低了約5%。

接下來,我們來看下乘法次數與運算總量分析。

通過論文中的定理1的推導,RXTX的乘法次數表達式為:

圖片

實驗數據表明,當n為4的冪次時,RXTX的乘法次數比原算法低5%,且隨著n增大,這一優勢持續保持:

圖片圖片

通過優化加法步驟(利用公共子表達式減少加法次數),RXTX的總運算量表達式為:

圖片

而原算法的總運算量包含對數項,導致其增長更快。

實驗顯示,當n≥256時,RXTX的總運算量優于原算法;當n≥1024時,顯著優于樸素算法:

圖片圖片

在6144×6144矩陣的測試中,RXTX的平均運行時間為2.524秒,比BLAS的默認實現快9%,且在99%的測試中表現更優:

圖片

盡管運行時間受硬件和內存管理影響,但理論分析表明,當n≥256時,RXTX即可展現速度優勢。

值得一提的是,RXTX的發現得益于機器學習與組合優化的結合,具體流程如下:

  • RL代理生成候選乘積:通過強化學習策略生成大量可能的秩-1雙線性乘積。
  • MILP枚舉與篩選:

a.MILP-A:枚舉候選乘積與目標表達式(XXt的各分塊)之間的線性關系。

b.MILP-B:選擇最小的乘積子集,確保所有目標表達式可通過線性組合表示。

  • 大鄰域搜索迭代:通過迭代優化,逐步減少冗余乘積,提升算法效率。

這一方法借鑒了AlphaTensor的思路,但通過限制候選空間為二維張量,顯著降低了計算復雜度,使得MILP求解器(如 Gurobi)能夠高效處理。

論文地址:
https://arxiv.org/abs/2505.09814

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-08-26 00:00:06

異步編程程序

2025-05-26 08:41:00

模型數據訓練

2023-08-29 10:07:15

人工智能AI

2024-02-06 10:55:47

2023-10-26 08:36:05

2018-09-17 13:10:13

命令Linux別名

2022-03-10 14:16:31

人工智能風電場清潔能源

2023-08-09 17:10:01

論文獲獎

2023-05-28 12:32:13

Windows 11微軟

2021-01-27 07:44:42

QLCTLC硬盤

2021-12-14 12:10:41

ChromeWindows瀏覽器

2025-05-20 09:07:00

2021-03-01 21:32:49

HTTP2 QUIC

2021-09-17 17:04:29

港華能源騰訊云智慧能源

2024-10-14 14:45:00

數據模型

2019-07-29 10:00:10

Windows 10節省空間Windows

2021-04-20 20:21:12

微軟Edge瀏覽器

2023-11-20 10:32:13

騰訊云港華能源

2023-12-25 14:56:28

人工智能智能建筑

2022-10-09 10:02:09

Python3.12
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩成人精品在线观看 | 亚洲精品一二三区 | 国产99久久精品一区二区300 | 国产四区| 一级毛片视频在线观看 | 久久九| 日韩欧美视频在线 | 中文字幕在线观看 | 欧美在线 | 久久久www成人免费无遮挡大片 | 毛片高清| 七七婷婷婷婷精品国产 | 欧美在线a | 久久久久久亚洲欧洲 | 国产精品毛片无码 | 久久国产麻豆 | 亚洲精选久久 | www国产成人免费观看视频,深夜成人网 | 午夜免费影视 | 国产精品国产成人国产三级 | 午夜精品一区二区三区免费视频 | 日本中文字幕日韩精品免费 | 久久久久久国产一区二区三区 | 成人精品一区二区三区中文字幕 | 欧美一级α片 | 中文字幕精品一区二区三区精品 | 婷婷开心激情综合五月天 | 日韩精品福利 | 国产成人一区二区三区电影 | 久久久精品视频免费看 | 日韩在线免费 | 日韩欧美国产精品一区 | 日本一区二区高清不卡 | www日日日 | 91久久精品国产91久久性色tv | 国产成人精品午夜 | 亚洲精品欧美 | 国产欧美在线视频 | 国产极品车模吞精高潮呻吟 | 在线视频一区二区三区 | 亚洲免费视频网站 |