成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

姚期智團隊開源新型注意力,節省90%內存不降性能,一個框架統一MHA/MQA/GQA

人工智能 新聞
論文由清華&上海期智研究員團隊、UCLA顧全全團隊合作,共同一作為清華博士生張伊凡與姚班校友、現UCLA博士生劉益楓。

新型注意力機制TPA姚期智院士團隊打造。

圖片

TPA對每個token做動態的張量分解,不存儲完整的靜態KV,而是保留分解的版本,內存占用節省90%(或者更多),而不會犧牲性能。

圖片

論文中還證明了流行的MHA、MQA、GQA都是TPA的特殊情況,用一個框架統一了現代注意力設計

圖片

用此方法訓練的新模型T6,代碼已在GitHub開源。

圖片

論文發布后,有創業者表示,終于不用付那么多錢給云廠商了。

圖片

也有研究者認為,論文中的實驗看起來很有希望,不過實驗中的模型規模有點小,希望看到更多結果。

圖片

動態張量分解,無縫集成RoPE

盡管現有的注意力機制在眾多任務中取得了不錯的效果,但它還是有計算和內存開銷大的缺陷。

DeepSeek-v2中提出的MLA壓縮了KV緩存,但與RoPE位置編碼不兼容,每個注意力頭需要額外的位置編碼參數。

為了克服這些方法的局限性,團隊提出張量積注意力(TPA,Tensor Product Attention)。

新方法在注意力計算過程中對QKV做分解。

與LoRA系列低秩分解方法相比,TPA將QKV分別構造為與上下文相關的分解張量,實現動態適應。

圖片

通過只緩存分解后的秩,設置合適的參數可使內存占用降低90%或以上。

圖片

對于流行的RoPE位置編碼,TPA可以與之無縫集成,實現以較低的成本旋轉分解KV,無需進行復雜的調整。

圖片

在實驗中,使用FineWeb-Edu 100B數據集訓練模型,TPA與其他注意力設計相比始終保持較低的困惑度。

圖片

在ARC、BoolQ、HellaSwag和MMLU等基準測試中測試了零樣本和少樣本性能。TPA和TPA-KVonly在大多數任務中都優于或匹配所有基線。

圖片

論文由清華&上海期智研究員團隊、UCLA顧全全團隊合作,共同一作為清華博士生張伊凡與姚班校友、現UCLA博士生劉益楓。

此外還有來自心動網絡Taptap的Qin Zhen。

圖片

論文地址:https://arxiv.org/abs/2501.06425
開源代碼:https://github.com/tensorgi/T6

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-02-26 14:32:51

2024-04-03 14:31:08

大型語言模型PytorchGQA

2024-09-19 10:07:41

2025-02-25 09:40:00

模型數據AI

2023-01-31 12:30:26

模型代碼

2024-12-05 16:19:14

2023-10-26 00:30:00

Excel開源框架

2018-08-26 22:25:36

自注意力機制神經網絡算法

2025-01-17 13:20:00

2019-01-29 10:06:31

開源技術 趨勢

2024-07-01 12:17:54

2025-01-06 06:10:00

開源.NEThttps://mp

2025-06-09 08:52:00

2025-05-30 09:06:00

2021-09-17 13:05:55

模型人工智能框架

2013-07-02 10:24:52

團隊管理團隊遠程團隊

2024-12-23 14:10:00

AI模型數據

2016-09-13 10:56:03

運維性能密度

2022-02-08 15:43:08

AITransforme模型

2020-11-13 07:08:51

Spring Boot應用Spring
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产91色在线 | 亚洲 | 亚洲自拍偷拍视频 | 亚洲国产伊人 | 国产精久久久久久 | av入口| 欧美精品在线一区 | 黄色网址在线免费观看 | 国产成人综合一区二区三区 | 91精品久久久久久综合五月天 | 成人av影院 | 国产精品中文字幕在线观看 | 亚洲精品国产一区 | 国产在线观看免费 | h视频在线观看免费 | 亚洲美乳中文字幕 | 亚洲美女网站 | 国产精品视频网 | 日韩欧美一级精品久久 | 一区二区三区国产视频 | 综合久久99 | 麻豆changesxxx国产 | 久久精品国产一区二区电影 | 成人欧美一区二区三区黑人孕妇 | 亚洲一区二区免费 | 国产精品一区二区视频 | 欧美日本一区二区 | 久久久久久国产精品免费免费狐狸 | 久草色播 | 欧美精品乱码99久久影院 | 在线中文视频 | 99久久精品免费看国产四区 | 成人美女免费网站视频 | 久久国产精品免费视频 | 久久精品欧美一区二区三区麻豆 | 欧美日韩a | 91影库 | 中文字幕一区在线 | 99热视| www.av在线| 日本超碰| 黄色一级免费 |