成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

突破算力限制!Meta開源“記憶層”,重塑Transformer架構大模型 精華

發布于 2025-1-3 10:09
瀏覽
0收藏

今天凌晨3點,全球社交巨頭Meta分享了一個創新研究——Memory layers(記憶層)。


目前,Transformer架構的預訓練大模型在存儲、查詢數據時,隨著參數的變大對算力的需求呈指數級增長。“記憶層”提出了新的高效查詢機制替代了傳統的查詢方法,通過比較查詢鍵與兩個較小集合中的鍵,可以快速找到最相關的鍵,而無需遍歷模型的整個記憶層。

這也就是說,可以在不增加算力的情況下顯著增加大模型的參數。例如,研究人員在僅有1.3億參數的模型中添加了128億額外的記憶參數,其性能與Meta開源的Llama 2- 70相當,而算力卻比它低了10倍左右。


開源地址:???https://github.com/facebookresearch/memory??

突破算力限制!Meta開源“記憶層”,重塑Transformer架構大模型-AI.x社區

Product - Key Lookup

在傳統的鍵值查找中,每個查詢都需要與記憶層中的每個鍵進行比較,以找到最匹配的值。該方法在鍵的數量較少時是可行的,但隨著記憶層規模的增長,這種暴力搜索的方式變得非常低效,需要消耗巨大算力和時間。


給大家舉一個簡單的例子,你想在一個巨大的圖書館里找一本書。這個圖書館有成千上萬本書,每本書都有一個唯一的編號(相當于記憶層中的“鍵”)。如果你要找到一本特定的書(相當于查詢),傳統的方法是逐個檢查每一本書的編號來查找你要的那一本。


這種方法在圖書館只有幾百本本書時可能還行得通,當圖書館藏書量達到數萬時,逐本查找方法就變得極其耗時和低效了。

突破算力限制!Meta開源“記憶層”,重塑Transformer架構大模型-AI.x社區

Product - Key Lookup是“記憶層”的核心算法之一,使用了一種分而治之的策略,將傳統的單一鍵集合分解為兩個較小的鍵集合,通過兩個階段的查找來減少必要的比較次數,從而提高查找效率


首先,查詢鍵被分割為兩個子查詢,每個子查詢分別與兩個半鍵集合進行比較。由于每個半鍵集合的大小只有原始鍵集合的平方根大小,因此這個階段的計算量大幅減少。在第一階段,每個半鍵集合中找到與子查詢最相似的k個鍵,這個過程稱為top-k查找。

突破算力限制!Meta開源“記憶層”,重塑Transformer架構大模型-AI.x社區

在第二階段,兩個半鍵集合中找到的top-k鍵被合并,以確定最終的top-k鍵。這一步驟涉及到對兩個半鍵集合中找到的鍵進行綜合評分,以確定它們與原始查詢鍵的整體相似度。需要考慮到兩個半鍵集合中的鍵的組合,以找到最佳的匹配。


除了計算效率之外,Product-Key Lookup模塊還優化了內存和帶寬的使用。由于每個GPU只需要處理一半的鍵,因此內存的使用量減少了一半。由于每個GPU只需要返回與自己處理的鍵相關的值,所以內存帶寬的需求也得到了優化。


Product-Key Lookup算法不僅提高了記憶層的查詢效率,還為記憶層的應用開辟了新的可能性,使得記憶層可以被應用于更大規模的數據集和更復雜的任務中,包括大規模知識圖譜的查詢、長文本的語義檢索等。

并行記憶層和共享記憶參數

并行記憶層主要是用于對硬件GPU的優化。在傳統的Transformer架構模型中,隨著模型規模的增加,計算和內存需求也隨之增長。特別是在處理大規模數據集時,單一的計算單元很難滿足這種需求。并行記憶層通過在多個GPU之間分配任務,有效解決這一難題。


在并行記憶層的設計中,每個計算單元只負責處理一部分數據,這樣可以減少單個計算單元的負擔,同時提高整體的處理速度。這種設計允許模型在保持單個計算單元負載合理的同時,處理更大規模的記憶層。使得模型可以擴展到數十億甚至數百億的參數,而不會受到單個計算單元性能的限制。

突破算力限制!Meta開源“記憶層”,重塑Transformer架構大模型-AI.x社區

共享記憶參數則是另外一個重要優化方法,允許不同層的記憶層共享同一個參數集合。這種設計的優勢在于,它減少了模型的總參數數量,同時提高了參數的利用率。


當一個記憶層接收到輸入后,它會先從共享記憶池中查找最相似的記憶單元,然后根據查詢結果生成輸出。由于所有記憶層都指向同一個記憶池,因此它們可以在不影響彼此的情況下同時進行操作。

突破算力限制!Meta開源“記憶層”,重塑Transformer架構大模型-AI.x社區

為了應對訓練期間可能出現的變化,研究人員開發了一套動態調整策略。每當有新的鍵加入或舊有的鍵被更新時,系統會自動調整相應的子集,而無需對整個記憶池進行全面改造。這樣的設計既簡化了維護流程,又提高了系統的靈活性和適應性。


本文轉自 AIGC開放社區  ,作者:AIGC開放社區


原文鏈接:??https://mp.weixin.qq.com/s/Zv2oyzLb4bIaq9FrzK3GXw??

收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 亚洲国产免费 | 亚洲日本乱码在线观看 | 亚洲日韩欧美一区二区在线 | 日本精品一区二区 | 韩国主播午夜大尺度福利 | 亚洲精品国产成人 | 国产在线小视频 | 欧美一区二区三区视频 | 久久久久亚洲 | www.v888av.com| 国产日韩中文字幕 | 午夜免费观看体验区 | 欧美色成人| 中文字幕人成人 | 99福利视频| 欧美一级免费看 | 中文二区 | 欧美成人免费在线视频 | 国产在线97 | 一区二区三区精品在线视频 | 久久亚洲综合 | 欧美日韩成人在线观看 | 午夜视频在线免费观看 | 久在线 | av黄色免费在线观看 | 一区二区三区中文字幕 | 中文字幕成人av | 在线只有精品 | 国产亚洲黄色片 | 福利二区| 伊人网站在线观看 | 国产精品九九视频 | av天天澡天天爽天天av | 久久中文字幕一区 | 99re在线视频 | 五月激情六月婷婷 | 亚洲精品国产电影 | 欧美激情精品久久久久 | 99久久婷婷国产综合精品电影 | 人人爽人人爽 | 午夜网站视频 |