成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

微軟推出 ZeRO++ 技術,可顯著減少 AI 大模型訓練時間和成本

人工智能 新聞
微軟研究人員日前推出了名為 ZeRO++ 的新技術,用于優化在訓練大型 AI 模型時,容易遇到的數據傳輸成本和帶寬限制的難題,可顯著減少大模型訓練時間和成本。

6 月 27 日消息,微軟研究人員日前推出了名為 ZeRO++ 的新技術,用于優化在訓練大型 AI 模型時,容易遇到的數據傳輸成本和帶寬限制的難題,可顯著減少大模型訓練時間和成本

據悉,ZeRO++ 建立在現有的 ZeRO 傳輸技術基礎上,并提供增強的通信策略,可提高訓練效率,同時減少訓練時間和成本。

▲ 圖源 微軟

為了減少參數通信量,ZeRO++ 可對權重進行量化,其利用基于塊的量化方法來保持訓練精度,這種優化的量化過程相對原始 Zero 傳輸技術更快更準確。為了能夠盡量減少通信開銷,ZeRO++ 通過在每臺機器上保持完整的模型副本,以向 GPU 顯存換取通信帶寬。而在梯度通信方面,ZeRO++ 引入了一種名為 qgZ 的新的量化梯度通信方式,可以減少跨節點的流量和延遲。

▲ 圖源 微軟

這些改進的通信技術大大減少了通信量,微軟研究人員表示,與 ZeRO 相比,ZeRO++ 減少了高達 4 倍的通信量,提高了訓練吞吐量和效率。當在每個 GPU 上使用小批量大小時,在高帶寬集群中,ZeRO++ 相比 ZeRO-3 的吞吐量提高了 28% 至 36%。在低帶寬集群中,與 ZeRO-3 相比,ZeRO++ 實現了平均 2 倍的加速,使得大模型訓練在更多種類的集群上更為可行。

IT之家注:IT之家注意到,例如 Turing-NLG、ChatGPT 和 GPT-4 這樣的大型模型,其訓練需要跨多個 GPU 設備占用大量顯存和計算資源,而 ZeRO++ 引入了通信優化策略,以克服在低帶寬集群上進行訓練時原有 ZeRO 傳輸技術的帶寬限制。目前微軟已經放出了相關技術文檔,研究人員可以利用 ZeRO++ 更有效地訓練模型,在 AI 領域探索新的可能性。

責任編輯:龐桂玉 來源: IT之家
相關推薦

2023-06-25 09:55:04

模型方案

2023-06-27 13:49:00

GPU通信RLHF

2025-03-12 12:10:13

2011-05-13 17:58:21

軟件測試

2011-05-13 18:04:45

軟件測試

2011-05-13 17:53:48

軟件測試

2023-11-23 18:19:15

騰訊騰訊混元Angel

2024-12-02 11:45:48

2023-11-07 14:07:51

GPT-4大語言模型

2024-09-26 00:11:01

2020-09-11 10:48:49

微軟機器學習開源AI

2024-02-27 11:26:47

2023-09-20 16:55:15

華為AI 計算集群

2023-03-22 08:19:57

微軟AIOpenAI

2025-04-01 09:54:09

AI算法大模型AI

2023-07-11 09:37:24

CoDiAI 模型

2022-08-29 20:21:53

微軟Windows 11

2023-10-22 13:21:54

2025-01-09 08:01:10

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久久久久久久久一区 | 久久青草av | 久久精品国产v日韩v亚洲 | 麻豆亚洲| 免费久久网 | 日韩欧美字幕 | 国产成人网 | 91社区在线观看播放 | 蜜桃五月天 | av性色 | 日日碰碰 | 在线黄av | 国产精品久久二区 | 中文久久 | 最新超碰 | 国产精品五月天 | 欧美日韩一本 | 国产成人精品一区二区三区四区 | 黄色片免费在线观看 | 日本三级电影免费观看 | 国产欧美一区二区三区久久 | 国产精品美女久久久久aⅴ国产馆 | 毛片的网址| 久久久国产一区二区三区 | 视频在线一区二区 | 久久精品国产一区二区电影 | 在线观看视频91 | 欧美激情一区二区 | www日本在线 | 国内毛片毛片毛片毛片 | 亚洲精品一级 | 国产成人综合在线 | 亚洲精品久久久久久一区二区 | 狠狠干天天干 | 亚洲伊人久久综合 | 国产精品精品视频一区二区三区 | 视频一区在线 | 乳色吐息在线观看 | 日韩欧美操 | 国产精品一区二区三区四区五区 | 91精品国产综合久久婷婷香蕉 |