成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

全球AI算力報告出爐,LLM最愛A100!谷歌坐擁超100萬H100等效算力

人工智能 新聞
全球有多少AI算力?算力增長速度有多快?在這場AI「淘金熱」中,都有哪些新「鏟子」?AI初創企業Epoch AI發布了最新全球硬件估算報告。

AI的物質基礎是機器學習硬件,例如圖形處理單元(GPU)和張量處理單元(TPU)。

據不完全統計,目前全球超過140款AI加速器,用于開發和部署深度學習時代的機器學習模型。

Epoch AI帶來了全球算力的估計報告,利用公開信息估計了全球機器學習硬件的現狀和趨勢。

圖片

除了傳統硬件廠商英偉達、AMD等紛紛推出加速卡,一些新興勢力開始「造芯」,算力持續提升。

圖片

2008至2024年全球機器學習硬件的計算能力示意圖

除了GPU,硬件類型也豐富了起來。比如,出現了專門處理張量計算的TPU(張量處理單元,Tensor Processing Unit)。

報告的主要結論,總結如下:

  1. 總量每年增長43%,價格下降30%。
  2. 低精度計算成為主流。
  3. 頂級硬件能效每1.9年翻一番。
  4. 八年間,訓練大型模型所需的處理器數量增加了20多倍。
  5. 全球NVIDIA支持的計算能力平均每10個月翻一番。

關鍵發現:ML硬件的「摩爾定律」

ML硬件每年增長43%

以16位浮點運算衡量,機器學習硬件的性能以每年43%的速度增長,每1.9年翻一番。32位性能也存在類似的趨勢。

優化機器學習數字格式和張量核心提供了額外的改進。

驅動因素還包括晶體管數量的增加和其他半導體制造技術的進步,以及針對AI工作負載的專門設計。這種改進降低了每FLOP的成本,提高了能源效率,并實現了大規模人工智能訓練。

圖片

機器學習硬件在不同精度下的峰值計算性能

性價比每年提升30%

每美元性能提升迅速,并且任何給定精度和固定性能水平的硬件每年都會便宜30%。與此同時,制造商不斷推出更強大、更昂貴的硬件。

圖片

單位時間單位價格下的FLOP

低精度格式是趨勢

在使用針對人工智能計算優化的張量核心和數據格式時,GPU通常速度更快。

與使用非張量FP32相比,TF32、張量FP16和張量INT8在總體性能趨勢中平均提供約6倍、10倍和12倍的性能提升。

一些芯片甚至實現了更大的加速。例如,H100在INT8時的速度比在FP32時快59倍。

自推出以來,這些改進約占整體性能趨勢改進的一半。隨著開發人員利用這種性能提升,使用較低精度格式(尤其是張量FP16)訓練的模型已經變得很常見。

圖片

能效每1.9年翻一番

根據歷史數據,頂級GPU和TPU的能效每1.9年翻一番。

就tensor-FP16格式而言,效率最高的加速器是Meta的MTIA(每瓦高達2.1x10^12FLOP/s)和NVIDIA H100(每瓦高達1.4x10^12FLOP/s)。即將推出的Blackwell系列處理器可能會更有效率,具體取決于其功耗。

圖片

模型也各有所愛

在Epoch的數據集中,NVIDIA A100是用于高引用或最先進人工智能模型的最常用的硬件,自發布以來已用于65個著名ML模型。

其次是NVIDIA V100,用于訓練55個著名模型,其次是谷歌的TPU v3,用于47個。

然而,估計NVIDIA H100到2023年底的銷量已超過A100,因此它可能在不久的將來成為訓練模型最受歡迎的GPU。

圖片

不同加速器訓練的知名模型數量

圖片

2019年至今,不同領域大模型訓練所需算力比較

訓練集群規模猛增

用于訓練大型語言模型(LLMs)的處理器數量的顯著增長。

  • Google NASv3 RL網絡(2016):使用了800個GPU進行訓練。
  • Meta Llama 3.1 405B(2024):使用了16,384個H100 GPU進行訓練。

這意味著在短短八年間,訓練大型模型所需的處理器數量增加了20多倍。

圖片

四大「算力帝國」?

谷歌、微軟、Meta和亞馬遜擁有相當于數十萬個NVIDIA H100的AI算力。

這些計算資源既用于他們內部的AI開發,也用于云客戶,包括許多頂級AI實驗室,如OpenAI和Anthropic。

谷歌可能擁有相當于超過一百萬個H100的計算能力,主要來自他們的TPU。

微軟可能擁有最大的NVIDIA加速器庫存,約為50萬個H100當量。

大量的AI計算能力由這四家公司以外的集團共同擁有,包括其他云公司如Oracle和CoreWeave,計算用戶如特斯拉和xAI,以及各國政府。

之所以重點介紹谷歌、微軟、Meta和亞馬遜,因為他們可能擁有最多的計算能力,而其他公司的數據公開較少。

初步工作發現,截至2024年中,谷歌TPU的總算力大約是英偉達芯片的30%。

圖片

英偉達每年不止翻一番

自2019年以來,NVIDIA芯片的總可用計算能力大約每年增長2.3倍,從而能夠訓練越來越大的模型。

也就是說,全球NVIDIA組成的計算能力平均每10個月翻一番。

Hopper這一代NVIDIA AI芯片目前占其所有AI硬件總計算能力的77%。按照這種增長速度,舊的芯片型號在其推出后大約4年左右,對累計計算量的貢獻往往會低于一半。

請注意,此分析不包括TPU或其他專用AI加速器,因為這方面的數據較少。TPU可能提供與NVIDIA芯片相當的總計算能力。

圖片

按芯片型號分解,發現目前大約77%的NVIDIA FLOP/s來自Hopper代際的GPU,如H100。

目前估計NVIDIA GPU可提供4e21 FLOP/s的計算能力,約相當于400萬個H100。

圖片

注意:這些估計基于NVIDIA的收入申報文件,并假設不同時代芯片的分布隨時間變化的模式與AI集群數據集中的模式相同。

圖片

英偉達23-24年季度財報

此外,報告發現自2019年以來,計算能力的累計總和(考慮折舊)每年增長2.3 倍。

但僅考慮數據中心銷售額,而忽略NVIDIA收入報告中「游戲」(Gaming)銷售額帶來的計算能力。

公開數據集

Epoch同時公布了機器學習硬件數據集和數據分析源代碼。

圖片

https://epoch.ai/data/machine-learning-hardware-documentation#overview

詳細數據分析流程,參見下列NoteBook。

圖片

https://colab.research.google.com/drive/1gbbrKDKFjghUPmH-aSI9ACtb1Iuwg-cR?usp=sharing

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-04-06 09:37:22

谷歌AI

2024-09-05 13:30:00

2025-01-20 07:30:00

2023-08-29 13:51:00

AI數據

2023-04-05 14:31:49

AI超算人工智能

2023-11-14 08:59:25

英偉達AI

2024-10-31 13:39:47

2024-04-15 12:53:00

模型訓練

2024-05-27 00:50:00

2024-01-19 12:34:39

2024-05-29 14:11:00

2023-08-09 17:19:54

服務器計算

2020-12-18 15:29:19

AI 算力人工智能

2024-10-28 08:15:00

2023-08-06 13:01:34

AI開發

2024-06-24 08:30:00

2023-03-14 13:06:54

2023-10-18 13:17:12

AI芯片英偉達美國
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 中文字幕成人在线 | 91精品国产综合久久久动漫日韩 | 99这里只有精品视频 | 免费一级淫片aaa片毛片a级 | 成人国产精品色哟哟 | 亚洲精品1区 | 国产精品自产拍在线观看蜜 | 18gay男同69亚洲网站 | 久久91| 91伊人| 精品一区二区三区电影 | 波多野结衣一区二区 | 在线一区视频 | 久久久久成人精品 | 成人在线视频看看 | 国产精品一区二区三区在线 | 美女视频黄的 | 一区二区三区亚洲 | 日日夜夜免费精品 | 亚洲视频精品 | 日本成人区 | 日本在线视频一区二区 | 狠狠爱综合| 黄网站在线播放 | 欧洲亚洲一区 | 免费毛片网站在线观看 | 天天综合91| 国产精品自产拍在线观看蜜 | 99reav| 国产精品久久国产精品久久 | 999久久久久久久久6666 | 久久com| 国产乡下妇女做爰 | 午夜在线精品 | 在线观看免费av网 | 国产免费自拍 | 精品欧美一区二区三区免费观看 | h视频在线观看免费 | 欧美精品第三页 | 91精品午夜窝窝看片 | 欧美精品 在线观看 |