成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

老黃H100再破紀錄,4分鐘訓完GPT-3!全新「特供版」H20、L20和L2曝光,性能史詩級縮水

人工智能 新聞
英偉達H100再次刷榜了,不到4分鐘就訓完GPT-3,比6月成績提升3倍。另外,特供版H20、L20和L2性能全都爆出。

H100再次在MLPerf中刷新了記錄!

英偉達超算NVIDIA Eos在GPT-3模型的基準測試中,只用了3.9分鐘就完成了訓練。

這比6月份的刷新記錄的成績——10.9分鐘,提升了近3倍。

Eos使用了多達10,752個H100和NVIDIA Quantum-2 InfiniBand網絡互連。

通過推算,Eos現在可以在短短8天內進行訓練,比之前使用512個A100 GPU的先進系統快73倍。

在本輪新的生成式AI測試中,1,024個NVIDIA Hopper架構GPU在2.5分鐘內完成了基于Stable Diffusion文本到圖像模型的訓練基準測試,為這一新工作負載設定了高標準。

與此同時,外媒曝光了英偉達為應對新規而打造的全新「特供版」芯片——H20、L20和L2。

系統擴展效率飆升93%

最新的結果部分是由于使用了有史以來應用于MLPerf基準測試的最多加速器。

10,752個H100 GPU遠遠超過了6月份AI訓練的規模,當時英偉達使用了3,584個Hopper GPU。

GPU數量擴展3倍,性能擴展了2.8倍,效率達到93%,這在一定程度上要歸功于軟件優化。

高效擴展是生成式AI的關鍵要求,因為LLM每年都在以一個數量級的速度增長。

最新結果顯示,即使是世界上最大的數據中心,英偉達也有能力應對這一前所未有的挑戰。

這一成就歸功于加速器、系統和軟件創新的全棧平臺,Eos和Microsoft Azure在最近一輪測試中都使用了該平臺。

Eos和Azure在各自的提交中都采用了10,752個H100。它們的表現相差不到2%,展示了英偉達AI在數據中心和公有云部署中的高效性。

英偉達依靠Eos完成了各種關鍵任務。

它有助于推進NVIDIA DLSS和ChipNeMo等計劃,后者是幫助設計下一代GPU的生成式AI工具。

9項基準測試,刷新記錄

除了在生成式AI方面取得進步,英偉達在這一輪測試中還刷新了幾項新的記錄。

比如,在訓練推薦系統模型的測試中,H100 GPU比上一輪快了1.6倍。在計算機視覺模型RetinaNet的測試中,性能提高了1.8倍。

這些性能提升來源于軟件和硬件規模擴充的優化結合。

英偉達再次成為唯一一家完成了所有MLPerf測試的公司。H100在9項基準測試中展示了最快的性能和最大的擴展性。

這些加速為用戶訓練大模型或用NeMo等框架自定義模型以滿足業務需求,帶來了更快上市時間、更低成本和節省能源。

這一輪測試中,包括華碩、戴爾技術、富士通、技嘉、聯想、QCT和超微等11家系統制造商在提交結果中使用了NVIDIA AI平臺。

特供版H20、L20和L2性能曝光

在過去幾年中,美國對高性能硬件出口實施了非常嚴格的限制。

尤其是在2023年11月生效的新規,更是要求所有達到一定總處理性能和/或性能密度的硬件都必須獲得出口許可。

據最新泄露的文件和四位熟悉內情的人士透露,為了遵守美國的出口管制,英偉達已經推出了三款全新的「中國定制版」芯片——HGX H20、L20 PCle 和 L2 PCle GPU。

其中,HGX H20配有高達96GB的HBM3顯存,以及4TB/s的帶寬,并且基于全新的Hopper架構。

與H100的50MB二級緩存相比,H20還擁有更大的60MB二級緩存。

然而在性能方面,HGX H20只能提供FP64精度1 TFLOPS(H100為34 TFLOPS)和FP16/BF16精度148 TFLOPS(H100為1,979 TFLOPS)的算力。

由此,功耗也從700W降到了400W。

有趣的是,基于安培架構并配備24GB HBM2的入門級A30 GPU,在FP64和FP16/BF16精度下,都要比HGX H20快不少。

至于L20和L2 PCIe GPU,則是基于閹割后的AD102和AD104核心,對應的是與L40和L40S相同的市場。

更直觀地,RTX 4090采用的便是AD102的變體,而4070和4070Ti則是基于AD104的變體。

除此之外,為了遵守新規,HGX H20、L20 PCle和L2 PCle GPU不僅性能是殘血的,而且還只配備了殘血版的NVLink連接。

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-06-30 09:53:08

英偉達AI

2023-06-29 21:30:30

英偉達用戶基礎設施

2025-05-26 09:10:00

2025-05-30 08:40:00

英偉達芯片AI

2023-06-29 17:40:10

模型測試

2025-02-27 09:34:32

2021-03-03 15:34:57

人工智能機器學習技術

2023-12-05 12:50:14

GPT-4DeepMind

2021-10-20 19:14:30

緩存CacheCPU

2013-09-17 09:49:29

程序集讀懂程序編程

2016-09-13 20:58:41

MySQ基礎入門Sql

2025-04-27 09:17:00

2025-03-21 09:46:50

2023-01-31 09:12:16

CPU芯片緩存

2015-01-20 13:19:52

OpenStack網絡層數據鏈路層

2022-02-17 16:47:40

OpenharmonIPC通信鴻蒙

2022-08-26 14:58:43

區塊鏈比特幣架構

2023-03-22 10:09:26

AIChatGPT

2024-07-26 11:47:37

2025-03-12 17:59:31

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产一区二区三区在线看 | 91资源在线 | 国产免费一区二区三区网站免费 | 欧美极品在线 | 欧美黑人一区 | 亚洲精品欧美一区二区三区 | 亚洲国产小视频 | 九九激情视频 | 国产成人精品免高潮在线观看 | 亚洲一级视频在线 | japan25hdxxxx日本 做a的各种视频 | 欧洲尺码日本国产精品 | 日本色高清 | 亚洲一区二区三区在线 | 蜜桃在线播放 | 午夜精品一区二区三区在线视 | 国产一区二区精品在线观看 | 欧美日韩精品影院 | 亚洲精品久久久一区二区三区 | 日本在线看 | 久久久久久久久国产成人免费 | 亚洲欧美综合 | 日韩中文一区二区 | 日本电影韩国电影免费观看 | 999国产视频 | 精品videossex高潮汇编 | 欧美亚洲一区二区三区 | 福利视频大全 | 久草www| 日韩精品成人 | 亚洲区在线 | 亚洲午夜精品一区二区三区他趣 | 九九亚洲 | 国产精品成人一区二区三区吃奶 | 久久久精品久久 | 国产精品久久久久久久久久三级 | 亚洲一区二区精品视频 | 亚洲一区二区视频 | 99re在线播放 | 人人干人人舔 | 国产夜恋视频在线观看 |