LUMI 超算仍在代碼移植和開源調優,計劃年中上線
位于芬蘭的 LUMI(Large Unified Modern Infrastructure)超級計算機目前仍在組裝過程中。按照原計劃,這臺擁有 375+ PFLOPs 算力的超算應該在 2021 年底前上線。但受到供應鏈危機的影響,其當下的目標是在 2022 年年中實現普遍供應。
LUMI 基于 AMD EPYC 處理器和 Instinct 計算卡打造,一旦投入運行,其預計將超越目前最快的日本 Fugaku 超算系統。LUMI 共有 2560 個計算節點,每個節點由一枚 64 核 AMD Trento CPU 和 4 路 AMD Instinct MI250X GPU 加速卡組成。
科技網站 Phoronix 指出,雖然硬件在不斷完善,但 LUMI 團隊的 HPC 工程師仍一直在努力優化開源的 Linux 軟件棧。LUMI 超級計算機的工程師、CSC 首席 HPC 科學家 Georgios Markomanolis 曾在去年 2 月發布過一個演講,提到了彼時 Radeon Open eCosystem 的情況,以及他們為使傳統上以 NVIDIA 為中心的 HPC 工作負載在當時的 AMD 測試硬件中運行而進行的所有移植工作 —— 其最初規劃使用的是 MI100,但 LUMI 同時也在等待 MI250X 的成熟落地。
日前舉行的 FOSDEM 2022 上,Georgios Markomanolis 分享了該團隊在過去一年中所進行的相關開源工作的一些信息?,F如今,HPC 工程師在對 AMD 用于 GPU 計算的 ROCm 開源軟件棧方面已經積累了更多的經驗;同時繼續在 HIP 上將更多的 CUDA 代碼庫移植到 AMD GPU 支持的軟件中,并努力微調代碼,以便在 AMD 硬件上運行時獲得最大性能。
此外,在過去的一年里,工具包中還新增了一個值得一提的軟件組件:AMD 開源的 GPUFort,用于幫助將 OpenACC 和 CUDA Fortran 代碼遷移到 AMD 的架構中。
盡管相關工作依然很復雜,但通過將復雜的代碼庫轉移到 AMD ROCm 空間,可以獲得最佳的 GPU 性能。
更多有關 CSC 為準備 LUMI 上線而進行的開源移植和調優工作詳情可在 FOSDEM.org 上查看,其中包含有 Georgios Markomanolis 的演講 PPT 和視頻記錄。想了解更多關于 LUMI 的信息可以查看 lumi-supercomputer.eu。
本文轉自OSCHINA
本文標題:LUMI 超算仍在代碼移植和開源調優,計劃年中上線
本文地址:https://www.oschina.net/news/182098/lumi-amd-oss-tuning-2022