成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

大規模實用化量子化學計算曙光顯現,ByteDance Research開源工具集ByteQC

人工智能 新聞
字節跳動 ByteDance Research 團隊開發并開源的 ByteQC 軟件包克服了 GPU 開發過程中顯存受限,復雜邏輯難以高效實現的問題,實現了量子化學方法的高效 GPU 化。

真實化學體系包含大量的微觀粒子,其精確的嚴格計算需要指數高的復雜度,對這些體系的模擬一直是材料、制藥和催化等領域的難點和前沿。

為了解決這一問題,近日字節跳動 ByteDance Research 團隊開發并開源了 ByteQC —— 基于 GPU 加速的大規模量子化學計算工具集。該工具集使用強大的 GPU 算力,大幅度加速了常見的量子化學算法,同時結合領域內前沿的量子嵌入方法實現了量子化學「黃金標準」精度下的大規模量子化學體系的模擬。論文以大尺寸分子團簇,表面吸附問題為例,展示了 ByteQC 在真實材料計算中的應用潛力。

圖片

  • 論文鏈接:https://arxiv.org/abs/2502.17963
  • 代碼鏈接:https://github.com/bytedance/byteqc

該論文作者中還包括 NVIDIA 和北京大學的合作者。

摘要

在大規模體系中應用量子化學算法需要大量的計算資源,并且計算資源的需求隨著體系規模和所需精度的提高而增長。字節團隊開發并發展了開源項目 ByteQC(ByteDance Quantum Chemistry)。

在硬件層面,ByteQC 在現代 GPU 上高效實現了多種標準量子化學算法,包括平均場計算(Hartree-Fock 方法和密度泛函理論)以及后 Hartree-Fock 方法(如 M?ller-Plesset 微擾理論、隨機相位近似、耦合簇方法和量子蒙特卡洛方法)。

在算法層面,ByteQC 提供了一種量子嵌入方法,該方法在保持量子化學「黃金標準」精度的同時,顯著擴展了可計算的體系規模。

圖片

圖 1. ByteQC 軟件架構

方法

GPU 的顯存顯著小于 CPU 內存,同時架構的不同導致很多 CPU 可以高效實現的復雜邏輯在 GPU 上很難實現。為了解決這些問題 ByteQC 在開發過程中主要使用了以下方法:

1. 引入高效計算庫

張量縮并是量子化學計算的主要熱點之一,為此作者團隊引入了 NVIDIA 提供的高效張量計算庫 cuTENSR/cuTENSORMG。該計算庫在最小占用顯存的前提下高效計算張量縮并。作者團隊完善了相關的函數封裝,將其引入到了 Python / Cupy 的生態中。

2. 高效實現復雜計算邏輯

在周期性體系屏蔽計算中需要在 GPU 上實現高效的動態生產者 - 消費者模型,作者團隊提出使用動態的 warp 特例化高效實現。在平均場 Fock 矩陣構建中,涉及相鄰任意多的線程競態求和的問題。CUDA 自帶求和函數并未針對該特殊情況優化,作者團隊使用 warp 內的 shuffle 指令實現了高效地求和。

圖片

圖 2. 基于 warp 特例化的生產者-消費者模型

圖片

圖 3. 基于 warp 同步原語的相鄰 7 個線程的競態求和

3. 優化緩存和簡單高效的原位操作
ByteQC 的諸多代碼實現均進行了詳細的緩存分析,最大限度地實現了緩存的復用,減少了顯存需求。此外大量地使用 Cupy 提供的 kernel 接口,通過 CUDA kernel 實現了原位操作,減少了顯存的占用。

結果

基準測試表明相比于 100 核 CPU,ByteQC 的標準量子化學算法最高可實現單 A100 GPU 60 倍加速,大多數模塊的多卡標度可達到線性加速。對應可以單 GPU 計算的體系規模也大幅提升:

  • 耦合簇單、雙激發(CCSD):1,610 軌道
  • 帶微擾三重激發(CCSD (T)):1,380 軌道
  • 二階 M?ller-Plesset 微擾理論(MP2):11,040 軌道
  • 開放邊界條件下的平均場計算:37,120 軌道
  • 周期邊界條件下的平均場計算:超過 100,000 軌道

圖片

圖 4. ByteQC 的子模塊加速比(數據點)和計算規模(虛線)

此外,結合 ByteQC 中提供的量子嵌入功能,團隊在 2,753 軌道的水團簇問題和 3,929 軌道的氮化硼表面水吸附問題上均實現了 CCSD (T) 水平的「黃金標準」精度的計算。

圖片

圖 5. (左)水團簇結構和(右)氮化硼表面水吸附結構

總結

字節跳動 ByteDance Research 團隊開發并開源的 ByteQC 軟件包克服了 GPU 開發過程中顯存受限,復雜邏輯難以高效實現的問題,實現了量子化學方法的高效 GPU 化。

此外,結合量子嵌入方法,ByteQC 可以在保持 CCSD (T) 的精度的前提下,計算更大的規模。通過這些創新和優化,ByteQC 有望成為推動量子化學領域發展的工具。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2020-08-28 15:39:26

谷歌量子計算開發者

2023-04-12 15:58:58

2022-04-12 14:23:52

安卓cpu

2022-03-21 11:18:48

機器學習量子計算開發

2023-09-10 13:18:10

算法量子化

2022-03-02 10:52:30

量子計算科學家量子處理器

2024-02-29 11:53:22

神經網絡NNVMC偏微分方程求解器

2020-11-16 08:54:05

Google 開源技術

2017-05-08 14:56:07

開源Prophet預測

2016-01-29 20:23:23

華為

2022-01-20 16:05:02

Nature論文研究

2017-02-28 19:27:22

Facebook開源Prophet

2018-10-19 12:16:06

開源技術 數據

2023-04-06 16:29:18

模型AI

2018-09-10 15:02:51

開源技術 數據

2020-10-15 19:22:09

Menger機器學習強化學習

2010-06-07 13:28:08

IPv6網絡應用

2025-02-24 10:09:18

2023-10-26 01:26:04

Vaex數據數據集
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲视频二区 | 久久久久久久电影 | 国产精品一区三区 | 91夜夜夜| 综合久久av | 国产精品不卡 | 成人黄色在线观看 | 日韩视频在线一区 | 欧美成人hd | 亚洲欧美一区二区三区视频 | 欧美成人一区二区三区 | 在线观看免费福利 | 亚洲视频一区在线观看 | 色.com| 亚洲一区二区三区四区五区午夜 | 国产精久久久 | avav在线看 | 美女黄色在线观看 | 瑟瑟视频在线看 | 四虎av电影 | 欧美性大战久久久久久久蜜臀 | 亚洲欧美日韩在线不卡 | 99久久婷婷国产综合精品电影 | 91国自产 | 碰碰视频| 日韩一区二区三区av | 日韩一级精品视频在线观看 | 男女视频91 | 精品久久中文字幕 | 国产精品一区二区精品 | 久久久网 | 欧美999 | 男人天堂久久久 | 国产综合久久久久久鬼色 | 91精品国产综合久久福利软件 | 成人免费三级电影 | 日本视频一区二区 | 91se在线 | 久久天堂 | 国产日韩欧美一区二区在线播放 | 亚洲精选久久 |