火山引擎助力深勢科技發布行業首個三維分子預訓練模型Uni-Mol
新藥物的不斷出現,一定程度上提高了人類生存質量和平均壽命。藥物設計領域,由于藥物分子有千萬種組合方式,結構又多樣,候選藥物的化學空間變得很大。
如何才能加速藥物的設計?成立于2018年的深勢科技,致力于運用人工智能和分子模擬算法,結合先進計算手段求解這一重要科學問題。
分子模擬算法的挑戰
深勢科技是 “AI for Science”科學研究范式的踐行者,為人類文明最基礎的生物醫藥、能源、材料和信息科學與工程研究打造新一代微尺度工業設計和仿真平臺。
這家高新技術企業具有強大的科研與產業落地能力。例如在醫藥領域,深勢科技通過Hermite Uni-FEP、Uni-Fold、RiD等模塊,將自由能微擾理論、分子動力學、增強采樣算法與高性能計算相結合,精準預測蛋白質結構及構象變化,并以化學精度高效評估蛋白與配體的結合自由能,為藥物研發人員提供高效精準的理論指導,提升藥物設計與優化效率。
由于分子模擬算法對算力等資源呈線性依賴,深勢科技在底層資源調度、算法優化等方面遇到了以下挑戰:
- 計算任務數量多,波動大,需要底層平臺提供靈活高效的彈性調度能力;
- 大模型,大內存訓練;
- 海量非結構化文件數據讀取;
深勢科技選擇與火山引擎合作,獲取高效、可靠、靈活的高性能計算服務。
行業首個三維分子預訓練模型
火山引擎為深勢科技提供了基于GPU加速的科學計算解決方案,可以根據業務流量自動彈性擴容,以及自動采集各節點健康狀態并制定相應自愈策略,實現智能運維。比如說,當遇到節點不可用時,該方案能夠替換和重新調度節點上的容器,保障業務平穩健康運行。
科學計算解決方案依托火山引擎的云基礎產品,提供可彈性伸縮的加速計算服務器GPU,掛載高性能的文件服務集群以及超高并發吞吐的并行文件存儲,并搭配專為AI和科學計算等高性能計算場景設計的機器學習平臺,賦能深勢科技專注于核心業務發展。
深勢科技相關負責人表示:“使用科學計算解決方案后,我們可以專注于構建應用本身,無需直接購買和管理底層服務器等基礎設施,有效降低了IT維護成本。”
火山引擎科學計算解決方案有力的保障了深勢科技的研發進度。近日,深勢科技發布了首個三維分子預訓練模型 Uni-Mol (https://github.com/dptech-corp/Uni-Mol)。
Uni-Mol框架示意圖
Uni-Mol直接將分子三維結構作為模型輸入,而非采用一維序列或二維圖結構。從三維信息出發的表征學習讓
Uni-Mol 在幾乎所有與藥物分子和蛋白口袋相關的下游任務上都超越了 SOTA(state of the art),也讓 Uni-Mol 得以能夠直接完成分子構象生成、蛋白-配體結合構象預測等三維構象生成相關的任務,并超越現有解決方案。
未來,深勢科技還會基于火山引擎平臺推出一系列蛋白質自由能、絕對自由能的計算功能,為行業帶來革新性的先進生產力工具,加速藥物等設計的發展。