成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

彌合化學反應預訓練和條件分子生成之間的差距,北大&望石智慧提出「統一」模型

人工智能 新聞
與分子對接等虛擬篩選方法相結合,該生成模型可以實現高效的構效關系研究。該模型生成的巨大的可合成類藥物化學空間可以提高藥物再利用或命中分子搜索的真陽性率。

化學反應是藥物設計和有機化學研究的基礎。研究界越來越需要一種能夠有效捕獲化學反應基本規則的大規模深度學習框架。

近日,來自北京大學和望石智慧的研究團隊提出了一種新方法來彌合基于反應的分子預訓練和生成任務之間的差距。

受有機化學機制的啟發,研究人員開發了一個新的預訓練框架,使其能夠將歸納偏差納入模型中。所提框架在執行具有挑戰性的下游任務中取得了最先進的結果。通過掌握化學知識,生成框架克服了當前依賴少量反應模板的分子生成模型的局限性。在大量的實驗中,模型生成了高質量的可合成藥物樣結構。

總的來說,該研究向各種基于反應的應用程序的大規模深度學習框架邁出了重要一步。

該研究以《Bridging the gap between chemical reaction pretraining and conditional molecule generation with a unified model》為題,于 2023 年 12 月 5 日發布在《Nature Machine Intelligence》上。

論文鏈接:https://www.nature.com/articles/s42256-023-00764-9

深度學習模型已在眾多科學研究領域得到應用。預訓練框架有助于新任務的無縫集成,從而加快建模過程,特別是對于標記數據有限的場景。

化學反應是藥物設計和有機化學研究的基礎。目前,數據挖掘研究和應用已經使深度學習模型能夠應用于化學反應。基于這些數據,已經有許多數據驅動的研究深入研究化學反應的表征學習。

表征學習是指從數據中自動學習有用的特征,然后將其用于各種下游任務。現有方法忽略了有機化學的基本理論,限制了其性能。

基于化學反應的分子生成

除了反應分類任務之外,基于化學反應的分子生成也是一個重要的應用。早期的研究總是采用基于模板的逐步分子生成策略。

這些基于模板的方法在很大程度上依賴于預定義的構建模塊和反應,這縮小了可訪問的化學空間。在反應產物預測領域也發現了類似的趨勢,其中基于模板的方法不能外推到復雜的反應;這個問題可以通過使用無模板方法來解決。

在基于反應的分子生成任務中,無模板方法也表現出了優于基于模板方法的泛化優勢。然而,現有的無模板分子生成方法只能基于預定義的反應物庫生成分子。除此之外,對于藥物設計中的先導化合物或先導化合物優化階段,利用化學反應作為編輯工具來修改給定的結構是更有利的。生成的化學庫將重點關注可以用更少的反應步驟合成的化學空間的子集。

一個新、全面的化學反應深度學習框架

在此,研究人員提出了一個新的、全面的化學反應深度學習框架,稱為 Uni-RXN。旨在解決兩個基本任務:自監督表征學習和條件生成建模。

圖片

圖示:Uni-RXN 的組成和方法。(來源:論文)

與現有方法不同,研究人員提出了一套專門針對化學反應精心設計的自監督任務。這些任務包括反應中心預測、主反應物與子反應物配對以及反應物-產物配對。在對具有挑戰性的反應任務的廣泛評估中,Uni-RXN 方法超越了最先進的水平,證明了其有效捕獲化學反應領域知識的能力。所獲得的有希望的結果為廣泛的下游應用鋪平了道路。

通過有效捕獲化學規則,Uni-RXN 非常適合生成任務。與依賴于從預定義反應物庫中選擇片段的傳統方法不同,Uni-RXN 將分子結構作為輸入條件并生成相應反應物的表示,同時保持反應內的排列不變性。利用密集向量相似性搜索包的強大功能,Uni-RXN 能夠從大型反應物和試劑庫中高效檢索反應物。隨后,采用反應預測模型來生成產物輸出。

與僅探索化學空間的有限子集的基于模板的方法相比,Uni-RXN 在生成更廣泛的可合成藥物樣結構方面表現出卓越的性能。這一特點使其特別適合虛擬 library 枚舉,并得到全面統計分析和案例研究的支持。

Uni-RXN 方法具有多種優勢,能夠為具有挑戰性的化學反應分類任務派生豐富的表示。Uni-RXN 大幅優于其他基線模型,在每類僅提供 4 個數據點的情況下實現了 58.7% 的準確率。

表 1:化學反應分類的準確度。(來源:論文)

Transformer 模型還可以應用于區分化學反應數據中的優化反應和未優化反應。此外,編碼器可以毫不費力地應用于結構條件生成。

圖示:Uni-RXN 的檢索性能和注意力權重。(來源:論文)

實驗結果強調了所提模型生成的分子的有利特性,使它們非常適合藥物發現任務。該模型能夠生成具有更多類似藥物特性和可合成可及性的分子。

圖示:Uni-RXNGen 流程與性能。(來源:論文)

與分子對接等虛擬篩選方法相結合,該生成模型可以實現高效的構效關系研究。該模型生成的巨大的可合成類藥物化學空間可以提高藥物再利用或命中分子搜索的真陽性率。

責任編輯:張燕妮 來源: 機器學習
相關推薦

2025-06-11 14:45:57

強化學習訓練模型

2019-07-17 15:07:06

物聯網網絡安全技術

2023-12-04 18:08:49

云安全云計算

2023-11-29 14:00:00

AI數據

2021-11-23 10:15:57

Linux代碼匿名頁

2023-08-13 19:41:18

Gherkin開源

2024-02-29 16:51:36

GenAI運營供應鏈

2023-07-11 15:43:31

模型分子

2018-10-18 14:37:01

國際貿易AI反應

2020-08-28 15:39:26

谷歌量子計算開發者

2022-11-02 14:02:02

強化學習訓練

2023-08-08 06:54:43

2021-09-26 10:47:12

預訓練模型GPT

2024-01-12 16:03:14

數據管理大數據數據領導者

2023-02-17 17:54:13

Penpot代碼

2022-11-01 14:50:00

數據計算

2015-11-13 10:35:05

大數據醫院信息化WOT

2025-01-06 10:00:00

模型視覺生成

2025-05-15 09:04:00

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产片侵犯亲女视频播放 | 免费观看色 | 日本在线免费视频 | 国产精品亚洲成在人线 | 久久精品高清视频 | 日韩黄a | 自拍亚洲 | 日韩精品在线看 | 亚洲免费在线 | 亚洲一区二区免费 | 欧美一区二区成人 | 亚洲欧美综合精品另类天天更新 | 国产成人av在线播放 | 亚洲一区二区三 | 亚洲国产视频一区二区 | 精品乱子伦一区二区三区 | 91免费在线 | 一本岛道一二三不卡区 | 粉嫩一区二区三区国产精品 | 91一区二区三区 | 男人的天堂久久 | 亚卅毛片 | 国产成人精品一区二区三区在线 | 欧美精品在线免费 | 女人夜夜春| 五月婷婷色 | 欧美亚洲国产一区 | 日韩精品一区二区三区视频播放 | 日日摸天天添天天添破 | 日韩精品一区二区三区视频播放 | 国产精品永久久久久 | 欧美日韩三级视频 | 国产综合久久久久久鬼色 | 日本三级做a全过程在线观看 | 日日夜夜操天天干 | 国产一区二区三区日韩 | 亚洲国产一区二区视频 | 免费激情网站 | 久草a√ | 国产成人精品午夜视频免费 | 亚洲精品一级 |