成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

機器學習模型以出色的精度進行有機反應機理分類

人工智能 新聞
研究結果表明,人工智能引導的機理分類是一種強大的新工具,可以簡化和自動化機理闡明。預計這項工作將進一步推動全自動有機反應發現和開發的發展。

化學反應的發現不僅受到獲得實驗數據的速度的影響,還受到化學家理解這些數據的難易程度的影響。揭示新的催化反應的機理基礎是一個特別復雜的問題,通常需要計算和物理有機化學的專業知識。然而,研究催化反應很重要,因為它們代表了最有效的化學過程。

近日,來自英國曼徹斯特大學(UoM)化學系的 Burés 和 Larrosa 報告了一種機器學習模型,展示了可以訓練深度神經網絡模型來分析普通動力學數據并自動闡明相應的機理類別,而無需任何額外的用戶輸入。該模型以出色的精度識別各種類型的機理。

研究結果表明,人工智能引導的機理分類是一種強大的新工具,可以簡化和自動化機理闡明。預計這項工作將進一步推動全自動有機反應發現和開發的發展。

該研究以「Organic reaction mechanism classification using machine learning」為題,于 2023 年 1 月 25 日發布在《Nature》上。

圖片

論文鏈接:?https://www.nature.com/articles/s41586-022-05639-4?

化學反應機理的傳統闡明方式

確定將底物轉化為產品所涉及的基本步驟的確切順序,對于合理改進合成方法、設計新催化劑和安全擴大工業過程至關重要。為了闡明反應機理,需要收集多個動力學曲線,人類專家必須對數據進行動力學分析。盡管反應監測技術在過去幾十年中有了顯著改進,以至于動力學數據收集可以完全自動化,但機理闡明的基礎理論框架并沒有以同樣的速度發展。

當前的動力學分析流程包括三個主要步驟:從實驗數據中提取動力學特性,預測所有可能機理的動力學特性,以及將實驗提取的特性與預測的特性進行比較。

一個多世紀以來,化學家們一直在從反應速率中提取機理信息。今天仍在使用的一種方法是評估反應的初始速率,重點關注最初百分之幾的起始物質的消耗。這種方法很受歡迎,因為在大多數情況下,反應物濃度隨時間的變化在反應開始時是線性的,因此分析起來很簡單。雖然很有見解,但這種技術忽略了在大部分時間過程中發生的反應速率和濃度的變化。

在過去的幾十年里,已經發展出了更先進的方法來評估整個反應過程中反應組分的濃度。數學技術進一步促進了這些方法,這些技術從反應動力學圖中揭示了參與一個反應步驟的組分的數量(也稱為反應組分的順序)。這些技術肯定會繼續為化學反應性提供深刻的見解,但它們局限于分析反應組分的順序,而不是提供一個更全面的機理假設來描述催化系統的動力學行為。

圖片

圖 1:動力學分析的相關性和最新技術。(來源:論文)

AI 改變動力學分析領域

機器學習正在徹底改變化學家解決問題的方式,從設計分子和路線到合成分子,再到理解反應機理。Burés 和 Larrosa 現在通過機器學習模型,根據模擬的反應動力學特征對反應進行分類,為動力學分析帶來了這場革命。

在這里,研究人員證明了一個基于模擬動力學數據訓練的深度學習模型能夠正確地闡明來自時間濃度分布的各種機理。機器學習模型消除了速率定律推導和動力學性質提取和預測的需要,從而簡化了動力學分析,極大地促進了所有合成實驗室對反應機理的闡明。

由于對所有可用動力學數據進行了整體分析,該方法提高了詢問反應曲線的能力,消除了動力學分析過程中潛在的人為錯誤,并擴大了可分析的動力學范圍,包括非穩態(包括活化和失活過程)和可逆反應。這種方法將是對目前可用的動力學分析方法的補充,并將在最具挑戰性的情況下特別有用。

具體研究

研究人員定義了 20 類反應機理,并為每一類制定了速率定律。每種機理都由一組動力學常數(k1, … kn) 和化學物質濃度的常微分方程(ODE)函數進行數學描述。然后,他們求解了這些方程式,生成了數百萬個描述反應物衰變和產物生成的模擬。這些模擬動力學數據用于訓練學習算法以識別每個機理類別的特征簽名。生成的分類模型使用動力學曲線作為輸入,包括初始和時間濃度數據,并輸出反應的機理類別。

圖片

圖 2:機理范圍和數據構成。(來源:論文)

深度學習模型的訓練通常需要大量數據,當必須通過實驗收集這些數據時,這可能會帶來相當大的挑戰。

Burés 和 Larrosa 訓練算法的方法避免了產生大量實驗動力學數據的瓶頸。在案例中,研究人員能夠通過數值求解 ODE 集來生成 500 萬個動力學樣本用于模型的訓練和驗證,而無需使用穩態近似。

模型包含 576,000 個可訓練參數,并結合使用兩種類型的神經網絡:(1) 長短期記憶神經網絡,一種用于處理時間數據序列(即時間濃度數據)的循環神經網絡;(2) 全連接神經網絡,用于處理非時間數據(即每次動力學運行中催化劑的初始濃度和長短期記憶提取的特征)。該模型輸出每種機理的概率,概率總和等于 1。

研究人員使用模擬動力學曲線的測試集評估了訓練模型,并證明它正確地將這些曲線分配給機理類,準確率為 92.6%。

圖片

圖 3:機器學習模型在測試集上的性能,每個動力學曲線有六個時間點。(來源:論文)

即使有意引入「嘈雜」數據,該模型也表現良好,這意味著它可用于對實驗數據進行分類。

圖片

圖 4:誤差和數據點數量對機器學習模型性能的影響。(來源:論文)

最后,研究人員使用先前報道的幾個實驗動力學曲線對他們的模型進行了基準測試。預測的機理與早期動力學研究的結論非常吻合。在某些情況下,該模型還識別了在原始工作中沒有檢測到的機理細節。對于一個具有挑戰性的反應,該模型提出了三個非常相似的機理類別。然而,作者正確地說,這個結果不是一個錯誤,而是他們模型的一個特征,因為它表明需要進一步的具體實驗來探索機理。

圖片

圖 5:具有實驗動力學數據的案例研究。(來源:論文)

總之,Burés 和 Larrosa 開發了一種方法,不僅可以自動執行從動力學研究中推導出機理假設的漫長過程,還可以對具有挑戰性的反應機理進行動力學分析。與數據分析中的任何技術進步一樣,由此產生的機理分類應被視為需要進一步實驗支持的假設。誤解動力學數據的風險始終存在,但該算法能夠在少量實驗的基礎上以高精度識別正確的反應路徑,可以說服更多研究人員嘗試動力學分析。

因此,這種方法可以普及和推動動力學分析納入反應開發流程,尤其是當化學家對機器學習算法越來越熟悉時。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2022-06-05 21:16:08

機器學習Python

2022-08-15 15:16:20

機器學習圖片深度學習

2020-08-12 09:46:46

TensorFlow數據機器學習

2018-09-06 22:19:04

機器學習人工智能微軟

2017-01-06 13:33:35

初學實踐分類網絡

2017-07-25 09:19:02

2020-11-23 09:26:22

機器學習技術算法

2020-02-03 08:00:00

機器學習人工智能AI

2022-04-11 15:40:34

機器學習研究推理

2024-10-30 16:59:57

Python機器學習

2017-08-25 14:05:01

機器學習算法模型

2020-09-22 14:59:52

機器學習人工智能計算機

2017-07-13 10:12:58

機器學習

2022-07-14 10:33:20

XGBoost機器學習

2022-09-20 23:42:15

機器學習Python數據集

2021-03-10 14:21:33

人工智能機器學習算法

2019-01-23 11:45:47

機器學習人工智能機器人

2022-10-30 15:00:40

小樣本學習數據集機器學習

2022-06-09 09:14:31

機器學習PythonJava

2020-09-27 18:29:03

代碼機器學習數據科學
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 在线中文视频 | 一区在线观看视频 | 久草网在线视频 | 丁香久久 | 亚洲国产网址 | 伦理午夜电影免费观看 | 国产目拍亚洲精品99久久精品 | 91精品麻豆日日躁夜夜躁 | 国产福利在线视频 | 国产精品视频一二三区 | 精品中文字幕视频 | 在线亚洲免费 | 日韩久久久久久久久久久 | 精品亚洲一区二区三区 | 国产视频一区二区 | 91视频一区 | 真人毛片 | 欧美激情免费在线 | 久久精品一区二区三区四区 | 高清黄色网址 | 国产一区二区 | 久操国产 | 日韩久久成人 | 自拍中文字幕 | jav成人av免费播放 | 日日摸日日爽 | 少妇性l交大片免费一 | 精品欧美一区二区精品久久久 | 国产成人啪免费观看软件 | 国产精品久久久久久久久久免费看 | 免费特级黄毛片 | 性高朝久久久久久久3小时 av一区二区三区四区 | 能看的av | 久草成人 | 91亚洲国产成人久久精品网站 | 亚洲欧美在线观看 | 国产精品国产精品 | 在线免费观看成年人视频 | 精品一区二区三区在线观看国产 | 国产精品日韩欧美一区二区三区 | av男人天堂影院 |