DeepMind 開源 AlphaFold 2,生命科學領域或迎來巨變
DeepMind 近日在《自然》雜志上發表了一篇論文,在論文中 DeepMind 詳細介紹了 AlphaFold 2 ,并正式開源了 AlphaFold 2,借助 AlphaFold 2 的人工智能系統可以更加準確的預測蛋白質的形狀。DeepMind 表示,隨著代碼庫對外公開希望能夠擴大 AlphaFold 2 在醫療保健和生命科學等領域的使用。
2018 年 12 月,DeepMind 試圖用 AlphaFold 解決蛋白質折疊的挑戰,DeepMind 當時表示,AlphaFold 可以比之前的解決方案更精確地預測蛋白質結構。經過兩年時間的改進,AlphaFold 2 于 2020 年 12 月推出,新版本進行了多項改進,大幅提升了蛋白質折疊預測。在第 14 屆 CASP 的評估結果中,AlphaFold 2 的平均誤差僅有 0.1 納米(相當于一個原子的寬度),人工智能的預測結果可與實驗方法的結果相媲美。近日 DeepMind 則正式將 AlphaFold 2 開源。
蛋白質 —— 由氨基酸組成的大分子,是組織、肌肉、毛發、酶、抗體和其他生物體的基本組成部分 —— 是在 DNA 中編碼的。正是這些基因定義限制了他們的三維結構,進而決定了他們的能力。但是蛋白質的 "折疊",僅僅從相應的基因序列中是很難弄清楚的。DNA 只包含關于氨基酸殘基鏈的信息,而不是這些鏈的最終形式。
正如上段所述,蛋白質的形狀很重要,因為它有助于確定該蛋白質的功能。大多數藥物通過與蛋白質結構中形狀非常特殊的 "口袋" 結合而發揮作用。因此,了解蛋白質的確切形狀可能是開發新藥的關鍵一步,AlphaFold 2 有可能加速藥物研發與發現。
AlphaFold 從生物學、物理學和機器學習領域獲得了靈感。 它利用了這樣一個事實,即一個折疊的蛋白質可以被認為是一個 "空間圖"。AlphaFold 利用一種人工智能算法,試圖解釋這個圖的結構,同時利用進化相關的序列、多序列比對和氨基酸殘基對的表示法對它正在構建的隱性圖進行推理。
在開源版本中,DeepMind 大大簡化了 AlphaFold 2。原本該系統需要數天的計算時間才能為 CASP 的一些條目生成結構,而開源版本的速度大約提升了 16 倍。依據蛋白質的大小它可以在幾分鐘到幾小時內生成結構。
DeepMind 認為,如果進一步完善 AlphaFold,未來可以將其應用于此前蛋白質折疊領域難以解決的問題,包括與流行病學工作相關的問題。去年,DeepMind 預測了 SARS-CoV-2 的幾個蛋白質結構,其中包括 ORF3a,而在此之前 ORF3a 的構成一直是一個謎。在 CASP 14 上,DeepMind 還預測了另一種冠狀病毒蛋白 ORF8 的結構,該結構后來被科研人員所證實。
除了幫助應對流行病,DeepMind 預計 AlphaFold 2 還將被用于探索目前缺乏模型的數以億計的蛋白質。在公開的通用蛋白質數據庫中,目前有 1.8 億個蛋白質序列,而只有大約 17 萬個蛋白質結構。
DeepMind 表示,它致力于使 AlphaFold "規模化",并與合作伙伴共同探索新的前沿領域,如多種蛋白質如何形成復合物并與 DNA、RNA 和小分子相互作用。今年早些時候,DeepMind 還宣布與位于日內瓦的 "Drugs for Neglected Diseases Initiative" 建立新的合作關系,該組織利用 AlphaFold 確定了非昔硝唑(Fexinidazole)作為有毒化合物美拉胂醇(Melarsoprol)的替代品用于治療昏睡病。
本文轉自OSCHINA
本文標題:DeepMind 開源 AlphaFold 2,生命科學領域或迎來巨變
本文地址:https://www.oschina.net/news/151434/deepmind-alphafold-2-for-protein-structure-predictions