AI預測蛋白質結構登上Science、Nature年度技術突破,潛力無窮
如果要給 AI 領域的 2021 評個最具突破獎,你會選擇誰?《science》和《nature》給出的答案都是「蛋白質結構預測」。
今年 7 月,蛋白結構兩大 AI 預測算法相繼開源,一個是 DeepMind 的 AphaFold2,另一個是華盛頓大學等機構研發的 RoseTTAFold。現在這兩大算法被《science》評為 2021 年度突破。
眾所周知,蛋白質中的長鏈氨基酸扭曲、折疊并交織成復雜的三維結構,這些結構可能很難,甚至根本不可能破譯。數十年來科學家們一直希望通過基因序列簡單地預測蛋白質的結構形狀,以開啟一個洞察生命運作機理的新世界,但一直進展緩慢。
直到 DeepMind 宣布,人們首次發現了一種通過計算來預測蛋白質結構的方法。即使在不知道相似結構的情況下,AI 也可以在原子層面上精確預測蛋白質的結構。
DeepMind 表示 AlphaFold 可以周期性地以原子精度預測蛋白質結構,在技術上利用多序列對齊和深度學習算法設計,并結合關于蛋白質結構的物理和生物學知識提升了預測效果。AlphaFold 的突破性研究成果將幫助科研人員探索引發某些疾病的機制,并為設計藥物、農作物增產,以及可降解塑料的「超級酶」研發鋪平道路。

AlphaFold 的論文于 7 月發表在《nature》雜志上,論文地址:https://www.nature.com/articles/s41586-021-03819-2
近日 Alphafold 的締造者之一 John Jumper 也被評為《nature》2021 年度十大科學人物。
John Jumper
從 2018 年初代 AlphaFold 在國際蛋白質結構預測競賽(CASP)嶄露頭角,到 2021 年 AlphaFold2 正式開源,John Jumper 帶領 DeepMind 的研究團隊克服了重重困難,才讓 AlphaFold2 實現了 2/3 蛋白質結構預測的卓越成績。
同為蛋白質結構預測研究的 RoseTTAFold 也一被《science》評選為 2021 年度突破。

RoseTTAFold 是由華盛頓大學醫學院蛋白質設計研究所(Institute for Protein Design)聯合哈佛大學、德克薩斯大學西南醫學中心、劍橋大學、勞倫斯伯克利國家實驗室等機構研發的一款基于深度學習的蛋白質預測工具。RoseTTAFold 取得了媲美 AlphaFold2 的超高準確率,而且速度更快、所需要的計算機處理能力也更低。

RoseTTAFold 發表于《science》雜志上,論文地址:https://www.science.org/doi/abs/10.1126/science.abj8754
從結構上來看,RoseTTAFold 是一個三軌(three-track)神經網絡,意味著它可以兼顧蛋白質序列的模式、氨基酸如何相互作用以及蛋白質可能的三維結構。在這種結構中,一維、二維、三維信息來回流動,使得神經網絡能夠集中推理蛋白質的化學部分及其折疊結構。
正如其為人們所驚嘆的那樣,十幾年前一些科學家認為蛋白質結構預測的問題永遠無法解決,但今天這已然成為了現實。人工智能帶來的最大突破就是把「不可能」變成了「可能」。
擴展來看,不只是對蛋白質結構預測的變革,AI 對整個科研領域還有大量的潛力等待挖掘,這也是 AI for Science 這一主題在今年備受關注的原因,如 AI + 數學、AI + 化學、AI + 醫藥。
也許,接下來兩年會有更多 AI + 科研的突破,大家可以重點關注下。