成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

快了一個0!Meta祭出150億參數蛋白質大模型,碾壓AlphaFold2

人工智能
迄今為止規模最大的蛋白質語言模型問世了!一年前,DeepMind開源AlphaFold2連登Nature、Science,刷爆生物和AI學界。一年后,Meta帶著速度快一個數量級的ESMFold來了。不光速度快,模型還足足有150億個參數。

迄今為止規模最大的蛋白質語言模型問世了!

一年前,DeepMind開源AlphaFold2連登Nature、Science,刷爆生物和AI學界。

一年后,Meta帶著速度快一個數量級的ESMFold來了。

不光速度快,模型還足足有150億個參數。

圖片

LeCun發推稱贊,這是Meta-FAIR蛋白質團隊的偉大新成果。

圖片

共同一作Zeming Lin透露,30億參數的大模型在256個GPU上訓練了3個星期,而ESMfold在128個GPU上用了10天。至于150億參數的版本,目前還不清楚。

他還表示,代碼隨后肯定會開源,敬請關注!

又大又快!

今天,我們的主角是ESMFold,一個從蛋白質個體的序列,直接進行高準確度、端對端、原子層級結構預測的模型。

圖片

論文地址:https://www.biorxiv.org/content/10.1101/2022.07.20.500902v1

150億個參數帶來的好處不必多說——通過訓練,如今的大模型可以在原子大小的精度上預測蛋白質的三維結構。

從準確度上看,ESMFold和AlphaFold2、RoseTTAFold差不多。

但是,ESMFold推測速度要比AlphaFold2快一個數量級!

一下說數量級可能不好理解三者之間速度的對比,看看下面這張圖就懂了。

圖片

有啥區別?

雖說AlphaFold2和RoseTTAFold在原子分辨率結構預測問題上取得了突破性的成功,但它們也依賴于使用多序列比對(MSA)和類似的蛋白質結構模板來實現最佳性能。

相比之下,通過利用語言模型的內部表征,ESMFold只用一個序列作為輸入就能生成相應的結構預測,從而大大加快了結構預測的速度。

圖片

研究人員發現,ESMFold對低復雜度序列的預測與當下最先進的模型相當。

而且,結構預測的準確性與語言模型的復雜度息息相關,也就是說,當語言模型能更好地理解序列時,便可以更好地理解結構。

圖片

目前,有數十億結構和功能未知的蛋白質序列,其中許多來自元基因組測序。

利用ESMFold,研究人員只需6個小時,就能折疊完成100萬個元基因組序列的隨機樣本。

圖片

其中很大一部分具有高置信度,并且與任何已知的結構不同(在數據庫中沒有記錄)。

研究人員認為,ESMFold可以幫助理解那些超出現有認知的蛋白質結構。

圖片

此外,由于ESMFold的預測速度比現有的模型快一個數量級,因此研究人員便可借助ESMFold來協助填補快速增長的蛋白質序列數據庫與進展緩慢的蛋白質結構和功能數據庫之間的鴻溝。

150億參數的蛋白質語言模型

接下來我們就來具體說說Meta這款全新的ESMFold。

ESM-2是一個基于Transformer的語言模型,并使用注意力機制來學習輸入序列中成對氨基酸之間的相互作用模式。

相對于上一代模型ESM-1b,Meta對模型結構、訓練參數進行了改進,并增加了計算資源和數據。同時,相對位置嵌入的加入,使模型能夠推廣到任意長度的序列。

從結果來看,具有1.5億個參數的ESM-2模型比具有6.5億個參數的ESM-1b模型表現得更好。

此外,在結構預測的基準上,ESM-2也超過了其他的蛋白質語言模型。這種性能的提高與大型語言建模領域建立的規律是一致的。

圖片

隨著ESM-2規模的增加,可以觀察到語言建模的精度有很大的提高。

圖片

端到端的單序列結構預測

SMFold和AlphaFold2的一個關鍵區別是,ESMFold使用語言模型表示,消除了對明確的同源序列(以MSA的形式)作為輸入的需要。

ESMFold通過用一個處理序列的Transformer模塊取代處理MSA的計算昂貴的網絡模塊,簡化了AlphaFold2中的Evoformer。這種簡化意味著ESMFold的速度大大提高,遠高于基于MSA的模型。

折疊主干的輸出接下來又被一個結構模塊處理,它負責輸出最終的原子級結構和預測的置信度。

圖片

研究人員將ESMFold與AlphaFold2和RoseTTAFold在CAMEO(2022年4月至2022年6月)和CASP14(2020年5月)測試集上進行比較。

當只給單一序列輸入時,ESMFold的表現要比Alphafold 2好得多。

而當使用完整的管道時,AlphaFold2在CAMEO和CASP14上分別達到了88.3和84.7。ESMFold在CAMEO上取得了與RoseTTAfold相當的準確率,其平均TM分數為82.0。

圖片

結論

研究人員發現,以無監督學習為目標的語言模型在一個大型的進化多樣化的蛋白質序列數據庫中訓練,能夠對蛋白質結構進行原子級的分辨率預測。

將語言模型的參數擴大到15B,就可以系統地研究規模對蛋白質結構學習的影響。

我們看到,蛋白質結構預測的非線性曲線是模型規模的函數,并且觀察到了語言模型對序列的理解程度與結構預測之間的強烈聯系。

ESM-2系列的模型是迄今為止訓練的最大的蛋白質語言模型,其參數僅比最近開發的最大文本模型少一個數量級。

而且,ESM-2比以前的模型有非常大的改進,即使在150M的參數下,ESM-2也比ESM-1代語言模型在6.5億的參數下捕捉到更準確的結構圖。

研究人員表示,ESMFold性能的最大驅動力是語言模型。由于語言模型的迷惑性和結構預測的準確性之間有很強的聯系,他們發現當ESM-2能較好地理解蛋白質序列時,就可以獲得與目前最先進的模型相當的預測結果。

ESMFold獲得了準確的原子分辨率結構預測,推理時間還比AlphaFold2快了一個數量級。

在實踐中,速度的優勢甚至還要更大。因為ESMFold不需要搜索和進化相關的序列來構建MSA。

雖說有更快的方法可以減少搜索時間,但再怎么減少還是可能會很長。

而推理時間的極大縮短帶來的利好不言自明——速度的提高將使繪制大型元基因組學序列數據庫的結構空間成為可能。

除了基于結構的工具來識別遠端同源性和保護性之外,用ESMFold進行快速準確的結構預測,還能在大量新序列集合的結構和功能分析中發揮重要作用。

在有限的時間內獲得數以百萬計的預測結構,有利于發現對天然蛋白質的廣度和多樣性的新認識,并能發現全新的蛋白質結構和蛋白質功能。

作者介紹

本文的共同一作是來自Meta AI的Zeming Lin。

圖片

據個人主頁介紹,Zeming在紐約大學攻讀博士學位,并在Meta AI擔任研究工程師(訪問),主要負責后端基礎設施的工作。

他本碩都就讀于弗吉尼亞大學,在那里,他和Yanjun Qi大佬一同做有關機器學習應用的研究,尤其是在蛋白質結構預測方面。

感興趣的領域為深度學習、結構預測,以及信息生物學。

責任編輯:未麗燕 來源: 新智元
相關推薦

2022-11-02 13:41:46

2022-12-23 15:04:33

Meta模型

2021-07-24 10:21:46

模型人工智能深度學習

2022-02-14 00:04:24

AI蛋白質結構

2021-07-21 17:13:17

DeepMind開源AlphaFold 2

2021-07-16 14:16:51

AI 算法人工智能

2024-06-26 13:21:50

2022-11-02 13:42:08

AI語言模型

2021-08-27 14:54:38

深度學習編程人工智能

2023-03-02 13:49:25

開發蛋白質

2024-08-26 12:43:46

2022-03-21 15:23:43

AI研究抗體

2025-02-04 11:11:07

2023-07-06 16:59:56

英特爾

2023-07-06 13:23:49

2023-08-08 10:17:16

人工智能

2023-09-20 12:44:00

AI訓練

2023-03-03 14:00:00

模型深度學習

2024-09-18 13:16:46

2022-02-22 16:33:58

深度學習人工智能模型
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲 欧美 日韩在线 | www.亚洲视频.com | 精品一二三区视频 | 国产精品免费一区二区三区四区 | 国产成人免费网站 | 91麻豆精品国产91久久久更新资源速度超快 | 欧美成人h版在线观看 | 午夜影院网站 | 国内久久 | av三级在线观看 | 免费毛片www com cn | 色资源在线 | 青青草一区二区三区 | 成人小视频在线免费观看 | 亚洲在线日韩 | 亚洲区视频 | 美日韩精品 | 国产福利91精品 | 国产农村妇女精品一区 | 成人欧美一区二区三区黑人孕妇 | 真人一级毛片 | 日韩免费av一区二区 | 成人一区二区在线 | 成人免费观看视频 | 久久国产精品无码网站 | 国产欧美精品一区二区三区 | 天天噜天天干 | 黄色片网此 | av不卡一区 | 精品日韩一区二区 | 国产分类视频 | 嫩草视频在线看 | 国产乱码精品一区二区三区忘忧草 | 日韩av最新网址 | 午夜视频在线 | 国产日韩欧美二区 | 久久精品免费 | www.午夜| 少妇无套高潮一二三区 | 国产激情一区二区三区 | 一本一道久久a久久精品综合 |