成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Nature報道:谷歌新模型1秒讀懂DNA變異!首次統一基因組全任務,性能碾壓現有模型

人工智能 新聞
據Nature最新報道,谷歌DeepMind團隊目前推出了突破性生物模型AlphaGenome。

谷歌DeepMind Alpha家族又雙叒登上Nature報道,這次瞄準的是DNA變異。

現在只需1秒,就能精確定位基因組序列變異。

圖片

據Nature最新報道,谷歌DeepMind團隊目前推出了突破性生物模型AlphaGenome

它能夠從長達1兆堿基的DNA序列中,同時預測數千種功能基因組特征,并以單堿基分辨率評估變異效應。

在基因表達、剪接、染色質可及性等多種任務上性能全面超越現有模型,為解析基因組調控代碼提供了強大工具。

作者將其描述為整個生物領域的里程碑:

我們第一次擁有了一個單一的模型,它統一了整個基因組任務范圍內的遠程上下文、基本精度和最先進的性能。

在未來,AlphaGenome也會更好地幫助我們理解疾病,癌癥這本“天書”也許終于得以破解。

該工具將提供一塊關鍵的拼圖,使我們能夠建立更好的聯系來了解癌癥等疾病。

首個統一基因組任務的單一模型

解讀基因組序列變異的影響始終是生物學領域的核心挑戰。

過去十年里,科學家們為了揭開基因組的秘密,單獨開發了數十種AI模型,那么是否能創造一種“一體化”解釋工具呢?

AlphaGenome就是這樣一個模型,可以將多模態預測、長序列背景和堿基對分辨率統一于單一框架。

圖片

模型架構受U-Net啟發,可以將1兆堿基的DNA輸入序列,在下采樣階段處理為兩種類型的序列表達,分別是對應線性基因組的一維嵌入(1bp和128bp分辨率),和對應基因組片段空間相互作用的二維嵌入(2048bp分辨率)。

在架構內部,卷積層對局部序列模式進行建模,Transformer塊則結合Rotary位置編碼,對顆粒度較粗但范圍更長的依賴關系進行建模。

通過8個互相連接的張量處理單元,實現對完整堿基對的分辨率訓練,然后利用編碼器跳躍連接,在上采樣階段恢復序列的1bp分辨率。

最后輸出包括基因表達、詳細剪接模式、染色質狀態和染色質接觸圖譜在內的11種模態,涵蓋5930條人類或1128條小鼠基因組軌道。

圖片

模型通過預訓練蒸餾兩階段進行訓練:

  • 預訓練:首先利用觀測數據生成折疊特異性模型和全折疊模型,前者采用4折交叉驗證方法進行訓練,防止過擬合,后者在基因組的全部可用區間上進行訓練,并視作后續蒸餾的教師模型。
  • 蒸餾:使用隨機增強的輸入序列方法訓練單一學生模型,學習全折疊教師模型的輸出預測,以實現更強的魯棒性和變異效應預測準確性。

最終實現在NVIDIA H100 GPU上,學生模型的推理時間能達到一秒以內,具有極高的效率。

性能全面超越現有技術

為了評估AlphaGenome的泛化能力,研究團隊進行了24項基因組軌道評估,將AlphaGenome模型與各任務最強的現有模型進行比較。

圖片

AlphaGenome在其中22項都保持領先,其中與另一種多模態序列模型Borzoi3相比,更是在細胞類型特異性的LFC預測上,表現出+17.4%的相對改進。

預測變異效應方面,實驗組組裝了26個變異效應預測基準,包含基因表達、剪接、多聚腺苷酸化、增強子-基因連接、DNA可及性和轉錄因子結合等。

圖片

與現有最強模型對比,有24項達到或超越,例如在表達QTL的方向預測,相比Borzoi3提升25.5%,在可及性QTL上相比ChromBPNet10提升8%

結果表明,AlphaGenome在多模態和專門的單模態任務上都存在優勢,可以準確模擬基因組軌道和變異效應。

另外,AlphaGenome也在跨模態基因組軌道預測方面,都達到了最先進水平。

圖片

預訓練的折疊特異性模型顯示,在未見的基因組區間上,預測的讀取覆蓋度與觀察到的讀取覆蓋度高度一致。

從定量角度,人類和小鼠基因組中功能性基因組軌道的預測信號與觀測信號之間,存在較強的皮爾遜相關系數(r),整體表達水平預測良好。

剪接模態方面,AlphaGenome首次實現剪接位點、剪接效率和剪接連接的全方位預測,展現出強大的預測組織特異性可變剪接的能力。

基于AlphaGenome的多維度剪接預測,實驗團隊為每個預測模態設計了定制的變異評分策略,并將單個評分求和,以綜合考量變異預測效應。

圖片

在剪接相關變異效應預測(VEP)任務上進行基準測試,AlphaGenome在精細定位的剪接QTL(sQTL)分類中表現最佳,并在監督和無監督場景下均取得最高性能。

但在MFASS評估罕見變異是否破壞剪接能力的實驗中,AlphaGenome的auPRC達 0.54,表現僅略低于Pangolin的0.51,但超過了SpliceAI和DeltaSplice(均為0.49)。

總之,AlphaGenome在7項基準測試中的6項上實現了最先進的剪接變異效應預測,為剪接事件改變和轉錄本結構提供了更全面的視圖。

圖片

AlphaGenome在臨床上,可以幫助研究人員更精準地理解疾病的潛在原因,甚至發現新的治療靶點。

例如在一項針對T細胞急性淋巴細胞白血病 (T-ALL)的研究中,AlphaGenome就通過引入MYB DNA結合基序,成功解析了TAL1基因附近的致癌變異。

另外它還可以幫助預測合成DNA的設計以及協助進行基本DNA研究,未來通過擴展數據,AlphaGenome也將會產生更準確的預測精度以及涵蓋更廣泛的物種,科學家們將只需要進行微調,就能更快地生成和測試假設。

目前AlphaGenome已提供預覽版,并計劃正式發布,歡迎大家搶先體驗。

鏈接:https://macro.com/app/pdf/56a50ffc-120d-4a9a-87e5-a18753430f22

代碼鏈接:https://github.com/google-deepmind/alphagenome

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-06-26 10:08:34

谷歌模型AI

2024-11-19 13:13:54

2024-05-06 08:46:57

AI基因編輯

2025-03-31 09:30:00

數據訓練模型

2023-09-20 09:49:41

2023-12-20 14:54:29

谷歌Gen-2視頻

2019-10-31 14:37:55

技術人工智能開發

2023-01-07 12:53:44

模型效果Muse

2022-07-26 00:00:03

語言模型人工智能

2014-03-26 09:06:27

Google大數據

2012-11-19 11:08:45

初志云存儲

2025-05-20 11:55:22

人工智能Vision RAGLLM

2024-03-20 12:27:48

模型訓練

2023-08-02 12:52:02

谷歌模型

2024-11-15 13:42:25

2020-09-22 15:17:59

谷歌Android技術

2022-12-12 10:35:00

2018-10-08 15:22:36

IO模型

2023-06-13 09:36:34

AI代碼

2023-12-27 14:03:48

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 热re99久久精品国产99热 | 91精品国产91久久久久游泳池 | 91视频导航| 91免费入口 | 精品欧美一区二区中文字幕视频 | 亚洲精品免费观看 | 久久91| 亚洲精品久久久一区二区三区 | 国产日韩一区二区三免费高清 | hitomi一区二区三区精品 | 久久精品一区二区三区四区 | 日日天天 | 蜜桃黄网| 最新日韩av| 自拍偷拍一区二区三区 | 99久久99久久精品国产片果冰 | av网站在线看 | 福利一区二区在线 | 久久久精品在线 | 免费黄色片在线观看 | 二区不卡 | 国产999精品久久久久久 | 超碰97人人人人人蜜桃 | 天天操夜夜爽 | 国产精品污www在线观看 | 麻豆精品国产91久久久久久 | 精品久久久久久亚洲综合网站 | 欧美一区二区三区在线观看视频 | 日韩中文字幕一区 | 日韩超碰在线 | 亚欧午夜| 色吧久久 | 欧美久久久久 | 97日日碰人人模人人澡分享吧 | 操视频网站 | 中文欧美日韩 | 91精品国产综合久久久久久蜜臀 | 亚洲免费观看视频 | 久久精品在线免费视频 | 国产午夜精品一区二区三区嫩草 | 国产操操操 |