成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

譚濟(jì)民、夏波等提出基因組構(gòu)象預(yù)測模型及高通量計算遺傳篩選方法

人工智能 新聞
本文首先提出了新型多模態(tài)機(jī)器學(xué)習(xí)模型 C.Origami 來預(yù)測特定細(xì)胞類型的染色質(zhì)構(gòu)象,并基于遺傳篩選的原理提出了全新的高通量計算遺傳篩選 (in silico genetic screening, ISGS) 方法。

圖片

圖 0

不同種類細(xì)胞中基因組構(gòu)象的差異決定了基因表達(dá)的特異性,進(jìn)而決定不同細(xì)胞類型的功能差異。長久以來,從原位雜交到高通量檢測如 Hi-C、micro-C 技術(shù),基因組構(gòu)象檢測的實驗方法通常耗時耗力、成本高昂且有很強(qiáng)的技術(shù)局限性。這些方法極大地限制了這些實驗技術(shù)在基因組構(gòu)象研究領(lǐng)域的廣泛應(yīng)用,尤其是研究稀有細(xì)胞類型以及需要大規(guī)模驗證基因組構(gòu)象調(diào)控的因果關(guān)系等方面。這些方法的局限性也長期限制三維基因組構(gòu)象調(diào)控領(lǐng)域里的新發(fā)現(xiàn)。

圖片

圖 1

2023 年 1 月 9 日,紐約大學(xué)醫(yī)學(xué)院(NYU Grossman School of Medicine)Aristotelis Tsirigos 實驗室和博德研究所(Broad Institute of MIT and Harvard)夏波實驗室合作在 Nature Biotechnology 上發(fā)表文章《Cell type-specific prediction of 3D chromatin organization enables high-throughput in silico genetic screening》。

圖片

論文地址:https://www.nature.com/articles/s41587-022-01612-8

這項研究中,第一作者紐約大學(xué)醫(yī)學(xué)院博士生譚濟(jì)民與夏波博士首先提出了新型多模態(tài)機(jī)器學(xué)習(xí)模型 C.Origami 來預(yù)測特定細(xì)胞類型的染色質(zhì)構(gòu)象,并基于遺傳篩選的原理提出了全新的高通量計算遺傳篩選 (in silico genetic screening, ISGS) 方法,用以鑒定細(xì)胞類型特異性的功能基因組元件,助力發(fā)現(xiàn)新的染色質(zhì)構(gòu)象調(diào)控機(jī)理。

圖片

圖 2

研究者首先構(gòu)建了應(yīng)用于基因組數(shù)據(jù)的新型多模態(tài)深度學(xué)習(xí)框架,Origami,使其能有效地整合 DNA 序列信息以及細(xì)胞特異性的功能基因組信息,進(jìn)而預(yù)測新的基因組信息。通過反復(fù)調(diào)試及模型訓(xùn)練,研究者發(fā)現(xiàn)整合 DNA 序列、CTCF 結(jié)合狀態(tài)(CTCF ChIP-seq)、及 ATAC-seq 信號作為輸入信息可以準(zhǔn)確地預(yù)測染色質(zhì)構(gòu)象,并以二維的 Hi-C 矩陣作為預(yù)測輸出目標(biāo)(圖 1-2)。輸入信息為 2 百萬堿基對的 DNA,CTCF ChIP-seq 和 ATAC-seq。研究者們使用 Onehot-encoding 來編碼離散的 DNA 序列,而 CTCF ChIP-seq 和 ATAC-seq 則編碼成非離散的特征。

圖片

C.Origami 模型分為三個部分,處理并壓縮 DNA 及基因組信息的編碼器,Transformer 中間層和輸出 Hi-C 解碼器。其中編碼器由一系列 1D ResNet 和 strided convolution 構(gòu)成用來編碼和壓縮 2 百萬堿基對的輸入信息。在編碼器末端 2 百萬長度的信息被壓縮為 256 長度并作為 Transformer 的輸入信息。Transformer 的自注意力機(jī)制可以處理不同基因組區(qū)域間的 interdependency 并提升了模型的綜合性能。Transformer 中的注意力矩陣還可以增強(qiáng)模型的可解釋性。研究者們將注意力權(quán)重轉(zhuǎn)換成了 “attention score ”,用來衡量模型在預(yù)測時對于不同區(qū)域的側(cè)重。最后,研究者們將 Transformer 模塊的 1D 輸出用 “outer concatenation” 的方式轉(zhuǎn)換成了 2D 的 contact/adjacency matrix,用作 Hi-C 解碼器的輸入信息。解碼器是一個 Dilated 2D ResNet。研究者們調(diào)整了不同層的 dilation factor 使得最后層的每一個像素位置的 receptive field 都能覆蓋所有輸入信息。

這一預(yù)測染色質(zhì)構(gòu)象的模型則被稱為 C.Origami。研究者稱 C.Origami 是基因組學(xué)中第一個多模態(tài)深度學(xué)習(xí)模型。由于它多模態(tài)的特性,C.Origami 能夠準(zhǔn)確地預(yù)測(de novo prediction)從未接觸過的新細(xì)胞類型的染色質(zhì)構(gòu)象。例如,在 IMR-90 細(xì)胞(肺成纖維細(xì)胞)上訓(xùn)練的模型能夠準(zhǔn)確預(yù)測出 GM12878 細(xì)胞(B 淋巴細(xì)胞)里特定的染色質(zhì)構(gòu)象(圖 3)。

圖片

圖 3

結(jié)構(gòu)變異(structural variant)---- 比如染色體易位 ---- 在腫瘤中非常常見,并經(jīng)常改變?nèi)旧|(zhì)相互作用模式,進(jìn)而可能影響癌基因或抑癌基因的表達(dá)。研究這些結(jié)構(gòu)變異對染色質(zhì)構(gòu)象及基因表達(dá)的影響對理解腫瘤發(fā)生和進(jìn)展的機(jī)理有重要作用。這類研究通常需要借助 4C-seq 或 Hi-C 等實驗來分析結(jié)構(gòu)變異位點的染色質(zhì)構(gòu)象,但又往往受限于資源和時間的限制,難以大規(guī)模開展。

這項研究中,C.Origami 可以在輸入變量中模擬 DNA 序列的變異,然后預(yù)測變異后的癌癥基因組中新的染色質(zhì)相互作用。之前的研究發(fā)現(xiàn) T 細(xì)胞急性淋巴細(xì)胞白血?。═-ALL)細(xì)胞模型 CUTLL1 有一個 chr7-chr9 的染色體易位(圖 4)。通過計算模擬染色體易位變異,C.Origami 準(zhǔn)確預(yù)測了在變異位點的新 TAD 結(jié)構(gòu),并檢測到從 chr9 延伸到 chr7 的‘互動束’(chromatin stripe)結(jié)構(gòu)(圖 4)。

圖片

圖 4

鑒于 C.Origami 的精準(zhǔn)預(yù)測效果,并受到反向遺傳篩選原理的啟發(fā),研究者提出了全新的高通量計算遺傳篩選 (in silico genetic screening,ISGS) 方法,用以系統(tǒng)鑒定細(xì)胞類型特異性的功能基因組元件,并助力發(fā)現(xiàn)新的染色調(diào)控分子(圖 5)。研究者們基于 C.Origami 模型開發(fā)了用于系統(tǒng)性鑒定染色質(zhì)構(gòu)象所需的順式調(diào)控元件(cis-regulatory element)的計算遺傳篩選 ISGS 的框架。通過對全基因組 1kb 分辨率的 ISGS,作者分離出對染色質(zhì)構(gòu)象有重要影響的順式調(diào)控元件(占約 1% 的基因組)。這些染色質(zhì)構(gòu)象調(diào)控序列呈現(xiàn)出對 CTCF 結(jié)合和 ATAC-seq 信號的不同依賴度(圖 5)。

圖片

圖 5

ISGS 框架可以對細(xì)胞或疾病特異性的染色質(zhì)構(gòu)象進(jìn)行高通量篩選。研究者在 CUTLL1、Jurkat 和正常 T 細(xì)胞中分別進(jìn)行了 ISGS,并發(fā)現(xiàn)了一個在 CHD4 基因附近的順式調(diào)控元件 (CHD4-insu) 在 T-ALL 細(xì)胞里特異性丟失。篩選結(jié)果表明,T-ALL 細(xì)胞中 CHD4-insu 的絕緣性缺失可能使 CHD4 基因建立新的染色質(zhì)相互作用,進(jìn)而上調(diào) CHD4 表達(dá)并促進(jìn)白血病細(xì)胞增殖。

ISGS 也可以用來系統(tǒng)地發(fā)現(xiàn)調(diào)控染色質(zhì)構(gòu)象的新型反式作用因子(trans-acting factors)。通過對細(xì)胞類型特異性的重要調(diào)控序列與轉(zhuǎn)錄因子結(jié)合部位的富集分析,研究者確定了有助于細(xì)胞類型特異的基因組構(gòu)象的調(diào)控因子。有意思的是,之前研究發(fā)現(xiàn) MAZ 可能與 CTCF 一起調(diào)控染色質(zhì)構(gòu)象。通過 ISGS 及轉(zhuǎn)錄因子富集分析,作者發(fā)現(xiàn) MAZ 極大地富集于開放染色質(zhì)區(qū)域,而在 CTCF 結(jié)合的非開放染色質(zhì)區(qū)域僅顯示微弱結(jié)合。這一結(jié)果預(yù)示 MAZ 可能獨立于 CTCF 調(diào)節(jié)基因組構(gòu)象。

研究者們在染色質(zhì)結(jié)構(gòu)預(yù)測中看到了結(jié)合 DNA 序列與染色質(zhì)信息的多模態(tài)機(jī)器學(xué)習(xí)模型的巨大潛力。而該模型的底層多模態(tài)架構(gòu) Origami 可以推廣到其他基因組學(xué)數(shù)據(jù)的應(yīng)用,例如表觀遺傳修飾、基因表達(dá)、突變功能性篩查等。研究者預(yù)測,未來的基因組學(xué)研究將更多的轉(zhuǎn)向使用利用深度學(xué)習(xí)模型作為工具來進(jìn)行主要計算遺傳篩選,并輔以生物實驗驗證的新一代高通量研究方法。

這項研究中,紐約大學(xué)醫(yī)學(xué)院博士研究生譚濟(jì)民為第一作者,Aristotelis Tsirigos 博士和夏波博士為共同通訊作者。這項研究起始于 2020 年 10 月疫情封控期間夏波與譚濟(jì)民的頭腦風(fēng)暴,歷經(jīng)兩年半的完善與打磨,在 2023 年一月于 Nature Biotechnology 正式刊出。 

此項目的代碼和訓(xùn)練數(shù)據(jù)已在GitHub和Zenodo上開源,并配有Google Colab做功能展示。

項目地址:https://github.com/tanjimin/C.Origami

通訊作者

夏波博士實驗室(Broad Institute of MIT and Harvard)主頁:www.boxialab.org

夏波博士致力于解析調(diào)控基因組三維構(gòu)象的核心機(jī)理及其對人類疾病、發(fā)育及進(jìn)化的生物學(xué)意義。夏波實驗室歡迎志同道合的博士后加入團(tuán)隊。

Tsirigos Lab(New York University Grossman School of Medicine)主頁:http://www.tsirigos.com

Tsirigos Lab 的主要研究方向包括染色質(zhì),表觀遺傳學(xué)和機(jī)器學(xué)習(xí)在精準(zhǔn)醫(yī)療中的應(yīng)用。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2018-02-28 16:20:57

中科睿芯

2018-10-26 10:47:11

中科睿芯

2018-08-15 09:13:27

布線系統(tǒng)線纜用量

2023-07-17 10:34:57

模型性能

2017-11-27 08:38:10

UPS選擇容量

2017-11-09 12:58:50

中科睿芯

2024-11-19 13:13:54

2012-06-14 10:21:31

線程線程池Java

2009-08-21 10:50:42

電線電纜材料用量

2015-07-22 18:07:59

阿里云批量計算

2024-03-04 09:55:11

開源模型訓(xùn)練

2025-06-11 04:00:00

增量計算Lamda架構(gòu)

2022-06-08 16:29:45

無損壓縮方案分布式

2018-01-24 09:27:30

文本分類工具fastText

2020-03-03 09:34:22

聯(lián)想

2015-05-18 17:11:50

華為高通量路由器華為

2018-09-21 09:32:06

聯(lián)想

2023-09-20 12:58:00

訓(xùn)練研究

2022-07-12 14:45:54

達(dá)摩院模型
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 一区二区三区在线观看视频 | 亚洲精品日韩在线 | 在线亚洲欧美 | 欧美啊v在线观看 | 懂色中文一区二区三区在线视频 | 欧美综合一区二区三区 | 在线国产视频 | 毛片99| 久久精品国产一区二区三区不卡 | 国产清纯白嫩初高生视频在线观看 | 久久久久久免费看 | 看黄在线 | 人人澡人人爱 | 看片国产 | 久草资源| 天天拍夜夜爽 | 欧美啪啪| 久久久久久综合 | 水蜜桃亚洲一二三四在线 | 久久精品一 | 日韩精品免费视频 | 97视频成人| 亚洲欧美日韩久久 | 久久99精品久久久久子伦 | 免费一级黄 | 久草电影网 | 日本超碰 | 国产欧美一区二区三区在线看 | 欧洲一级毛片 | 国产成人麻豆免费观看 | 精品自拍视频在线观看 | 精品在线观看入口 | 中文字幕在线播放第一页 | 精品国产一二三区 | 中文字幕一二三 | 色综合久久久久 | 91精品久久久久久综合五月天 | 少妇精品久久久久久久久久 | 欧美日韩福利视频 | 久久亚洲二区 | 亚洲成人av |