成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

打破AlphaFold大模型局限,世界最大蛋白質(zhì)相互作用數(shù)據(jù)集AlphaSeq橫空出世

人工智能
雖然AlphaFold等系列的大模型已經(jīng)在蛋白質(zhì)預(yù)測(cè)方面取得了前所未有的突破,但依舊無(wú)法勝任蛋白質(zhì)-蛋白質(zhì)相互作用(PPI)這種復(fù)雜的任務(wù)。初創(chuàng)公司A-Alpha Bio的PPI數(shù)據(jù)集AlphaSeq,有望補(bǔ)足這方面的技術(shù)短板。

隨著最近AlphaFold 3和ESM 3的相繼推出,我們看到了深度學(xué)習(xí)在生物學(xué)領(lǐng)域的無(wú)限潛力。

然而,Dyno Therapeutics的高級(jí)機(jī)器學(xué)習(xí)工程師Abihishaike Mahajan在上個(gè)月發(fā)布的一篇博文中指出了潛在的增長(zhǎng)危機(jī)。

圖片圖片

他認(rèn)為,AlphaFold系列所取得的成果,即將一個(gè)強(qiáng)大的深度學(xué)習(xí)模型應(yīng)用于一個(gè)已經(jīng)存在大量數(shù)據(jù)的領(lǐng)域,從而引發(fā)一場(chǎng)徹底的革命——這是極難復(fù)制的。

原因還是數(shù)據(jù)。我們幾乎用盡了所有預(yù)先存在的數(shù)據(jù),未經(jīng)訓(xùn)練的蛋白質(zhì)結(jié)構(gòu)和序列正在枯竭,RNA和DNA也是如此。

要想進(jìn)一步訓(xùn)練模型,發(fā)掘更多來(lái)源和模態(tài)的數(shù)據(jù)是必不可少的。Mahajan指出,理想情況下,這樣的數(shù)據(jù)應(yīng)該滿足3個(gè)條件:

- 具有復(fù)雜的潛在分布

- 與重要的生理現(xiàn)象高度相關(guān)

- 適合大規(guī)模收集

在生物學(xué)領(lǐng)域,有很多數(shù)據(jù)可以滿足前兩個(gè)要求,比如蛋白形式測(cè)序、空間轉(zhuǎn)錄組學(xué)、體內(nèi)測(cè)量和蛋白質(zhì)-蛋白質(zhì)相互作用等,但這類數(shù)據(jù)似乎很難大量采集、生成,形成規(guī)模化的數(shù)據(jù)集。

可喜的是,初創(chuàng)公司A-Alpha Bio最近做出了這方面的突破。

他們最近發(fā)布的AlphaSeq數(shù)據(jù)庫(kù)專注于蛋白質(zhì)-蛋白質(zhì)相互作用(protein-protein interaction, PPI),包含了超過(guò)7.5億條測(cè)量結(jié)果,構(gòu)成了世界上最大的PPI數(shù)據(jù)集。

在AlphaSeq數(shù)據(jù)的基礎(chǔ)上,訓(xùn)練出的AlphaBind模型可以準(zhǔn)確預(yù)測(cè)有不同結(jié)合特性(親和力、特異性、交叉反應(yīng)性、表位等)的蛋白質(zhì)序列,從而輔助蛋白質(zhì)設(shè)計(jì)或發(fā)現(xiàn)全新的蛋白質(zhì)。

圖片圖片

此外,作為實(shí)驗(yàn)平臺(tái),AlphaSeq還能夠同時(shí)定量測(cè)量數(shù)百萬(wàn)個(gè)PPI的結(jié)合親和力,并快速得出結(jié)果,完美滿足了規(guī)模化擴(kuò)展的需求。

根據(jù)CTO Randolph Lopez的說(shuō)法,他們目前每月執(zhí)行約30次AlphaSeq檢測(cè),每次可以得到100k~5M個(gè)交叉點(diǎn)。這意味著,AlphaSeq數(shù)據(jù)庫(kù)還在以每月3M~50M的速度快速擴(kuò)展。

A-Alpha Bio這家初創(chuàng)公司也是大有來(lái)頭。不僅有計(jì)算生物學(xué)領(lǐng)域的大牛David Baker作為科學(xué)顧問(wèn),聯(lián)合創(chuàng)始人之一David Younger也是Baker實(shí)驗(yàn)室的校友。

圖片圖片

David Baker是華盛頓大學(xué)教授、蛋白質(zhì)研究所所長(zhǎng)。他領(lǐng)導(dǎo)團(tuán)隊(duì)從頭開(kāi)發(fā)的Rosetta算法奠定了用深度學(xué)習(xí)方法預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)的基礎(chǔ),揭開(kāi)了AlphaFold和ESMFold的帷幕。

A-Alpha Bio成立于2017年,根據(jù)CrunchBase的數(shù)據(jù),他們已經(jīng)融資64.1M美元,旨在通過(guò)合成生物學(xué)和機(jī)器學(xué)習(xí)技術(shù)來(lái)測(cè)量、發(fā)現(xiàn)、預(yù)測(cè)和設(shè)計(jì)蛋白質(zhì)-蛋白質(zhì)相互作用,從而加速藥物開(kāi)發(fā)的進(jìn)程。

補(bǔ)足AlphaFold

提到蛋白質(zhì)相關(guān)的預(yù)測(cè),你估計(jì)會(huì)疑惑:AlphaFold還不夠強(qiáng)大嗎,為什么還需要開(kāi)發(fā)新的數(shù)據(jù)和模型?

很遺憾,AlphaFold的確不夠強(qiáng)大,因?yàn)橐私獾鞍踪|(zhì)的相互作用(PPI)是一個(gè)相當(dāng)復(fù)雜且困難的任務(wù)。

比如,要預(yù)測(cè)含有13個(gè)氨基酸的多肽與受體的結(jié)合效果,需要十多個(gè)不同的種子反復(fù)運(yùn)行AlphaFold,以及MSA子采樣和其他一系列「技巧」,模型才能給出「某種程度上」正確的結(jié)構(gòu)。

這個(gè)任務(wù)之所以如此復(fù)雜,主要源于PPI的復(fù)雜性。即使規(guī)定了蛋白質(zhì)間作用力的空間,可能的結(jié)構(gòu)數(shù)量也會(huì)隨氨基酸數(shù)量呈指數(shù)級(jí)增長(zhǎng)。

圖片圖片

其中,分子構(gòu)象的靈活性會(huì)導(dǎo)致不可預(yù)測(cè)的結(jié)合模式,并且潛在的相互作用表面的組合數(shù)量也會(huì)爆炸。

如果有足夠的訓(xùn)練數(shù)據(jù),模型也許能逐漸增強(qiáng)預(yù)測(cè)能力,應(yīng)對(duì)問(wèn)題的復(fù)雜性。

然而,傳統(tǒng)的PPI數(shù)據(jù)規(guī)模相當(dāng)有限,比如今年1月剛剛發(fā)布的PDBbind+數(shù)據(jù)集,總共只包含3176個(gè)蛋白質(zhì)-蛋白質(zhì)復(fù)合物,遠(yuǎn)遠(yuǎn)無(wú)法滿足生產(chǎn)級(jí)的蛋白質(zhì)設(shè)計(jì)需求。

圖片圖片

AlphaSeq所用的方法,起源于Baker實(shí)驗(yàn)室在2017年發(fā)表的一篇論文,描述了A-Alpha Bio對(duì)PPI數(shù)據(jù)進(jìn)行大規(guī)模收集和表征的基本方法。

圖片圖片

論文地址:https://www.pnas.org/doi/10.1073/pnas.1705867114#sec-1

酵母細(xì)胞立大功

出乎意料的是,AlphaSeq的原理是利用了酵母細(xì)胞的配對(duì)過(guò)程。

酵母細(xì)胞由兩種類型的配子:MATa和MATα,它們?cè)谧匀唤缰心軌驅(qū)ふ业奖舜瞬⑷诤铣蔀槎扼w細(xì)胞。

這個(gè)過(guò)程就是由MATa細(xì)胞上的Aga2蛋白和MATα細(xì)胞上的Sag1蛋白所介導(dǎo)的。當(dāng)這些蛋白質(zhì)相互作用時(shí),它們會(huì)導(dǎo)致細(xì)胞粘在一起,促進(jìn)配對(duì)并形成二倍體細(xì)胞。

AlphaSeq正是利用了這個(gè)自然過(guò)程。研究人員對(duì)酵母細(xì)胞進(jìn)行基因改造,讓相關(guān)的蛋白質(zhì)暴露在細(xì)胞表面,MATa細(xì)胞搭載一組蛋白質(zhì),而MATα細(xì)胞搭載另一組蛋白質(zhì)。

將改造過(guò)的細(xì)胞進(jìn)行混合時(shí),它們配對(duì)的可能性就取決于表面蛋白質(zhì)相互作用的強(qiáng)度。

那么如何快速測(cè)量數(shù)千萬(wàn)個(gè)蛋白質(zhì)對(duì)之間的相互作用呢?答案是DNA編碼庫(kù)(DNA-encoded library)。

酵母細(xì)胞表面的每種蛋白質(zhì)都與一個(gè)獨(dú)特的「DNA條形碼」相關(guān)聯(lián)。當(dāng)兩個(gè)酵母細(xì)胞配對(duì)時(shí),這些條形碼會(huì)在生成的二倍體細(xì)胞中聚集在一起。

通過(guò)一些基因工程的操作,這些DNA條形碼最終會(huì)位于同一條染色體上的相鄰位置。

在此基礎(chǔ)上,我們就可以提取細(xì)胞DNA進(jìn)行測(cè)序,兩個(gè)DNA條形碼相鄰的頻率就與兩種蛋白質(zhì)相互作用的強(qiáng)度直接相關(guān)。

圖片圖片

值得注意的是,將整個(gè)平臺(tái)都建立在酵母細(xì)胞上,可能存在根本限制。雖然酵母細(xì)胞表達(dá)的蛋白質(zhì)和人體內(nèi)的蛋白質(zhì)之間具有高度可翻譯性,但兩者的翻譯后修飾依舊存在差異。

翻譯后修飾的差別可能會(huì)影響蛋白質(zhì)的折疊,從而影響結(jié)合。

目前我們尚不清楚A-Alpha Bio如何將收集的數(shù)據(jù)從酵母遷移到人類細(xì)胞,但他們已經(jīng)對(duì)一些蛋白質(zhì)的可翻譯性進(jìn)行了驗(yàn)證。這種方法至少總體上是可行且有效的。

應(yīng)用前景

遺憾的是,A-Alpha Bio目前還沒(méi)有發(fā)布AlphaSeq的最新論文,關(guān)于AlphaBind模型的信息也十分有限。

但根據(jù)Mahajan文章的分析,該公司一系列產(chǎn)品有相當(dāng)?shù)膽?yīng)用前景。

對(duì)疾病治療領(lǐng)域而言,可以幫助設(shè)計(jì)免疫細(xì)胞因子等藥物;與大型制藥公司合作,也可以幫助「分子膠」的開(kāi)發(fā)。

使用AlphaSeq平臺(tái)進(jìn)行細(xì)胞因子親和力調(diào)整來(lái)生成靶向免疫腫瘤治療藥物使用AlphaSeq平臺(tái)進(jìn)行細(xì)胞因子親和力調(diào)整來(lái)生成靶向免疫腫瘤治療藥物

參考資料:

https://www.owlposting.com/p/creating-the-largest-protein-protein

https://www.owlposting.com/p/wet-lab-innovations-will-lead-the

https://www.pnas.org/doi/10.1073/pnas.1705867114

責(zé)任編輯:武曉燕 來(lái)源: 新智元
相關(guān)推薦

2010-03-25 10:04:10

UbuntuOne M

2021-07-24 10:21:46

模型人工智能深度學(xué)習(xí)

2021-12-17 07:00:56

ESMongoDBRedisJson

2018-11-29 10:49:36

2016-10-08 23:30:58

Power8云計(jì)算

2010-12-09 09:09:37

2013-11-01 09:07:15

2022-05-12 15:25:16

惡意軟件網(wǎng)絡(luò)攻擊

2009-05-07 18:50:35

四核Nehalem服務(wù)器

2016-04-27 11:01:11

SparkStormApache Apex

2021-11-22 09:39:21

深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)人工智能

2023-04-19 07:34:21

AutoGPT程序員GitHub

2014-01-17 14:08:45

移動(dòng)os國(guó)產(chǎn)軟件

2023-02-21 21:48:29

2011-05-04 15:09:56

激光打印機(jī)奔圖科技

2024-10-18 15:30:00

2020-10-12 14:47:25

芯片半導(dǎo)體技術(shù)

2022-07-22 14:49:37

語(yǔ)言模型DeepMindAlphaFold2

2014-11-13 16:37:50

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 三级视频在线观看电影 | 操一草 | 精品国产乱码 | 日韩免费在线 | 精品在线一区二区三区 | 成人黄色在线视频 | 国产精品久久久久免费 | 国产精品日韩在线观看 | av色噜噜| 夜夜久久| 国产午夜三级一区二区三 | 天天操天天干天天透 | 久色| 黄色一级视频免费 | 怡红院成人在线视频 | 亚洲乱码国产乱码精品精的特点 | 91中文 | 狠狠综合久久av一区二区小说 | 欧美v在线观看 | 亚洲国产一区二区三区在线观看 | av黄色免费在线观看 | 中文字幕亚洲一区二区三区 | www.色综合| 中国美女一级黄色片 | 国产在线www | 粉嫩一区二区三区国产精品 | 中文在线а√在线8 | 91精品久久久久久久久 | 在线免费观看成年人视频 | 黄色一级免费 | 亚洲一区二区三区四区在线观看 | 欧美一级在线观看 | 人人干人人玩 | 国产一区二区三区视频 | 激情国产视频 | 国产伦精品一区二区三区精品视频 | 在线免费观看黄色 | 一区二区三区视频在线免费观看 | 欧美日韩视频一区二区 | 国产在线区 | 国产福利91精品 |