共同抗“疫” AWS加速新冠病毒的藥物篩選
原創(chuàng)【51CTO.com原創(chuàng)稿件】 庚子年初,新型冠狀病毒來襲,打亂了人們的工作和生活。除了“逆勢(shì)前行”的醫(yī)務(wù)工作者以外,還有更多的科研機(jī)構(gòu)人員對(duì)病毒進(jìn)行分析,篩選潛在藥物和研發(fā)疫苗。上海交通大學(xué)陳海峰課題組便是其中的一員。
在新型冠狀病毒疫情爆發(fā)時(shí),陳教授課題組積極開展研究的準(zhǔn)備工作,在對(duì)新型冠狀病毒潛在藥物篩選工作時(shí),利用AWS的CPU實(shí)例快速搭建虛擬藥物篩選流程,通過GPU實(shí)例搭建分子動(dòng)力學(xué)模擬分析流程,從而找到有效的藥物分子的成藥可能性。
藥物發(fā)現(xiàn)涉及多個(gè)階段 并非易事
陳海峰課題組是隸屬于上海交通大學(xué)生命科學(xué)技術(shù)學(xué)院生物信息學(xué)與生物統(tǒng)計(jì)學(xué)系和微生物代謝國(guó)家重點(diǎn)實(shí)驗(yàn)室的研究團(tuán)隊(duì),其團(tuán)隊(duì)主要研究方向?yàn)樘摂M藥物篩選,分為兩大方向,一是天然無規(guī)蛋白的精準(zhǔn)分子力場(chǎng)研究,二是通過計(jì)算機(jī)輔助創(chuàng)新藥物設(shè)計(jì),找到藥物和靶標(biāo)蛋白之間的匹配關(guān)系,從而找到治療某種特定疾病的相關(guān)藥物。
上海交通大學(xué)陳海峰課題組
新型冠狀病毒出現(xiàn)后,很多醫(yī)療機(jī)構(gòu)和科研機(jī)構(gòu)都在積極的找到應(yīng)對(duì)病毒的藥物,然而,新型病毒出現(xiàn)后,是需要多個(gè)階段才能完成最終的藥物發(fā)現(xiàn),這并非易事。陳海峰教授介紹道:一個(gè)新的病毒出來后,首先我們將病毒株分離;分離后對(duì)病毒進(jìn)行基因測(cè)序;測(cè)序完成后,對(duì)病毒基因組的序列進(jìn)行分析,找到重要的能夠編碼蛋白的基因,也就是關(guān)鍵性蛋白;下一步,通過X射線衍射或者冷凍電鏡的方法,測(cè)定病毒蛋白的三維結(jié)構(gòu),作為藥物篩選的靶標(biāo);而后,可以利用計(jì)算生物學(xué)的方法評(píng)估哪些小分子化合物能夠和已知蛋白靶標(biāo)很好的結(jié)合;有了虛擬篩選結(jié)果后,通過特定方法,例如細(xì)胞實(shí)驗(yàn),驗(yàn)證其是否能夠抑制病毒;接下來就是臨床試驗(yàn),通過動(dòng)物模型,驗(yàn)證藥物有效性;然后是人體的三期臨床試驗(yàn),評(píng)估藥物的安全性、治病效果以及大批量試驗(yàn)確定藥物的劑型劑量。
陳海峰教授表示,天然無規(guī)蛋白是一類在生理?xiàng)l件下沒有穩(wěn)定三級(jí)結(jié)構(gòu)的蛋白質(zhì),這類蛋白在真核生物蛋白質(zhì)組中的含量超過40%,與腫瘤、心血管疾病、神經(jīng)退行性疾病以及糖尿病等復(fù)雜疾病的發(fā)生發(fā)展密切相關(guān)。由于它們很難結(jié)晶,現(xiàn)有試驗(yàn)方法很難測(cè)定它們的結(jié)構(gòu)。于是計(jì)算機(jī)生物學(xué)的方法就成為研究這類蛋白的一種重要方法。為了研究這類蛋白,我們就開發(fā)了相關(guān)分子力場(chǎng),即在ff03分子力場(chǎng)的基礎(chǔ)上,通過添加基于格點(diǎn)的能量矯正項(xiàng),發(fā)展了一種平衡而高效的分子力場(chǎng)ff03CMAP,該力場(chǎng)受到國(guó)際國(guó)內(nèi)同行的廣泛關(guān)注。
如何短期獲取高效研究成果 云成為可能
在新型冠狀肺炎疫情期間,陳海峰課題組也進(jìn)行了相關(guān)研究,通過計(jì)算機(jī)輔助篩選哪些藥物分子可能與新型冠狀病毒的關(guān)鍵蛋白結(jié)合,讓病毒的生命周期終止,從而抑制病毒蔓延。
要想篩選藥物分子,需要知道病毒的關(guān)鍵蛋白。在饒子和院士課題組發(fā)布了新型冠狀病毒蛋白的晶體結(jié)構(gòu)后陳海峰課題組在第一時(shí)間(1月27日)申請(qǐng)進(jìn)行抗病毒藥物的虛擬篩選研究。
但是,人類對(duì)新型冠狀病毒的了解還非常有限,需要進(jìn)行大量的計(jì)算研究,而且時(shí)間不等人,越是快速研究出成果,越可以早日打贏這場(chǎng)攻堅(jiān)戰(zhàn)。陳海峰教授表示,新型冠狀病毒在全世界大流行,越早獲得相關(guān)信息,找到可能的命中結(jié)果,就可以越早的結(jié)束這場(chǎng)疫情。
但是藥物的篩選過程非常復(fù)雜,需要大量的計(jì)算資源來輔助完成。陳海峰教授告訴51CTO,傳統(tǒng)的方法是用過本地服務(wù)器來進(jìn)行研究,而且,通常需要很長(zhǎng)時(shí)間才會(huì)有結(jié)果。此外,由于課題經(jīng)費(fèi)有限,計(jì)算資源不能無限擴(kuò)展,要想在短時(shí)間獲得更高效的結(jié)果,云計(jì)算提供了一種可能性。
陳海峰教授
在全球疫情爆發(fā)之時(shí),亞馬遜在全球推出了“AWS診斷開發(fā)計(jì)劃”,是AWS針對(duì)新型冠狀疫情成立的專項(xiàng)研究基金,為研究機(jī)構(gòu)和商業(yè)藥物研究組織提供包括云計(jì)算資源和技術(shù)方面的支持。當(dāng)?shù)弥狝WS診斷開發(fā)計(jì)劃后,陳海峰教授課題組欣然加入,雙方一拍即合。
CPU+GPU 加速藥物篩選進(jìn)程
據(jù)陳海峰教授的學(xué)生劉灝介紹,過去,課題組在本地有兩臺(tái)服務(wù)器,裝有8張GPU運(yùn)算卡。但是隨著時(shí)間更迭以及技術(shù)的快速發(fā)展,實(shí)驗(yàn)室的NVIDIA Tesla K20 或K10的GPU運(yùn)算卡計(jì)算效率以及性能都相對(duì)降低。于是,課題組采用了AWS中國(guó)(寧夏)區(qū)域的計(jì)算資源展開研究。
課題組通過采用 Amazon EC2實(shí)例(c5.9xlarge,第5代計(jì)算優(yōu)化型實(shí)例),完成藥物的虛擬篩選工作。在得到新型冠狀病毒的S蛋白結(jié)構(gòu)后,課題組通過分子對(duì)接的方法篩選親和力(藥物分子與蛋白的相互作用),評(píng)估有可能的藥物小分子。通過AWS的計(jì)算實(shí)例,僅用2天時(shí)間就完成了五個(gè)藥物分子庫(kù)的篩選,獲得了14個(gè)具有潛在抗毒性的分子。
在藥物小分子篩選完成后,需要通過GPU平臺(tái)進(jìn)行分子動(dòng)力學(xué)模擬,來驗(yàn)證藥物與病毒蛋白之間的作用,這就利用了Amazon EC2實(shí)例(p3.8xlarge,第三代GPU實(shí)例,內(nèi)含8個(gè)GPU,支持NVlink)。課題組搭建了GPU加速的分子動(dòng)力學(xué)模擬分析流程,選擇了虛擬篩選結(jié)果最優(yōu)的4個(gè)藥物分子進(jìn)行第一批的模擬分析,僅用1周的時(shí)間(本地服務(wù)器一般需要20-30天)就拿到了初步模擬的結(jié)果,隨后又提交了第二批篩選藥物分子進(jìn)行模擬,得到了很好的分子模擬結(jié)果,證明了這些藥物分子的成藥可能性。
來自巴基斯坦的留學(xué)生Ashfaq Ur Rehman分享了課題組使用AWS的體會(huì)。首先,AWS的速度確實(shí)比本地的服務(wù)器快很多,在虛擬藥物篩選速度方面提升了5倍,在分子動(dòng)力學(xué)模擬過程中的速度平均提升4倍。第二,AWS平臺(tái)是易用的。過去在研究時(shí),我們需要連接本地服務(wù)器,效率較低,而且現(xiàn)在的環(huán)境也不能回到實(shí)驗(yàn)室。AWS提供的平臺(tái)可以方便地連接到云端進(jìn)行快速分析,登陸云端服務(wù)器后的操作使用與本地環(huán)境沒有太大區(qū)別,幫助我們提高了篩選效率。第三,AWS是非常安全的。過去本地服務(wù)器是有多個(gè)課題組共用的,數(shù)據(jù)安全得不到有效保障,而AWS擁有隔離的網(wǎng)絡(luò)環(huán)境,讓我們安心地進(jìn)行科研研究。
未來
目前,我國(guó)的新型冠狀病毒疫情得到有效控制,但是對(duì)抗病毒之路還需砥礪前行。陳海峰課題組也會(huì)繼續(xù)深耕,篩選研究出更多可以應(yīng)對(duì)病毒的藥物。陳海峰教授表示,未來會(huì)通過人工智能技術(shù)來設(shè)計(jì)更高效的分子力場(chǎng),更加高效的評(píng)估藥物分子或蛋白之間的相互作用,加快藥物篩選進(jìn)度;同時(shí),會(huì)加大云端的資源和算力,更長(zhǎng)時(shí)間評(píng)估藥物分子與蛋白的結(jié)合情況,提高研發(fā)效率。
【51CTO原創(chuàng)稿件,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文作者和出處為51CTO.com】