干細胞圖片數(shù)據(jù)庫共享,深度學(xué)習(xí)預(yù)測細胞外觀

原作者 | Amy Maxmen
編譯 | 姜范波 Aileen
導(dǎo)語:
如同世界上沒有兩片樹葉是相同的,也沒有兩個細胞是相同的。Allen細胞研究所的科學(xué)家們,用6000多幅干細胞的熒光照片,展示了在細胞這樣的小小空間里,如何別有洞天。
據(jù)Nature最新報道,艾倫細胞科學(xué)研究所(Allen Institute for Cell Science)今天發(fā)布的網(wǎng)站Allen Cell Explore,包含數(shù)千個干細胞的三維立體圖像,不止是發(fā)現(xiàn)每個細胞的獨特外觀,通過深度學(xué)習(xí)算法,該研究所還對細胞的外觀進行了預(yù)測。改變一個基因?qū)毎w而言,如同一場正在進行的球賽換了球員,細胞的命運或?qū)⒈桓淖儭6毎麅?nèi)部這場球賽的后續(xù)過程,也將在人們眼前栩栩如生地呈現(xiàn)。
干細胞為何如此重要?
干細胞在一定條件下,可以分化成多種功能細胞。人,都是從受精卵這一個干細胞發(fā)育而來。誘導(dǎo)多能干細胞(iPS),是首度無需使用受精卵或是胚胎干細胞而創(chuàng)造出具有分化能力的干細胞,它為干細胞的研究提供了豐富的細胞來源,也促進了細細胞分化機制的研究。從任何一個細胞,可以誘導(dǎo)發(fā)育到另外一種人類需要的細胞,這是一個充滿了想象的空間。而且,如果使用患者自身細胞所創(chuàng)造出的iPS細胞,培養(yǎng)出需要的組織或是器官移植回原患者身體內(nèi)時,將可避開受到自身免疫系統(tǒng)攻擊的難題。未來,也許女性細胞也可以制作出精子。甚至老化細胞的重生,都將不再只是想象。
2012年10月,英國和日本兩位科學(xué)家因“發(fā)現(xiàn)成熟細胞可以被重新編程為多功能的干細胞(即iPS)”而摘取2012年度諾貝爾生理學(xué)或醫(yī)學(xué)獎, iPS從而更為人們所知曉。
來自皮膚的人類干細胞的三維視圖顯示出DNA(藍色),細胞膜(紫色)和其他結(jié)構(gòu)(黃色)
沒有兩個干細胞是相同的,即使它們來源于同一個遺傳克隆。如此驚人的多樣性,在今天公開的一個巨大的3D干細胞圖像在線目錄中被揭示。這些圖像源自經(jīng)基因編輯工具CRISPR改變的細胞系,通過深度學(xué)習(xí)分析而生成。不久的將來,該網(wǎng)站將允許研究人員預(yù)測可能預(yù)示癌癥和其他疾病的細胞布局的變化。
這個名為 Allen Cell Explore(http://www.allencell.org/)的網(wǎng)站,由位于華盛頓西雅圖的艾倫細胞科學(xué)研究所(Allen Institute for Cell Science)建立,包含了超過6000張誘導(dǎo)性多能干細胞(iPS)的圖片,這些細胞的特定基因由于使用了熒光標(biāo)記物而發(fā)光。
有不少的組織正試圖在DNA,RNA和蛋白質(zhì)水平上闡釋單細胞的獨特性,Allen Cell Explorer無疑是它們的有力補充。艾倫細胞科學(xué)研究所所長雷克·霍維茨(Rick Horwitz)表示,這些圖片可能通過揭示細胞結(jié)構(gòu)的意想不到的方面來加速干細胞研究,推動癌癥研究和藥物開發(fā)方面的進展。 “如果你知道所有球員的統(tǒng)計數(shù)據(jù),但從來沒有看過比賽,那么你無法預(yù)測足球比賽的結(jié)果。”
深入皮膚細胞內(nèi)部
該項目大約一年前開始,Horwitz和他的團隊先將成年皮膚細胞重新編程成胚胎樣、未分化狀態(tài),然后使用CRISPR-Cas9在基因中插入標(biāo)簽,使細胞內(nèi)的結(jié)構(gòu)發(fā)光。這些基因包括肌動蛋白絲的編碼基因,(肌動蛋白絲是一種細胞骨架蛋白,譯注),它們有助于細胞移動并保持其形狀。很快可以清楚地看到,來自同一親本細胞的所有細胞,在其布局,形狀和組分的數(shù)量(例如線粒體和肌動蛋白纖維)方面各不相同。
分裂的人類干細胞,顯示細胞膜(黃色),DNA(藍色)和微管(紅色)
計算機科學(xué)家們使用深度學(xué)習(xí)程序分析了數(shù)千個圖像,并發(fā)現(xiàn)了細胞結(jié)構(gòu)位置之間的關(guān)系。然后,他們使用這些信息來預(yù)測,當(dāng)程序只給出幾條線索(例如核的位置)時,其它細胞結(jié)構(gòu)可能會在哪里。程序通過將預(yù)測結(jié)果與實際細胞進行比較來“學(xué)習(xí)”。
Horwitz說,深度學(xué)習(xí)算法與其他公司用來預(yù)測人們偏好的算法相似。 “如果您在亞馬遜購買電鋸,那么可能會顯示鏈條油和格子襯衫。”
基于這種深度學(xué)習(xí)能力的3D交互式工具將在今年晚些時候上線。目前,該網(wǎng)站展示了一段預(yù)告片,解釋并排比較預(yù)測圖像和實際圖像的工作原理。
華盛頓大學(xué)的細胞生物學(xué)家本杰明·弗里德曼(Benjamin Freedman)期待在艾倫研究所團隊用算法來識別更多基因或化學(xué)變化的iPS細胞后,使用Cell Explorer的預(yù)測功能。例如,弗里德曼說他可以從Allen研究所的一個熒光標(biāo)記的干細胞中刪除與腎臟疾病相關(guān)的基因,并了解突變?nèi)绾斡绊懓l(fā)光結(jié)構(gòu)。然后他可以使用該網(wǎng)站的建模工具來確定其他細胞組分是如何被改變的。 “最終,”弗里德曼說,“我們想要了解在整個細胞水平上引起腎臟疾病的過程。”
為“每個細胞都是不同的”理論填補空白
在接下來的幾個月中,艾倫研究所的研究人員將更新處于不同的分裂階段的細胞圖像,比如細胞分化成如心臟和腎臟細胞時。 Horwitz說,捕獲不同時間點的圖像,對于確定基本的細胞發(fā)育過程至關(guān)重要。
遺傳相同干細胞的DNA(紫色)和細胞膜(藍色)的結(jié)構(gòu)差異
艾倫研究所著眼于干細胞圖片研究,與一些其他機構(gòu)試圖將細胞的其他方面進行分類相契合。例如,英國倫敦的慈善機構(gòu)“英國癌癥研究”(Cancer Research UK)正在創(chuàng)建腫瘤中乳腺癌細胞的互動虛擬現(xiàn)實模型。而另一個國際性的合作組織“人類細胞圖譜”( Human Cell Atlas)正試圖根據(jù)其分子譜(包括DNA序列,RNA轉(zhuǎn)錄物和蛋白質(zhì))定義所有人類細胞類型。
Aviv Regev是馬薩諸塞州劍橋Broad研究所的計算生物學(xué)家,他正在致力于人體細胞圖譜,他指出,Allen Cell Explorer關(guān)注細胞外觀形態(tài)特征,而她的項目關(guān)注基因,RNA和蛋白質(zhì)在細胞內(nèi)相互作用,這樣正好互為補充。她表示:“科學(xué)社區(qū)直到最近才認可這個事實,即我們以前認為相同的細胞,之間存在很多差異,”她說,“所以現(xiàn)在我們正在采取一種不偏不倚的方式,來了解這個拼圖的每一塊局部,而以前,我們都不知道它的存在。”
Allen Cell Explorer網(wǎng)站的推出,將是艾倫細胞科學(xué)研究所與全球科學(xué)界共享圖像數(shù)據(jù)和預(yù)測模型的平臺,這個開放數(shù)據(jù)的門戶網(wǎng)站將使研究人員能夠提出關(guān)于細胞變異性的重要新問題,以及它們?nèi)绾巫兓只蛻?yīng)對藥物的變化。 作為一個社區(qū),科學(xué)家可以一起應(yīng)用和擴展這些工具,在細胞生物學(xué)領(lǐng)域取得飛躍,造福人類的健康和疾病研究。
來源:http://www.nature.com/news/machine-learning-predicts-the-look-of-stem-cells-1.21769
【本文是51CTO專欄機構(gòu)大數(shù)據(jù)文摘的原創(chuàng)譯文,微信公眾號“大數(shù)據(jù)文摘( id: BigDataDigest)”】