成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

AI干6周=生物學家134年!斯坦福生物學基礎模型開啟生物學AI時代

人工智能 新聞
AI在生物學領域的成績再添一筆,斯坦福大學開發(fā)的生物學基礎模型,在短短6周內就發(fā)現(xiàn)了人類花了134年才發(fā)現(xiàn)的Norn細胞,生物學的AI時代正在開啟。

人類花了134年才發(fā)現(xiàn)Norn細胞,AI用了6周就做到了!

來自斯坦福大學的研究人員使用數(shù)百萬個真實細胞的化學和基因組成作為原始數(shù)據(jù)訓練了一個AI大模型,

通過自行學習到的知識,模型可以將之前從未見過的細胞歸類為1000多種類別中的某一種,Norn細胞就是其中之一。

而此時,距離科學家發(fā)表Norn細胞的發(fā)現(xiàn)才過去短短幾個月,也許早一點訓練模型的話,這個功勞說不定就被AI給搶了!

Norn細胞是一種腎細胞,可以感知缺氧狀態(tài)。當人體氧氣含量迅速下降時,Norn細胞就會出來搶救,通過消耗鐵來合成促紅細胞生成素(Epo)。

這可是能救命的能力,于是最初的發(fā)現(xiàn)者以傳說中控制人類命運的北歐神靈來命名了這個細胞。

而對于Norn細胞及其相關機制,至今仍是非常重要的研究,比如Nature上動不動就要揭開人家的面紗:

Norn細胞產(chǎn)生的Epo是氧穩(wěn)態(tài)的主要調節(jié)因子,在紅細胞的生成過程中至關重要。

健康狀態(tài)下,Epo的調控能夠保證紅細胞按需生成,比如當人處于高海拔或者高強度運動時,紅細胞就會增加,滿足人體的供氧。

相應的,如果調控出現(xiàn)問題,就會影響人體健康:過低會導致貧血,過高會引起多發(fā)性骨髓瘤等疾病。

歷經(jīng)134年的發(fā)現(xiàn)

1889年,一位名叫Francois-Gilbert Viault的法國醫(yī)生從安第斯山脈的一座山上爬下來,從他的手臂上抽血,并在顯微鏡下檢查。

結果顯示,Viault的血液中運送氧氣的紅細胞激增了42%。——于是他發(fā)現(xiàn)了人體的一種神秘力量:可以按需制造紅細胞。

最早,科學家們推測是激素,稱這種激素為促紅細胞生成素。七十年后,研究人員在過濾了670加侖尿液后終于發(fā)現(xiàn)了這種促紅細胞生成素。

又過了大約50年后,也就是去年,以色列的生物學家宣布,他們發(fā)現(xiàn)了一種罕見的腎細胞,當氧氣降得太低時,它就會產(chǎn)生激素,——這就是掌管人類命運的Norn細胞。

從1889年到2023年,人類花了整整134年的時間才發(fā)現(xiàn)Norn細胞。

但是在去年夏天,斯坦福大學研究者訓練的AI模型,在短短六周內就發(fā)現(xiàn)了Norn細胞。

生物學基礎模型

研究人員訓練了一個類似于ChatGPT的模型,所不同的是,ChatGPT吃的是互聯(lián)網(wǎng)上的數(shù)十億條文本,而他們的模型喂的是數(shù)百萬個真實細胞的化學和基因組成的原始數(shù)據(jù)。

研究人員沒有告訴模型這些數(shù)據(jù)的含義,也沒有解釋不同種類的細胞具有不同的生化特征(哪些細胞在我們的眼睛中發(fā)光,或者哪些細胞產(chǎn)生抗體)。

模型自行處理數(shù)據(jù),根據(jù)它們在廣闊的多維空間中彼此的相似性創(chuàng)建所有細胞的模型。

當訓練完成時,模型已經(jīng)學到了驚人的知識,可以將以前從未見過的細胞歸類為1000多種不同類型之一,這其中就包括Norn細胞。

斯坦福大學的計算機科學家Jure Leskovec表示,“這很了不起,因為從來沒有人告訴模型腎臟中存在Norn細胞”。

斯坦福的這個模型是最近的幾個生物學基礎模型之一,它們不僅僅是整理生物學家收集的信息,而是正在發(fā)現(xiàn)基因如何工作以及細胞如何發(fā)育。

隨著模型規(guī)模的擴大、實驗室數(shù)據(jù)和計算能力的增加,科學家們預測會得到更深刻的發(fā)現(xiàn)。

比如揭示有關癌癥和其他疾病的秘密,或者找出將一種細胞變成另一種細胞的秘訣。

用AI來理解生物學是一個有爭議的問題。不過樂觀的科學家認為,基礎模型甚至能夠解決當前最大的生物學問題:是什么將生命與非生命區(qū)分開來?

心臟細胞和鼴鼠

長期以來,生物學家一直試圖了解人體內的不同細胞如何利用基因來做維持生命所需的許多事情。

大約十年前,研究人員開始了工業(yè)規(guī)模的實驗,從單個細胞中撈出遺傳片段。

波士頓兒童醫(yī)院(Boston Children's Hospital)的醫(yī)師Christina Theodoris博士閱讀了谷歌工程師在2017年為語言翻譯制作的AI模型,——也就是大名鼎鼎的Transformer。

Transformer擁有翻譯以前從未見過的句子的能力,Theodoris博士于是設想一個類似的模型是否可以自學,以理解細胞圖譜中的數(shù)據(jù)。

2021 年,她努力尋找一個實驗室來支持自己的想法,雖然遭到了很多質疑,但最終波士頓Dana-Farber癌癥研究所的計算生物學家Shirley Liu給了她機會。

Christina Theodoris

Theodoris博士從106項已發(fā)表的人體研究中提取數(shù)據(jù),總共包括3000萬個細胞,她將這些數(shù)據(jù)全部喂給了一個名為GeneFormer的模型。

模型深入學習了人類基因在不同細胞中的行為。例如,它預測關閉一個名為TEAD4的基因會嚴重破壞心肌細胞,這與Theodoris團隊的實際測試相符。

在另一項測試中,Theodoris和同事為模型提供了心跳節(jié)律有缺陷的人以及健康人的心臟細胞數(shù)據(jù),并詢問模型如何修改不健康的細胞。

GeneFormer建議降低某四個基因的活性,而這四個基因以前從未與心臟病相關。

Theodoris團隊遵循了模型的建議,在參加實驗的病例中,有一半獲得了改善。

斯坦福大學團隊在幫助建立了世界上最大的細胞數(shù)據(jù)庫之一(CellXGene)后,開始研發(fā)基礎模型。

從去年8月開始,研究人員利用數(shù)據(jù)庫中的3300萬個細胞的數(shù)據(jù)訓練模型,并重點關注一種稱為信使RNA的遺傳信息。他們還向模型提供了蛋白質的三維結構。

據(jù)此,模型學會了如何根據(jù)基因的開啟和關閉方式對一千多種類型的細胞進行分類。

研究人員將這個基礎模型命名為通用細胞嵌入(Universal Cell Embedding,UCE),吸收了幾代生物學家發(fā)現(xiàn)的細胞類型數(shù)據(jù)。

此外,UCE還自學了一些關于細胞如何從單個受精卵發(fā)育的重要知識。UCE認識到,體內的所有細胞都可以根據(jù)它們在早期胚胎中三層中的哪一層來進行分組。

幫助開發(fā)UCE的斯坦福大學的生物物理學家Stephen Quake表示,“它基本上重新發(fā)現(xiàn)了發(fā)育生物學”。

UCE還能夠將知識轉移到新物種上。通過一種從未見過的動物(比如裸鼴鼠)的細胞遺傳圖譜,UCE可以識別出許多細胞類型。

“你可以帶來一個全新的生物體——雞、青蛙、魚,隨便什么——把它放進去,你會得到一些有用的東西。”

——好家伙,新時代的黑暗料理。

在UCE發(fā)現(xiàn)Norn細胞后,Leskovec博士和他的同事們在CellXGene數(shù)據(jù)庫中查看了細胞的來源,因為根據(jù)數(shù)據(jù),模型有可能在腎臟外發(fā)現(xiàn)了Norn細胞。

人們之前并沒有在其他地方發(fā)現(xiàn)促紅細胞生成素激素。但可能存在一種新細胞,像Norn細胞一樣感知氧氣。

換句話說,UCE可能在生物學家之前發(fā)現(xiàn)了一種新型細胞。

細胞互聯(lián)網(wǎng)

當然了,像所有大模型一樣,生物模型有時也會出錯。

牛津大學的計算生物學家Kasia Kedzierska和她的同事們最近對GeneFormer和另一個基礎模型scGPT進行了一系列測試。

他們向模型展示了以前從未見過的細胞圖譜,并讓模型執(zhí)行諸如細胞分類等任務。這些模型在某些任務上表現(xiàn)良好,但在一些情況下表現(xiàn)不如普通的程序。

雖然Kedzierska博士對這些模型寄予厚望,“但就目前而言,在沒有正確了解其局限性的情況下,不應該開箱即用。”

相對于大語言模型使用互聯(lián)網(wǎng)數(shù)據(jù)不斷改進自身,生物模型能得到的新數(shù)據(jù)量(細胞圖譜)是較小的,Kedzierska博士想要一個完整的細胞互聯(lián)網(wǎng)。

隨著更大的細胞圖譜上線,更多的細胞正在路上。

科學家們同時也在收集不同類型的數(shù)據(jù),比如對粘附在基因上的分子進行分類,或者拍攝細胞照片來表明蛋白質的精確位置。

科學家們還在開發(fā)工具,讓基礎模型將自己學到的東西與生物學家已經(jīng)發(fā)現(xiàn)的東西結合起來。

所有這些信息都將作為基礎模型的養(yǎng)料,使它們越來越強大。

有了足夠的數(shù)據(jù)和計算能力,科學家們最終可能會創(chuàng)建出一個完整的細胞數(shù)學表示,——虛擬細胞。

這對生物學領域來說將是巨大的革命,從培養(yǎng)皿,轉移到了計算機。

也許,AI正在學著理解生命的意義。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-11-26 09:30:00

模型算法

2023-06-08 11:25:30

人工智能合成生物學

2020-12-01 10:53:42

AI 數(shù)據(jù)人工智能

2023-12-11 11:50:05

AI胚胎深度學習

2024-05-09 11:08:22

2022-05-16 16:44:08

AI合成生物學數(shù)據(jù)集

2020-12-22 19:37:04

決策樹機器學習人工智能

2022-06-20 18:56:04

戴爾

2009-06-16 15:09:38

曙光高性能醫(yī)學

2012-04-01 09:25:22

云計算醫(yī)療

2019-07-25 10:35:10

2022-02-04 23:22:56

人工智能算法醫(yī)學

2014-08-26 16:04:30

2023-12-14 12:38:52

ChatGPT生物學家地質學家

2025-03-31 09:30:00

數(shù)據(jù)訓練模型

2023-12-01 09:47:31

AI技術

2022-10-13 09:18:21

深度學習智能

2010-01-13 19:01:18

曙光刀片高性能計算

2021-02-07 10:01:31

AI 數(shù)據(jù)人工智能

2023-07-04 13:50:22

AI協(xié)作項目
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品久久久99 | 谁有毛片| 亚洲精品电影 | 日韩1区2区| 亚洲视频在线播放 | 日韩av啪啪网站大全免费观看 | 影音先锋中文在线 | 国产超碰人人爽人人做人人爱 | 午夜av成人| 四虎国产 | 亚洲导航深夜福利涩涩屋 | 视频一区二区中文字幕 | 国产精品久久久久久久久久三级 | 欧美激情视频一区二区三区在线播放 | 久久99蜜桃综合影院免费观看 | 黄色国产 | 国产精品一区二区在线播放 | 国产精品视频免费观看 | 国产高清一区二区 | 中文字幕视频网 | 亚洲国产自产 | 国产精品一级 | 日韩福利在线 | 成人欧美日韩一区二区三区 | 中文字幕在线视频一区二区三区 | 一区二区国产在线 | 欧美色性 | www.日韩 | 日韩日韩日韩日韩日韩日韩日韩 | 精品一级| 久久tv在线观看 | 91人人视频在线观看 | 国产精品国产a级 | 成人欧美一区二区三区黑人孕妇 | 精品国产99 | 久久精品国产一区二区电影 | 午夜久久久久久久久久一区二区 | 亚洲最大的黄色网址 | 精精精精xxxx免费视频 | 日韩精品在线一区 | 日韩成人免费av |