用DNA直接存儲(chǔ)圖像,「活細(xì)胞相機(jī)」分辨率達(dá)96像素
本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。
DNA可以用來拍照了,而且是直接存進(jìn)去的那種!
新加坡國立大學(xué)的研究團(tuán)隊(duì)成功將圖像投影到DNA上并進(jìn)行了存儲(chǔ),分辨率達(dá)到了96像素。
甚至,利用同一段DNA序列,還能存儲(chǔ)多張!
傳統(tǒng)的DNA存儲(chǔ)需要從頭開始構(gòu)建DNA序列,并通過人工合成的方式編碼。
但這一成果直接使用從大腸桿菌中提取到的DNA,將圖像轉(zhuǎn)換成DNA數(shù)字信號(hào)的編碼器也是活細(xì)胞。
于是,通過將細(xì)菌(Bacteria)和照相機(jī)(Camera)結(jié)合,團(tuán)隊(duì)把這一成果命名為BacCam。
BacCam不僅將DNA存儲(chǔ)的效率大大提高,還具有極強(qiáng)的魯棒性,常見的一些特殊環(huán)境都能耐受。
相關(guān)論文已經(jīng)登上了Nature子刊。
英偉達(dá)AI科學(xué)家范麟熙(Jim Fan)也轉(zhuǎn)發(fā)了這一成果。
雖然我不是生物學(xué)專家,但我很期待看到生物和機(jī)器之間的無縫銜接。我已經(jīng)迫不及待地想要把大語言模型(LLM)掛載到「生物API」上了!
無懼水深火熱
實(shí)驗(yàn)中,BacCam展現(xiàn)出了極強(qiáng)的魯棒性。
對(duì)于其中一張圖像,將DNA稀釋5萬倍之后,數(shù)據(jù)沒有受到絲毫影響。
稀釋后的DNA濃度只有0.36皮(10-12)摩爾每升,比在水池中放一粒沙子還要低上那么幾個(gè)數(shù)量級(jí)。
不過,稀釋對(duì)DNA分子本身影響不大,可能還不足以說明問題。
但將溶液烘干之后復(fù)原,熟悉的笑臉依舊清晰可見。
對(duì)于復(fù)雜的外部環(huán)境條件,BacCam也能輕松應(yīng)對(duì)。
除了在室溫條件下能保持完好之外,冷凍和加熱也都對(duì)數(shù)據(jù)沒有什么影響。
在60度的烘箱當(dāng)中放上一周,圖像仍然完好無損,不過70度就不行了。
但據(jù)論文中介紹,把DNA在70度環(huán)境下放上一周,相當(dāng)于在9.4度下放兩千年。
就算用紫外線照上一個(gè)小時(shí),里面的數(shù)據(jù)依舊巋然不動(dòng)。
而對(duì)于存儲(chǔ)不同圖像的DNA,也無需分別進(jìn)行保存,直接混在一起就可以了。
將不同DNA混合后,讀取時(shí),只需要使用特定引物,對(duì)需要的部分進(jìn)行擴(kuò)增。
團(tuán)隊(duì)將5段存儲(chǔ)不同圖像的DNA混在了一起,結(jié)果單次讀取時(shí)圖像幾乎能保持完整,多次隨機(jī)讀取的最低準(zhǔn)確率也有80%。
△B行為單次讀取,C行為多次隨機(jī)讀取
既然如此,它是如何做到的呢?
點(diǎn)陣化方式處理
BacCam大致的工作流程是醬嬸兒的:
首先,要存儲(chǔ)的圖像被分割成96個(gè)區(qū)域。
然后,利用對(duì)特定波長(zhǎng)光線敏感的反應(yīng)重組酶,根據(jù)該波長(zhǎng)光的有無,對(duì)DNA進(jìn)行編輯。
這種“條形碼”式的編輯方式直接保留了圖像中各像素點(diǎn)的空間位置,使圖像數(shù)字化,而不需要額外進(jìn)行編碼。
此外,利用光的復(fù)用能力和對(duì)不同波長(zhǎng)敏感的酶,團(tuán)隊(duì)將正交的紅藍(lán)兩種顏色圖像分層,實(shí)現(xiàn)了用同一段序列存儲(chǔ)兩個(gè)圖像。
這種存儲(chǔ)方式下,BacCam依舊擁有很高的準(zhǔn)確率。
利用機(jī)器學(xué)習(xí)方式,研究團(tuán)隊(duì)對(duì)BacCam的解碼方式進(jìn)行了優(yōu)化。
經(jīng)過大量的無監(jiān)督式學(xué)習(xí),已經(jīng)實(shí)現(xiàn)了DNA編碼的自動(dòng)化解讀。
團(tuán)隊(duì)簡(jiǎn)介
BacCam的研究團(tuán)隊(duì)來自新加坡國立大學(xué)EngBio實(shí)驗(yàn)室。
該實(shí)驗(yàn)室主要進(jìn)行以生物學(xué)為核心的多學(xué)科交叉工程研究。
論文第一作者是來自該實(shí)驗(yàn)室的華人博士生Cheng Kai Lim。
他的研究方向是利用DNA進(jìn)行數(shù)據(jù)存儲(chǔ),同時(shí)還在攻讀MBA學(xué)位。
Lim的導(dǎo)師、實(shí)驗(yàn)室負(fù)責(zé)人Chueh Loo Poh教授是本文的通訊作者。
論文地址:https://www.nature.com/articles/s41467-023-38876-w