DNA的四種脫氧核苷酸(A,G,C,T)可被用來對數據進行編碼
用人類基因DNA來存儲數據,聽上去像天方夜譚,但是DNA在存儲信息上的高效率是普通硬盤存儲不可望其項背的。
據國外媒體報道,在談到信息存儲時,硬盤完全不能和DNA相提并論。在人類的基因序列中,1克的重量就可以包含幾十億GB的數據,而1毫克分子的信息存儲空間就可以包含美國國會圖書館全部的書籍,并且還有剩余。在過去,這些只是理論上的概念。現在,最新的一項研究表明,研究人員可以把一部遺傳學教科書的內容存儲到1微微克(picogram,相當于萬億分之一克)DNA中,這一技術上的突破很可能會革命性的提升人類存儲信息的能力。
過去,有些研究團隊一直試圖向活細胞中的基因組寫入數據,但是這種方式有一些不足之處。首先,細胞會死亡,這并不是你存儲學期論文的好方法。另外,細胞還會分裂、復制,其中會不斷發生變異,從而改變數據的內容。
為了解決這些問題,一個由波士頓哈佛醫學院合成生物學家喬治-丘奇(George Church)領導的研究團隊發明了一種DNA信息歸檔系統,完全不需要利用細胞。相反,利用的是一臺噴墨打印機,從而將化學合成的一小段DNA嵌入到一塊微型玻璃芯片的表面。為了給數字文件進行編碼,研究人員把文件劃分為微小的數據塊,并把這些數據塊以A、C、G、T(DNA的四種脫氧核苷酸)的字母組合來表示,放棄了過去在計算機上的1和0編碼方法。每條DNA片段還包含了一個數字“條碼”,用來記錄數據在原文件中的位置信息。在讀取信息時,需要DNA測序儀和電腦將所有片段按序重新組合起來,并轉換為數字的格式。計算機還需要負責處理錯誤信息,因為每個數據塊都可能會被復制上千次,經過比對,任何小錯誤都可以被發現和糾正。
為了證實這一系統在實際應用中的能力,該團隊使用了這種DNA芯片將丘奇同他人合著的一本遺傳學書籍進行了編碼。他們成功了。在將書籍內容轉換為DNA的信息、并將其翻譯成數字存儲模式后,該系統顯示的出錯率為每百萬比特僅兩個錯誤,相當于一些小小的拼寫錯誤。這同DVD的性能差不多,遠遠好過硬盤。本周五,該團隊在《科學》雜志上發布的報告稱,考慮到DNA芯片的體積非常小,它成為了目前世界上最密集的信息存儲介質。
不過,你最好別急著將閃存上的數據復制到基因存儲上。美國馬里蘭州羅克維爾市克雷格-文特爾研究所的合成生物學家丹尼爾-吉布森(Daniel Gibson)表示,DNA測序儀和其他設備的成本相當高,目前還不適宜推廣,但是這一領域發展迅速,這項科技將會變得更便宜、更快速和更輕便。吉布森過去領導的研究團隊曾合成了世界上第一個最完整的基因組,并在DNA中加入了一些額外的信息作為“水印”。不過,這些研究人員使用的是三個字母的編碼系統,要比丘奇團隊的效率低一些,但是卻成功阻止了活體細胞的復制,從而不會將DNA轉換為蛋白質。吉布森說,“如果DNA要被用來存儲信息,并且使用環境不在實驗室里,那么你還需要DNA測序儀的幫助,而這是很不現實的。”丘奇不同意這種觀點。他表示,除非某人有意識的“破壞”他的DNA數據存儲系統,否則信息將非常安全。