摘要 : 在人們發愁如何存儲爆炸式增長的基因數據時,生物學家卻發現,基因本身,就是最好的存儲設備。 一個拇指大小的DNA存儲設備,就能存下整個互聯網的信息。
能存下整個互聯網的DNA“硬盤”
基因測序技術的飛速發展忙壞了數據存儲公司,在他們發愁如何存儲爆炸式增長的基因數據時,生物學家卻另辟蹊徑,他們發現,基因本身,就是最好的存儲設備。
今年2月,瑞士聯邦理工學院的項目團隊對外公布了一項最新研究成果:他們成功將一段DNA片段塞進了石英玻璃材質的球形膠囊中。
看起來不是什么重大成果,此前人們早已能夠把DNA片段塞進各式各樣的材料中。但關鍵是,4周后,瑞士科學家從那段DNA中,完整取出了之前存入的83KB數據。
這就算是DNA存儲技術的歷史性突破了。它意味著,利用DNA存儲和讀取數據,不再是一個不錯的想法,而是一個可行的辦法。
不過,雖然實驗已證明了其可行性,但要真正干掉如今的硬盤和服務器,DNA存儲還有很長的路要走。
【1克=700TB】
在分析所有困難前,先來看一個基本的問題,為什么要用DNA來存儲數據?
答案不是為了好玩,也不是某些技術先鋒的創新之舉,而是我們現有的存儲工具,已經跟不上數據存儲的需求。
市場研究公司IDC和數據存儲公司EMC在2014年做了一項調研,他們發現,2013年全世界的數據總量達到了4.4ZB(1ZB=10.74億TB),按照如今的數據增長速度,即使保守估計,2020年,數據總量也將超過44ZB。
而隨著摩爾定律的升級,人類已經逐步接近傳統電子制造技術的極限,即便摩爾定律一直生效,現有電子存儲設備的性能和容量提升速度,也無法跟上人類產出數據的速度。
在數據大爆炸災難發生前,人類需要找到不受摩爾定律限制的存儲設備。DNA存儲的設想,由此而生。
關于DNA存儲,流傳最廣的說法是2010年誕生于酒吧中。當時,歐洲生物信息研究所副所長尤安?伯尼和同事尼克?古德曼在德國漢堡市一間酒吧中發愁,用什么可以替代昂貴的存儲硬盤,以處理日益繁多的基因數據。
兩人開玩笑說,要是有存儲設備能像DNA一樣存儲遺傳基因信息多好,你看一只猛犸象的基因就能讓我們了解數萬年前的許多信息。
話音剛落,兩人立馬有了同樣的想法,為什么不用DNA存儲信息呢?它本身就是一個很好的存儲設備。于是,兩位科學家找了一張餐巾紙,在上面寫下了這個偉大的構想。
在兩人的構想中,所謂DNA存儲,就是利用DNA的4個堿基——A、T、C、G為基本符號,通過獨特的排列組合,形成一套編碼存儲和讀取數據。
這與如今的二進制電子存儲有異曲同工之妙,只不過,二進制電子存儲是以1和0為基本符號進行排列組合,形成不同的序列,進而組合成信息和數據。
而DNA有4個堿基,在編碼上也就多了許多可能,眾多的優勢也將從中顯現。
最明顯的優勢,就是容量。DNA本身就是攜帶海量遺傳信息的“數據庫”,在人類的基因序列中,1克重量的DNA就包含數十億GB的遺傳數據,而根據2012年美國科學家喬治?丘奇在1沙克(億萬分之一克)DNA中存入的數據量換算,1克DNA能存儲的數據,多達700TB,相當于1.4萬張藍光光盤,或233個3TB的硬盤。
丘奇說,以這個存儲容量,今后,一個拇指大小的DNA存儲設備,就能存下整個互聯網的信息。
【最佳存儲選擇?】
除了容量巨大,DNA存儲的優勢還包括無須依賴電源和不需要維護等,不過以此就斷言DNA是未來最佳存儲設備,還為時尚早。
2013年,經過3年努力,尤安?伯尼和尼克?古德曼完成了他們首次的DNA存儲實驗,將154首莎士比亞的詩歌、一張歐洲生物信息研究所的JPG格式圖片、一份關于DNA分子結構的PDF學術論文、馬丁?路德?金“我有一個夢想”的26秒演講片段以及一個編碼系統文檔統統存進了微量的DNA里。
但完成這一存儲過程,著實費了不少功夫。
最基本的難題是如何將這些數字化形式存在的文字、圖片和視頻,轉化成DNA堿基的編碼語言。科學家們時至今日使用的方法,都是發明一段中間代碼,讓這段代碼充當中介,實現二進制電子語言與DNA堿基語言的轉化。
比如,將莎士比亞的詩歌翻譯成中間代碼,再利用DNA合成技術,將堿基按序排列,合成一段符合詩歌代碼的DNA片段,并加上一段索引代碼,保證每一個位置的堿基與相應的詩歌字母相匹配。
讀取階段,則是利用基因測序儀和計算機,按照DNA片段的序列索引,將DNA中存儲的信息排列好,并通過中間代碼轉化成計算機能夠讀取的二進制數字語言。
理論上看這是一個接近完美的存儲和讀取方法,但實際上,除去中間代碼的編寫難度之高,DNA本身的存儲和數據保護,也是一個大麻煩。
以往眾多科學家的測試結果表明,合成存入數據的DNA并不困難,但要讀取數據時,DNA會對周圍環境作出反應,很難保持穩定,這很容易導致讀取的DNA數據經常出現錯誤,或者數據隨著細胞死亡而丟失。
瑞士聯邦理工學院科學家們的實驗之所以可以稱為突破性成功,就在于解決了DNA片段的存儲問題,將DNA片段當成“化石”保存,再通過氟化物的作用,釋放DNA,進而完整準確地讀取出所有存入的數據。
瑞士的科學家說,利用這種方法,存儲數據的DNA可以在-18℃下保存100萬年之久。
不過,即便保存方法難題得到解決,DNA存儲還需要面對所有前沿科技面臨的共同挑戰——成本。
瑞士科學家在DNA片段中存儲的83KB數據,包括一份瑞典聯邦憲章以及英文版的阿基米德著作《機械定理方法》,整個存儲和讀取過程,花費超過1000歐元,而若要存儲一整部電視劇,費用將是一個驚人的數字。
不過好消息是,基因測序和DNA合成技術的發展速度也同樣驚人,DNA存儲的成本也在隨之降低,屆時,即便不能成為最佳存儲設備,也會是最好的選擇之一。