雷鋒網(公眾號:雷鋒網)按:如果未來我們能夠像使用磁帶一樣用DNA存儲數據,那么理論上可以將人類有史以來記錄的所有數據存儲在大約兩個車庫大小的空間里。
本周,微軟研究院的計算機網絡架構師們跟外媒分享了他們的愿景。他們表示,希望在接下來的幾年時間里,開始將數據存儲到DNA鏈中,并于2020年前將DNA存儲系統投入到數據中心中使用。
盡管老式磁帶看起來有些過時,但它仍然是目前最佳的數據存儲方式之一,不僅價格便宜,而且可以有效保存數據長達30年。每卷磁帶還可以容納多達1TB的數據。
但考慮到過去兩年產生的數據比此前人類歷史上的數據總和還多,磁帶恐怕難以在接下來的幾十年里勝任數據存儲的任務。
用DNA這種生物材料來備份大量數據聽起來似乎有些奇怪,但其在極小空間中存儲大量信心的能力早在70年前就已經得到了證實。
早在20世紀40年代,物理學家埃爾溫·薛定諤就曾提出了一個可裝入非重復結構的遺傳性編碼腳本。埃爾溫·薛定諤將這個非重復結構稱作非周期性晶體。
他提出的理論啟發詹姆斯·沃森和弗朗西斯·克里克在羅莎琳德·富蘭克林的研究基礎上,確定了DNA的雙螺旋結構,引發了生命科學的革命性發展。
盡管核酸鏈在細胞中記錄信息已有數十億年歷史,但其在IT數據存儲中的作用直到五年前才得到證明。當時哈佛大學的遺傳學家將他的著作包括其中的插圖編碼進了不到5500萬條DNA中。
從此,該技術迅速發展。據雷鋒網了解,如今科學家已經能夠在一千克DNA中存儲多達兩億一千五百萬GB的數據了。
雖然核酸序列中的數據存儲密度很高,但存儲速度并不快,而且成本也不低。
去年,微軟演示了其DNA數據存儲技術。微軟將約200M大小的100本文學經典一次性編碼進了DNA中。
據雷鋒網了解,整個過程耗資大約80萬美元。也就是說,這項技術必須將成本壓縮數千倍才能在市場上具備競爭力。
此外,數據的存儲速度也很慢,只有大約400字節每秒。微軟表示,必須將存儲速度提高至100M/s,這項技術才有實用價值。
目前還不清楚微軟是否找到了降低DNA存儲成本以及提升存儲速度的方法。但近年來已經出現了降低基因測序成本的新技術。因此,微軟于2020年前將DNA存儲技術商用的目標并非不切實際。
不過,即使微軟的目標能夠實現,這項技術也將僅限于特定的場景中,比如存儲法律文檔和醫療數據,而不會取代當前的主流存儲方案。
但是我們完全可以大膽猜想,未來DNA數據存儲技術將更加先進,而且可以應用到我們的日常生活當中。
雖然目前微軟的DNA存儲方案是基于芯片的,但不排除未來可能會利用到酶和細菌來實現計算。
即使在細胞外,DNA也有可能提供全新的計算方式,比如加速某些特定問題的數據運算,就算量子計算機在其他領域的作用。
不過目前來看,用DNA來解決實際問題,只會讓問題變得更糟。