生活中處處充滿了數據
在地球上
我們每天都會產生
5億條推文
400萬GB的聊天數據
2940億封電子郵件
……
根據IDC的數據,在2020年,全球創建、捕獲、復制和消耗的數據總量約為64ZB,而到了2025年,全球數據總量可能會達到驚人的163ZB,如果將其存儲在艾字節數據中心里,整個數據中心可能有好幾個足球場那么大,建造和維護成本高達數十億美元。
那么,有沒有一種更有效的方式來存儲這些數據呢?
當然是有的啦~許多科學家認為,另一種更加高效的解決方案就潛藏在我們的DNA當中:既然DNA能夠承載遺傳信息,那么它也能夠儲存數字信息。按照國際上廣泛接受的說法,每一克DNA可存儲215PB的數據。麻省理工學院生物工程教授馬克·巴斯這樣說到:
“
理論上,一個裝滿DNA的咖啡杯可以存儲世界上所有的數據。DNA的存儲密度甚至比閃存要大一千倍,而當你制造出DNA聚合物后,它就不會消耗任何能量,你可以編寫DNA,然后將其永久保存。
” 我們可以看到,相比于其他存儲介質,將DNA作為存儲介質擁有諸多優勢:
01
存儲密度極高
每個核苷酸,最多相當于兩個比特,約為1立方納米。理論上講,1立方毫米的DNA便能夠存儲大約1EB的數據,真正做到把EB級的數據“握到手心里”。
02
存儲時間長
在合適的存儲條件下,這些DNA可以存儲上萬年,且幾乎沒有后期維護成本。
03
能耗極低
使用DNA作為存儲介質無需額外的維護成本,由于其高密度的特性,存儲數據不再像其他介質一樣需要占用大量場地,能耗也遠遠小于傳統介質。
DNA的存儲原理并不復雜,數字存儲系統將文本、照片等信息編碼為0和1;同樣的,遺傳密碼的四種核苷酸在DNA中編碼為:A、T、C和G。我們可以用0來表示G和C,用1來表示A和T。簡單來講就是用遺傳代碼ATGC來替代計算機的二進制代碼。
整個DNA存儲流程大致可以分為四個步驟:信息編碼、DNA合成、DNA測序和信息解碼:
第一步:借助信息科學領域的編碼算法,將數據轉換為DNA中的四種堿基序列。
第二步:利用DNA合成技術例如固相亞磷酰胺三脂法、酶合成法進行DNA的合成,這一步驟相當于數據的寫入。
第三步:依靠基因測序技術,在眾多信息中讀取你所需要的DNA序列信息。
第四步:將堿基序列重新轉換成二進制序列,在經過糾錯后便可得到原始數據。
當然,將DNA作為存儲介質并不是一個新穎的話題,使用DNA存儲數據的想法可以追溯到1959年,但以當時的技術條件,該項研究并未取得突破性進展。近年來,隨著算力上限的不斷突破、各科學領域不斷交叉融合,才讓幾十年前近乎瘋狂的想法逐漸變為可能。
當然,人類在探索的路途中不止DNA存儲一種,下一代顛覆性存儲技術還有無懼濕熱、干冷的玻璃存儲以及可行性更高的全息光存儲。我們可以發現,無論是哪一種存儲技術,都在追求更小的體積和更大的容量,這也是存儲的本質:通過提高讀寫效率以滿足數據管理和數據應用的需求。
盡管大規模使用下一代存儲介質還不能完全實現,但我們一直在朝著這一方向努力著,例如數據縮減技術:在存儲介質上保留一個唯一實例,將冗余數據替換為指向唯一數據副本的一個指針,從而做到在更少的空間儲存更多的數據,節約存儲成本并延長SSD的使用時間。越高的數據縮減比就意味著更多的有效空間,而這一比例也是衡量一款存儲產品先進與否的重要標準。
而在這方面,戴爾科技“第五代存儲”家族的PowerStore絕對可以稱作該領域的佼佼者,在不妥協性能的前提下至少實現4:1的無損數據縮減,即每4TB數據寫入存儲盤里最終只占用1TB的空間。
戴爾PowerStore采用英特爾®至強®可擴展處理器,該處理器可以優化工作負載,可靠性強,還有高計算力、高穩定性和高效敏捷性,幫助企業為數字化變革做好準備。
除了4:1的數據縮減比以外,PowerStore還采用了專用的壓縮處理器,不會額外占用控制器的CPU資源,這就意味著用戶不必擔心開啟縮減功能后,存儲性能急劇下降,讓您的數據縮減功能“始終可用”。
當然,數據縮減功能不僅僅是PowerStore獨有,今年新發布的PowerMax 2500除了擁有開放系統4:1數據縮減以外,在大型機存儲領域也能提供3:1的數據縮減保證,填補了業內該領域的空白。
30年前,人們很難想象GB級別的數據能夠存放在一塊十幾克的塑料盒子里,而現在,包含閃存顆粒的U盤已經成為人們日常工作生活中的常客。戴爾科技作為全球數字化轉型領導者,也將通過不斷革新的技術幫助企業提煉寶貴的數據,挖掘數據的價值!
如果您想了解更多有關戴爾科技的產品和解決方案信息,請掃描以下二維碼咨詢戴爾官方客服。