大數網的作者群有一個叫“大王”的,專門研究存儲。近期寫了一系列的科普文章,知識點很多。這里把他說的資料全部整理了一下,來一起研究存儲的未來。
存儲有什么未來?可以預見的是,由于SSD的價格的不斷下降,以及PCIe接口的不斷完善,加上NVMe協議的逐漸成熟,正在為整個存儲系統帶來顛覆性的改變,這種趨勢明顯。
如果再加上明年新材料TLC、3D-NAND、3D-Xpoint等面世和大規模商業化,PCIe+NVMe完全可能進入數據中心充當主存儲系統,而不是只當緩存。
一直以來,緩存都是二房丫頭的命,幫主子(數據)救急,過度一下IO;可二房丫頭雖然顏值高,可價格貴,身子嬌貴,主子可不敢把金銀財寶(數據)完全交給她?,F在二房丫頭可以成為正房了。
我們看看這一切如何發生的。
壹 存儲當前的瓶頸在哪里?
一定程度上,閃存將磁盤換掉之后,引發的連鎖效應非常廣泛,從接口到協議,從存儲系統到網絡架構,整個系統性的改變;但改變是緩慢的,就那NVMe來說,也是經過幾年在互聯網行業的成熟,才慢慢被接受。
現在,服務器、網絡甚至于各種板卡和芯片廠商都著實為SSD方方面面騷動了一番。
具體有這么幾個方面:
接口來說,磁盤時代6Gb/s的SATA和12Gb/s 的SAS,已經是帶寬非常高的接口了,但SSD的出現立即把這些踢到了垃圾桶。
數據保護來說,之前PCIe SSD一般在Tie0層,主要的充當角色是緩存,主要作用是頂IO壓力,而不是對應用數據的長時間儲存。但是現在,PCIe SSD要做主存儲,首先要解決的就是如何將多個PCIe SSD組合成為一個存儲池了。
再用硬盤時代的RAID技術?NONO。比如RAID6效率非常低,而且寫入次數太多,閃存使用壽命會縮短。當下針對PCIe SSD的數據保護技術可以說還處于初級階段,閃存廠商可能會自己做一個數據保護軟件。但是由于閃存廠商多有硬件的基因,所以這類軟件未來必然走向閃存陣列。另一方面,針對固態存儲的數據保護軟件也將是軟件廠商必爭的一個領域。
可以預料的是,PCIe SSD有望成為主流,雖然會有新的固態介質和新的硬件接口,但是這需要時間也需要大量的投入,同時磁盤走向沒落已經是沒跑的事了。
其次,雖然PCIe SSD很熱,特別是NVMe成熟之后,但是現在PCIe SSD仍在一個發展的前期,很多系統和網絡層面的事還沒有做。
貳 NVMe over Fabric統一網絡結構?
說SSD正在改變所有,數據中心的網絡協議就可能徹底改變。為什么?
因為未來數據中心有可能是上千片PCIe SSD充當存儲主系統,用的就是NVMe over Fabric搭建。NVMe over Fabric的作用是,如何解決網絡互聯的問題。
NVMe over Fabric就是要將NVMe嫁接在各種網絡上面,這里的網絡可以是以太網(iWARP或者是RoCE)、InfiniBand等等,當然為了進一步縮減延遲,RDMA(Remote Direct Memory Access,遠程直接數據存取)在NVMe over Fabric中也是非常重要的角色。
這個架構有三點需要說明。
首先,前端和后端都是基于NVMe的,并且與iSCSI和TCP/IP共用一個網絡;
其次,對于RDMA的支持可以使得數據傳輸跳過操作系統進行,所以延遲可以得到進一步降低;
最后,隨著網絡技術的不斷演進,iWARP RDMA不是唯一的選擇,基于Omni和FC的方案應該也會有。
NVMe聯盟早在去年9月就已經發布一個新聞稿,說是在舊金山的IDF上會有NVMe over Fabric的解決方案demo展出,而最早成型的解決方案有望在2016年出現。
既然說是網絡中的問題,很多網絡廠商也有相關的動向,比如InfiniBand領域的高手Mellanox有一個NBDx架構,兩塊PCIe SSD可以實現百萬級的IOPS性能。還有EMC的DSSD,也是大規模的基于NVMe SSD的存儲系統,資料太少,就不說了。