近期出現了很多在未來的存儲基礎設施中閃存和磁盤驅動器所扮演角色的文章,顯而易見,閃存將會用于基本工作負載,至于其他則仍需要對象存儲和磁盤。
實際情況也是如此,就原始數據場景中的IOPS/GB而言,閃存的地位毋庸置疑,但在對存儲容量有一定的需求的地方,磁盤仍有用武之地。即使你在固態存儲方面有好的想法,閃存的價格一降再降,閃存與磁盤價格容量比方面的區別在未來的幾年里依然巨大。
因何而異
價格容量比($/GB)一直以來都是用于計算傳統陣列存儲成本的參數,但加上現代數據服務和壓縮技術,這些就變得模糊不清了。實際上價格容量比不同于用戶對用戶,它取決于你存儲的數據類型,數據的可壓縮性和其他與存儲系統及應用的總效率相關因素。
近期閃迪發布的一個新產品——JBOF陣列系列(閃存)。它的存儲密度大,價格也相當便宜(據說少于2美元每GB),但是如果你添加數據保護(一個RAID或者一個文件系統類似Ceph或者ZFS)就不同了。只想一想備份,2美元的標價瞬間就成了4美元。
現狀核實
為了讓大家一目了然,我們會以最簡單的方式——對比一個近期HGST價格表來揭露關于$/GB和$/IOPS的真相。這些是單個磁盤的購買價格表(也就是說如果你是OEM或者購買數量多最終價格會便宜很多)。這些價格有一個來自亞馬遜,是一個消費級產品。
以下是四個磁盤:
性能聚焦:
HGST Ultrastar C10K1800: 2.5” 10K RPM, 900GB SAS disk – $350
HGST S841: 2.5” MLC 15nm 800GB SAS SSD – $2,440
容量聚焦:
HGST Ultrastar He8: 3.5” 7.2K RPM 6TB SATA disk – $298
HGST Deskstar: 3.5” 5.4K RPM 4TB SATA disk – $150(亞馬遜上價格)
首先,我們只對比簡單的組件(原材料),還有所有陣列制程前端的操作和幾個后端操作。RAID,塊大小優化,壓縮/再壓縮,刪除重復,總線或CPU限制等等,限制了主機對IOPS陣列數量的有效可見度的。
做到簡單地數學題:
考慮一個50,000 IOPS 4KB隨機工作負載。
顯而易見,如果是通過$/IOPS和IOPS/GB對比的話,固態存儲驅動器取勝簡直易如反掌。但是另一方面,在SATA 驅動器的0.037-0.049價格容量比與其他驅動器拉開了很長一段距離。
輸家是……
對我而言最大的輸家是10K SAS磁盤。這并不是從對比中得出的結論,因為其技術在以后都沒有太大提高,經過時間的洪流將逐漸淡出人們的視線。
同時,消費級SATA磁盤的價格容量比幾乎比閃存好100倍,公平地說,一個消費級閃存驅動器(帶SATA接口)的價格容量比僅是一個SATA硬盤的10倍,但即使其同比價格降低40%,如果不考慮我們已擁有的許多更大存儲容量硬盤,也仍需要五六年的時間才會有可比性價格。
在不久的將來我們會看到更多(PB級別)存儲系統使用消費級,低成本SATA驅動器,并與現代數據保護技術如分布式Erasure Coding相結合。這有助于減小多磁盤故障,加速重建時間,HDS,和它的HCP S10已經開始著手。
圓滿完結
閃存勝在IOPS,硬盤勝在容量,短時間內這是不會改變的。
全閃存系統因為其能不計成本進行刪除重復和壓縮所以比較劃算。他們的可預見性很高,而且對高標準的基本工作負載幫助很大。
同時,當IOPS要求不是很高的時候,混合系統比全閃存要好。在這種情況下,將IOPS/GB代入上述圖表是一個非常重要的度量標準。如果你想在IOPS和容量之間建立一個平衡系統,你還是需要閃存和SATA磁盤。這就是眾多SMB客戶始終在走混合路線的原因,眾多公司中Tegile和Nimble已經做得相當不錯了。
最后一個要點是,高存儲系統在很長一段時間仍會繼續接近全磁盤發展,這里說“接近”是因為現今大多數對象存儲系統把RAM用于元數據和緩存。未來,它會比在一些小的SSD上存儲信息更便宜。