云存儲毋庸置疑已成為存儲行業未來最明朗的方向之一,不僅金融電信醫療等行業和政府信息化水平的提高,產生越多越多的結構化的電子交易數據和檔案;互聯網應用和個人手持的數據終端的增多,也大量導致了照片,視頻,設計原文件等非結構化數據的瘋長,日益強烈的PB級海量存儲的需求決定了在從現在往后展望的未來10年內,云存儲將部分取代傳統存儲成為主流存儲架構。
有必要先糾正兩個認識上的誤區:
一,并非達到PB級海量存儲就稱為云存儲,傳統存儲通過專用陣列也能達到PB級,但是管理和維護上肯定會遇到很大的困難,成本太高,容易遭遇性能瓶頸,并且使數據面臨著非常大的風險;
二,并非云存儲一定要達到PB級,云存儲的不同在于其架構,例如可管理性,高性能,無限擴展等,單一的云存儲系統可能只有幾十到幾百TB,但其擴展性使得可以通過多個系統達到PB的級別。
所以最終來決定云存儲未來的是對海量存儲的可管理性、性能擴展性、可靠性、總體擁有成本(TCO)、以及容量擴展性。但一些廠商往往有意無意的忽略掉管理性和性能擴展性兩個指標,試想如果真是通過傳統的向上擴展(Scale-up)存儲架構實現云存儲,不僅性能難以與容量同步擴展,一定會遭遇性能熱點,管理上也對人員能力和規模提出極高的要求,一定會導致性能和可靠性之間出現魚與熊掌不可兼得的尷尬境地,并且管理成本會隨之增長。
因此在可管理性和性能擴展性這兩個關鍵標準上具有無與倫比優勢的IBM XIV出現很可能在云存儲早期發展的一段時間,例如10年內成為取代傳統存儲架構的主流解決方案,因此IBM XIV號稱革命性存儲架構也是有道理的,至于10年后,恐怕業內還看不到那么遠。
之所以稱IBM XIV為革命性的存儲架構,是因為XIV使用了全新的網格技術以及大規模并行技術, 所以又稱為網格存儲,這也是屹今為止世界上唯一一款網格架構的存儲器。像動車組有別于傳統列車那樣,XIV使用了突破的,均衡的,分布式系統架構,其中許多技術與概念在上個世紀80年代末Symmetrix/USP架構設計時尚不存在,因此,與Symmetrix/USP等傳統高端存儲相比,XIV在設計理念,架構,算法等方面都是獨樹一幟而且領先至少一代的,而正是XIV的這種技術進步能徹底解決許多Symmetrix/USP客戶的切膚之痛(可靠性,熱點,管理,調優等).對于那些考慮簡化存儲管理復雜性,降低整體擁有成本,把更多的精力側重于業務的客戶來說,XIV是極具競爭力的企業級高端存儲解決方案.
XIV采用的網格存儲架構的好處就是橫向擴展(Scale-out)。傳統存儲架構的向上擴展(Scale-up)容易遭遇前端控制器的性能瓶頸,也就是說容量增長到一定程度,性能的增長不會相應增長,而是會遇到一個瓶頸,這是公認的事實。XIV網格存儲的橫向擴展(Scale-out)具有“自優化”的特性,不依賴任何主控制器,而是全部采用處理能力和存儲能力緊耦合的網格單元,所以整個系統的擴展是性能和容量同步線性增長,在增加到一定程度以后,再使用第二個機架,乃至第三、第四個……理論上是可以繼續線性擴展下去的,這就是云存儲必須達到的性能擴展性和容量擴展性必須兼顧的標準。
IBM XIV的另一個優勢就是“自管理”,大大簡化了海量存儲的管理復雜性,傳統架構的高端存儲就像一輛豪華跑車,必須有一個好車手才能駕馭,但也不可避免遇到可靠性的風險。XIV采用了基于網格的全虛擬化,內置了主流的管理軟件,不需要客戶單獨購買軟件和進行復雜的人工配置,幾乎100%實現自動化管理,不僅實現了性能的均衡,并且降低了管理不善造成的數據可靠性成本和人員管理成本,從而使客戶總體擁有成本大幅降低。
可靠性是所有企業存儲系統的關鍵特性,XIV對可靠性同樣有革命性的創新,拋棄了傳統的Raid磁盤陣列的方式,而是采用創新的細粒度數據分布設計,每一磁盤均會分成很多小的條帶,每一條帶又會鏡像到不同的磁盤之上。這一架構的優越之處在于當磁盤出現故障時,系統中所有的磁盤均會自動通過分布式Cache參與重建,不會影響到整體性能,可將1TB磁盤在充滿數據情形下,30分鐘或更短時間內重建,極大(成數量級的)地降低了數據風險。這一點“自恢復”的特性跟傳統存儲系統相比優勢更加明顯,傳統存儲系統在故障時使用直寫磁盤模式(write-throughmode),重建時間可能長達6~25小時,在重建期間部分磁盤會經受很大的負載壓力,造成性能降級,使數據面臨雙重故障風險。
在確保海量數據的可管理性,可靠性和性能穩定前提下,企業存儲系統還會關注總體擁有成本(TCO),IBM XIV采用的單層SATA磁盤解決方案采用業界標準組件,極大降低了采購成本;內置瘦供給、快照、容災等管理軟件以及高度的自動化管理又減少了在軟件附加費用和人員管理費用;以上兩項使一級存儲成本可省70%。另外,SATA磁盤的高密度,低能耗特性使數據生命周期內的機房空間和能耗等運營管理成本也大幅降低,總體能耗、空間和散熱開銷可省80%。
如果用海量存儲的可管理性、性能擴展性、可靠性、總體擁有成本(TCO)、以及容量擴展性這幾個標準來衡量,無疑只有具有“自恢復,自優化,自管理”特性的IBM XIV代表了云存儲的核心需求,要往后看云存儲發展趨勢十年,IBM XIV所創建的網格存儲架構必將大興其道。而EMC和HP為代表的傳統存儲架構的云存儲還需在達到PB級數量后經受可管理性,性能均衡,可靠性,TCO的多重考驗。