1. 傳統(tǒng)RAID的局限性
RAID(Redundant Array of Independent Disk,獨立冗余磁盤陣列)技術(shù)誕生于 1987年,最初由美國加州大學(xué)的伯克利分校提出,其基本思想是把多個獨立的物理硬盤通過相關(guān)的算法組合成一個虛擬的邏輯硬盤,從而提供更大容量、更高性能,或更高的數(shù)據(jù)容錯功能。
作為一種成熟、可靠的磁盤系統(tǒng)數(shù)據(jù)保護標準,RAID 技術(shù)自誕生以來一直作為存儲系統(tǒng)的基礎(chǔ)技術(shù)而存在,但是近年來隨著數(shù)據(jù)存儲需求的快速增長,高性能應(yīng)用的不斷涌現(xiàn),傳統(tǒng) RAID 逐漸暴露出越來越多的問題。
IDC 預(yù)測,未來 5 年內(nèi)存儲市場將繼續(xù)保持年平均增長 10%以上的良好態(tài)勢,全球存儲總?cè)萘靠赡苓_到 16840PB。為了滿足數(shù)據(jù)增長的需求,磁盤設(shè)備制造商不斷地提升技術(shù)來增加磁盤單位存儲密度,如今,4TB 的高容量磁盤和 900GB 的高性能 SAS 磁盤在企業(yè)和消費市場已經(jīng)非常普遍,當這些高容量磁盤由于出現(xiàn)磁盤故障而需要進行數(shù)據(jù)重構(gòu)時,傳統(tǒng) RAID 的弱點便會立即凸顯。
以 7.2K RPM 4TB 磁盤為例,在傳統(tǒng)的 RAID5(8D+1P)中,其重構(gòu)時間在 40 個小時左右。重構(gòu)的進程會占用系統(tǒng)的資源,導(dǎo)致應(yīng)用系統(tǒng)整體性能下降,當用戶為了保證應(yīng)用的及時響應(yīng)而限制重構(gòu)的優(yōu)先級時,重構(gòu)的時間還將進一步延長。此外,在漫長的數(shù)據(jù)重構(gòu)過程中,繁重的讀寫操作可能引起 RAID 組中其他磁盤也出現(xiàn)故障或錯誤,導(dǎo)致故障概率大幅提升,極大地增加數(shù)據(jù)丟失的風(fēng)險。
另一方面,傳統(tǒng) RAID 受限于硬盤數(shù)量,在數(shù)據(jù)容量劇增的年代無法滿足企業(yè)對資源統(tǒng)一靈活調(diào)配的需求,同時,隨著硬盤容量的增大,以硬盤為單位對數(shù)據(jù)進行管理也顯得越來越力不從心。
如何解決傳統(tǒng)RAID表現(xiàn)出來的問題已成了各大廠商急需解決的頭等問題!
2. 解決之道
為了解決傳統(tǒng) RAID 的上述問題,同時順應(yīng)虛擬化技術(shù)的發(fā)展趨勢,眾多存儲廠商紛紛提出了傳統(tǒng) RAID 技術(shù)的替代方案:
LUN 虛擬化:以 EMC 和 HDS 為代表的存儲廠商,在傳統(tǒng) RAID 基礎(chǔ)之上將單個或者多個 RAID 組進行更細粒度地切分,再將切分的單元進行組合,構(gòu)建主機可訪問的空間。
塊虛擬化:以華為和 HP 3PAR 為代表的存儲廠商,將單個硬盤劃分成一個個小粒度的數(shù)據(jù)塊再組成存儲池,基于數(shù)據(jù)塊來構(gòu)建 RAID 組,使得數(shù)據(jù)均勻地分布到存儲池的所有硬盤上,然后以數(shù)據(jù)塊為單元來進行資源管理
RAID2.0+技術(shù)是華為針對傳統(tǒng) RAID 的缺點,設(shè)計的一種滿足存儲技術(shù)虛擬化架構(gòu)發(fā)展趨勢的全新的 RAID 技術(shù),其變傳統(tǒng)固定管理模式為兩層虛擬化管理模式,在底層塊級虛擬化(Virtual for Disk)硬盤管理的基礎(chǔ)之上,通過一系列 Smart 效率提升軟件,實現(xiàn)了上層虛擬化(Virtual for Pool)的高效資源管理
3. RAID2.0技術(shù)亮點
RAID2.0+通過兩層虛擬化管理模式,克服了傳統(tǒng) RAID 的一些固有缺點,大大提升了存儲系統(tǒng)的可靠性和資源管理的效率,借助于 RAID2.0+的創(chuàng)新技術(shù),T 系列存儲系統(tǒng)真正實現(xiàn)了以往高端存儲才能有的安全可信、彈性高效。
自動負載均衡,降低整體故障率
傳統(tǒng) RAID 存儲系統(tǒng)中一般會有多個 RAID 組,每個 RAID 組中包含幾塊到十幾塊硬盤。由于每個 RAID 組的業(yè)務(wù)繁忙程度不同,導(dǎo)致硬盤的工作壓力不均,部分硬盤存在熱點,RAID2.0+技術(shù)通過塊虛擬化實現(xiàn)了數(shù)據(jù)在存儲池中硬盤上的自動均衡分布,避免了硬盤的冷熱不均,從而降低了存儲系統(tǒng)整體的故障率。
l 快速精簡重構(gòu),改善雙盤失效率
容量的增長使得傳統(tǒng) RAID 不得不面臨一個嚴重的問題:10 年前重構(gòu)一塊硬盤可能只需要幾十分鐘,而如今重構(gòu)一塊硬盤需要十幾甚至幾十個小時。越來越長的重構(gòu)時間使得企業(yè)的存儲系統(tǒng)在出現(xiàn)硬盤故障時長時間處于非容錯的降級狀態(tài),存在極大的數(shù)據(jù)丟失風(fēng)險,存儲系統(tǒng)在重構(gòu)過程中由于業(yè)務(wù)和重構(gòu)的雙重壓力導(dǎo)致數(shù)據(jù)丟失的案例也屢見不鮮。
基于底層塊級虛擬化的 RAID2.0+技術(shù)由于克服了傳統(tǒng) RAID 重構(gòu)的目標盤(熱備盤)性能瓶頸,使得重構(gòu)數(shù)據(jù)流的寫帶寬不再成為重構(gòu)速度的瓶頸,從而大大提升了重構(gòu)速度,降低了雙盤失效的概率,提升了存儲系統(tǒng)的可靠性。
故障自檢自愈,保證系統(tǒng)可靠性
T 系列存儲系統(tǒng)針對硬盤采用了多重故障容錯設(shè)計,具有硬盤在線診斷、DHA(Disk Health Analyzer,硬盤故障診斷與預(yù)警)、壞道后臺掃描、壞道修復(fù)等多種可靠性保障,RAID2.0+技術(shù)會根據(jù)熱備策略自動在硬盤域中預(yù)留一定數(shù)量的熱備空間,用戶無需進行設(shè)置,當系統(tǒng)自動檢測到硬盤上某個區(qū)域不可修復(fù)的介質(zhì)錯誤或整個硬盤發(fā)生故障時,系統(tǒng)會自動進行重構(gòu),將受影響的數(shù)據(jù)塊數(shù)據(jù)快速重構(gòu)到其他硬盤的熱備空間中,實現(xiàn)系統(tǒng)的快速自愈合。
虛擬池化設(shè)計,降低存儲規(guī)劃管理難度
使用 RAID2.0+技術(shù)的 T 系列存儲系統(tǒng),采用了領(lǐng)先的虛擬化技術(shù),對存儲資源進行池化設(shè)計,管理員只需要維護少量的存儲資源池,所有的 RAID 配置在創(chuàng)建存儲池時自動配置完成,同時,系統(tǒng)會自動根據(jù)制定的策略來智能管理和調(diào)度系統(tǒng)資源,大大降低了規(guī)劃和管理的難度。
增加 LUN 所跨硬盤數(shù),大幅提升單 LUN 性能
RAID2.0+技術(shù)支持由幾十甚至上百塊硬盤組成一個大的存儲資源池,LUN 基于存儲池創(chuàng)建,不再受限于 RAID 組磁盤數(shù)量,寬條帶化技術(shù)能夠讓單個 LUN 上的數(shù)據(jù)分布到很多不同的磁盤上,避免了磁盤熱點,使得單 LUN 性能和容量都得到了大幅提升。如果當前存儲的容量無法滿足要求時,只需要簡單向硬盤域中增加硬盤就可以完成存儲池和 LUN 的動態(tài)擴容,提升了磁盤的容量利用率。
空間動態(tài)分布,靈活適應(yīng)業(yè)務(wù)變化
RAID2.0+基于業(yè)界領(lǐng)先的塊虛擬化技術(shù)實現(xiàn),卷上的數(shù)據(jù)和業(yè)務(wù)負荷會自動均勻分布到存儲池所有的物理硬盤上,借助于智能的 Smart 系列效率提升套件,T 系列存儲系統(tǒng)能自動根據(jù)業(yè)務(wù)所需的性能、容量、冷熱數(shù)據(jù)等因素在后臺進行智能調(diào)配,靈活地適應(yīng)企業(yè)業(yè)務(wù)的快速變化。
4. 客戶價值
性能提升,IO負載均衡:
LUN基于資源池(Pool)創(chuàng)建,單LUN的性能得到大大提升
Smart X 特性保障數(shù)據(jù)自動均勻分布在存儲池中,消除熱點盤
磁盤資源利用率提升:
存儲資源的管理由預(yù)先規(guī)劃改進為寫時分配機制,動態(tài)調(diào)整存儲空間
可靠性提升,重構(gòu)時間縮短20倍:
重構(gòu)數(shù)據(jù)量由TB級降至MB級:
參與重構(gòu)的硬盤增至pool所有硬盤
1TB數(shù)據(jù)修復(fù)時間: 30分鐘