RAID已經成為現代存儲系統的主流,但當存儲系統的數量和驅動器的容量不斷增加時,RAID出現問題的可能性將會不斷上升。目前最主要的問題是企業數據存儲大容量磁盤驅動器的重建需要大量時間。雖然在2011年,很有專業人士預測RAID將會滅亡,但是現在RAID仍然是大多數存儲系統的保護的首選。那么2012年有什么不同嗎?
什么是RAID?我們可以簡單理解,RAID其實就是一種數據保護機制,允許硬盤在存儲過程中發生故障,而且仍然能夠完整存儲據數據的方法。
但是問題是在我們重建RAID驅動器的時間很少是以小時計算,很多時候卻是用天來衡量的,而且會隨著磁盤的增加而時間不斷延長。需要更長時間恢復故障磁盤和被取代磁盤是一件糟糕的事,這有三方面的原因。
1.這意味著會危險期。更換故障磁盤和恢復其中內容的一段時間——變得越來越長。在這期間,可能會有更多故障導致數據丟失。而危險期的加長意味著數據可靠性降低。
2.恢復是一項繁重的工作。這期間,有用的磁盤訪問減少,用戶工作負載的磁盤性能降低。恢復期越長,用戶“事倍功半”的時間就越長
3.每個硬盤存儲數據的容量不斷增加出現故障的幾率也同時增加。隨著硬盤容量增加,驅動器讀取數據的誤讀率就會增加,這是一個不可修復的讀錯誤的誤碼率(BER)。而硬盤容量暴漲,誤碼率的比例一直保持相對增加。一個2 TB的驅動器是需要更多讀取整個驅動器,這是在RAID重建期間發生錯誤的概率會比1 TB驅動器遇到錯誤的幾率大。
結果就是,RAID系統需要更長時間恢復到全面保護狀態,發生其他故障的幾率和數據丟失的可能性也有所增加。許多大型存儲系統很可能將在不斷的重建狀態。
RAID保護的兩種解決方案
顯然,該行業面對這樣尷尬的現實。而目前的解決方案也只有兩個不算太好的辦法。
1.使用RAID 5或RAID 6是最常見的“解決方案”。當同時重建出現,存儲供應商可以通過確保有足夠的存儲硬盤提供足夠的系統性能。你一點也不會為看到一些供應商安排專項備用硬盤驅動器來協助重建而感到奇怪。
2.另一個RAID解決方案,就是所有的關鍵任務數據的基于閃存的存儲。雖然閃存也會像硬盤一樣失敗,但是其重建進程的速度會明顯加快。重建的RAID保護的閃存體通常是時間少于15分鐘。但是其費用相對昂貴。
最終,我們可能全部加起來可能會有一堆鏡像、復制策略。因為畢竟現在硬盤價格非常便宜,而且有一個存儲系統,能夠自動保護數據并且存在硬盤里可能是最簡單和最實用的方法了。
希望明年或將來,能看到看到一個能夠像閃存一樣快速并且向硬盤一樣廉價的東西出現,RAID重建將耗時更少,空間利用率更大。