近來備份圈的問題之一是如果可以消除整個備份程序,那么多很多快照,重復數據刪除,壓縮和復制的功能的多數存儲系統,他們是否也可以被消除呢?這個想法聽起來很好。讓主存儲自己掌控,這樣也可以消除數據中心中的一個麻煩進程,但是這個策略也有一個漏洞。那就是主存儲可以完全完成我們所期待的備份任務嗎?
例如,備份系統的能力是當一個系統發生故障或數據設置被破壞時,我們可以追溯到某個特定的時間點。這就意味著在某個時間我們能夠復制一套好的數傳串,通常我們是在晚上來做,并且在一個獨立的存儲設備上來存儲這些數據,這些獨立的存儲設備通常容量比主存儲小,價格也比主存儲上更便宜。
在存儲冗余副本時,使用快照,重復數據刪除,壓縮和復制功能是一套更高效的方法。很多主存儲系統利用重復數據刪除來支持更多的快照或不限制數據副本。多數可以把數據復制到一個遠程站點,因此可以避免在一個站點發生災難后沒有先前數據的問題。有了這些功能部署,我們現在可以在災難發生時,及時的在某個時間點恢復,并且整個系統也可以被恢復,但是即使這樣,還存在一些潛在的缺點。
使用主存儲存在的一個明顯的漏洞是在主要位置發生一個系統故障的風險。這可能來自一個控制器錯誤或一個多驅動故障。如果主存儲系統發生故障時,而主存儲是備份副本的唯一來源,那么這時你需要從遠程副本中恢復數據。此時,最主要的問題是時間。需要多長時間從廣域網上獲取數據,并恢復本地系統的數據呢?和通過線上獲取所有的數據這種方法相比,把它傳送到災難恢復單元更容易些。
另一個問題是所有冗余數據的參考方法。通過重復數據刪除,當制作一個數據副本或做快照時,快照或重復數據刪除服務為冗余副本創建一個參考表格來標記寫入要求,而不是實際的寫入。這個參考表格是一個數據庫。主要是為了應對潛在的故障。你主存儲上的數據和所有副本的數據點都依賴這個表格來配置自身數據。如果表格被破壞了,那么你的在某個時間點的副本甚至你的主存儲數據都變得不可讀。
以上情況發生的幾率都很小,但這也就是我們做備份來防止數據丟失的原因。你可以在本地復制第二個模塊兒,在災難恢復時復制第三次,這和備份基本上是一樣的事情。我們同樣也可以假設系統故障或破壞瞬時發生。
不管是重復數據刪除或快照都可能會產生錯誤,但這個錯誤不會即刻顯現。我們有可能在一個壞的表格中寫入了數據,重復數據刪除也可能在積極的尋找錯誤,所有的程序都正確的進行,直到一個月后,你可能才發現這個問題。你突然讀取一個文件時,這個文件可能丟失了,也可能被破壞了。多數重復數據刪除進程可以自我檢查代碼,這樣有助于防止發生類似的事情。但是這種事情也是值得注意的。
多虧了主存儲上的快照,重復數據刪除和復制,甚至是二級恢復也可以很好的被接受。它基本上可以99.999%的保證你的關鍵信息迅速恢復。在一個獨立的平臺沒有存儲數據時,要特別注意它的風險。