雖然云供應商通常都會在他們的各級基礎設施中增加冗余,但是單獨使用冗余策略并不足以防止停機事件的發生。本地組件故障、WAN故障或者云供應商中斷都會導致數據變得不可用。至少,使用云存儲服務的組織應當部署冗余的云存儲網關和冗余的WAN鏈路。另外,如果預算允許,應通過采用冗余獨立云(BRIC)集合架構以實施更高級別的冗余措施。
確定云存儲服務的高可用性的第一步就是驗證你從你的云算儲服務供應商那里得到的保護等級。確定你的云存儲服務供應商針對你的業務需求而提供的冗余等級是非常重要的工作。例如,如果你的企業的數據存儲策略要求所有數據都有三個副本,那么僅僅把用戶數據復制至二級數據中心的云存儲供應商可能就無法滿足你的數據存儲策略需求了。你可能會發現你需要更高層次的服務才能實現你所需的冗余等級。
正如云存儲冗余是非常重要的一樣,還有必須予以考慮的其它注意事項。為了實現云存儲的真正高可用性,你還需要把冗余策略應用于你與云存儲的連接方式上。云計算供應商們是以一種“首先失敗”的心理在建設他們自己的基礎設施的,但是供應商們對于在你的本地基礎設施中所使用架構是沒有控制權的。
需要考慮應用冗余策略的關鍵所在:WAN連接,網關
通常,我們會使用兩種組件來提供云存儲的連接性:一個WAN連接和一個云存儲網關,也就是所謂的云存儲控制器。這是兩個為實現高可用性而必須被解決的問題。
WAN冗余的一個通用解決方案就是從不同的WAN供應商那里租用冗余的網絡連接。從理論上來說,如果其中有一家供應商發生了中斷事件,那么你應當能夠通過另一個供應商的鏈路來保持云的連接性。
大多數的云存儲服務都是基于一個對象存儲平臺的。因為大部分的本地存儲都是基于塊存儲的,所有我們需要有一個機制來執行塊存儲和對象存儲之間的轉換。通常,這樣的一個任務是由云存儲網關設施來完成的,它可以為本地和云存儲提供一個全局的命名空間。
有鑒于云存儲網關的重要性,防止云存儲網關因出現單點故障而造成整體系統停機是至關重要的。如果云網關是一個物理設施,那么顯而易見的解決方案就是根據你企業的具體冗余需求來部署一個或多個附加的設施。但是物理設施的價格是相當昂貴的。如果附加設施并不在你的預算中,那么你還可以與你的供應商溝通以確定是否可能有其它選擇方案存在。如果高可用性是你的唯一目標,那么你可能會發現你可以使用一個較低端的設施或者甚至一個虛擬設施來達到目的。
在使用虛擬云存儲網關設施的情況下,你將不得不考慮所需的冗余等級。因為,一個虛擬云網關設施真的只不過就是一個虛擬機(VM),通過在你的服務器虛擬化基礎設施中的冗余措施,你就可以保護該設施。值得一提的是,雖然諸如Hyper-V故障轉移這樣的高可用性功能可以保護虛擬設施出現物理硬件故障,但是硬件集群對于防止發生在虛擬機中的故障并沒有發揮任何作用。因此,你應考慮是否可能需要通過部署并行虛擬設施來提供附加的保護,這是有必要的。
當談及云存儲的高可用性時,從過去的經歷中獲得經驗是比較重要的。例如,在2011年,亞馬遜網絡服務就由于單一可用區域中的彈性塊存儲資源發生故障而遭遇了一次重大的中斷事件,進而無法對讀寫操作請求作出響應。雖然這種類型的大問題并沒有再次出現,但這也說明了,即便云供應商擁有他們內置的高可用性機制,他們還是有可能發生問題的。所以,制定一個針對云存儲供應商遭遇數據丟失事件的到位的應急預案是一個好主意。
BRIC架構保護數據和訪問
傳統觀點一直認為,當談及確保存儲可用性時,客戶往往會聽任云存儲供應商的擺布。畢竟,如果一個供應商出現了一次亞馬遜曾遭遇過的中斷事件,這終究還是會影響到他們客戶的。但是,BRIC的架構是大有裨益的。
BRIC的工作方式類似于一個RAID存儲陣列,所以用戶不必擔憂單個磁盤出現問題,BRIC可跨多個云運行。通過使用這種方法,如果云供應商發生了故障或數據丟失事件,數據也將可以得到保護,同時在其它云中保持了數據的可訪問性。
使用BRIC架構的最大缺點就是成本。雖然也有諸如Tahoe Least-Authority文件系統(Tahoe-LAFS)這樣免費的開源BRIC實施,但是云計算存儲供應商通常會根據用戶所消費的存儲資源數量來計費。如果某家組織使用BRIC在單獨的幾個云中存儲數據的多個副本,那么他們的云存儲成本將成倍增加。情況就是如此,如果某家組織想要考慮實施一個BRIC架構,那么他們應準確地預測他們未來的存儲量需求并選擇一個能夠以最小化成本實現最大限度保護的存儲方法,這是非常重要的。否則,客戶的云存儲成本很快就會失控。