人類最不可抗拒的就是大自然的力量,臺風、海嘯、泥石流、地震、火災等,當他們中的隨便一個發生時,都不是我們能夠承受的,當然還包括一些突發的意外事件,如爆炸。這是近期發生的一件大事,但是在這里我不想多說,愿逝者長已。在這里主要想提到的是如何在災后保全數據中心,因為每次災難過后的數據中心多少都會留下遺憾。
數據中心是全球協作的特定設備網絡,是企業業務系統與數據資源的有機組合,它的作用不可小覷!一旦災害發生時,我們的數據被迫中斷,那么數據的丟失幾乎是不可避免的,損失也將大到無法預估。
回顧往昔,發現類似的事件還真是不少:
2008年3月,美國,火災
結果: 威斯康辛的數據中心遭遇大火燒毀75臺服務器、路由器和交換機等設備,引發大量站點癱瘓,歷時10天得以修復。
2009年9月,土耳其,洪水
結果:伊斯坦布爾遭遇的暴雨,進而引發洪水,Vodafone數據中心遭殃,大量手機用戶因該數據中心被淹而無法使用通信服務。
2010年,澳大利亞,暴雨
結果: Datacom主機代管中心的天花板被暴雨沖毀,服務器、存儲和網絡設備都遭損壞。
2011年3月,日本,地震
結果: 日本8.9級大地震,引發的海嘯影響了日本東北部沿岸地區。許多公司在那一帶建設的數據中心受到了破壞。
2012年10月,美國,颶風
結果:颶風桑迪襲擊美國東海岸,支持著當地工業園運轉的數據中心在颶風中因斷電而癱瘓,造成了巨大損失。
2013年1月,加拿大,故障
結果:TSS的一個數據中心故障崩潰,導致Visa卡暫停服務,促使加拿大人民無法進行網絡交易,給當地金融業帶來了巨大損失。
2014年5月,美國,爆炸
結果: 美國德克薩斯州的一家名為ThePlanet H1的數據中心,電力短路引發爆炸,一舉停擺9000臺服務器
2015年,天津,事件
……
如果有組織,提前計劃,及時關閉數據中心設施,結果肯定是令人欣慰的,但是面臨突發狀況時,根本來不及多想的情況下,一套具備可操作性的關閉計劃就顯得尤為重要了。
現在,自然災害的發生越來越頻繁,而且破壞性越來越強,突然事件也是接二連三,因此,災備中心的建設是十分重要的。今年1月10日,由華為、北京郵電大學、中治研國際信息技術研究院和中國郵政存儲集團聯合發起的 “災備技術產業聯盟”在北京的成立,也預示著政府、行業、企業都已經認識了災備的重要性,以及災備的價值。
那么關于災備有什么技術手段得以實施呢?
目前數據中心整體災備技術可以分為以下五種:冷備、暖備、熱備和雙活、多活。
但是隨著發展,冷備技術,已經越來越無法適應數據中心高要求的發展,逐漸成為一種淘汰的技術方式,而暖備技術工作效果也不是很理想,因為它是手工方式運作,需要人員24小時值守,熱備技術相比暖備是實現了整體自動切換,但是比起雙活技術來說還是遜色一籌。雙活技術可以實現主備數據中心均對外提供服務,正常工作時兩個數據中心的業務可根據權重負載分擔,沒有主備之分,當一個數據中心出現故障時,另一個數據中心將承擔所有業務。而多活技術的最大特點是業務在多個數據中心上同時運行,當一個或多個數據中心故障時,其他數據中心將自動接管所有應用業務,在具體實現上,多活技術部署了很多檢測故障的方式,如:ICMP Monitor、TCP Monitor、HTTP Monitor、FTP Monitor,還可以實時檢測服務器的運行狀態、服務器負載均衡情況等,其最大特點即是不會造成數據中心的資源浪費,顯然多活比雙活可靠性更高,但投入成本也會相應變高,實現技術也更為復雜。但是,現在在金融行業、互聯網行業的數據中心更多愿意采用的還是多活技術,因為穩定性是最重要的。
進入云計算時代,災備與云服務相結合也是一條值得探索的新路。新崛起的國內災備廠商英方軟件剛剛發布了英方云,其產品特色包括:字節級數捕獲,實時復制,連續數據保護,幫助用戶恢復歷史數據,加密/壓縮傳輸,確保數據安全等,在災備云服務方面也是一個有益的嘗試。
當然數據中心的選址也是很重要的,遠離危險區域很必要(地震帶、港口、機場、易燃易爆區等),大自然不可抗,突發事件不可避免,那么我們能做到的就是防患于未然,全面部署,以積極應對災害給我們帶來的損失,災備計劃~你的數據中心準備好了嗎?