數據中心宕機會對整個企業產生負面影響,雖然首席信息官們不需要每天考慮數據中心的運營情況,但他們需要了解有關數據中心業務的一些基本要素,因為這些要素與數據中心宕機事件有關。以下就是首席信息官必須知道的關于數據中心宕機的10個問題:
1.假設數據中心明天要宕機,你會怎么做?
這是一個價值上百萬美元的問題,大概很多首席信息官都回答不上來,但是,如果事前不知道數據中心存在的漏洞和缺陷,就更有可能出現業務中斷的情況。首席信息官需要與經驗豐富的顧問合作,利用他們的專業知識,通過新的視角來解決這個問題,這樣以來至少可以審查兩件事情:數據中心的設計方式和數據中心的運作方式。審查將有助于確定數據中心潛在的風險,并指出減輕潛在風險的方法。
2.你的企業是否定義了何為重大中斷事故?
這里的關鍵定義是“重大中斷”,不同規模的企業對這個定義的認識會不同,同時,定義也會因應用程序而發生變化。“重大中斷”這一定義對于發現和阻止意外中斷至關重要,一旦定義完成,企業就會開始跟蹤,測量和傳達這些定義。
3.你的企業最為關鍵的應用程序是什么?
我們常常會聽到每個應用程序都很重要,但是每個企業都有自己定義的最為關鍵的應用程序和服務。例如,一家醫院的網站中斷并不能阻止病人得到治療,但是一家電子商務公司的網站中斷就會導致銷售錯誤,并帶來一定的損失,這是因為醫院和公司定義的最關鍵的應用程序不同。企業一旦確定了最關鍵的應用程序和服務,就會根據具體的業務情況和風險承受能力,確定誰將保護它們以及如何保護它們。
4.如何衡量數據中心中斷的成本?
清楚數據中心中斷成本可以幫助企業做出更好的決策,通過開發一個模型來確定業務的中斷成本,并根據成本來降低風險,幫助企業做出更明智的決策。企業的停電總成本可能是模糊的,因為它需要花費一定的時間去做統計。有些發電機項目和UPS升級失敗,只是因為經理沒有將數據中心中斷成本告訴業務人員。所以,這里給出一個忠告:停電的證據和費用必須是真實的。
5. 數據中心中斷造成的間接業務成本是多少?
雖然每個企業之間的成本差別很大,但都是難以量化的成本,如生產力損失,競爭優勢的喪失,客戶忠誠度降低,監管罰款,以及許多其他類型的損失。
6.你是否制定了程序和制度來減少數據中心的人為錯誤?
根據最近Uptime Institute機構的統計顯示,大約73%的數據中心中斷是人為原因引起的。在人們能夠采用機器取代工作人員之前,解決這個問題的唯一方法是明確定義流程。目前,這個統計數字并沒有隨著時間的推移而改變,這表明大多數企業在這方面還有很多工作要做。同時,執行這些政策也至關重要,因為許多企業雖然有健全的政策,但沒有充分執行。
7.你的數據中心安全策略是否與你的業務安全策略一致?
現在,IT部門和設施部門正在協作,并在為尋求更好的合作而努力。人們常見的問題是,企業物理安全系統需要在數據中心內運行,但企業其他部門則不需要,如果把企業安全和數據中心運營整合或共享數據,則會產生問題。
8.你是否有一個結構化和持續的應用程序?
隨著業務需求的變化,企業的應用程序和服務也會發生變化。所以在數據中心中運行的所有應用程序應至少每年進行一次評估和評審,并根據業務的可靠性、性能和安全需求,為每個應用程序確定最佳類型的基礎結構。
9.你的物聯網安全策略是什么?
現在大多數企業已經解決或減輕了自攜設備(BYOD)的威脅,物聯網設備很可能成為下一個跟蹤和監控的主要類別的輸入設備。但是一直以來企業只監視應用程序堆棧的活動,而不監視物聯網設備,而這些設備在運行企業的IT堆棧的物理基礎設施(如電源和冷卻系統)中起著重要作用,由于這些設備沒有受到保護,數據中心中斷的風險則會增加。
10.你的業務連續性、災難恢復過程是什么?
如果你有一個非常重要的數據中心活動,那么你是否已經做好計劃?活動的流程是很關鍵的,大多數企業在這些過程中都會進行設計、實施,并記錄。如果你還沒有做好計劃,企業的員工是否知道他們需要做什么?然而,大多數人不了解這些過程并且沒有實踐經驗,所以他們不知道當一個重大事件發生時該怎么辦。
以上十個問題是數據中心IT運營面臨的最大的風險和問題。你能否回答這些問題?如果不能,現在是尋找答案的時候了。