摘要:本文介紹數據中心管理存在的16個常見誤區,這些誤區因為各種各樣的原因會存在于數據中心的日常管理和運行維護中,可能人們還沒有重視它們。所以數據中心的管理人員應該重視它們并做好安全防范的工作。
在數據中心的正常運行中,一個微小的錯誤就可能導致災難性的后果。不僅會對客戶造成經濟損失,對自身的商業形象和發展也會產生不良的影響。所以作為數據中心的管理人員一定要保持良好的心態,以避免錯誤的發生。如果錯誤發生了,就從這些錯誤中吸取教訓,來防止以后再次發生這些錯誤。
以下是16個常見的數據中心管理存在的誤區,這些誤區因為各種各樣的原因會存在于數據中心的日常管理和運行維護中,可能人們還沒有重視它們。所以數據中心的管理人員應該重視它們并做好安全防范的工作。
16個最常見的數據中心管理誤區
這些誤區是沒有先后順序的,而且可能它也不是很詳盡的,但是它會提醒數據中心的管理人員,做好安全防范的工作。萬一錯誤出現了,后悔是來不及的。
錯誤一:沒有一個良好的電力使用規劃忘記了電力成本的巨額支出
數據中心的電力費用是整個數據中心日常開銷中最大的一部分,如果沒有一個良好的電力使用規劃,那么數據中心的財政支出就被浪費了不少。對于數據中心創造的業務價值來講,保持低成本的運行才是企業所樂意看到的。
錯誤二:沒有設計模塊化
如果你擁有一個現在最先進的數據中心,但是卻沒有部署模塊化的環節,那么用不了幾年,這個數據中心就會被更先進的技術淘汰。所以為了適應數據中心將來的發展,必須要部署模塊化。
錯誤三:沒有利用數據中心的設計和設施的優勢,來幫助數據中心降低成本并更有效地運行。
有些數據中心不會利用自身的優勢來降低成本并提高效率,例如,在冬天的時候可以利用室外的低溫改善制冷技術,來達到節省冷卻成本的效果。
錯誤四:認為只有一個方法來設計或維護一個數據中心。
標準化的管理方案并非是最好的,最具成本效益的解決方案。雖然數據中心通常是相似的,但使用一個能夠適合企業理念和需要的管理方案才能使該數據中心發揮出最大的作用。所以,每個數據中心都應該的定制一個屬于自己的管理方案。
錯誤5:工作人員的任用不當
數據中心必須要保證每個工作人員都能適合并勝任他們的工作,而且必須明確每個人所扮演的角色和應該承擔的責任,并保證整個工作團隊的協作。
錯誤6:工作人員沒有得到適當的培訓和指導
如果數據中心的工作人員不能夠得到一些培訓和指導的情況下,他們在面臨一些問題的時候會很難做出迅速的反應。同時也可能不可避免的犯一些錯誤。所以,對員工做一些專業的培訓和指導對于處理一些突發事件是一件很有必要的事情。
錯誤7:沒有關鍵環境工作許可
每個數據中心都必須對它的員工說明,哪些工作是具有危險性的。并且在進行那些具有危險性的操作時,為了為了防止以外的發生,工作人員必須要通過一個關鍵環境工作許可(CEWA)的認證。CEWA有不同的等級,對應不同的風險水平,在高危險的水平下工作甚至需要行政授權。。每個外勤工作人員都應該詳細地了解這些,來避免危險的發生。
錯誤8:沒有提醒數據中心的客戶會存在一些不可預見的狀況
在跟客戶的溝通上,一定要提醒客戶可能會存在一些不可預見的狀況,如自然災害,停電等等。這樣可以使客戶能夠做好更充分的準備,并保證他們的業務不會因為這些突發狀況而受到影響。
錯誤9:沒有考慮氣候的因素
不管什么時候,數據中心的管理者都應該注意氣候的變化,并做出相應的舉措。例如,在夏季高溫的條件下,數據中心必須加強制冷系統的監管,必要的情況下必須要擴大制冷系統來防止因為數據中心宕機而引起更大的損失。而在低溫的冬季,有些地區晚上甚至可以關閉精密空調冷卻系統而讓數據中心進入自由冷卻狀態。
錯誤10:數據中心和企業在發展目標上缺乏協調和溝通
數據中心的建設本身是為企業服務的,所以數據中心必須要和企業在長遠規劃上相一致。例如,引入綠色IT的戰略,建立綠色數據中心不單單是為了數據中心本身的考慮,更多的是考慮企業的社會形象。
錯誤11:一些關鍵性的重要設施上沒有標志
雖然這是一件小事,歐洲專利局的數據中心曾經發生一起事故,其關鍵性的電力設施上沒有標志導致一位清潔工以外關閉了電源,結果使整個數據中心失去電力供應。
錯誤12:沒有對數據中心進行升級和維護
如果數據中心缺少必要的升級和維護,不但工作效率上會降低,有時候也會因為設備陳舊而導致一些問題的產生,例如短路造成的停電。
錯誤13:沒有認識到網絡延遲和應用延遲的不一致性
如果服務器的延遲增加了50毫秒,并不是意味著應用程序的延遲也是增加了50毫秒。很多數據中心的管理人員并沒有意識到這一點。
錯誤14:忽視了一些安全問題
有些安全問題經常被忽視,例如接地,靜電等等,不要把任何事情都視為理所當然。不要因為有了UPS,就忽視了防雷電路的監測。所有的安全問題都必須要得到重視,不重視的后果往往是災難性的。
錯誤15:過度依賴于環境監測程序
不能只依賴于顯示器,如果事情不對勁,靠人來確定顯得更為可靠。如果UPS發出了一個奇怪的聲音,監視器上是什么也看不到的,但這個問題很可能會導致一個致命的錯誤。所以,數據中心的管理工作必須要一絲不茍,一點都不能疏忽。
錯誤16:認為所有的網絡連接是平等的。
并不是所有的服務提供商提供的網絡都是一樣的。所以數據中心的管理者必須要確保他們的網絡服務提供商提供給他們的網絡是高效的,可以確保用戶獲得他們想要取得的數據和信息。
如何避免這16個最常見的數據中心管理的誤區
現在技術已經發展到了這個地步,連汽車都有了自動導航防撞系統。那么,數據中心為什么不能避免錯誤的發生呢。其實許多很小的問題都是可以避免的,但就是因為這些小的問題,導致了數據中心的宕機,停電,甚至企業的癱瘓。
有一些數據中心曾經發生過一些錯誤,導致了一些事故的發生。所以,每一個數據中心的管理人員很有必要去吸取這些經驗教訓,來找出自己的不足,并加以改善。對于這些,有以下五個步驟,可以幫助數據中心的管理人員來更好的避免這些事故。
第1步:敢于承認自己的錯誤
用于承認自己的錯誤,并不意味著失敗。相反,它意味著對錯誤深刻的認識,以及改正這些錯誤的決心。所以,對于數據中心的管理人員來講,承認錯誤對于更好的管理數據中心是很有幫助的。
第2步:進行“災難演習”
因為數據中心的事情一般不會發生,所以在安全的情況下,應該進行突發事故的演習。只有經歷的這些,工作人員才能夠突發事故出現的時候做出迅速的反應,來避免不必要的損失。
第3步:做出詳細的解決方案
這個解決方案包括使用的設備,解決的過程說明以及那些可能會發生故障的設施。這個解決方案可以作為工作人員的參考指南,并為每個新員工提供指導。
第4步:聽取第三方顧問的意見
在建設一個新的數據中心的時候,一定要仔細聽取第三方顧問的意見。這樣做,可以最大程度上了解潛在的問題。在建設的時候,可以通過第三方顧問了解到比承包商更多的設備來源并選取適當的設備。在數據中心建成的時候,還可以通過第三方顧問來測試數據中心的安全性,并制定一個相應的使用計劃。
第5步:勇敢的去改變。
雖然做出一些改變往往涉及到一些費用和時間,當如果發生了事故,損失往往會更大。