在日前的《行業之聲》中,FORTRUST公司首席運營官羅伯特o麥克拉里討論了數據中心維護和工作方式戰略,以及包括哪些內容。FORTRUST公司首席運營官羅伯特o麥克拉里主要負責FORTRUST公司的業務運營,高層建設和戰略技術指導的整體監督。他開發并實施了過程控制,有效地支持了自2001年以來丹佛公司提供的持續正常運行時間和可靠性。他是數據中心行業管理和運營的領先專家之一,并被AFCOM選為入圍年度數據中心經理。
擁有維護和生命周期策略的熟練運營團隊是數據中心關鍵系統基礎設施在長時間能持續提供高可用性服務交付和正常運行能力的核心。
根據最近的市場研究,企業在繼續利用托管服務,并將其作為企業基礎設施的關鍵部分。桑德勒研究公司預測,到2020年,全球托管市場的復合年增長率將超過12%,這是由于企業IT預算減少,以及關鍵應用支持和可訪問性需求的上升。
隨著企業越來越依賴托管服務提供商,對這些數據中心進行適當維護變得更加重要。即使是一分鐘的宕機時間,也可能使企業付出數千美元的代價,并損害其在行業中的聲譽,因此需要服務提供商竭盡全力確保24小時的正常運行時間是絕對必要的。
這就是強大的數據中心維護和生命周期策略在發揮作用,并成為數據中心設施流程的關鍵部分。但是,確切地說,客戶應該問托管供應商這些維護策略會帶來什么樣的好處?
是什么使維護和生命周期策略如此重要?
在當前的IT環境中,停機時間不僅在成本方面代價高昂,而且還會對企業品牌的聲譽造成無法估量的損害。尤其是那些支持客戶服務所必需面向客戶資源的托管數據中心設施更是如此。
FORTRUST公司首席運營官羅伯特o麥克拉里指出,數據中心糟糕的維護和生命周期策略是計劃外停機的第二個主要原因,人為錯誤和容量管理不善是數據中心停機的最主要的原因。即使是最佳優化設計的數據中心,如果缺乏適當的系統維護和保養的話,也無法阻止這種情況發生。
麥克拉里在FORTRUST公司發布的高可靠性數據中心操作指南中寫道:"數據中心的設計可靠性并不能彌補較差的維護和生命周期策略所帶來的損失。而維護和生命周期戰略是數據中心持續長期提供高可用性服務交付和正常運行時間的核心。"
不同類型的維護
當涉及到維護策略時,有一些不同的類型,托管客戶應該獲取有關這些過程的細節,這是至關重要的,因為它將顯示托管服務提供商對數據中心設施內正常運行時間的奉獻。
麥克拉里指出,這里的全面戰略應包括:
定期和徹底的檢查:數據中心工作人員應該不斷檢查數據中心的各種系統和設備,以確保它們處于正常工作狀態。這包括對發電機,水溫,燃料液位,氣室壓力,電氣和機械分配系統操作參數,以及其他系統參數和配置的日常檢查等。
連續測試:數據中心設施的員工還應測試特定系統,以確保其在正確的參數范圍內運行。這里的過程可以包括紅外線,負載測試和故障切換測試。
預測性維護:這是數據中心戰略的關鍵部分。預測性維護利用測量和其他數據分析來識別可能指示潛在故障的任何變化,趨勢或者違規行為。這樣,工作人員可以在導致中斷之前解決這些問題。
預防性維護:麥克拉里解釋說,預防性維護的目的是"保持一件設備或部件運行在最佳水平或延長其生命周期的行動".這種類型的維護可包括過濾器或換油,以及清潔熱交換器和電氣系統。
糾正性維護:最后,當系統或組件需要維修或更換時,工作人員應充分利用糾正性維護流程。在正確的維護下,阻止泄漏或更換軸承或閥門。
通過包括預測性和預防性維護的策略,系統故障的可能性大大降低。這些過程使數據中心設施的工作人員能夠在導致計劃外或甚至計劃中斷之前查明和解決問題。
"不要成為一個只會等待失敗的組織。" 麥克拉里建議說,"我相信,在故障前預測到設備中的問題是簡單的。事實上,我相信,如果你有一個強大的維護和生命周期戰略,不可預測的失敗將會成為一個隨機事件。"因此,定期維護對于確保關鍵系統正常運行時間至關重要。
生命周期策略的部分
確保設施管理人員有一個生命周期策略也是至關重要的。麥克拉里解釋說,這包括預防性和預測性維護計劃以及其他最佳實踐,以提高設備的生命周期。在這里尋找的活動包括:
故障前更換:許多系統和組件在其使用期到期之后,將在一定的間隔時間之后進行更換。而沒有更換這些設備會增加故障和意外停機的幾率。
切換:類似地,某些組件需要根據特定的時間表進行切換,以確保性能和平衡。
更換:最后,客戶應確保設數據心設施工作人員有一個規定正確時間更換設備的策略。
此過程可以確保關鍵系統在過程中不中斷。
其他最佳實踐
托管客戶還應確保其服務提供商遵循其他維護和生命周期最佳實踐。麥克拉里表示,"供應商應優先考慮預防性和預測性維護。這包括了解并將設備制造商的建議納入其整個流程。在許多情況下,設施工作人員不應只是遵循這些建議,而是在這些建議之外,需要確保設備在最佳水平運行,并且可以延長其生命周期。客戶還應該確保他們的提供商優先進行預防性和預測性維護措施,而不是糾正性維護措施。
"從長遠來看,校正維護的成本要大得多," 麥克拉里寫道。 "而定期的預防性維護將為企業節省更多的成本。"
此外,最好確保包括數據中心維護和生命周期過程的關鍵流程在內部處理,并且這些活動不會外包給第三方。數據中心設施管理者應該為外部供應商執行哪些流程提供極大的選擇性。根據經驗,這些整體程序中不到20%應該是外包的。
麥克拉里說:"擁有維護和生命周期策略的技術運營團隊是數據中心關鍵系統基礎設施在長時間內持續提供高可用性服務交付和正常運行時間的能力的核心。維護和生命周期戰略必須是一個例行程序。這些細節和所有權都是可以復制的,而整個組織的每一級都可以確定和強調。
麥克拉里表示,FORTRUST公司已經連續提供了100%關鍵系統正常運行時間超過15年。