人云亦“云”的時代,數據中心作為重要基礎設施發揮著必不可缺的重要作用,而隨著數據中心建設規模的不斷擴大,新技術的層出不窮,數據中心的運維難度也“更上一層樓”。尤其是當面臨“突發事故”,更是考驗一個數據中心的運維能力。
數據中心在國內突飛猛進只有十多年的時間,卻已從只有UPS、空調和IT設備的普通機房時代,進入到囊括互聯網、大數據、AI、云服務等全方位服務、動輒擁有數萬機柜,自然冷、風墻、水下數據中心、液冷服務器等新技術不斷被創造和應用的新時代。這樣一來,運維管理面臨更大的挑戰。
首先,規模超大帶來的人員、組織和效率的變化。以前萬平米以內的數據中心,人工巡檢一次2-4小時,現在數十萬平米,需要更多的運維人員分布在不同的責任區,增加了管理的難度和成本。其次,電壓等級提高,安全風險增加。以往運維人員接觸的是低壓(低于1000V),現在供電設備、發電機、冷機都是高壓供電,維護安全要求提升。此外,規模集中,導致風險集中,事故影響更大。例如之前亞馬遜的數據中心事故,導致了全球大面積的服務和應用中斷,損失慘重,因此運維管理的壓力超前。
為了保障新時代數據中心的安全,在實際運維過程中,運營商不僅需要對數據中心里面的溫濕度、電能、水流及風量等進行全面實時的監控,以期發現潛在問題,通過預警機制及相應的流程做到防患于未然,還要科學運用這些數據來為應急措施及節能措施提供可靠的指導依據。
其實,采用智能化的管理手段,可以輕松滿足這些需要。以電源管理為例,領先的智能電源管理解決方案供應商力登(Raritan)提供了一整套以智能PDU為核心的機柜內部微環境和供配電監控管理以及整個數據中心平臺管理方案:通過智能PDU進行實時遠程電源監控,能夠對相關參數包括對電流(單位:安培)、電壓、功率(單位:kVA、kW)和能耗達到±1%計費級準確度,甚至可以單獨對每個電源插座的上述相關參數進行監控。除了高效、可靠地分配電源之外,新的iPDU(系統)還憑借更多計算和存儲功能,可支持新的應用并收集和分析IT設備的用電數據、數據中心內可用電源容量以及機柜環境健康狀況;并且提供更多的傳感功能與基礎架構數據收集點(特別是獨特的力登電子門鎖)。此外,還能通過Power IQ電能管理軟件對設備所處微環境的溫度、濕度、氣壓等狀況進行監控,更重要的是這些計量后的數據會被收集整理,從而為管理者提供決策參考。
力登智能PDU
包括LinkedIn、Cisco、Twitter、eBay等在內的國外知名數據中心高密度機柜配電管理都在采用力登的智能電源管理解決方案。艾瑞咨詢發布的《2018年中國企業IT運維管理市場報告》顯示,2016年中國數據中心運維服務市場規模達到1496.4億元,預計到2020年,這一規模將達到2744.7億元,年復合增長率為16.4%。智能化無疑也是中國數據中心運維管理的必然趨勢,它幫助運維人員從被動響應變為主動防御,從而將運維管理從IT成本中心,向IT服務中心和IT價值中心轉變。