面對多變性天氣,企業(yè)IT機房和數(shù)據(jù)中心同樣面臨管理、安全等多方面考驗。
IT機房和數(shù)據(jù)中心對企業(yè)業(yè)務發(fā)展尤為重要,由于國內(nèi)氣候環(huán)境的多變性,為IT運維管理帶來了巨大挑戰(zhàn)。夏季機房,IT經(jīng)理不僅要解決機房溫度濕度、保障服務器設備穩(wěn)定運行及確保數(shù)據(jù)安全等問題,還要承受降低企業(yè)總體擁有成本的壓力。
我們知道大多數(shù)機房都建有制冷系統(tǒng),來保證內(nèi)部溫度在22℃的安全線以內(nèi)。但是,夏季持續(xù)性高溫會多引發(fā)系統(tǒng)、硬件異常工作,甚至是癱瘓罷工,且機房和數(shù)據(jù)中心的內(nèi)部溫度比平均水平每升高10度,數(shù)據(jù)中心“融化”的風險就會提高5%。如何確保機房或數(shù)據(jù)中心在高溫多雨天氣下安全、穩(wěn)定的運維,成為眾多IT經(jīng)理當下迫切希望解決的問題。
作為企業(yè)的CIO或IT管理者如何解決這些“熱”煩惱、“雨”擔憂,不妨從以下幾方面著手做起。
強化數(shù)據(jù)中心制冷系統(tǒng)
數(shù)據(jù)中心,支撐整個企業(yè)IT系統(tǒng)正常運轉(zhuǎn)的后臺架構(gòu),其包含計算、存儲、網(wǎng)絡等多種高性能、高密度硬件設備。如服務器、存儲設備在作為動力源同時也成為熱源的生產(chǎn)者,再加之夏季溫度一再攀升,IT經(jīng)理不得不采取措施,強化制冷系統(tǒng),確保內(nèi)部溫度在安全線以內(nèi)。
第一,結(jié)合企業(yè)自身數(shù)據(jù)中心架構(gòu)布局,建設可隨負荷變化的管理制冷系統(tǒng)。在滿負載工作情況下,可提供足夠的冷量和風量;不滿負荷情況下,制冷系統(tǒng)可提供恰當?shù)娘L量,在保證精確調(diào)節(jié)同時,也能更好的綠色節(jié)能,節(jié)約成本。
第二,根據(jù)數(shù)據(jù)中心不同密度區(qū)域,采用不同的制冷形式。例如,可在刀片服務器高密度區(qū)域采用水冷機柜等。
第三,可選用氣流送風技術(shù),但要做到非常均勻的送風,實際操作則具有一定難度,在此不建議中小企業(yè)采用。
小結(jié):數(shù)據(jù)中心制冷系統(tǒng)強化,需CIO依據(jù)內(nèi)部設施布局進行慎重建設。
選擇合適的服務器設備
除了通過強化數(shù)據(jù)中心制冷系統(tǒng)外,從硬件基礎設施出發(fā)同樣能做到節(jié)能降耗、平臺正常運轉(zhuǎn)功效。面對極端環(huán)境或特殊應用的需求,設備生產(chǎn)商精益求精,針對高溫環(huán)境推出耐高溫服務器或自帶降溫技術(shù)設備的整體解決方案,例如戴爾PowerEdge服務器就可在-5℃到45℃之間正常運行。
戴爾為了確保企業(yè)數(shù)據(jù)中心的服務器、存儲等設備能夠在高溫環(huán)境正常運行,降低額外的維護和基礎設施成本,在研制耐高溫服務器同時,為企業(yè)數(shù)據(jù)中心打造新風冷卻解決方案。借助該解決方案組合不僅具備高散熱能力和可靠性等優(yōu)勢,還使得方案中的服務器、存儲和網(wǎng)絡設備允許在更高溫度條件下安全、穩(wěn)定的運行,避免因高溫宕機“罷工”現(xiàn)象。
小結(jié):IT機房或數(shù)據(jù)中心擁有良好的服務器、存儲設備不僅能降低IT故障率,更重要的是降低了企業(yè)TCO。
建立設備實時監(jiān)控機制
企業(yè)IT機房設備(服務器、存儲、交換機等)絕大部分是24×7小時運行,面對高溫、多雨季節(jié),企業(yè)應建立設備實時監(jiān)控機制。監(jiān)控機制包括兩部分:員工實時檢查和網(wǎng)絡實時監(jiān)測。
企業(yè)部署相關(guān)員工對服務器設備運行數(shù)據(jù)進行按日分析,并整理出服務器工作日志,以便第一時間處理異常現(xiàn)象;同時對服務器機房進行按日檢查,避免人為諸如機房亂堆放雜物、有灰塵等情況干擾服務器正常運行。另一方面,企業(yè)選擇一套服務器監(jiān)控解決方案,對服務器進行實時監(jiān)控,一旦出現(xiàn)宕機、存儲硬盤受損及時發(fā)出警報,第一時間安排相關(guān)技術(shù)人員進行整修。
服務器、存儲提供商在保障產(chǎn)品品質(zhì)外,還會為其定制或添加多功能工具和軟件,以應對企業(yè)多方面需求。而戴爾作為中國服務器第一大提供商,在產(chǎn)品日常維護方面更是行業(yè)第一。戴爾12G服務器內(nèi)置硬件診斷工具Diagnostics,且無需依賴操作系統(tǒng),若診斷出硬件不能正常工作,會自動發(fā)出警報;同時,戴爾為用戶提供OpenMange Essentials系統(tǒng)管理軟件,提供免代理監(jiān)控服務。
除戴爾服務器外,IBM、HP、華為等服務器均有類似診斷工具或管理軟件。
小結(jié):人無遠慮,必有近憂。企業(yè)亦如此,單純依靠人工進行設備實時監(jiān)控,必將投入大量人力物力。因此,選擇成套的服務器監(jiān)控解決方案才是最佳監(jiān)控措施。
制定災難備份修復方案
夏季機房突發(fā)情況有許多,諸如機房斷電、服務器宕機、存儲硬盤損壞等等,為保證機房正常運行,防患于未然,企業(yè)在夏季做好相應的災備措施具有重大意義。
既然設備故障問題(服務器宕機等)不可避免, IT經(jīng)理就需在購買設備時與相關(guān)IT專家進行討論,分析企業(yè)可能會出現(xiàn)故障的情況,并將這些情況分析結(jié)果形成意見,制定一套災備修復方案,以減少因故障而帶來的損失。具體方案有:
加強設備維護檢查,制定設備在夏季運行方案;儲備或協(xié)調(diào)后備應急水源及燃料,保證在斷電、斷水情況發(fā)生時有足夠的備用資源;以主動措施應對被動狀況,例如儲備應急冰塊、購置通風用軸流風機、水噴淋措施等。
小結(jié):做好災備修復方案對企業(yè)來講至關(guān)重要,不僅保證了平臺正常運行,還進一步確保了數(shù)據(jù)的安全性。
做好防水、防雷安全措施
IT機房或數(shù)據(jù)中心做好上述幾點就萬無一失了嗎?答案顯然是否定的,企業(yè)機房還需做好防水、防雷等安全措施。
機房內(nèi)擺放著大量的精密、貴重計算機及網(wǎng)絡設備,其均具備高密度、高速度、低電壓和低功耗等特性,不僅怕水,還對各種諸如雷電過電壓、電力系統(tǒng)操作過電壓、靜電放電、電磁輻射等電磁干擾非常敏感。如果防護措施不力,企業(yè)隨時可能遭受重大損失。
夏季多雨,機房更應防止漏水事故發(fā)生。IT經(jīng)理可直接通過降低機房空調(diào)供水管道的壓強來解決漏水隱患。通過對機房專用空調(diào)加濕器的供水系統(tǒng)的分析,專家認為機房專用空調(diào)加濕罐補水時并不需要過高的供水壓力,相反降低了機房空調(diào)供水管道的壓強,可使供水管道中的閥門、接頭、彎頭、管壁所承受的壓力降低,安全系數(shù)提高,有利于機房空調(diào)安全供水的實現(xiàn)。
有雨必有雷。為了保護建筑物和建筑物內(nèi)各項電子網(wǎng)絡設備不受雷電損害或使雷擊損害降低到最低程度,應從整體防雷的角度來進行防雷措施的設計。IT機房主要應從UPS電源系統(tǒng)防雷保護、通訊系統(tǒng)的防雷與過電壓保護及防雷器的安裝與接線著手做起。
小結(jié):盡管IT機房在建設之初已經(jīng)做過防水、防雷、防震等突發(fā)災難措施,但在夏季多雨時節(jié),仍需做好檢查和防御措施,防患于未然。
隨著大數(shù)據(jù)崛起、云計算漸成企業(yè)寵兒,各類計算越來越依賴數(shù)據(jù)中心;業(yè)務的多樣化,也對IT機房的設備管理、運維以及安全等多方面提出了更高要求。面對故障多發(fā)期,夏季對機房和數(shù)據(jù)中心來講均是一個嚴峻的考驗。因此,IT經(jīng)理做好夏季機房故障防御措施十分重要。
面對夏季對機房多方面影響,IT經(jīng)理除了采取一定有效措施防御故障發(fā)生外,更希望在保證平臺正常運維下降低企業(yè)TCO,來提升整體能效。據(jù)DataCenterUsersGroup調(diào)查顯示,數(shù)據(jù)中心能效已迅速成為業(yè)界優(yōu)先考慮事項。絕大多數(shù)受調(diào)查者認為,數(shù)據(jù)中心在制冷設備(49%)、服務器(46%)、電源設備(39%)和存儲設備(21%)等方面存在巨大的能效改善機會。由此可見,企業(yè)迫切降低投入、運維等成本。而最直接、最有效做到這一點的方案就是,企業(yè)在為機房采購設備時,從一開始就選擇具備低能耗、耐高溫等特性設備或成套解決方案,不僅可以有效減少故障率,亦能夠降低企業(yè)整體擁有成本。