本周,某云存儲(chǔ)公司的部分客戶反應(yīng)存儲(chǔ)的圖片無(wú)法正常顯示或者打開。經(jīng)與故障IDC服務(wù)商核實(shí),該故障是由于該云服務(wù)商下的IDC基礎(chǔ)設(shè)施合作單位的部分機(jī)柜掉電導(dǎo)致。同時(shí),掉電還影響到一臺(tái)城域網(wǎng)核心交換機(jī),間接影響到另外一個(gè)用戶的業(yè)務(wù)運(yùn)行。這一事故引發(fā)了行業(yè)熱議和思考——為什么部分機(jī)柜會(huì)掉電?如何避免此類事故再次發(fā)生?
造成部分機(jī)柜掉電的原因可能有:
機(jī)柜可靠性等級(jí)低,并沒有實(shí)現(xiàn)真正的獨(dú)立雙路供電,只有一路PDU或者兩路PDU來(lái)自同一個(gè)開關(guān)供電;
機(jī)房安全性等級(jí)低,沒有機(jī)柜電流監(jiān)測(cè)和報(bào)警,部分機(jī)柜電力負(fù)荷率偏高,但未提前發(fā)覺;
PDU缺少分插口分?jǐn)喙收系哪芰Γ瑔闻_(tái)服務(wù)器故障短路導(dǎo)致PDU上端總開關(guān)越級(jí)跳閘,其下PDU多條同時(shí)失電;
天氣炎熱,多臺(tái)機(jī)柜為同一類系統(tǒng)正好負(fù)荷率同時(shí)升高導(dǎo)致同時(shí)超載跳閘掉電;
天氣炎熱,機(jī)房散熱能力下降,配電系統(tǒng)容量下降,跳閘;
違規(guī)使用PDU插座,比如插上測(cè)試插頭或者個(gè)人手機(jī)充電或者臨時(shí)改造或者施工等,同時(shí)又正好碰見短路故障;
因此,可靠、高效、完備的電源管理解決方案是保障數(shù)據(jù)中心生產(chǎn)力及業(yè)務(wù)連續(xù)性的根基,而PDU在其中擔(dān)當(dāng)了重要的角色。
如今,無(wú)論是外部大環(huán)境的大數(shù)據(jù)、IT消費(fèi)者化、虛擬化以及云計(jì)算的發(fā)展趨勢(shì),還是內(nèi)部關(guān)于傳遞完全可信、安全和靈活性服務(wù)的需求,都對(duì)數(shù)據(jù)中心的運(yùn)營(yíng)方式提出了更高的期待與要求。數(shù)據(jù)中心的電源供給與分配不能再僅僅是一個(gè)被動(dòng)的過(guò)程。技術(shù)、設(shè)備、運(yùn)營(yíng)方針等方面日新月異的應(yīng)用,都導(dǎo)致在機(jī)柜級(jí)別的電能和環(huán)境管理需求急劇增加。人們已不再滿足于PDU的原本角色和作用,而對(duì)之提出了新的期待:更智能,具備監(jiān)測(cè)、分析和實(shí)時(shí)響應(yīng)威脅和機(jī)會(huì)的功能。
例如,領(lǐng)先的智能電源管理解決方案供應(yīng)商力登(Raritan)旗下智能PDU產(chǎn)品,就能通過(guò)機(jī)柜級(jí)和設(shè)備端的用電監(jiān)控管理,除了能夠追蹤電流、電壓、電功率、功率因素以及能源的使用率(提供1%級(jí)別的計(jì)費(fèi)級(jí)測(cè)量精度), 其遠(yuǎn)程切換功能讓運(yùn)維人員無(wú)需親臨現(xiàn)場(chǎng),就能通過(guò)力登智能PDU對(duì)設(shè)備進(jìn)行電源開、關(guān)、重啟等操作,及時(shí)修復(fù)故障,保障系統(tǒng)持續(xù)運(yùn)行,還能將PDU空閑插座設(shè)為無(wú)電狀態(tài),消除因人為失誤或設(shè)備同時(shí)加電等引起的斷電跳閘。
此外,力登的智能PDU最大的特點(diǎn)在于,運(yùn)維人員能夠通過(guò)Power IQ電能管理軟件對(duì)設(shè)備所處微環(huán)境的溫度、濕度、氣壓等狀況進(jìn)行監(jiān)控,更重要的是這些計(jì)量后的數(shù)據(jù)會(huì)被收集整理,從而為管理者提供決策參考。如果設(shè)備用電出現(xiàn)異常或者設(shè)備微環(huán)境出現(xiàn)變化都會(huì)及時(shí)報(bào)警通知運(yùn)維人員,從而最大程度地保證設(shè)備始終處于健康狀況,避免計(jì)劃外宕機(jī)。
由此可見,智能化的電源管理解決方案不僅能夠保障數(shù)據(jù)中心用電安全、避免掉電,還能幫助數(shù)據(jù)中心運(yùn)維人員提高管理效率、簡(jiǎn)化管理流程、提升數(shù)據(jù)中心資源利用率以及業(yè)務(wù)綜合管理。