摘要:近10年來,歐美的數據中心客戶已經把測試驗證作為數據中心工程質量管理的規定動作,國內近幾年建設的大型數據中心也都開始把測試驗證作為必須的要求。但相對起國外,行業人士預計還有80%的國內數據中心沒有聘用專業的第三方機構進行數據中心的測試驗證,這為數據中心的穩健運行埋下了隱患。文中對數據中心測試驗證的對象、內容和測試儀器以及測試驗證常見問題和分析予以較詳盡的論述。
④消防系統
數據中心如果發生火災,會毀壞計算機設備,中斷正常的系統運行,甚至危及工作人員的生命,所以消防系統非常重要。對于消防系統的測試驗證工作主要就是檢查報警系統、滅火系統、排煙系統是否能夠在早期發現火災隱患,準確及時報警,在火災發生后快速滅火,并將有害氣體排出。有關消防系統的測試驗證主要工作內容見表4。
⑤裝飾裝修系統
數據中心基礎設施為用戶的業務需求提供支撐,同時它也是一個建筑主體,需要滿足設備、人員對裝飾裝修方面的相關要求。裝飾裝修系統的測試驗證工作主要是對地板、吊頂、門窗、墻體等是否符合規范的檢查。有關裝飾裝修系統的測試驗證主要工作內容見表5。
⑥故障模擬
故障模擬測試是借助假負載營造數據中心上線后的實際運行情況,然后模擬機房運行中可能出現的故障,來驗證各系統在出現故障情況下的反應是否符合設計預期,從而判斷機房的抗故障能力和設計等級。故障模擬測試不但是驗證機房實際運行能力的重要手段,也為運維團隊提供應對緊急狀況的實踐經驗,運維人員應該在故障模擬測試過程中了解系統的薄弱環節、總結有可能出現的故障特征、制定最佳應對流程,才能在以后的運維工作中遇到故障不慌亂,及時準確地采取措施,將故障對系統運行的影響降到最低。有關故障模擬的測試驗證主要工作內容見表6。
以上按照驗證對象來劃分的測試驗證工作并不能覆蓋所有內容,針對項目做具體的方案時還應該考慮設計圖紙、設備配置、客戶需求等因素來增減條目,才能真正符合驗證系統是否滿足運行要求的目標。
4 常見問題及案例分享
(1) 測試驗證中出現的常見問題
在測試驗證過程中,一些設備性能、系統聯動方面的問題就暴露出來,這也正是我們做測試驗證工作的目的。如果這些問題不及時發現,進行整改,機房上線后就可能出現無法彌補的損失。按照驗證對象分類角度,列舉相關系統測試驗證中出現的常見問題及其危害,分別見表7至表11。
(2) 案例介紹
北京某大型IDC數據中心,總建筑面積25552.51m2,地下1層,地上2層,建筑高度(最高處)19.9m,是原有建筑改造工程。該項目共分三期進行,以二期的第一階段為例,測試驗證工作共涉及4個機房,766個機柜。
測試驗證團隊針對電氣系統、空調系統、智能建筑系統、消防系統、裝飾裝修系統進行了測試驗證工作,共完成77大類測試項目,實時記錄4809個數據,其中4400個數據在正常范圍內,409個數據偏離正常值。經過對非正常數據的分析,總結出19個問題,主要包括:UPS室空調氣流短路,無法有效地給UPS散熱;UPS室上面線槽距離UPS太近,UPS散熱效果不好;4個機房均為負壓,機房密閉性差;PMS、BMS無法正常顯示監控數據,仍需繼續進行調試;變壓器失電后,PMS系統中UPS上口配電柜沒有聲光報警;機柜運行參數中通訊故障,監控室無數據顯示:CCTV系統攝像頭編號未編寫,軟件中無法看到是在什么房間什么位置;CCTV軟件中無地圖,無法判定是什么位置的攝像頭;門禁系統軟件地圖個別地方與實際不符,需要重新調整,需要添加房間編號;門禁系統延遲時間太長,門狀態改變之后至少需要1.5min之后,軟件中的狀態方能改變;溫濕度監控系統現場沒有標簽,誤差值較大;干接點測試中變壓器模擬故障時,干接點系統無聲光報警;空調的過濾網沒有進行固定。這些問題如果不在機房上線前解決,將為機房運行帶來非常大的隱患,也為運維工作增加了難度。
用戶在收到這些問題反饋之后,及時進行了整改,復測全部合格。目前該數據中心二期已經上線運行,運行狀況良好,測試驗證工作達到了預期的目標。
5 結束語
測試驗證是一個確保系統設計、安裝、功能測試、系統聯調、運行狀態與設計意圖相符合的過程,是設施獲得良好功能和可靠運行過程中的重要組成部分。一個好的測試驗證不應僅滿足“測試”相關的設備功能指標,更重要的是“驗證”系統是否可以滿足運行階段的要求。運維人員也應利用測試驗證的過程,熟悉未來的管理對象,驗證設備操作流程的正確性,增加實際操作和應對突發事件的經驗。
另外,部分用戶認為測試驗證工作只與新建項目有關,其實不盡然,測試驗證同樣也適用于擴建、改造項目和日常的維護活動。對已經運行的數據中心做測試驗證,通常稱為“健康評估”,就是通過儀表測量、觀察、分析等方式,找出隱藏的運行隱患,確保基礎設施達到功能要求,實現預期的可靠性和可用性。用戶應考慮將“健康評估”作為一種常態的測試驗證形式,融入到日常的操作和維護工作中。
作者簡介
王茜,北京中科仙絡咨詢服務有限公司技術及服務中心總經理,《數據中心場地基礎設施運維管理標準》起草成員,《銀行數據中心基礎設施建設與運維管理》編委會成員,《從運維菜鳥到大咖,你還有多遠——數據中心設施運維指南》編寫成員,UptimeATD、ATS認證工程師。畢業于大連理工大學,制冷與低溫工程碩士學位,先后工作于阿爾西制冷工程技術有限公司、博悅能集團,曾經從事制冷空調系列產品的研發設計,東南亞電信市場制冷設備的業務拓展,數據中心基礎設施主設備的產品管理等工作。2011年加入博悅能集團,擔任中科仙絡咨詢服務有限公司技術及服務中心總經理,是數據中心全生命周期技術咨詢服務和Uptime認證方面的專家。