ASHRAE 美國采暖、制冷與空調工程師學會認為,數據中心驗證是一個系統性的質量驗證過程。此過程驗證并記錄該數據中心設施作為一個整體及其所有的設備、子系統滿足用戶的設計目標和運行要求。
作為全球最有影響力的行業組織,ASHRAE更看重數據中心驗證過程的重要性。數據中心驗證是業主對于數據中心建造質量進行確認的一個過程。在歐美的建筑行業,驗證作為工程質量管理的規定步驟已經存在了30多年。近10年來,歐美的數據中心客戶也已經把驗證作為數據中心工程質量管理的規定動作了。
國內近幾年建設的大型數據中心也都開始把驗證作為必須的要求。但相對起國外,行業人士預計還有80%的國內數據中心沒有聘用專業的第三方機構進行數據中心的驗證。這為數據中心穩健運行埋下了隱患。
而從數據中心項目實際進展的角度,規劃、設計、建設階段投資大,周期長,驗證是確保投資達到預期目標的最重要的手段,也可以看作數據中心建設的終點。與此同時,驗證是數據中心運行的起點。一個專業和完善的測試驗證可以極大降低數據中心在其運行早期的故障率,并為其全生命周期的穩健運行奠定基礎。也就是說,數據中心驗證過程發生在工程竣工和投產之間的關鍵節點,這個節點也直接決定了數據中心前期投資和后期運行能否按照規劃順利實現。
基于大數據[注]導致業務量激增和數據中心能力不斷增強的雙重需求,無論是以金融業為代表的注重自身業務持續性的行業用戶,以互聯網、運營商為代表的希望通過數據中心擴展業務收入的行業用戶,以地方政府為代表的以產業園模式介入數據中心產業發展的新興用戶,還是以提供數據中心服務為己任的老牌IDC 提供商們,都需要全程參與數據中心的從無到有。而用戶自身參與的過程也為數據中心項目帶來諸多潛在風險,最值得引起重視的風險包括前期數目巨大已經投入的投資風險和后期業務對數據中心潛在的嚴重依賴風險。
數據中心驗證的價值——為什么要做?
以汽車為例子,在生產線上有嚴格的質量管理,出廠前也有廠驗。所有汽車在從組裝線下線之后、交付用戶之前,需要經歷整車綜合測試、道路測試。同時,對于每個車型要做碰撞實驗,以模擬最壞情況下汽車整車的應對能力。只有那些通過了所有上路實際測試的車輛,才能讓我們放心駕駛。
數據中心建設和汽車有很多相似之處。安全(可靠性和可用性)也是頭等大事。未經測試直接投入運行的數據中心,未必立刻出現故障,但存在用戶自己也無法掌握的隱患和風險。經過對行業案例的分析比對,專家認為,忽視數據中心驗證過程會增加風險變成事故的幾率。舉例來說,北京某知名數據中心,投產前因工期緊張等原因未進行測試驗證。在運行一段時間后,用戶希望對A路UPS 進行保養,在操作斷開A 路斷路器的時候,不幸的是,B路UPS 卻被切斷,導致系統中斷,也因此付出了數額不菲的經濟代價。
由此可見,只有在投產前進行全面的測試驗證才能發現全部問題,排除定時炸彈。數據中心驗證作為項目必須經歷的重要過程,應該引起國內用戶們的足夠重視。
通常情況下,客戶會要求具備相關能力和資質的第三方公司針對包括供配電、安防、空調、監控、環境、布線、線纜、防雷接地等子系統進行設備測試、系統內測試、系統聯調、和基于故障模擬的集成測試。
高端客戶更看重基于故障模擬的集成測試,模擬極端情況,測試系統實際抗故障能力:模擬發電機故障以測試容量及冗余能力,模擬市電故障測試轉換開關和發電機性能,模擬UPS 故障測試UPS 冗余能力,等等。
可以說,數據中心驗證作為檢測必備環節,正在成為每一個數據中心建設工程的標準流程。
驗證能夠有效幫助后期正常運行,對項目實際運行、后期運維和可能的事故預案都有著非常重要的作用。
測試驗證過程通過多層級測試、模擬多種情景來幫助發現系統可能存在的問題,并且針對薄弱環節進行整改,減少實際運行的故障隱患,提高系統可靠性,保證項目前期投資;
另外,驗證過程所實施的大量測試工作,為運維團隊提供了提前參與項目管理的機會,使得運維團隊對系統更加熟悉,并且掌握了一定的解決問題能力,便于后期對數據中心的全面管理;
更為重要的是,針對關鍵設備、系統內、系統間及基于故障模擬的集成測試的驗證過程,為業主提供了大量真實有效的測試數據,為將來數據中心的各項操作提供了全面的數據支持,也為業主完成標準化管理流程和運維預案提供了價值素材。
數據中心驗證的實施——誰來做?
數據中心驗證最重要的目標就是通過對所有故障可能性的設想和模擬,來找到數據中心在設計和建設過程中留下的問題,幫助用戶規避更多風險,降低數據中心故障率。好的驗證服務就是為業主發現當前的問題,并且提醒業主所有的單點故障點,為潛在的問題敲警鐘。所謂當前的問題,就是通過測試中發現的問題,比如斷路器的線可能接反;又比如線路標識的缺乏;或者是電路接點沒有擰緊。所謂單點故障(Single Point Of Failure) 就是列出所有供配電及制冷系統上可能引起系統中斷的點。
實踐中,有些數據中心管理者業存在這樣的誤區:我是否還需要驗證?我已經有監理公司負責工程了?設備廠家也會來調試設備的啊?
機房工程中,業主會因為工程復雜程度以及施工多頭介入而頭痛不已,聘請工程監理介入施工過程是國內常用的做法,工程監理主要關注于工程的安全、進度、預算、材料質量的把控。但卻不能對整體工程結果性能負責。究其原因,工程監理駐場的團隊一般僅有1-2名,無法三頭六臂看顧偌大工程,沒有相應的儀器和測試經驗,也無法精通從供配電到制冷到弱電等全部專業的技術,無論從團隊能力還是團隊力量可能都沒法勝任專業的驗證過程。
還有部分業主把測試驗收分別交付給設備廠商或是工程承包商,他們或只著眼于自身所提供設備的質量驗收,無法提供系統聯調的專業服務,更無故障模擬測試能力;或者無法提供用戶角度的第三方的測試驗收和整改意見。顯而易見,監理、施工公司和廠商代表都無法幫助業主完成真正意義上的驗證過程,而測試驗證真正需要的是專業技術團隊的實施,從而保證最終的整體工程結果的性能符合設計要求和運行要求
數據中心驗證的內容——做什么?
以國內數據中心技術咨詢服務公司——中科仙絡咨詢服務公司為例,專注于數據中心技術服務領域,擁有10年歷史,及為上百家IDC和金融客戶提供數據中心全生命周期咨詢服務的經驗,是美國Uptime研究所認可的戰略聯盟伙伴,擁有Uptime認證之ATD及ATS 技術人員。
擁有專業理論、豐富項目經驗和權威的技術團隊等優質資源,中科仙絡認為,通過對關鍵設備測試、系統內測試、系統間測試以及基于故障模擬的集成測試這四個不同層級的專業測試,以及通過圖紙審核、現場測試、專家評審、整改總結等步驟來完成測試驗證過程。測試驗證的目標就是挑出數據中心所有的問題和潛在的弱點,通過測試及驗證,最大化降低系統性風險,提高數據中心的可靠性、可用性程度;確認機房竣工前關鍵節點的施工質量、安裝工藝、系統可用性;減少及規避機房建設階段的問題及隱患,降低帶病工作的可能性;獲得設備、設施第一手真實的相關數據,評估及優化設備、設施的配置以達到節能的目標,讓業主對項目驗收和未來的投產更有信心。