中國IDC圈6月8日報道,時光荏苒,技術騰飛。曾經的巨人在老去,回首他們昨日的光輝,依然洋溢著驕傲。站在時光的十字路口,是決然的揮手別離,還是期盼老樹發新枝?—這是我們對待裁撤數據中心管理的思考。
一、待裁撤數據中心面臨的挑戰和機遇數據中心的運營壽命通常為8~10年,隨著時間的推移,數據中心基礎設施設備老化加劇、設備穩定性下降、故障率上升、設備運營效率下降、維保成本顯著增加;IDC網絡架構難以滿足當前業務發展的需求;IT設備過保、設備故障率顯著提升、續保成本增加。
圖1 待裁撤IDC的挑戰
雖然待裁撤IDC面臨諸多問題和挑戰,但是他們也有很多值得關注的優勢。近10年的數據中心運營,已經建成了較為成熟完善的運營體系;運營團隊在技術積累、梯隊人員培養方面相對穩定;更重要的是我們與IDC運營商之間建立的長達近10年的鋼鐵般的互信情誼。
尤其對于大型數據中心園區,對待裁撤數據中心進行改造還有以下優勢:有利于集中化管理,避免數據中心碎片化;大型數據中心園區市政基礎設施配套建設有較好的資源投入,特別是外市電、市政供水的可靠性和可用性高;數據中心園區成熟的周邊配套,對運營人員的穩定性也有幫助;大型數據中心改造的成本低、建設周期短、相比與重新選址可以大大縮短整個交付周期。
圖2 待裁撤IDC的優勢
因此,除了綜合考慮待裁撤數據中心基礎設施等硬件條件外,運營體系等軟件優勢也是數據中心經理對待裁撤數據中心評估管理的重要內容。
二、老樹發新枝,待裁撤數據中心的改造評估面對業務不斷發展的需求,對于存量老數據中心的挑戰日益嚴峻。待裁撤數據中心改造或許將為我們帶來新的機遇。
基礎設施方面各種設備的使用年限并不一樣,例如高、低壓配電柜,變壓器設計使用年限通常為20年;而UPS系統設計使用年限通常為8~10年(部分部件可能提前更換,例如電池、電容器一般每五年更換一次)。那么待裁撤數據中心改造評估需要如何著手呢?
1. 基礎設施改造評估:
(1) 配電系統:市電容量是需要重點關注的事項,隨著IDC的發展,單機柜功耗不斷提升,尤其MDC(微模塊數據中心)可以實現單機柜6.5~10kW.在單位空間內的電力容量需求將顯著提升。
高低壓配電柜及變壓器通常使用年限為20年,對于投產8~10年的IDC,這部分可以考慮繼續使用,但是需要進行全方位的檢查,并對隱患設備進行更換。
UPS系統,投產8~10年的數據中心主要采用UPS系統。根據UPS的生命周期,UPS主體已經達到報廢年限,而UPS電池和電容(通常每五年更換一次)等部件已經經歷了2次更替,也不建議保留。同時,我們可以考慮引入能效更高的HVDC系統(雙路HVDC或者HVDC+市電直供)。
(2) 空調系統:對于傳統風冷式空調系統,機房整體PUE相對較高,在高溫極端氣候下,制冷效果不佳。在空間滿足的情況下,建議更新為水冷機組,或者配置為雙冷源系統。這將顯著提升系統的運營效率,并增加系統的健壯性和可靠性。
對于水冷機組系統,在良好的維保情況下,冷機、水泵的核心設備通常仍可以正常使用,但是我們需要充分評估其運行效率,并對隱患部件進行更換。管道系統是需要重點關注的環節,管道銹蝕以及閥門銹蝕將嚴重威脅系統運行。
(3) 機柜模式:8~10年的傳統數據中心,可能采用當時較為先進的機柜下送風、冷熱通道隔離技術。其制冷效率有較大的提升空間。
當機房空間以及承重條件較好時,我們建議考慮使用MDC技術。MDC技術可以實現制冷效率的顯著提升,同時實現機架快速分批交付,是應對業務快速發展需求的不二選擇。
當機房層高、承重受限時,冷熱通道隔離技術仍然可以發揮重要的作用。
(4) 其他系統:對于消防系統,相對于傳統運營商數據中心廣泛采用的氣體消防系統,騰訊數據中心致力于推動預作用高壓細水霧消防系統(IT機房內)的應用。當面臨火災等風險的時候,騰訊數據中心始終將運維人員的生命安全放在第一位。
門禁和監控系統,需要考慮原有的門禁和監控系統是否可以覆蓋改造后的新增擴容需求,例如動環監控、群控、CCTV、MDC監控數據對接等。
2. 網絡架構改造評估:
(1) 網絡架構:為了滿足業務的發展需求,網絡架構也是日新月異。以騰訊數據中心為例,傳統數據中心主要采用千兆網絡架構,而當前我們主要建設的是萬兆網絡架構,兩種架構下的設備無法完全匹配(通常萬兆服務器可以兼容千兆網絡架構,而千兆服務器不能兼容萬兆網絡架構)。因此,我們需要根據當前的業務需求,選擇適宜的網絡架構。
(2) 機位上架標準:機位上架標準是結合網絡架構、設備功耗、機架空間及電力容量等多方面制定的規范。傳統機架主要為16A或者20A機架(單機柜4.4kW以下),而騰訊IDC當前主要采用30A機架,因而上架標準也需要更新。
3. 服務器評估:服務器技術的更新周期很快,通常服務器的生命周期為3-5年,對于在使用年限且符合新網絡架構的服務器可以繼續搬遷使用,對于過期過保的設備可以更新淘汰。另外服務器對于交流、直流配電系統以及制冷系統的兼容性相對較好,通常不是決定數據中心去留改造的瓶頸。
4. 相關業務評估:對于多點分布、業務健壯性好、抗風險能力好、能夠快速靈活調度的業務,且對改造時間要求緊迫,對基礎設施側健壯性要求不苛刻,同時也追求運營成本的業務。可以考慮,選擇快速、低改造成本,適度小改為“廉價”機房供此類業務使用。(此處“廉價”已包括對改造后數據中心的低維保投入)
對于業務健壯性較弱,且對基礎設施側健壯性依賴大的業務,可以考慮高改造投入,適度改建為高可靠性的數據中心,滿足業務需求。
當然,不管哪一類業務,我們都還需要考綜合考慮業務的遷移成本。
「結束語」
數據中心裁撤是數據中心生命周期管理的重要組成部分,隨著時間的推移,更多的傳統數據中心將迎來裁撤和退役。如何最大程度的利用現有的基礎設施條件,同時滿足業務發展需求將是考驗數據中心經理(簡稱“數經”)管理能力的重要課題。
今天,我們提出這個話題,是因為我們自己在海量運營過程中也剛剛碰到這個難題,怎么做才是最佳,我們目前也沒有答案,希望接下來能夠和大家多多討論。當然如果在實踐的過程中我們摸索出一點點經驗的話,也會及時對外分享。
老樹發新枝,數經在行動!