專業(yè)的事情給專業(yè)的人做,效率更高、更可靠,這句話在數(shù)據(jù)中心行業(yè)也同樣適用。隨著云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)等技術(shù)和應(yīng)用的普及,大大小小的數(shù)據(jù)中心如雨后春筍般出現(xiàn)各地,相應(yīng)地,數(shù)據(jù)中心的設(shè)計(jì)、建造以及維護(hù)需求也凸顯出來(lái)。特別是,隨著企業(yè)業(yè)務(wù)與IT的聯(lián)系日益密切(有些甚至業(yè)務(wù)即IT,比如金融),數(shù)據(jù)中心的可靠性和可用性的重要性越來(lái)越突出,依靠企業(yè)現(xiàn)有技術(shù)能力越來(lái)越難以提供可靠的保障,不少企業(yè)開(kāi)始尋求外部幫助。根據(jù)波洛蒙研究所發(fā)布的“數(shù)據(jù)中心成本中斷”報(bào)告顯示,自2010年以來(lái),停機(jī)時(shí)間的平均成本上升了38%,平均每起事件成本超過(guò)74萬(wàn)美元,相當(dāng)于每分鐘損失成本近9000美元。在這種背景下專業(yè)的數(shù)據(jù)中心全生命周期服務(wù)開(kāi)始贏得關(guān)注,一些富有前瞻性的公司也開(kāi)始大力布局。
高可用數(shù)據(jù)中心,一個(gè)艱巨的任務(wù)
如今在各地都能看到各種云計(jì)算園區(qū)和大數(shù)據(jù)園區(qū),據(jù)不完全統(tǒng)計(jì)全國(guó)現(xiàn)在大約有50萬(wàn)個(gè)大大小小的數(shù)據(jù)中心。大量的新興和改造升級(jí)的數(shù)據(jù)中心的出現(xiàn)帶動(dòng)了整個(gè)行業(yè)的變化:一個(gè)顯著變化是大型數(shù)據(jù)中心越來(lái)越多。如今10萬(wàn)臺(tái)、50萬(wàn)臺(tái)服務(wù)器規(guī)模的數(shù)據(jù)中心越來(lái)越常見(jiàn)。根據(jù)相關(guān)統(tǒng)計(jì),以AWS、Google、微軟為首的全球10個(gè)超大規(guī)模數(shù)據(jù)中心其服務(wù)器部署量占到了全球服務(wù)器保有量的10%;另一方面,傳統(tǒng)IDC也在頻繁進(jìn)行并購(gòu)和整合以提升競(jìng)爭(zhēng)實(shí)力;第三個(gè)變化,隨著節(jié)能環(huán)保理念的深入人心,綠色數(shù)據(jù)中心正在被廣泛接受。
與此同時(shí),數(shù)據(jù)中心的各種故障也是頻頻爆出。根據(jù)有關(guān)機(jī)構(gòu)的一份2017年的數(shù)據(jù)統(tǒng)計(jì),18%的數(shù)據(jù)中心在一年內(nèi)出現(xiàn)過(guò)宕機(jī)等業(yè)務(wù)中斷的情形,另有50% 的企業(yè)雖然沒(méi)有業(yè)務(wù)中斷,但也發(fā)生過(guò)異常事件。因此,如何保證數(shù)據(jù)中心的高可靠和高可用、低能耗,同時(shí)還要降低整體運(yùn)營(yíng)成本,成為擺在很多數(shù)據(jù)中心管理者面前亟待解決的問(wèn)題。
“數(shù)據(jù)中心出現(xiàn)宕機(jī)、斷電等事故,其原因可能存在于數(shù)據(jù)中心全生命周期中,包括從一開(kāi)始的規(guī)劃設(shè)計(jì)到中間的施工再到最后的運(yùn)營(yíng),每個(gè)階段都可能誘發(fā)最后的事故。”施耐德電氣IT業(yè)務(wù)部數(shù)據(jù)中心業(yè)務(wù)架構(gòu)總監(jiān)張子揚(yáng)表示。
張子揚(yáng)舉例說(shuō),某些超大型的數(shù)據(jù)中心設(shè)計(jì)時(shí)水系統(tǒng)也采用了雙環(huán)路雙系統(tǒng)2N設(shè)計(jì)(即一主一備),看似高可用了,但有實(shí)際使用過(guò)程中出于經(jīng)濟(jì)性的考慮,采取單路單系統(tǒng)運(yùn)行,另一套系統(tǒng)處于長(zhǎng)期閑置的狀況,一旦需要進(jìn)行切換時(shí),其長(zhǎng)期閑置組件沒(méi)有驗(yàn)證,就會(huì)出現(xiàn)切換時(shí)的故障或無(wú)法實(shí)際切換的狀況,所以做設(shè)計(jì)的人,應(yīng)該首先了解業(yè)主真實(shí)的使用狀況,以終為始進(jìn)行設(shè)計(jì),不能追求過(guò)度冗余。
顯然,要保證數(shù)據(jù)中心的可靠運(yùn)營(yíng)并不是一件十分容易的事情。正因?yàn)槿绱耍┠偷码姎馔瞥隽藬?shù)據(jù)中心全生命周期服務(wù)。張子揚(yáng)介紹,這是一個(gè)沉淀了施耐德電氣在數(shù)據(jù)中心36年的技術(shù)積累、覆蓋數(shù)據(jù)中心設(shè)計(jì)、建造、運(yùn)營(yíng)的一攬子解決方案,能夠真正覆蓋從CAPEX到OPEX階段進(jìn)行全過(guò)程管理。
“我們會(huì)聚焦在四點(diǎn):第一,在設(shè)計(jì)上我們會(huì)推出咨詢?cè)O(shè)計(jì)和設(shè)計(jì)驗(yàn)證服務(wù)以保證設(shè)計(jì)過(guò)程本身是可以驗(yàn)證的,降低系統(tǒng)性故障和更貼近真實(shí)業(yè)務(wù)需求;第二,在建造前后進(jìn)行雙驗(yàn)證,前面是設(shè)計(jì)驗(yàn)證,后面是測(cè)試驗(yàn)證。這樣才能實(shí)現(xiàn)透明數(shù)據(jù)中心建設(shè)過(guò)程;第三,抓住運(yùn)營(yíng),提供永續(xù)運(yùn)營(yíng)的能力;第四,進(jìn)行二次評(píng)估和優(yōu)化。這是一個(gè)完整的閉環(huán)過(guò)程。張子揚(yáng)介紹,其最終目的是:通過(guò)標(biāo)準(zhǔn)化的、可視化的工具為客戶提供全過(guò)程的規(guī)劃、運(yùn)營(yíng)、升級(jí)服務(wù),提高可驗(yàn)證性,降低運(yùn)營(yíng)風(fēng)險(xiǎn),為用戶的數(shù)據(jù)中心永續(xù)運(yùn)行提供保障,實(shí)現(xiàn)可持續(xù)發(fā)展。
設(shè)計(jì)和建造階段,驗(yàn)證的價(jià)值不容忽視
一個(gè)好的數(shù)據(jù)中心是從科學(xué)的規(guī)劃、設(shè)計(jì)開(kāi)始的,科學(xué)的可驗(yàn)證型的規(guī)劃設(shè)計(jì)加上可追溯的建造能為后期運(yùn)營(yíng)打下一個(gè)非常好的基礎(chǔ),從而大大降低后期數(shù)據(jù)中心運(yùn)營(yíng)時(shí)的隱患。
張子揚(yáng)告訴記者,數(shù)據(jù)中心的設(shè)計(jì)和建造過(guò)程中普遍存在如下問(wèn)題:數(shù)據(jù)中心建設(shè)規(guī)模超大,需要管理的資產(chǎn)非常龐大,資產(chǎn)本身所產(chǎn)生的信息更是數(shù)量級(jí)增長(zhǎng),但是我們的數(shù)據(jù)中心選址、設(shè)計(jì)過(guò)程缺乏驗(yàn)證,盲目跟從美國(guó),沒(méi)有形成自己的驗(yàn)證標(biāo)準(zhǔn);建設(shè)階段運(yùn)維人員很少介入;建設(shè)標(biāo)準(zhǔn)和度量衡落后,未完成從面積造價(jià)的不精確模式向IT機(jī)柜造價(jià)的精細(xì)模式的轉(zhuǎn)換;缺乏有效工具和方法論。
根據(jù)上述問(wèn)題,施耐德電氣提出了自己的全生命周期服務(wù)。區(qū)別于常規(guī)數(shù)據(jù)中心全生命周期分為四個(gè)環(huán)節(jié)(設(shè)計(jì)、實(shí)施、驗(yàn)收、升級(jí)改造),施耐德電氣的全生命周期服務(wù)細(xì)分為9個(gè)環(huán)節(jié),即在設(shè)計(jì)之前加入了咨詢環(huán)節(jié);在設(shè)計(jì)和實(shí)施之間加上了設(shè)計(jì)驗(yàn)證;實(shí)施后又加上了測(cè)試驗(yàn)證和驗(yàn)收環(huán)節(jié);以及最后的運(yùn)營(yíng)、升級(jí)改造和新數(shù)據(jù)中心選址。
施耐德電氣數(shù)據(jù)中心全生命周期服務(wù)的9個(gè)環(huán)節(jié)
強(qiáng)調(diào)驗(yàn)證是施耐德電氣全生命周期服務(wù)的一大特色,施耐德電氣也是業(yè)內(nèi)首批提出“設(shè)計(jì)驗(yàn)證”者之一。所謂“設(shè)計(jì)驗(yàn)證服務(wù)”是指終端用戶在最終投入總包實(shí)施建設(shè)前,一次關(guān)鍵性的模擬故障、性能推演服務(wù),以降低系統(tǒng)設(shè)計(jì)風(fēng)險(xiǎn),并優(yōu)化核心指標(biāo)(PUE、可用性、可驗(yàn)證性)。由于設(shè)計(jì)驗(yàn)證是真正動(dòng)手實(shí)施之前需求的最后一次系統(tǒng)性的梳理,非常關(guān)鍵。
張子揚(yáng)介紹,設(shè)計(jì)驗(yàn)證需要借助一些工具幫助客戶在方案階段、圖紙階段就檢查各種保護(hù)是不是成立的,來(lái)降低系統(tǒng)性故障和系統(tǒng)性風(fēng)險(xiǎn)。為此,施耐德電氣提供了很多工具,包括權(quán)衡工具以及設(shè)計(jì)參考等,可供免費(fèi)使用。
“大多數(shù)時(shí)候,設(shè)計(jì)中的問(wèn)題都是隱性的,不容易發(fā)現(xiàn),要追溯比較難。施耐德電氣致力于在業(yè)界建立一個(gè)度量衡,來(lái)看看最終的設(shè)計(jì)跟初衷(如能效指標(biāo)等核心指標(biāo))是否一致。“張子揚(yáng)說(shuō)。
WHOES法則是施耐德電氣的全生命周期服務(wù)的又一特色,也是施耐德電氣多年積累下來(lái)的經(jīng)驗(yàn)總結(jié)。WHOES是5個(gè)英文字母的縮寫(xiě),分布代表了5個(gè)方面的內(nèi)容,即What(這個(gè)客戶是誰(shuí)、他的業(yè)務(wù)是什么樣的)、How(尋找什么樣的路徑來(lái)實(shí)現(xiàn)這個(gè)目標(biāo))、Optimize(對(duì)尋找到的最佳路徑進(jìn)行優(yōu)化)、Engineering(如何工程化、實(shí)施落地)、Standardization(把整個(gè)文檔標(biāo)準(zhǔn)化,并作為一個(gè)完整的文件交出去)。
“WHOES法則是施耐德電氣總結(jié)的一個(gè)方法論,如果設(shè)計(jì)工程師都能夠按照這個(gè)來(lái)做設(shè)計(jì),準(zhǔn)確度和效率都會(huì)高很多。施耐德電氣的架構(gòu)師都是按照這個(gè)WHOES法則進(jìn)行工作的,這也是我們做咨詢?cè)O(shè)計(jì)和設(shè)計(jì)驗(yàn)證的優(yōu)勢(shì)。”張子揚(yáng)表示。
運(yùn)維到運(yùn)營(yíng)賦予服務(wù)更高的價(jià)值
數(shù)據(jù)中心是一個(gè)長(zhǎng)期的投資,除了前期的設(shè)計(jì)和建設(shè),后期的運(yùn)維一樣重要。與設(shè)計(jì)和建造不同,一旦數(shù)據(jù)中心投入使用,運(yùn)維將會(huì)始終相隨。而且,如前所述運(yùn)維對(duì)數(shù)據(jù)中心的可靠性和可用性的影響是顯性的、直接的,比如,數(shù)據(jù)中心停機(jī)事故中人為誤操作高達(dá)70%。
“根據(jù)我們的經(jīng)驗(yàn),數(shù)據(jù)中心運(yùn)維真正的考驗(yàn)是在數(shù)據(jù)中心建成5年以后,此時(shí)設(shè)備進(jìn)入老化階段,壓力會(huì)集中爆發(fā)。”施耐德電氣IT業(yè)務(wù)部全生命周期服務(wù)業(yè)務(wù)拓展經(jīng)理蔣勝表示,但在實(shí)踐中客戶普遍重視設(shè)計(jì)和建設(shè),而對(duì)運(yùn)維重視程度不夠。
蔣勝介紹,數(shù)據(jù)中心運(yùn)維的關(guān)注重點(diǎn)是可用性、可靠性和能效,這些都是一個(gè)長(zhǎng)期的工作,需要持續(xù)改進(jìn)的。正因?yàn)榇耍┠偷码姎飧敢鈱?shù)據(jù)中心的“運(yùn)維”稱為“運(yùn)營(yíng)”。
“運(yùn)維是指運(yùn)行和維護(hù),這個(gè)是最基本的,是保證數(shù)據(jù)中心正常的運(yùn)行;而運(yùn)營(yíng)指在數(shù)據(jù)中心在運(yùn)行的過(guò)程中要產(chǎn)生價(jià)值,要不斷優(yōu)化,要給客戶帶來(lái)價(jià)值,甚至可以為客戶優(yōu)化成本并幫助客戶實(shí)現(xiàn)主營(yíng)業(yè)務(wù)的增值。”蔣勝說(shuō)。
他介紹,施耐德電氣在運(yùn)營(yíng)服務(wù)方面分別提供三個(gè)層次的服務(wù),一個(gè)是維護(hù)集成服務(wù),它相當(dāng)于服務(wù)的總包,集成管理客戶所有的供應(yīng)商,維護(hù)合同,幫助出報(bào)告和出維護(hù)標(biāo)準(zhǔn)。第二個(gè)是維護(hù)管理服務(wù),比維護(hù)集成服務(wù)高一級(jí),如果供應(yīng)商不能夠及時(shí)到位,施耐德電氣會(huì)派工程師到現(xiàn)場(chǎng)服務(wù),另外還負(fù)責(zé)制定運(yùn)維流程。第三個(gè)是關(guān)鍵設(shè)施運(yùn)營(yíng),國(guó)內(nèi)普遍稱為代維服務(wù),是駐場(chǎng)服務(wù),也是最高等級(jí)的運(yùn)營(yíng)服務(wù)。
近年來(lái),有些客戶提出打造自己的數(shù)據(jù)中心運(yùn)維團(tuán)隊(duì),蔣勝認(rèn)為,客戶最應(yīng)該做的還是專注于自己的核心業(yè)務(wù)和競(jìng)爭(zhēng)力建設(shè),這也是數(shù)據(jù)中心運(yùn)營(yíng)服務(wù)的核心價(jià)值之一。除此之外,運(yùn)營(yíng)服務(wù)的價(jià)值還包括獲得更多的正常運(yùn)營(yíng)時(shí)間和更高可用性、可靠性;通過(guò)優(yōu)化和維護(hù)來(lái)實(shí)現(xiàn)節(jié)約成本;通過(guò)基于標(biāo)準(zhǔn)的、質(zhì)量驅(qū)動(dòng)的全面能力實(shí)現(xiàn)服務(wù)的可伸縮性(既可以給客戶提供駐場(chǎng)服務(wù),也可以培訓(xùn)客戶自己運(yùn)維)等。
今天,隨著數(shù)據(jù)中心的大量涌現(xiàn),市場(chǎng)上出現(xiàn)了不少提供數(shù)據(jù)中心相關(guān)服務(wù)的廠商,服務(wù)也林林總總。蔣勝告訴記者,相對(duì)同類業(yè)務(wù)施耐德電氣全生命周期服務(wù)的不同之處在于全方位的解決方案。
“施耐德電氣在數(shù)據(jù)中心擁有覆蓋最廣泛的產(chǎn)品線和解決方案,以及豐富的數(shù)據(jù)中心運(yùn)營(yíng)管理經(jīng)驗(yàn),我們擁有一套完整的標(biāo)準(zhǔn)化的流程和專家級(jí)的維護(hù)服務(wù)。此外我們也不斷針對(duì)客戶需求推出多種數(shù)字化工具,比如數(shù)據(jù)中心數(shù)字化運(yùn)維平臺(tái)、數(shù)字化能效管理平臺(tái)等,以推動(dòng)數(shù)據(jù)中心管理的數(shù)字化轉(zhuǎn)型。這些都是施耐德電氣與眾不同之處,也是能幫助客戶最終實(shí)現(xiàn)卓越運(yùn)營(yíng)價(jià)值所在。”蔣勝說(shuō)。
原文鏈接:http://server.zhiding.cn/server/2018/0816/3110081.shtml