隨著數(shù)據(jù)中心建設(shè)規(guī)模越來越大,運(yùn)維的工作變得十分重要。運(yùn)維的工作效率與好壞在一定程度上決定了數(shù)據(jù)中心的整體水平。數(shù)據(jù)中心運(yùn)維工作涉及兩大方面:一是確保數(shù)據(jù)中心的穩(wěn)定性而對(duì)數(shù)據(jù)中心各個(gè)環(huán)節(jié)進(jìn)行維護(hù);二是當(dāng)數(shù)據(jù)中心內(nèi)出現(xiàn)問題時(shí),能夠及時(shí)定位并且解決,以縮短故障時(shí)間。前一個(gè)是基礎(chǔ),后一個(gè)是關(guān)鍵。這就像當(dāng)兵打仗,俗話說“養(yǎng)兵千日,用在一時(shí)”,平時(shí)對(duì)數(shù)據(jù)中心各個(gè)方面進(jìn)行了精心的檢查和熟悉,對(duì)整個(gè)數(shù)據(jù)中心狀況了如指掌,那在數(shù)據(jù)中心發(fā)生故障時(shí),才能迅速找到痛點(diǎn),明確故障原因,并采取恢復(fù)措施。一個(gè)數(shù)據(jù)中心做得再好,不發(fā)生故障是不太可能的,即使是那些技術(shù)大牛的互聯(lián)網(wǎng)公司,數(shù)據(jù)中心發(fā)生中斷是家常便飯,只不過很多時(shí)候其業(yè)務(wù)都有備份系統(tǒng),當(dāng)發(fā)現(xiàn)異常時(shí)及時(shí)切換,這樣外界訪問數(shù)據(jù)中心感知不到,業(yè)務(wù)也不受影響,只有備份也沒有起到作用,才會(huì)引發(fā)業(yè)務(wù)中斷。數(shù)據(jù)中心運(yùn)維工作需要通過很多手段來進(jìn)行,ITIL就是其中一種。ITIL(Information Technology Infrastructure Library,信息技術(shù)基礎(chǔ)架構(gòu)庫)由英國政府部門CCTA在20世紀(jì)80年代末制訂,現(xiàn)由英國商務(wù)部負(fù)責(zé)管理,主要適用于IT服務(wù)管理,它包括了“服務(wù)提供”和“服務(wù)支持”兩個(gè)流程組,服務(wù)提供流程組指的是IT服務(wù)持續(xù)性管理、可用性管理、能力管理、服務(wù)級(jí)別管理和IT服務(wù)財(cái)務(wù)管理,服務(wù)支持流程組指的是發(fā)布管理、變更管理、配置管理、問題管理和事故管理。ITIL為數(shù)據(jù)中心的運(yùn)維提供了一個(gè)客觀、嚴(yán)禁、可量化的標(biāo)準(zhǔn)和規(guī)范,ITIL雖然不是一個(gè)正式標(biāo)準(zhǔn),但是由于已經(jīng)普遍實(shí)行,所以已經(jīng)成為實(shí)行的“事實(shí)”標(biāo)準(zhǔn)。
ITIL說白了就是制定一套規(guī)矩,按照這套規(guī)矩來,就可以最大程度保護(hù)數(shù)據(jù)中心正常運(yùn)行,而這套規(guī)矩是多少前輩的經(jīng)驗(yàn)積累起來的,具有一定的指導(dǎo)意義。ITIL V2版本提供了10個(gè)流程,到了V3版本提供了17個(gè)流程,這些流程不是所有的都要應(yīng)用到,要根據(jù)實(shí)際情況,看哪些是我們工作中需要的,不能完全照搬ITIL流程,必須對(duì)日常運(yùn)維流程進(jìn)行梳理之后,靈活地和ITIL結(jié)合起來。比如,在ITIL流程設(shè)計(jì)中,一個(gè)變更管理流程需要體現(xiàn)出開通業(yè)務(wù)、修改業(yè)務(wù)等不同情況的處理方式。而業(yè)務(wù)開通、修改和撤銷是數(shù)據(jù)中心日常工作的主要內(nèi)容,已經(jīng)形成一套操作習(xí)慣和認(rèn)識(shí),如果簡(jiǎn)簡(jiǎn)單單地用ITIL的變更管理流程來代替這些操作,就會(huì)很難推進(jìn)下去。相反,要讓員工感覺到雖然增加了一個(gè)變更管理流程,但是以前的操作習(xí)慣沒有太大變化,而不是不知道從哪下手。實(shí)際上,數(shù)據(jù)中心實(shí)施ITIL流程最關(guān)鍵的是對(duì)已有獨(dú)立的業(yè)務(wù)流程進(jìn)行梳理和整合,重點(diǎn)抓住流程的操作步驟和控制環(huán)節(jié),但又不會(huì)太大地改變?cè)瓉淼牟僮髁?xí)慣。比如人員出入室流程可能需要單獨(dú)列為一個(gè)服務(wù)流程,因?yàn)檫@是數(shù)據(jù)中心經(jīng)常要處理的事情,以便于用戶可以進(jìn)入數(shù)據(jù)中心維護(hù)自己的服務(wù)器,或者到數(shù)據(jù)中心參觀等等。這樣人員出入和設(shè)備的搬入搬出都可以放在服務(wù)請(qǐng)求管理流程里,在這個(gè)流程里,只要能體現(xiàn)出來“在不同人員出入的情況下,不同設(shè)備搬入搬出的情況下,相應(yīng)地需要審批哪些內(nèi)容,哪些需要密碼確認(rèn),就可以了。
ITIL從本質(zhì)上講,都是“管理變革”,而非“技術(shù)變革”,ITIL作為一種管理理念和體系,和其它管理學(xué)體系的書籍就內(nèi)容和表述上沒有太大區(qū)別,所以完全可以應(yīng)用經(jīng)典的組織變革管理的理論、實(shí)踐和經(jīng)驗(yàn)來指導(dǎo)ITIL的落地和深化,幫助完成問題的分析、對(duì)策的設(shè)計(jì)、執(zhí)行的管理以及持續(xù)優(yōu)化。但是在實(shí)際實(shí)施過程中,會(huì)發(fā)現(xiàn)ITIL在數(shù)據(jù)中心里遇到了不少的問題。首先是在不清晰了解數(shù)據(jù)中心實(shí)際情況前,就事先確定了服務(wù)管理體系,這就像是江湖醫(yī)生,看到病人的狀態(tài)就是頭疼醫(yī)頭,腳疼醫(yī)腳,只看到了變現(xiàn)的現(xiàn)狀,而沒有查到根兒上,這樣的后果可想而知;其次是ITIL是標(biāo)準(zhǔn),但也不能一成不變,所謂100%的遵從ITIL是完全不正確的,很多管理都是在眾多獨(dú)特的受限條件下進(jìn)行的,每個(gè)數(shù)據(jù)中心都有自己的特點(diǎn),所以需要在ITIL標(biāo)準(zhǔn)的基礎(chǔ)上進(jìn)行裁剪、修正,形成自己特有的數(shù)據(jù)中心運(yùn)維管理流程。第三是ITIL流程不應(yīng)該一成不變,隨著數(shù)據(jù)中心的業(yè)務(wù)變化,要隨時(shí)做出調(diào)整,以便適應(yīng)新的場(chǎng)景,否則ITIL制定的流程就起不到很好的效果,甚至?xí)鸱醋饔谩5谒暮芏嗳藢?duì)ITIL期望過高,以為部署了ITIL就萬事大吉了,希望它能夠無所不包,實(shí)現(xiàn)數(shù)據(jù)中心的高效運(yùn)維管理,這給ITIL扣了一個(gè)大大的帽子。ITIL只是一種管理工具,僅僅是自動(dòng)化的,甚至只是電子化的輔助手段而已,從來都不能承擔(dān)構(gòu)建管理體系的重任,只是通過ITIL流程可以優(yōu)化運(yùn)維工作,提升工作效率。最后隨著ISO20000的出臺(tái),越來越多數(shù)據(jù)中心都在說自己實(shí)施了ISO20000,其實(shí)這是對(duì)ISO 20000和ITIL的一種誤解。ITIL是告訴數(shù)據(jù)中心應(yīng)該怎樣去做服務(wù)管理,更像是一種方法論。而ISO 20000是衡量數(shù)據(jù)中心的服務(wù)管理是否合規(guī)即應(yīng)該做成什么樣,但到底該怎么做ISO 20000并沒有提及太多,因此說實(shí)施了ISO 20000是一種大大的誤解。
如何建設(shè)管理好數(shù)據(jù)中心已成為未來市場(chǎng)競(jìng)爭(zhēng)時(shí)需要認(rèn)真思考和解決的問題,ITIL的出現(xiàn)并引入數(shù)據(jù)中心領(lǐng)域,將可以通過ITIL幫助數(shù)據(jù)中心架構(gòu)面向未來的運(yùn)維服務(wù)管理體系。目前,ITIL成為全球事實(shí)上的標(biāo)準(zhǔn)主要是它得到了幾乎所有IT巨頭們的廣泛支持,在多個(gè)領(lǐng)域均有應(yīng)用,相信在未來的數(shù)據(jù)中心領(lǐng)域里,也會(huì)有更多的使用機(jī)會(huì)。