盡管網(wǎng)絡(luò)基礎(chǔ)設(shè)施的穩(wěn)定性越來(lái)越高、IT運(yùn)維概念不斷推陳出新,但事實(shí)上,還有眾多的網(wǎng)絡(luò)工程師并沒(méi)有從日常維護(hù)工作中得到真正意義上的解脫。而作為被動(dòng)運(yùn)維管理的典型,“電話報(bào)修”這種傳統(tǒng)模式必須要得以徹底改變,才能將網(wǎng)絡(luò)工程師丟失的時(shí)間、精力和效率找回來(lái),才能從在主動(dòng)服務(wù)中將IT運(yùn)維管理的真正價(jià)值釋放出來(lái)。
某大型電網(wǎng)公司網(wǎng)絡(luò)信息中心,每天接到的報(bào)修電話數(shù)量超過(guò)百個(gè),由于長(zhǎng)期處于高壓狀態(tài),很多工程師都對(duì)電話鈴聲極其反感,有的人甚至懷疑自己患上了“電話恐懼癥”。如果從心理學(xué)角度上分析,這種莫名的恐懼,是一種容易治療的疾病。但若從技術(shù)和管理角度上分析,則是整個(gè)IT運(yùn)維系統(tǒng)出現(xiàn)了問(wèn)題,電話另一頭許多的“未知”是讓工程師產(chǎn)生不安的“病根”。
作為國(guó)內(nèi)領(lǐng)先的IT運(yùn)維管理專(zhuān)家,北塔軟件認(rèn)為:只有具備主動(dòng)事前管理+故障判斷功能的運(yùn)維解決方案,才能幫助用戶(hù)徹底擺脫“電話報(bào)修”這種被動(dòng)運(yùn)維模式。網(wǎng)絡(luò)架構(gòu)就如同人體構(gòu)造一樣復(fù)雜,造成網(wǎng)絡(luò)故障的原因也是多種多樣。一方面,用戶(hù)在電話中的描述很難準(zhǔn)確;另一方面,網(wǎng)絡(luò)工程師采用手工檢測(cè)、經(jīng)驗(yàn)判斷,一般也就能解決“通斷”之類(lèi)的故障,對(duì)用戶(hù)端實(shí)際情況也很難判斷出真正原因。
那么,IT運(yùn)維人員通過(guò)何種途徑能夠?qū)崿F(xiàn)“事前管理“?針對(duì)本文中的案例來(lái)看,首要任務(wù)就是解決設(shè)備層面的監(jiān)控和預(yù)警難題。信息網(wǎng)絡(luò)中心需要把鏈路、網(wǎng)絡(luò)設(shè)備、服務(wù)器等納入一個(gè)平臺(tái)上進(jìn)行管理,提供7X24小時(shí)全天候監(jiān)控。
對(duì)此,我們通過(guò)分析北塔軟件IT運(yùn)維綜合管理解決方案可以看出端倪。首先,通過(guò)涵蓋網(wǎng)絡(luò)、應(yīng)用、故障、資產(chǎn)等方面一體化管理平臺(tái),徹底消除企業(yè)IT管理中的盲點(diǎn),從而解決“被動(dòng)運(yùn)維”給企業(yè)造成的效率不高、服務(wù)水平低陷的問(wèn)題。利用北塔軟件的自動(dòng)拓?fù)浒l(fā)現(xiàn)功能,可以幫助管理員對(duì)所管理的設(shè)備類(lèi)型進(jìn)行分類(lèi),并對(duì)設(shè)備所涉及到的參數(shù)進(jìn)行實(shí)時(shí)監(jiān)控。同時(shí),該方案還可以通過(guò)靈活多樣的告警方式,主動(dòng)告知運(yùn)維人員當(dāng)前遇到的問(wèn)題和原因,這便消除了電話中許多的“未知”因素,從而在全局和細(xì)節(jié)上都能實(shí)現(xiàn)主動(dòng)運(yùn)維。
其次,在故障發(fā)現(xiàn)方面,基于ICMP的管理,只能對(duì)服務(wù)器和網(wǎng)絡(luò)設(shè)備的連通性進(jìn)行簡(jiǎn)單性測(cè)試,但在業(yè)務(wù)逐漸復(fù)雜的后續(xù)階段就顯得力不從心了。不難看出,北塔軟件在解決方案中采用了以“路徑”為核心的故障分析方法,包含了化解故障復(fù)雜性的“故障根源分析策略”、TFS管理系統(tǒng)、業(yè)務(wù)流量視圖等等。
針對(duì)“路徑”的具體應(yīng)用,北塔軟件表示:不論多么復(fù)雜的系統(tǒng),都有數(shù)據(jù)行走的路線。而通過(guò)日常高頻度監(jiān)測(cè)少量關(guān)鍵指標(biāo),控制被管系統(tǒng)承載壓力,一旦發(fā)現(xiàn)問(wèn)題,便能依據(jù)業(yè)務(wù)系統(tǒng)實(shí)際的流量路徑,逐層擴(kuò)大數(shù)據(jù)采集的深度和廣度,層層深入,這樣就可直達(dá)故障的根源。
恐懼的原因是缺乏自信,而作為支持企業(yè)實(shí)現(xiàn)從設(shè)備管理跨越到業(yè)務(wù)管理的運(yùn)維平臺(tái),IT綜合管理解決方案中許多功能可以消除“未知”,從而讓IT運(yùn)維管理重獲自信。另外,該方案還包含了“業(yè)務(wù)視圖”、“自動(dòng)巡檢”和“業(yè)務(wù)仿真”等更高級(jí)的運(yùn)維“助手”,不但可以改善被動(dòng)運(yùn)維的局面,還可以站在用戶(hù)的角度實(shí)現(xiàn)網(wǎng)絡(luò)應(yīng)用體驗(yàn)。例如:設(shè)定完成“業(yè)務(wù)仿真”的流程和平均訪問(wèn)時(shí)間閾值之后,北塔BTIM將模擬業(yè)務(wù)與運(yùn)維人員自動(dòng)執(zhí)行登錄、模擬處理常規(guī)業(yè)務(wù)流程、搜尋業(yè)務(wù)系統(tǒng)故障、嘗試自動(dòng)修復(fù)等操作步驟。而這些創(chuàng)新應(yīng)用的引入,都是確保IT部門(mén)在電話鈴聲響起前,便能提前發(fā)現(xiàn)問(wèn)題,讓主動(dòng)服務(wù)輕松實(shí)現(xiàn)。
如此,網(wǎng)絡(luò)工程師遠(yuǎn)離電話鈴聲已經(jīng)不是問(wèn)題,而所有故障處理也不必再憑借“假設(shè)推斷”和“個(gè)人經(jīng)驗(yàn)”來(lái)排除。主動(dòng)運(yùn)維格局的形成,不但具有了從運(yùn)維怪圈跳出的彈力,更可以在日后的創(chuàng)新應(yīng)用中擁有持續(xù)優(yōu)化的能力,從而更好地將IT與業(yè)務(wù)相融合,促進(jìn)業(yè)務(wù)的快速發(fā)展。