偶爾的熬夜割接還好,可有時(shí)這種割接紛至沓來(lái),有的對(duì)時(shí)間的要求還極高。比如說(shuō)某個(gè)設(shè)備出現(xiàn)了軟件BUG,要及時(shí)進(jìn)行打補(bǔ)丁修復(fù),如果不盡快恢復(fù)可能引發(fā)的后果非常嚴(yán)重,假如數(shù)據(jù)中心有數(shù)百臺(tái)這樣的設(shè)備,每一臺(tái)都要打補(bǔ)丁或者重啟設(shè)備,就算連續(xù)一周每天都提變更操作,可能都完成不了,這可苦了這些運(yùn)維人員。長(zhǎng)期連續(xù)的熬夜,不用說(shuō)人們就都知道,對(duì)身體危害極大,不僅容易造成生物鐘紊亂、神經(jīng)恍惚,長(zhǎng)期下去積累出各種疾病,熬夜也會(huì)導(dǎo)致工作效率也十分低下。而且在割接的過(guò)程中,不僅不能休息睡覺(jué),還要時(shí)刻保持頭腦清醒,操作的每一步都不能有錯(cuò)誤,時(shí)刻關(guān)注業(yè)務(wù)層面的變化,這才是最辛苦的一面。每一次割接前,要準(zhǔn)備大量的工作,確保割接步驟正確,割接時(shí),時(shí)刻關(guān)注業(yè)務(wù)變化,同時(shí)對(duì)割接的效果進(jìn)行查看,確保達(dá)到預(yù)期的目的,割接后還要觀(guān)察一段時(shí)間,確保割接后沒(méi)有產(chǎn)生新問(wèn)題,觀(guān)察時(shí)間至少要數(shù)個(gè)小時(shí),所以也許割接操作在一個(gè)小時(shí)之內(nèi)已經(jīng)做完了,后續(xù)觀(guān)察的時(shí)候更長(zhǎng),很多時(shí)候凌晨2點(diǎn)割接后,直到第二日中午才會(huì)結(jié)束整個(gè)割接工作。在休息一個(gè)下午后,晚上可能又投入到新的割接之中,連續(xù)數(shù)日。這些辛苦都還好,最為關(guān)鍵的是還要承受住巨大壓力,一旦割接的操作對(duì)數(shù)據(jù)中心業(yè)務(wù)造成影響,割接出現(xiàn)失敗并起動(dòng)回退機(jī)制,往往要影響到個(gè)人的考核指標(biāo),這完全是一件費(fèi)力又不討好的事情。所以,有不少的技術(shù)人員滿(mǎn)心歡喜地進(jìn)入數(shù)據(jù)中心工作,沒(méi)多久就被這種割接的工作任務(wù)給嚇跑了。在漫漫長(zhǎng)夜里,獨(dú)自承受這巨大壓力,當(dāng)出現(xiàn)問(wèn)題完全陷入無(wú)助時(shí),想想都后怕。
數(shù)據(jù)中心何時(shí)才能擺脫夜夜割的狀態(tài),將運(yùn)維人員的壓力釋放出來(lái)?很多的數(shù)據(jù)中心已經(jīng)發(fā)現(xiàn)了這個(gè)問(wèn)題的嚴(yán)重性。過(guò)于頻繁的夜夜割狀態(tài),不僅給數(shù)據(jù)中心帶來(lái)運(yùn)行風(fēng)險(xiǎn),也增加了運(yùn)維人員的極大工作負(fù)擔(dān)。當(dāng)然最好的方式是數(shù)據(jù)中心不出問(wèn)題,可不出問(wèn)題就算能做到,設(shè)備自然老化、新業(yè)務(wù)部署都是不可避免的,還是逃不過(guò)要做業(yè)務(wù)割接、變更。現(xiàn)在將數(shù)據(jù)中心放在了云上,就有了可能,所有的操作都是在云平臺(tái)上完成。云平臺(tái)最大的特點(diǎn)就是靈活性,由軟件自動(dòng)編排和控制。這樣只要告訴云平臺(tái),要做哪些操作和變更,設(shè)定好時(shí)間,由云平臺(tái)下發(fā)指令就可以完成,這樣就可以到凌晨2點(diǎn)鐘時(shí),由云平臺(tái)自動(dòng)發(fā)起割接操作、完成,整個(gè)過(guò)程不再需要人為參與,徹底將人從這個(gè)工作中解脫出來(lái)。實(shí)際上,目前能做到如此的數(shù)據(jù)中心寥寥無(wú)幾,一方面是云平臺(tái)建設(shè)的不完善,另一方面是人對(duì)這個(gè)自動(dòng)操作過(guò)程依然不放心。如果放由云平臺(tái)自動(dòng)操作,鬼知道結(jié)果會(huì)變成怎樣,萬(wàn)一將數(shù)據(jù)中心系統(tǒng)搞癱了,得不償失。還有,具有比較完備備用系統(tǒng)的數(shù)據(jù)中心,可以在割接前先將業(yè)務(wù)割接到備用系統(tǒng),然后再進(jìn)行割接、變更,這樣割接時(shí)間就不一定要放到凌晨2點(diǎn),隨時(shí)隨地都可以操作,不僅不用熬夜,工作效率也更高。割接完后,再將業(yè)務(wù)切回來(lái)觀(guān)察,若有問(wèn)題再回退。這也不行,就只能老老實(shí)實(shí)地等到凌晨熬夜割接了。
在數(shù)據(jù)中心云平臺(tái)建設(shè)還不完善的今天,凌晨靠人工割接依然是一種工作常態(tài),短期內(nèi)看不到有減少的趨勢(shì),而且隨著數(shù)據(jù)中心建設(shè)的規(guī)模越來(lái)越大、系統(tǒng)也越來(lái)越復(fù)雜,這種事情只會(huì)更多。很多數(shù)據(jù)中心安排人員進(jìn)行24小時(shí)輪詢(xún)值守工作,這樣反到簡(jiǎn)單了,誰(shuí)凌晨當(dāng)班,誰(shuí)就去做割接的工作。不過(guò),對(duì)于很多無(wú)人值守的數(shù)據(jù)中心來(lái)說(shuō),就只能硬著頭皮安排了。數(shù)據(jù)中心要想擺脫夜夜割,就一定要在數(shù)據(jù)中心建成投產(chǎn)之前,做足功課,減少各種可能出現(xiàn)的漏洞、問(wèn)題,避免后續(xù)做頻繁的變更,“亡羊補(bǔ)牢、未為晚矣”,應(yīng)將所有可能出現(xiàn)的問(wèn)題考慮在前,考慮的更為長(zhǎng)久,這樣才能避免出現(xiàn)夜夜割的尷尬局面。數(shù)據(jù)中心的業(yè)務(wù)一旦部署后,短期內(nèi)是不會(huì)頻繁變化的,只有各種問(wèn)題不斷,才能出現(xiàn)夜夜割的局面,即使在未來(lái)幾年,各種業(yè)務(wù)擴(kuò)容、變更不可避免,也可以大為減少次數(shù),將運(yùn)維人員的精力釋放出來(lái)。
數(shù)據(jù)中心何時(shí)能擺脫夜夜割 藍(lán)瘦香菇!