運維是數據中心里最為重要的工作,但卻常常被人所忽略,這主要原因在于運維的工作是花錢部門,并且投入資金短時也看不到效果。而在運行出了故障時,又要運維被黑鍋,將矛頭指向了運維。實際上,一個數據中心運行的是否穩固是從其最開始建設就一定程度上決定了,就像一個人一樣出身是非常重要的,雖然并不能代表全部。一個數據中心在最開始建設的時候要求就很高,各方面建設非常標準,冗余和備份系統非常完善,這樣的數據中心后期運維也會很輕松,故障發生概率很低,即便出了故障也有備份系統正常接管業務,確保業務不受任何影響。不過,就算是最先進的數據中心,也離不開運維的工作,那些聲稱自己的數據中心是無人值守的,雖然不需要有人24小時在機房監控,可也離不開人管理,還是需要運維的人員周期性地對數據中心進行巡檢,及時發現隱患。可以說:“運維工作是數據中心的神經和大腦,IT設備等基礎架構是其骨架,而各種接口就是傳感器,運維工作可以控制和分析整個數據中心的運轉情況,保障數據中心良好運轉”,運維的工作重要性不言而喻。
既然運維的工作對于數據中心這么重要,為何長久以來,并不能得到重視呢?首先是傳統的“重建設,輕管理”的IT思維禁錮著數據中心運維的工作價值發揮和潛力發掘。在復雜多變的市場環境,快速發展業務為先,只有建設格調比較高的數據中心才能吸引到客戶使用,所以數據中心將心思幾乎全部用在建設上面,以便吸引到更多客戶使用;其次是運維的工作難以量化,不像數據中心建設取得的成果立竿見影。當一個數據中心建設完成后,容納多少服務器,能開啟多少業務,都是可以預知的,很容易獲得高層領導的認可。也正因此如此,數據中心架構師的收入要比運維工程師高出很多。的確,架構師只有在數據中心建設設計時投入精力比較多,可一旦建成就和架構師的關系不大了。一個數據中心建設之后,往往有漫長的生命周期,使用二三十年是常有的事兒,從時間長度上來說運維的工作伴隨著數據中心的整個生命周期中,可讓人印象深刻的一定是其發生的歷次故障事件,這本身實質是對運維的工作否定;第三是運維是要花錢的,數據中心隨著運行時間的延長,內部各個零件都是失效的可能,數據中心經常要進行零件的采購,這些都需要錢,還有運維的人員工資,各項技術培訓和管理支出。總之,各種各樣的運維費用讓數據中心有時也喘不過氣來,運維費用過高往往拖了數據中心建設和擴容的后腿,這些賬都要算在運維頭上,抱怨運維花錢太多,又不能直接產生效益,數據中心對待運維的態度多是能省則省。這樣一來,在數據中心里運維工作開展的并不順利,很多數據中心運維也是得過且過,只要不出問題一切都好,能不能出問題要看老天了。
冰凍三尺非一日之寒,要想一下子改變當前數據中心運維現狀很難。不過,隨著客戶對數據中心依賴程度的增加,數據中心的運維工作質量將直接影響到客戶的業務、市場甚至是形象等,數據中心宕機故障有可能導致數千萬元的損失,甚至被監管機構處罰的例子屢見不鮮。在這樣的嚴峻背景下,運維的工作逐漸浮出水面,確保數據中心不出故障僅僅是運維工作的一部分,遠遠不是全部。運維的工作重點應是如何定義數據中心工作與服務關系,如何建立與客戶之間的服務水平協議,如何快速地支持客戶業務的需求,如果規劃好數據中心建設,更好地為業務部門提供發展動力等。要進行高效運維,而不是將精力全部放到設備運維上去。一定有人會問“不做設備運維,那出了問題怎么辦,誰也無法保證設備不出問題”,是的,任何設備都有出故障的可能性,這就需要建設數據中心時做好系統備份,從服務器、網絡、存儲等都需要備份,甚至數據中心之間也可以備份,這樣數據中心出了什么故障都不怕,業務自動切換到其它備用系統上去,以此來確保數據中心業務不受影響,至于設備故障原因交由設備廠家來查,分析出原因后確保下次相同問題不再出就可以。當然數據中心設計的再好,也可能存在漏洞,尤其是在不斷擴容和運維過程中經常會出現這樣那樣的問題,這就需要不斷優化數據中心系統,確保發展業務的同時,系統穩定性不受到任何影響。隨著云計算和大數據的發展與普及加速了運維趨向成熟,基本上已經顛覆了小企業的運維模式,一場新的運維變革運行悄然興起。向運維的工作要利潤,向運維的工作要效率,是對運維提出的更高要求。新技術的到來勢必砸掉大多數不思進取的運維人員的飯碗,普通運維的人員一定要具有創新思維,建設自動化運維系統,提升運維工作效率,否則丟掉飯碗只是時間問題。運維技術人員要有一種職業危機感,不斷提升自己的技能水平,要有全局的視野,而不是局限于某些設備,某一類技術。運維的人員還需要不斷學習,接受新技術,學會使用一些好用的運維工具,或者自己具備開發運維工具的能力,通過使用這些工具來提升運維的工作水平。以前,運維的人員都是作為數據中心運轉幕后工作者,很難為外界所知,甚至數據中心內部管理者也未曾真正關注過。現在,數據中心發展對運維提出了更高要求,需要運維人員走到臺前,這給了運維改變歷史命運的機會,這樣改變運維在未來數據中心中的地位。