數據中心的運維團隊是整個數據中心最為辛苦的團隊,但也經常被人所忽視。從很多傳統的視角去看待運維工作,運維的確承擔了很多的職能。比如:服務器工程師、網絡工程師、桌面工程師、系統管理員、數據庫管理員、安全工程師等等。數據中心運維團隊要覆蓋數據中心所有門類的技術,掌握數據中心各個運行環節的機制。在以前包括現在,很多運維團隊就是將自己放在了一個提供IT資源和支持的定位上,不僅外人這樣看,運維團隊的人自己都這樣看,這樣的環境下,讓很多運維團隊的人成就感不強,終日和這些機器打交道,運維的工作也被貼上了“IT保姆”、“救火隊員”、“苦逼”等標簽,這也造成了數據中心運維這類技術人員的缺乏,沒有人愿意去做這樣一份沒有成就感的工作。難道我們的運維真的只能如此?數據中心這樣高大上的行業,怎么做數據中心的運維工作就變得如此低端了呢?這篇文章要和大家好好聊聊運維的價值。
提升運維工作的成就感,主要是要讓運維人員感到工作很有價值。同樣做一份工作,充滿期待的去做和按部就班地去做的效果完全是不同的,前者可能在原有工作的基礎上找到一些現有數據中心不足的地方,主動去優化,而后者則是能少做就少做,不出問題即可。經常有人說要創造性地去工作,指的就是前者。在騰訊的數據中心運維工作中,把運維價值分成了幾個方向:高質量,低成本,效率快,控制風險。運維工作的目標就是這四個方向,通過工作向這四個方向努力,工作的成績也體現到這四個方向上。
具體高質量指的對數據中心訪問的體驗感。許多研究都表明,用戶最滿意的打開網業時間,是在2秒以下,用戶能夠忍受的最長等待時間的中位數,在6~8秒之間。這就是說,8秒是一個臨界值,如果你的網站打開速度在8秒以上,那么很可能,大部分訪問者最終都會離你而去,如果等待12秒以后,網頁還沒有載入,那么99%以上用戶會關閉這個網頁,不再等待。衡量數據中心運維工作是否具有高質量,就是看數據中心能否提供持續的很好的用戶訪問體驗感,用戶滿意度是最重要的一個衡量標準。當然,我們知道這種體驗感的提升是多方面的,要增加應用軟件的穩定性,要擴大數據中心訪問帶寬等等,涉及很多的細節問題,作為運維人員很多方面還無法自己控制,但是工作努力的方向就是高質量,通過工作保持數據中心長時間穩定運行,通過工作利用現有資源進一步優化。成本也是運維工作要考慮的重要因素,運維部門是數據中心支出較大的部分,帶寬、服務器、人力等都是非常昂貴的資源,成本的控制精細化考驗了運維團隊的技術能力和管理能力。數據中心運維最經常做的工作就是新增應用業務,那么要不要再增加設備,是要仔細評估的,增加設備后運維的人力是否足夠,這些都需要新增資金投入,一個數據中心運維總監如果總是向企業要資金,哪個企業都不會太喜歡,運維工作就是利用現有資源最大化提升運轉效率,所以對于數據中心優化工作每時每刻都在上演,運維人員要在工作中善于發現一些節約成本的地方,時間長了小的積累就很可觀。再說工作效率,強調效率就是運維工作要有很強的時間意識,我們知道最近一次支付寶斷網花了2個小時才修復,而攜程網故障恢復居然用了12個小時,這說明處理故障的應急處理機制并不好,效率很低。最好的應急故障方式應該是在用戶無感知的情況下,完成業務的切換,將故障自動隔離。效率不僅體現在對突發故障的恢復處理上,還有在新建機房、擴容、搬遷等數據中心工作中,也有效率的體現。高速發展時期的互聯網數據中心往往可能一兩個星期就會新建一個機房,速度很快,這就要求運維人員要有很高的工作效率,這種交付能力是高效率的最好體現。安全是數據中心最重要一環,數據中心需要建立一個全面的安全體系,從系統級、數據級別、應用級別等各個緯度去對待安全問題,這是一個非常的話題,也貫穿在整個數據中心的運維工作中,數據中心要有自己的運維安全團隊,制定詳細的訪問控制、數據加密、數據備份、隔離訪問、軟硬件防火墻部署等安全措施。攜程網故障是由于員工的誤操作,那么能否從安全角度制定一些措施去避免,都是運維工作要考慮的。現在的數據中心遭受著各種各樣的攻擊,安全問題倍受關注,數據中心需要不斷進行優化安全的部署,將風險消除在搖籃之中。在日常的運維工作中,應該注重細節,發現一些系統不足的漏洞,然后及時去彌補,這些不足如果運維人員自己沒有及時發現,就有可能讓外人鉆了空子,所以對于數據中心安全,應該警鐘長鳴,運維工作應該確保數據中心不會遭受任何的損失。
經過以上的介紹,是不是感覺到運維工作還是很有成就感的,要做到這四方面是需要有大量的細化的工作,要搭建平臺,要建規范,做標準,還要學會用數據驅動運維、研發、測試,你會忙得不亦樂乎,這些運維工作最直接的結果就是這四個方面的體現,只有這四方面有進步了你的工作才能被領導所賞識。其實不僅在運維工作上,很多其它工作也并不是那么有趣,但是如果這個工作能讓人看到工作的巨大價值,工作起來就不會那么枯燥了,這就是要創造性地工作,只有創造性地去工作,才能提升工作的成就感。