數據中心的穩定運行離不開數據中心的運維人員,而數據中心運維的工作涉及到方方面面,它不同于其它的運維,處理的問題都是比較專業的問題。在很多的公司都是將服務器和設備托管到專門的數據中心機房讓專業的人士進行維護,只有一些技術實力比較強的大公司才建設有自己的數據中心。如今的信息技術更新得很快,什么大數據、云計算、虛擬化、綠色數據 中心等等新技術層出不窮,各種設備的CPU、內存、轉發芯片等也都在不斷地發展。
從單核CPU到多核、四核、八核、十六核、三十二核,網絡單端口帶寬從 10M、100M、1G、10G、100G,這些技術的進步給數據中心帶來了高速的信息處理能力,但是也讓這個數據中心的系統變得異常復雜,傳統的數據中心運維技能已經難以適應信息高速發展的需要了,需要我們去不斷學習,提升自己,才能在未來的數據中心里,將運維的工作開展好。下面將結合一些實際工作經驗 講述提升運維技能的一些方法。
數據中心是一個復雜的信息處理系統,包括系統、網絡、存儲、協議、需求、開發、測試、安全、空調、供電、監控等多個環節,運維的工作就是要包含到所有這些方面,可見 運維的工作是一個集多IT工種技能于一身的崗位。然而這里說的每一個部分都需要多種技術學科的支撐,比如系統可能有Linux、Windows的,應用有 LVS、HA、WebServer、DB、中間件,網絡就更復雜了,各種二三層協議,虛擬化,環路協議,路由協議等等。這么多的技術不可能每個人都精通,不可否認可能有這種全面精通的人存在,但人的精力畢竟是有限的,要有所得也要有所失。首先是溝通能力、團隊協作。運維的工作涉及跨部門、跨工種特別多,這樣運維的人員需要善于溝通,團隊協議能力要強,這樣在處理問題時,可以充分調用各種資源和技術力量,迅速解決問題。
對于數據中心時間就是利潤,流量就是金錢,一年365天要保持數據中心的穩定運行,不出故障或者少出故障才行。當業務部門反饋有故障時,根據反饋的故障現象迅速鎖定故障點,然后集中資源解決,這其中需要大量的溝通,有效的溝通將為排除故障節省下來大量時間。其次是運維工作要膽大心細。膽大才能創新,不走尋常路。即使數據中心再小,它也有自己的特點,充分利用它的優勢,才能發揮出數據中心最大的效能。數據中心本來就是一個技術更新很快的領域,愿意接受新事物,大膽引入先進運維的 技術將可以大大提升數據中心的工作效率。再次是做好日常監控工作,一個健壯的身體離不開每天的觀察,我們需要時時刻刻觀察我們的數據中心,看看數據中心發生的細小問題。每天都要對數據中心的所有方面運行參數進行全面檢查和記錄,慢慢地就會對數據中心運行狀態有了掌握,當某些參數變化時及時做應對之策。比如設備運行的CPU占用率,平時監控所有設備CPU占用率都在30%左右,突然有一天幾臺設備的CPU占用率無緣無故升到了60%,這就需要進一步檢查升高的原因,直到消除掉為止。如果沒有這些平日里的統計記錄,這樣的參數變化就不會引起人們的注意,故障遲早會到來。第四做好統計工作。一般的數據中心都擁有上千臺的服務器設備,還有其它不少的電子設備,要做好統計工作。比如服務器多少臺,都處于什么位置,都和網絡設備如何互連的,每臺設備的配置,應用的特性等等,這些統計工作馬虎不得,都關系著數十萬設備的物理安全。在平日接觸到的運維人員讓我們感受到不同的人員對自己數據中心的了解差異是非常大的,有的人可以對詢問的某個網段IP給什么應用使用脫口而出,而有的人卻對詢問的服務器放在哪個機架上都一無所知,當遇到問題或者進行數據中心變更時,后者的表現是顯而易見會出問題的。最后是要至少精通一門技術,數據中心需要運維人員是通材,就是方方面面都要懂一些,但是都懂一些相當于都不懂,這樣在數據中心里是無法立足的。還需要有自己精通的領域,至少有一門是自己精通,而別人無法替代的。比如精通Linux操作系統、精通網絡技術、精通安全技術等等,這樣才能在數據中心里立足,然后再向其它領域拓展,最終成為一個技術較為全面的運維人才。
數據中心的運維工作不像其它工作,比如測試工程師、研發工程師等,有非常明確的職責定位及職業規劃,有職業認同感與成就感。運維工作可能給人的感覺就是哪個方面都知道一些,但又哪個方面都比不上專業工程師更精通,慢慢工作起來就會迷失方向。其實運維工作也有自身的特點,就是什么領域的技術都有機會學習與接觸,掌握的深淺程度主要取決于運維人員的自身努力,可以在多個技術領域做到精通。新一代數據中心給運維工作帶來了更多挑戰,也使得運維成為一個融合多學科的綜合性技術,提供了很好的個人能力與技術廣度的發展空間,運維工作的相關經驗變得越來越重要。正因為運維的工作面廣,運維人員轉到其它崗位也很容易,沒有太大的局限性,而且只有運維工程師才有機會成為數據中心的系統架構師或者運維主管,這樣的職業發展前景也比較好。如今的數據中心已經開始重視運維技能的提升,大批量引起了不少高精尖的技術人才,從事數據中心運維人員的技能水平在不斷提高,將有越來越多的高技術人才加入到數據中心運維隊伍中來。