數據中心要正常運轉,離不開大量的運維工作。運維的工作需要很多專業技術人才,要做好數據中心的運維需要掌握多學科、多門類的專業技能,運維的工作不強調人才對一門技術有多專、有深度,但要有廣度。出于成本的考慮,數據中心不可能聘入所有專業知識領域的人才,需要的是通用人才。如何才能成為一名優秀的數據中心運維專家呢?本文就來說一說運維工作所需的知識體系架構,根據這個知識體系架構,對自己弱勢的部分有針對性地學習,很快就能成為一名數據中心運維專家。
數據中心運維知識可以分為三大部分:運維技術、測試和開發和運維管理體系。先來說一說運維技術,這里邊包含的技術非常廣泛,按照網絡層的設計可以將運維技術再分為幾大部分內容。首先是客戶端,包括DNS地址解析,瀏覽器的使用,安全策略。這部分需要掌握一些瀏覽器技術,知曉如何提高瀏覽器并發數、避免靜態資源在Cookie上傳;當域名解析不出來的時候,知道如何分析,確認是否是客戶端的問題;其次是外部層,包括第三方CDN,云計算和外包等,CDN這種網絡優化技術在數據中心應用層使用非常普及,還有云計算的基礎知識要掌握,尤其是與各種外包服務交流溝通的技巧,就算自己不了解的技術也可以通過外包找到答案,善于利用這些求助對象;第三是集群技術,包括負載均衡、集群管理。掌握四層和七層的負載均衡技術,開源的LVS(IP負載均衡),商業的F5都是很好的集群技術,應該去了解學習一下,這也是優化網絡流量的重要手段之一;第四是應用服務層,包括Web應用,數據層,文件存儲,分布式層等。這部分與應用關系密切,業務是否正常在這方面會有很多表現,往往數據中心出現故障,第一時間就是在應用層面上表現出來,掌握這部分的一些技術,有助于快速查找問題根源。像一些業務監控接口的設計、流量分析技術、服務和安全監控手段都需要認真掌握;第五是網絡層,包括從接入到匯聚、核心的所有網絡技術,主要有網關設備、防火墻、路由器、IPsec VPN、三層交換、二層交換等,網絡技術是數據中心里三大技術之一,是實現所有設備互聯互通的基礎技術,必須要認真掌握,每個數據中心別的工程師可以不用配置,但是網絡工程師必須配備。除了要掌握各種網絡技術,還要懂得如何監控網絡,掌握各種監控軟件的使用方法,利用軟件實現對網絡的自動監控。第六是基礎服務類,包括各種管理平臺:日志收集平臺、自動化部署平臺、Job管理平臺、項目管理、電子郵件、DHCP等等,這些技術可以通過各種監控軟件來完成,所以掌握這些Zabbix、Kerberos等管理軟件是非常有必要的,可以利用這些軟件對數據中心進行管理;第七是操作系統層,數據中心里由大量的服務器組成,這些服務器大部分是Linux的操作系統,要掌握這些系統常用的操作,這樣才能完成各種應用業務部署,并可以在出現問題的時候查看服務器的運行狀態;第八是基礎設施層,主要是設備的上下架,IDC的托管,這里要做好對網絡配置、設備標注、資產錄入、操作系統安裝、機房巡檢等運維工作,這部分工作雖然技術含量不高,但是卻是數據復雜的,容易出錯,需要工作的時候認真仔細才行,這部分的數據準確性直接決定了未來運維工作的有效性,尤其是在發生故障時,如果這些基礎數據是錯誤的,排查起來就非常慢,甚至是錯誤的。
運維的工作也包括測試和開發部分。數據中心經常要針對某種業務或者是網絡進行性能測試、故障模擬測試、新業務開展測試等,要掌握一些常見的測試方法,并在測試時設計好測試方案,尤其要避免對數據中心正在運行的業務造成影響。運維的工作有時也需要自己做軟件開發,主要是一些管理軟件,可提升運維效率,減少復雜重復的人力。有很多大型數據中心都是自己開發運維軟件,對整個數據中心進行自動化管理,這種可以按照自己的管理風格和喜好進行設計,方便做后期的運維。測試和開發也是運維工作的重要部分,掌握一些常用的開發軟件和測試方法非常必要。
運維的工作也需要管理,掌握一些管理體系:ITSM、ITIL、IT Service CMM等等,有效提升數據中心運維的管理水平,有些數據中心聘請了一些職業經理人進行管理,其實這些人并不了解數據中心里的各種技術,但是他們會管理,可以將運維的管理做得很好,這樣同樣可以提升數據中心運維水平,而且這種提升是質的提升,遠大于單純地掌握專業技能的人所做的貢獻。對數據中心進行管理也是一種藝術,做好了更能體現出數據中心的運維水平。
以上簡單羅列了數據中心運維所需的各種技術,一個人全部掌握起來難度不小。在大型的數據中心里運維人員也被分成網絡、服務器、應用、監控等幾個部分,每部分的人主要掌握其負責的這部分技術。在小型數據中心就沒有那么細分了,一個數據中心可能就一兩人在維護,所有涉及的技能問題都要處理,這時就需要掌握知識的廣度。要想在數據中心運維領域成為專家,必須要掌握以上介紹的這三方面技能,缺一不可,至少遇到問題得到知道是哪個方面的問題,自己搞不定還可以尋求專家,就怕遇到問題連這個問題是什么都說不清楚。所以,掌握運維知識體系架構就可以將問題搞清楚,就算自己搞不定,也可以說清楚,然而自己去找求資源,找到問題答案。
如果您在企業IT、網絡、通信行業的某一領域工作,并想把自己的想法或觀點分享出來,歡迎給企業網D1Net投稿,投稿郵箱:[email protected]