數據中心網絡如何高效運維?這個問題經常困擾著數據中心的運維技術人員,運維技術人員疲于處理各種網絡故障、變更、檢查等事物,沒有時間學習新技術,網絡運維技術人員的工作往往做得非常辛苦,經常加班加點處理,然而問題似乎越是解決反而越多,陷于一個惡性循環,運維的人員不停地加班,問題不斷出現,不斷被解決,似乎永遠都有處理不完的事情。實際上,網絡運維也是一門學問,已經演化成為一門技術學科。有些人整天忙于處理這樣那樣的問題,但是數據中心網絡依然問題不斷,而有的人似乎整天也沒有很多事情,數據中心業務有條不紊地進行著,而兩個數據中心的設備組成幾乎一樣,這顯然就是運維的問題。并不是整天加班處理各種網絡問題的運維技術人員就值得表揚,要深入考慮下其運維的效率是否出了問題,怎么會有這樣無窮盡的問題,一點得不到收斂,所以高效運維的技術關注效果而不是過程,過程再辛苦沒有好的結果也是徒勞,高效的運維就是用最少的工作量換取最佳的網絡穩定運行,本文將談談如何進行網絡運維。
關于網絡運維的書籍也不少,有的從技術方面闡述,給出各種常用網絡設備的使用方法、維護技巧;而有的則側重從管理方面入手,強調對人、對設備的管理,通過完善的管理制度達到提升運維效率的目的。本文將根據這兩個方面,并結合多年親身的網絡運維經驗,給出一些網絡運維的思路,篇幅有限,本文不對具體技能做講述,而是提供一種運維的思想,希望可以對數據中心網絡運維技術人員的工作起到畫龍點睛的作用。首先,在做數據中心網絡運維前要做大量的準備工作。不管是新手還是老手,都需要對數據中心的網絡構成、業務走向、設備互連關系等了如指掌,這些數據要熟記于心。平時多看多記,將這些數據通過表格整理好,便于隨時查找,對于任何一次網絡變更都要做記錄,并及時更新這些數據,確保這些數據是準確的。常用的網絡操作命令要反復記憶,不同設備的命令千差萬別,無任何規律可言,沒有太好的辦法,只能死記硬背。如果遇到了突發故障,或者領導要求緊急變更一下網絡,這時還需要去查找各種網絡資料,對應用配置不熟練,這不是很好的運維技術人員。這一點說白了就是需要運維技術人員要能吃苦,要耐心,對數據中心網絡環境相當熟悉。我們知道領兵打仗就要對地形非常熟悉,網絡運維也是如此,要對整個數據中心網絡環境非常熟悉,將整張網絡都印到了腦海里,否則掌握再好的網絡技術也無的放失;其次,網絡技術是一個大染缸,僅網絡協議就有數百種,再加上不同網絡設備實現上的差異,一個人要掌握全部協議根本不可能。所以網絡運維技術人員一定要懂得抓“重點”,縱然有很多網絡協議,但是因為要適應各種各樣的場景,在一個特定的數據中心里一般只要兩三種網絡協議就夠了,所以只要將自己數據中心需要的網絡技術吃透、玩精通足矣。比如早期的數據中心網絡基本靠OSPF、BGP、VRRP、LACP幾大網絡協議運轉,掌握這幾種協議就可以吃遍天下的數據中心。如今,數據中心技術也在不斷發展,VXLAN、TRILL、虛擬化等技術都涌現出來,掌握了這些新技術依然可以讓數據中心充滿活力,所以數據中心網絡技術人員一定要以自己的數據中心為基礎,吃透自己數據中心所用到的各種網絡協議技術,不管哪種協議出了問題,都能按照自己的理解去排查問題,有一套應對的措施,而不是亂做一團,不知所措;第三,數據中心與網絡設備商關系非常重要,數據中心運維技術人員對網絡技術再精通,也無法了解到網絡設備內部的實現,很多時候都需要設備商來分析問題,給出答案,所以要善于與網絡設備商打交道。作為甲方,運維技術人員有權力向網絡設備商獲取關于設備內部各種功能實現、配置手冊、操作手冊等資料,有了設備和資料,一定要認真學習,有疑問的地方及時向設備商人員咨詢。當然設備商也會考慮自己的利益,服務也是要占用成本支出的,為了能獲得更好的服務,數據中心也應該適當地購買一些服務,比如設備巡檢服務、維保服務、原廠工程師駐地服務等,購買這些服務的好處就是可以得到及時的技術交流。在出現一些重大網絡問題時,可以得到設備原廠工程師的積極響應,并幫助數據中心迅速恢復業務;最后,數據中心網絡不是靜止的,一成不變的,網絡技術也在不斷地更新與發展。現在的網絡設備和電腦一樣,過不了三年就面臨著淘汰,所以數據中心要想不斷進步,就需要掌握新技術,學習新知識。作為網絡技術人員,要有全球化的視野,掌握世界最新數據中心網絡技術動態,每一個數據中心都有著自己這樣那樣的問題,很多問題都要未來的新技術來解決。為了提升數據中心的競爭力,引入新的網絡技術是一個重要手段,所以網絡技術人員應該多出去走走,向周圍優秀的數據中心學習,與數據中心運維技術人員進行多交流,雖然可能不是同一個數據中心的,但時常也會面臨相同的問題。現在每年都有數據中心論壇、數據中心各種技術研討會、數據中心聯盟等各種會議,經常參加這樣的會議,可以擴大自己的視野,也可以在這里找到解決自己數據中心問題的方案。總之,數據中心運維技術人員要多看、多學。
數據中心網絡運維一指禪,對如何進行高效運維給了幾點思路,這里并沒有詳細地去告訴您具體維護的知識,只是給了學習的方向。不過有了正確的方向是最為關鍵的,因為一旦走錯了方向,那之后再努力也是徒勞的。