可視運維就是將種類繁多的信息源產生的大量數據,通過映射成幾何圖元,再描繪成圖形和圖像清晰直觀展現出來,可視運維提供了一種高效、一致性、透明化、面向用戶的服務。在數據中心里,可視運維可不是一個新概念,幾乎在數據中心誕生之初就有一些可視運維的技術和應用。比如:將網絡流量映射到監控大屏上,通過監控大屏可以看到各個網絡節點的流量轉發情況,一旦有不通的地方,就會有告警出現。將整個網絡結構圖呈現到監控大屏上,一旦哪個網絡設備失聯,大屏上就會顯示紅色,并有告警出現,這些都是可視運維的范疇。如今,可視運維被人推到風口浪尖上,成為非常火熱的一門技術,這是因為人們希望通過可視運維,可以做得更多,不再局限于以上簡單應用。
運維的工作在眾人眼里是一項投入沒有產出的工作,運維的方面投入越多,就會影響到數據中心的生產利潤。所以,運維的部門承擔了繁重工作,卻得不到足夠重視。很多時候是看到架構師在夸夸其談,暢想數據中心美好未來,給予這些建設者太多關注,其實真正實施時會遇到很多實際問題,這都需要運維的人員去擦屁股。可視運維就是運維者的機會,通過可視運維不僅能提升數據中心的生產效率,有隱患及時發現和消除,降低故障發生概率,還能給數據中心帶來利潤。可視運維可以極大降低數據中心在運維上的人力和資金投入,為數據中心節省了真金白銀。可視運維還能通過圖形或者數字的方式將數據中心的運行狀態和基礎架構呈現出來,供用戶觀察和選擇,讓數據中心在用戶面前不再是一座神秘的黑盒子,給了用戶以視覺上的感受和沖擊,吸引更多的用戶將其業務能夠部署到數據中心中來。可視運維還會將整個數據中心統計起來,讓數據中心認清自己的家底,哪里有不足和缺點,及時進行補充和更正。可視運維更像是數據中心的一面鏡子,鏡子擦得越亮,看得就更清楚,看清楚自己,很多時候人們就是看不清自己,所以可視對數據中心來說至關重要。
可視運維并不是那么美好,還存在很多問題。比如:很多時候網絡設備出現故障時,并不會所有業務都受影響,也許是一個端口,也許是一個IP,這時在網管監控的大屏上并不能顯示出設備故障,對于這類故障,現有的可視手段還無法甄別,仍然要靠流量統計或者鏡像等方式,逐臺設備去檢查,如此定位問題的時間會很長,尤其現在數據中心的網絡規模都很大,這種方式更加不可取,這時就要對數據流量進行可視。可以監控到網絡里每一條流量的轉發情況,如果有一條流出現問題,都立即可以可視出來,這是現在可視運維要追求的東西。再比如,要對整個數據中心的網絡流量進行統計,大數據分析,從而得出一定的規律,數據中心擁有海量數據,正是研究大數據的最好場所,通過數據分析就可能產生極大價值,為數據中心帶來額外的收入,這也是現在可視運維要做的。除了流量上的可視,還有機房環境、設備運行參數、歷史操作紀錄、功耗和溫度變化等等數據都要采集和可視出來。總之,只要有數據的地方,就要有可視,可視不僅要現實可見數據,還可以深入設備內部視察,將數據呈現出來。可視運維僅僅發現問題還不行,關鍵是要解決問題,所以可視運維還要引入執行動作,可以在發現問題時自動啟動修復模式,讓數據中心自動管理,這些都是現在的可視運維要解決的問題。傳統的可視運維視角太窄,并沒有給數據中心帶來太多的價值,更多是為人們提供一些監控數據而已,絕大部分時候人們還是要靠自己的經驗來分析問題,可視的運維帶來數據影響十分有限,必須做出改變。
正因為可視運維仍不完善,才要發展。現在的數據中心對可視化的要求越來越高,希望數據中心里的任何運動都要能夠圖像或數字化呈現出來,這給可視運維提供了機會,也帶來了挑戰。在BAT的數據中心里,如果你的網絡設備現在還不支持可視化,將不被考慮。支持可視化的程度直接決定了能夠在BAT的數據中心占用的份額,BAT對不支持可視化的設備有一票否決權。不僅是在BAT,在很多大型數據中心里都有新的可視化需求,傳統網管監控已無法滿足,這也催生了運維服務的市場,有不少軟件公司加入到可視運維中來,開發出一些對數據中心進行可視的專用軟件,向數據中心推薦使用。有些大型數據中心干脆自己做軟件,將可視運維集成到自己的私有云中,將整個數據中心運行狀態都在云上動態呈現,這對提升數據中心的運行效率極其有益,現在已經有不少的數據中心開始行動起來。
繁雜的運維事務不進一步封裝,對運維的人員來說,都意味著很高的學習成本和事務執行成本。運維的管理中監控、流程、自動化、運維大數據這幾個重要環節都少不了可視化呈現,才能降低運維成本。可視代表了運維,可視運維的實現程度高低,在一定程度上反映出我們對運維工作的理解程度。可視程度越高,運維也就越簡單,運維效率也就越高,間接地為數據中心創造了價值。現在的數據中心已經開始意識到這一點,在運維上,尤其是可視運維上舍得投入,與其所能帶來的益處相比,這些投入實在微不足道。不難預見,未來可視運維將得到更加重視,是數據中心高速發展的法寶,必須要掌握它。