“黑洞”能量巨大,連光線也沒有辦法掙脫,人們沒有辦法了解“黑洞”內(nèi)部的情況。以往企業(yè)信息化應(yīng)用中,運(yùn)營商網(wǎng)絡(luò)被稱為“黑洞”,用戶數(shù)據(jù)信息從一側(cè)進(jìn)入,從另外一側(cè)出來,中間歷程不可見,因此也談不上有效管控。
針對廣域網(wǎng)“黑洞”,需要運(yùn)營商網(wǎng)絡(luò)進(jìn)一步開放。但對于數(shù)據(jù)中心云網(wǎng)絡(luò),特別是混合云、容器環(huán)境網(wǎng)絡(luò)監(jiān)控的 “黑盒”,對于用戶來說,則完全不可接受。因?yàn)橛行ПO(jiān)控管理手段的缺失,一來影響可靠性,二來會帶來嚴(yán)重的安全隱患。
NPM面臨新問題
談到網(wǎng)絡(luò)有效監(jiān)控,很容易想到NPM(Network Performance Management 網(wǎng)絡(luò)性能管理)技術(shù),它將端到端業(yè)務(wù)和應(yīng)用在交互的可見性與網(wǎng)絡(luò)行為分析相結(jié)合,來解決網(wǎng)絡(luò)運(yùn)維管理方面難以發(fā)現(xiàn)、定位和診斷故障的挑戰(zhàn)。NPM可以分析應(yīng)用每一跳路徑上TCP或更高層面的網(wǎng)絡(luò)行為,或者某個核心節(jié)點(diǎn)上的所有基于諸如TCP等傳輸層協(xié)議的應(yīng)用行為,在出現(xiàn)故障的時候及時發(fā)現(xiàn)和定位問題,但NPM并不涉及到應(yīng)用會話的各種細(xì)節(jié)狀態(tài),要進(jìn)行這類分析需要借助APM(Application Performance Management 應(yīng)用性能管理)。
但是老革命遇上新問題,如今混合云、容器應(yīng)用蓬勃發(fā)展,NPM也面臨失效的問題。
首先傳統(tǒng)網(wǎng)絡(luò)應(yīng)用環(huán)境,通過物理設(shè)備MAC、IP地址進(jìn)行管理,物理設(shè)備邊界、邏輯應(yīng)用邊界清晰。但是虛擬化、容器應(yīng)用讓情況發(fā)生了改變。首先是需要監(jiān)控設(shè)備數(shù)量激增,虛擬化+容器應(yīng)用,特別是輕量級的容器應(yīng)用,需要管理的設(shè)備數(shù)量增加了至少100倍;二來虛擬機(jī)漂移,以及容器間的微服務(wù)化調(diào)用沒有辦法借助物理Mac地址、IP地址進(jìn)行標(biāo)記,從而讓物理設(shè)備、應(yīng)用邏輯邊界變得模糊不清。
在混合云、容器網(wǎng)絡(luò)環(huán)境下,NPM束手無策。
有數(shù)據(jù)表明,如今有狀態(tài)應(yīng)用已經(jīng)占到容器應(yīng)用市場的50%,其中類似MySQL、PostgreSQL、MangoDB、RabbitMQ、ElasticSearch等類型的應(yīng)用,大多屬于關(guān)鍵業(yè)務(wù)應(yīng)用,有效網(wǎng)絡(luò)監(jiān)控手段的缺失變得無法容忍,也沒有辦法適用容器微服務(wù)化應(yīng)用趨勢發(fā)展的需要。
云杉網(wǎng)絡(luò)領(lǐng)先一步
云杉網(wǎng)絡(luò)是SDN((Software Defined Network,軟件定義網(wǎng)絡(luò))實(shí)踐創(chuàng)新企業(yè),成立于2011年12月,專注于數(shù)據(jù)中心虛擬網(wǎng)絡(luò)監(jiān)、管、控方案及SDN軟件產(chǎn)品的研發(fā),針對混合云、容器網(wǎng)絡(luò)監(jiān)控存在的問題,云杉網(wǎng)絡(luò)的核心產(chǎn)品DeepFlow云網(wǎng)分析平臺增加了創(chuàng)新技術(shù)支持,讓陽光照亮了混合云、容器網(wǎng)絡(luò)監(jiān)控管理。
云杉網(wǎng)絡(luò)DeepFlow由采集器、控制器、數(shù)據(jù)節(jié)點(diǎn)組成,屬一體化網(wǎng)絡(luò)流量采集、分發(fā)和分析平臺,它以SDN技術(shù)為核心,基于x86集群和通用網(wǎng)絡(luò)設(shè)備,為多云、容器環(huán)境提供的一體化網(wǎng)絡(luò)監(jiān)控解決方案。
與傳統(tǒng)NPM所采用的Sidecar、SDK方案不同,DeepFlow采集組件不侵入業(yè)務(wù),僅以消耗算力1%、網(wǎng)絡(luò)帶寬0.01%代價,就實(shí)現(xiàn)了對于網(wǎng)絡(luò)、系統(tǒng)、應(yīng)用數(shù)據(jù)的全面采集,其效率10倍于傳統(tǒng)的方式。DeepFlow采用分布式架構(gòu),可以同步10萬數(shù)量級的計(jì)算節(jié)點(diǎn)集群,可以管理10萬個采集器,已經(jīng)能夠滿足現(xiàn)有應(yīng)用的極致需求,與此同時,DeepFlow為未來發(fā)展預(yù)留了橫向擴(kuò)展的空間,從而實(shí)現(xiàn)了組件的云原生化部署。
DeepFlow性能和架構(gòu)設(shè)計(jì),讓它足以應(yīng)對虛擬化、容器化應(yīng)用所帶來的監(jiān)控設(shè)備指數(shù)級的增長。針對虛擬機(jī)漂移、容器微服務(wù)化所帶來物理邊界消失,以及數(shù)據(jù)中臺應(yīng)用訪問、微服務(wù)化調(diào)用帶來業(yè)務(wù)邏輯混亂,DeepFlow打通了與SDN、NFV等overlay邏輯網(wǎng)絡(luò)管理、以及虛擬化管理平臺、容器管理平臺的信息調(diào)用,從而實(shí)現(xiàn)了混合云環(huán)境中的容器網(wǎng)絡(luò)監(jiān)控。
DeepFlow提供了分析工具,也提供了知識圖譜工具,可對吞吐量、時延、異常、傳輸狀態(tài)等網(wǎng)絡(luò)性能指標(biāo)進(jìn)行分析,可將網(wǎng)絡(luò)分布、訪問關(guān)聯(lián)、對比及回溯等信息有機(jī)地整合在一起,再清晰展現(xiàn)在運(yùn)維管理人員面前。
DeepFlow提供了分布式網(wǎng)絡(luò)時序數(shù)據(jù)庫服務(wù),在滿足快速寫入、數(shù)據(jù)持久化的同時,不斷優(yōu)化多維度的聚合查詢能力。不同角色用戶可以在核心視圖的基礎(chǔ)上,定制自己更關(guān)心的監(jiān)控面板并設(shè)置告警策略。
不僅如此,為滿足一次采集,多處分析的應(yīng)用需要,DeepFlow對信息采集與分析工具進(jìn)行了解耦,在滿足全景視圖、訪問路徑、依賴關(guān)系等網(wǎng)絡(luò)分析工具需要的同時,為更加上層業(yè)務(wù)應(yīng)用數(shù)據(jù)分析的需要提供了數(shù)據(jù)標(biāo)準(zhǔn)訪問接口。
總之,簡單說一句話:DeepFlow讓混合云、容器網(wǎng)絡(luò)監(jiān)控變得清晰透明,讓“黑盒”現(xiàn)象一去不復(fù)返!
小結(jié)
工欲善其事,必先利其器,很難想象,在容器化普遍應(yīng)用的今天,網(wǎng)絡(luò)監(jiān)管手段缺失,不僅容器之間的微服務(wù)化調(diào)度不可見,更加可怕的是:容器重建,虛擬機(jī)漂移使得網(wǎng)絡(luò)隔離手段失效,嚴(yán)重地威脅到業(yè)務(wù)應(yīng)用的安全。因此混合云、容器環(huán)境網(wǎng)絡(luò)監(jiān)控不僅是運(yùn)維管理的需要,更是精細(xì)化運(yùn)營,安全合規(guī)的需要。
從這個意義上說,以云杉網(wǎng)絡(luò)DeepFlow為代表的新一代網(wǎng)絡(luò)監(jiān)控管理工具,是云原生應(yīng)用時代用戶必須配備的手段,不可或缺!對此,您已經(jīng)充分意識到了嗎?!