DeepFlow助力地產企業統一管理5朵云 簡化混合云網絡監控
責任編輯:cres | 2020-08-31 15:40:54 本文摘自:互聯網
隨著企業對云的認識越來越成熟,行業云、私有云逐漸成為企業的選擇。“世界500強”某地產開發商對科技、互聯網的擁抱由來已久,早年便有向互聯網企業學習的歷史,CEO在一次演講中表示,企業向技術轉型是必然的趨勢,并于2016年啟動了“沃土計劃”,開啟了集團內部的一場信息化革命)。為保證沃土計劃的落地實施,地產開發商組建了自己的網絡科技全資子公司(以下簡稱“地產科技企業”)。
地產科技企業是向集團總部以及所有下屬子公司、相關聯公司提供IT規劃、開發和運營服務的IT服務提供商。在這樣的背景下,其IT建設迅速發展起來的。在轉型過程中,多元業務戰略對業務間整合、客戶資源打通、信息系統建設等也提出了更高的要求,集團總部希望自己扮演的角色是一個全新的生態構建者、連接者,采用“重服務,偏運營”的方式將產業上、下游的要素進行聚集,進而對產業鏈進行重構,形成新的生態系統。
2. 地產科技企業的多云戰略
據RightScale 2019年云狀態報告顯示,84%的企業采用了多云戰略。混合云的優勢在企業上云過程中愈發突顯,各大廠商也在混合云市場繼續發力使得多云管理、云網協同和安全方面的能力不斷提升,混合云在各個行業的應用越來越深入。在這樣的背景下,地產科技企業選擇了多云架構作為集團業務上云的基礎支撐。在不同階段分別上線了阿里公有云、微軟Azure公有云、華為公有云、VMware私有云、華為私有云共計5個云資源池平臺以滿足業務發展的需要。
2.1. 多云異構帶來的挑戰
與眾多企業一樣,虛擬網絡如何監控分析成為地產科技企業的新課題。這5朵云由于缺乏有效的虛擬網絡分析工具和手段,無法對其進行統一的管理,因此迫切希望構建統一的混合云管理平臺提高運營效率,以確保5朵云持續、高效、安全地運行。
業界已形成共識,針對傳統網絡的監控分析方法無法適應云時代的需求,目前地產科技企業的云平臺在虛擬網絡監控分析方面還存在一些空白。采用多云架構之后,云的管理團隊遇到了基礎設施資源池多樣化、異構資源池統一監控難、資源和服務的調配能力與效率低等困難。
2.2. 5朵云的統一流量管理
業界對于多云環境的統一網絡監控尚在探索之中。云杉網絡 DeepFlow® 獨有的采集器技術能夠同時運行在不同的資源池環境中,單臺控制器可以對接多個不同的云平臺和管理數千個采集器,從而實現多云異構環境下統一的網絡監控和分析,由此成為市場上能夠匹配地產科技企業的5朵不同云的最佳選擇。通過采用 DeepFlow® 方案,地產科技企業得以建設并實現如下目標:
東西向流量采集能力
針對5朵不同的云平臺,實現對部分直接在宿主機內部完成傳輸的東西向流量的采集,破除虛擬網絡帶來的黑盒效應。
全網可視化能力
實現包括虛擬網絡以及混合網絡中端到端的網絡可視化,生產網絡和業務網絡實時數據以及歷史網絡數據的可視化等。
基于租戶網絡的計量能力
通過對接云平臺及基于SDN的虛擬網絡,區分租戶網絡并實現對租戶網絡流量精確的采集、統計能力。
虛擬網絡異常感知能力
通過對虛擬網絡流量的分析,實現對業務網絡變更、網絡故障惡化、網絡異常的自動感知及告警能力。
3. DeepFlow® 解決方案
地產科技企業在經過反復調研和詳細溝通后,選擇了部署 DeepFlow® 虛擬網絡流量采集與分析系統軟件,以現有的5個云平臺網絡數據為核心,通過對其虛擬網絡流量進行采集和分析,實時監控云平臺網絡運行情況,保障網絡安全高效地運行。
3.1. 方案概述
在該項目建設中, DeepFlow® 平臺對接范圍包括阿里公有云、VMware、華為公有云、華為私有云、微軟公有云共5個平臺。通過部署DeepFlow® 采集器、控制器和數據節點三大組件,幫助地產科技企業在混合云環境中實現了虛擬網絡流量的統一采集和實時分析,實現對業務關鍵鏈路的全面性能監控,并提供虛擬網絡端到端的路徑診斷。
采集器運行于5朵云的計算節點,通過從控制器獲取ACL規則,提供對云環境中的網包數據完備的采集和預處理能力(如過濾、分發、Flow生成、Flow截取、脫敏等功能)可精細地實現對云網絡流量的采集和分析。
控制器組件以集群模式旁路部署在本地資源池的標準x86服務器中,提供5朵云的對接和全部采集器的管理以及采集策略的管理。數據節點部署方式和控制器相同,提供豐富的實時分析和回溯取證等功能,并根據項目規劃要求,支持橫向擴展。
3.2. 部署實施
在項目實施過程中,控制器和數據節點旁路部署在地產科技企業本地資源池的x86集群,控制器通過對接云平臺實現了虛擬機遷移感知,從而實現了采集策略的自動化跟隨;同時 DeepFlow® 擁有對自身系統的全面監控能力,以確保平臺穩定運行且不會對地產科技企業云環境造成影響。根據5朵不同云的技術差異,采集器組件在不同的云環境中,采取了如下部署方式:
在基于開源OpenStack云平臺環境(如華為私有云)中,采集器以用戶態進程的形式安裝在宿主機上,利用宿主機操作系統自身內核的功能模塊,對其虛擬網卡進行流量采集。
在VMware云平臺、微軟Hyper-V虛擬化環境和其他公有云中,通過在獨立虛擬機中安裝采集器的方式,借助宿主機或公有云操作系統自帶的虛擬交換機功能實現流量的采集。
3.2.1. 云網全景圖
地產科技企業云平臺對資源上下級的關聯展示有所缺失。例如網管平臺只有宿主機與虛擬機的信息關系,而云平臺又只有VPC、子網、虛擬機信息;當宿主機故障時,無法判斷影響了哪些客戶的哪些資源。借助 DeepFlow® 資源拓撲既能查看資源的所有云平臺信息、流量統計信息,又能根據不同視角來查看資源的關聯關系;例如VPC視角能將VPC關聯的虛擬網關、VPC所包含的子網、虛擬機、虛擬路由器、虛擬安全組、外網/內網IP等全部呈現。
現有的流量統計和管理工具中,基本具備對單資源點的監控,但多資源之間的流量走向關系卻不能直觀地可視化,因此則不能進行帶寬資源優化,也不能監控流量到底流向何方。借助 DeepFlow® 流量拓撲能力,云平臺的運營者不僅能從大范圍到小范圍層層深入揭示流量拓撲關系,也能窺見資源與資源之間、資源與Internet之間、資源與未知流量之間的關系。
3.2.2. 云網診斷
云時代東西向流量占比越來越大,虛擬網絡越來越得到重視,但虛擬網絡問題的定位還處在蠻荒期,多數場景下都是一邊人工查看配置信息,一邊找到對應設備,一邊導流量分析的狀態。云平臺運營者無法準確知曉業務部門提出來的帶寬需求是否合理;也不知道虛擬機的投放是否符合業務需求;不清楚東西向的流量與南北向流量的變化;難以區分哪些業務的流量產生了異常;不能預判活躍TCP端口是否有變化。
地產科技企業的5朵云不同程度地遇到了上述問題,要解決上述問題需要先解決東西向流量帶來的巨大壓力。DeepFlow® 依靠精準的流量預處理能力,從多資源維度、多租戶視角、多流量場景、任意時間粒度來統計與分析云網流量、包量,針對業務畫像梳理出來的業務做可視化監控。此外,DeepFlow® 提供了豐富的可自定義告警設置,通過對不同的云資源池、設定詳細的網絡性能監控指標和告警閾值,從而實現了快速發現和定位業務網絡異常;結合支持五元組采集過濾的PCAP下載功能,滿足了故障回溯取證的需求,覆蓋了故障事前預警和事后分析的全場景。
4. 價值總結
在不侵擾生產網絡、不影響業務連續性的前提下,DeepFlow® 通過與地產科技企業多云平臺的對接,在層次復雜的虛擬網絡環境中從服務和應用角度,梳理并監控業務網絡,通過對網絡指標的異常信息進行實時分析,為業務在虛擬網絡中的運行狀態提供及時的監控告警。地產科技企業通過部署 DeepFlow® 實現了異構云資源池虛擬網絡流量的按需采集、統一管理,解決了多云環境下虛擬流量的一體化管理和分析,為企業的業務整合、資源打通和基礎設施建設打下了堅實的基礎。
關鍵字:混合云