一、端到端萬兆網絡構筑高速大道
虛擬化給網絡帶來了性能挑戰,但提升網絡的整體性能需要有的放矢。首先需要明確網絡的瓶頸究竟在哪里。根據目前大量的案例和實踐總結分析,數據中心網絡主要面臨兩個瓶頸:一是數據中心的核心交換設備,它作為數據中心所有業務系統之間,以及業務系統和用戶之間的交換樞紐,將會是所有流量匯集的地方,所以網絡核心的性能壓力最大,是可能的瓶頸所在。另一個就是安全設備,安全設備的性能往往落后于網絡設備一個級數,而其在企業數據中心的部署又是必不可少的防護措施,所以如何突破安全的性能瓶頸至關重要。
網絡技術和數據中心的發展,同樣推動了數據中心級交換機的出現,目前數據中心級的核心交換機基于CLOS的多級交換架構,使其具備了10T以上的交換容量,能夠支持高密度的萬兆端口和未來的100GE標準,具有更好的擴展性,能夠很好的緩解數據中心網絡核心的交換壓力,解決核心網絡性能瓶頸。另一方面,雖然部門高端安全設備已經搭建在10G平臺之上,但依然不能滿足對其在性能上的高要求,所以目前最好的解決方法就是將萬兆的安全設備與網絡設備結合部署,通過在網絡設備中部署支持安全模塊實現性能累加,該方式在當前的數據中心建設中已經逐漸成為了主流方案,不但可以解決安全設備帶來的性能瓶頸,而且可以解決安全系統部署在可靠性上和空間上遇到的種種難題。
二、網絡虛擬化技術為虛擬機遷移鋪平道路
當虛擬機在物理服務器之間進行遷移,為了避免虛擬機遷移后路由的震蕩和修改網絡規劃,遷移只能在二層域進行,因此數據中心需要具備一個性能更高、二層域更大的網絡環境為遷移提供保障。在傳統的數據中心網絡中,都是通過STP+VRRP的方式進行網絡拓撲設計,但由于STP+VRRP的設計和維護都比較復雜,這種設計在很大程度上阻礙了其二層域的擴大,隨著服務器的數量和網絡設備的增多,這種網絡設計方式將會變得無法實施。同時,虛擬機的遷移對網絡的可用性要求也非常高,在STP+VRRP的組網中,如果鏈路出現故障,其收斂時間都在秒級,增加了應用系統遷移的限制。
以上問題可以通過網絡虛擬化技術來解決,在數據中心的應用中,網絡虛擬化主要是通過將多臺物理設備虛擬成一臺邏輯設備的方式,來減少設備節點,并通過跨設備鏈路聚合技術取代傳統部署方式中的STP+VRRP協議,使網絡拓撲變得簡潔,具備更強的擴展性,以滿足虛擬機遷移所需要構建的二層網絡環境,同時,其毫秒級的故障收斂時間,為虛擬機遷移提供了更加寬松的實現環境。
三 分布式緩存應對虛擬環境下的突發流量沖擊
絕大多數應用系統的流量模型都有一定周期性(即流量波峰的出現時間),就像乘坐電梯一樣,通常都是上下班時間客流最多,其他時間電梯基本處于空閑狀態。但突發流量已經成為了數據中心網絡系統面對的最棘手的問題之一,其難點在于業務的變化使得無法準確評估出其出現的峰值、精確的時間。服務器和存儲等設備實現虛擬化后,多個應用的疊加產生的突發流量就更加難以衡量和控制。所帶來的直接影響就是造成網絡擁塞,嚴重的甚至會導致業務中斷。
要解決這個問題,首先需要分析哪里會產生擁塞?網絡的擁塞只有兩種情況,一種是多個端口向一個端口發送數據的情況,另一種就是高速端口向低速端口發送數據的情況。找出擁塞節點并增加其帶寬,可以解決一部分問題,但是對于數據中心中復雜的業務模型和應用的變更而言并不適用,更加實際和行之有效的方法就是利用分布式緩存技術。所謂分布式緩存技術,主要是相對于傳統設備的出端口緩存技術而言的。傳統的網絡設備,緩存都是部署在設備的出端口,該技術可以緩解網絡中高速端口向低速端口發送數據時產生的擁塞,但是對于網絡中存在的多個端口向一個端口發送數據的情況卻是無能為力。分布式緩存通過對傳統的出端口緩存機制進行改良,將端口緩存置于入端口,這樣的實現方式可以靈活的根據入端口數量來動態的調整可用緩存的容量,可以很好的解決數據中心網絡環境中突發流量在上述兩種情況下帶來的網絡擁塞,提高業務連續性。
所以,在數據中心的網絡部署時,為了應對網絡核心處交互式流量的過載而產生的擁塞,需要在網絡的核心位置部署分布式緩存機制的數據中心設備;在接入層可以通過縮小收斂比來減少服務器上行流量帶來的沖擊,并要求網絡設備具備一定的緩存能力,來緩解下行流量對接入交換機的影響。