1.引言
眾所周知,云計算是近年來發展最快的互聯網技術,被稱為第四次IT革命。據權威機構預測,到2016年,2/3的IT應用服務將建立在云架構上 [1]。作為云計算核心的基礎承載設施,數據中心在網絡中所扮演的角色也愈加重要。目前,新一代的云數據中心正逐漸取代傳統數據中心,并成為互聯網業務和流量的主要源頭。在中國,工信部電信研究院發布的《2014年云計算白皮書》[2]顯示我國公共云服務市場仍處于低總量,高增長的產業初期階段。2013 年我國公共云服務市場規模已達47.6 億人民幣,增速36%,遠高于全球平均水平。
云計算市場旺盛需求,帶動了IDC產業的高速增長。對于通信運營商而言,IDC業務正逐漸成為其業務收入增長的新的重要源動力。2005-2012年間,中國IDC市場規模增長了6倍,且預計未來5年仍將保持25.5%的年均增長率[3]。
圖1 2011-2016年中國數據中心市場總體預測
為把握這一機遇,中國電信和中國聯通先后成立了專門運營云計算業務的云公司。中國移動也在多個省市開展云計算相關業務的試驗。可以預見,云計算業務將成為運營商未來業務增長、競爭的主要熱點之一。
2.現有數據中心組網現狀及問題
目前,國內主要運營商在全國已建有數百個數據中心,年收入達上百億元。但這些數據中心大多從數據機房演變而來,主要提供機架出租和主機托管等附加值較低的業務。與業界領先者相比,運營商IDC存在以下問題:
2.1 組網技術落后,擴展性受限。
虛擬機的大規模使用是云數據中心區別于傳統數據中心的一個最主要特點。由于虛擬機遷移要求,遷移前后的網絡要屬于同一個二層網絡。因此,新一代的數據中心組網技術如Trill、SPB等都專注于構建數據中心內部的大二層網絡。而運營商現有數據中心的網絡拓撲如下圖所示:
圖2 傳統數據中心網絡拓撲
其中,運營商只負責提供接入層以上的設備。租戶需要通過自備的網絡設備匯接其所有服務器,然后再通過配置靜態路由將流量導入接入層交換機。在路由協議配置上,接入交換機為二三層網絡分界線,接入層以上的設備運行三層網絡協議,包括ospf和BGP。在這種方式下,二層被限制在網絡邊緣。整個數據中心分割成相互獨立的多個煙囪式的業務網絡,極大的限制了虛擬機遷移的范圍和用戶網絡的擴展性。同時由于各業務網絡彼此隔離、無法復用,降低了網絡資源(如:接入帶寬和端口資源等)的利用效率。
2.2 運營模式粗放,業務開通速度慢。
業界領先的亞馬遜、阿里巴巴等互聯網公司已為客戶提供PaaS,SaaS等云服務,對用戶技術要求低,且業務開通僅需幾分鐘。而運營商數據中心機房目前還多以提供機房、機架出租等低附加值業務服務為主。用戶開通新業務需要通過提交申請、網絡劃分、逐臺設備配置等繁瑣的步驟,平均業務開通時間通常在幾周甚至幾個月左右。
2.3 高端資源不足,低端資源無法整合。
作為互聯網行業的基礎服務體系,數據中心站點正在向大規模、集群化方向發展。谷歌、微軟、騰訊等互聯網公司新建的數據中心站點都已擁有上萬臺物理服務器。國內調研數據顯示,2012年被調查IDC服務商機房擁有服務器數量在5000臺以上所占比例與2011年沒有多大變化;被調查IDC服務商機房擁有服務器數量在1000-3000臺的所占比例下降到23%,說明這兩年行業進行重組整合,較小的IDC服務商已經被重組或者淘汰[4]。
圖3 2012年中國IDC公司的機房服務器數量
而運營商現有的IDC機房中,五星級、四星級機房僅占20%左右。這無疑難以滿足用戶對資源需求的增長趨勢,不適于未來IDC業務的長期發展。同時,由于設備和組網技術的限制,無法將多個數據中心資源整合在同一個二層網絡中形成一個邏輯資源池。這樣,當面對網絡資源需求較大的用戶時,一方面各機房都無力單獨滿足用戶的使用規模需求;另一方面,大量資源被閑置、浪費的矛盾現象。
2.4 IDC資源利用率不均,分布不合理。
由于不同種類的業務對網絡時延的要求不同,各用戶對IDC機房地理位置的敏感度也存在差異。如提供頁面訪問業務的用戶,對機房位置的要求不太敏感;而金融和政府用戶則多要求部署在一、二線城市;中小用戶則要求就近部署在本地。
目前,運營商在一線城市機房的機架利用率和出口帶寬利用率也基本飽和。而三、四線城市機房的機架和帶寬利用率尚有可利用空間。但由于不支持虛擬化功能和統一的管理調度平臺,使得無法通過業務調度的方式,實現對現有網絡資源的整合。
2.5 缺乏多數據中心協作機制,難以發揮固網資源優勢。
目前運營商不同等級數據中心間缺乏協同工作機制與熱點流量推送機制;與Google,Facebook等公司的數據中心互聯模式相比,用戶體驗上還有差距。
此外,隨著云計算、移動互聯網和服務器虛擬化的大規模使用,對數據中心網絡提出了更高的要求:
(1)無阻塞網絡,并具備近似無限的高擴展性。
(2)能夠感知虛擬機,并支持虛機在單數據中心內部和多數據中心之間的漂移,并保證相關網絡策略隨之遷移。
(3)支持多業務、多租戶。能在同一物理網絡上,根據業務需求自由構建業務網絡并保證網絡安全性。
(4)網絡統一運維,高度自動化、智能化管理。
以上這些需求是現有的數據中心網絡難以實現的。
為滿足上述需求,業界主流廠家推出了一系列新的技術解決方案,如Trill、SPB、VEPA等。但這些技術都需要新的網絡硬件,即各級交換機設備。顯然,對于已建有數百數據中心的運營商而言,這一成本十分高昂,且是否值得也有待考驗。
此時,SDN和NFV技術的適時出現,為利用現有網絡設備,整合數據中心網絡資源,實現云化升級,提供一條解決思路。
3.SDN&NFV技術
SDN(Software Defined Network)即軟件定義網絡,它起源于美國斯坦福大學,是繼云計算之后,業界最關注的網絡新技術[5]。2012年,谷歌在其數據中心網絡上的成功應用SDN,標志著SDN進入到商用化階段。同時也使得數據中心成為業界公認的SDN技術應用的首選場景。
控制轉發分離、邏輯集中控制、開放可編程是SDN區別于傳統網絡的主要特征。正是這些特征使得SDN能夠良好的滿足數據中心網絡的使用需求。SDN 的控制轉發分離,為實現集中管理創造了條件。而管理集中化正是提高網絡管理和業務部署的自動化程度的必要前提。開放可編程接口則為將業務需求轉化為網絡需求提供了途徑。
目前,SDN有三種實現方案,即基于openflow協議的解決方案、基于overlay技術的解決方案和混合型解決方案。其中基于overlay 技術的解決方案是目前主流的發展趨勢。這種方案通過使用vxlan或nvgre等協議,在報文進入接入層設備前將二層報文封裝在三層報文中進行傳輸,最后在接收側解封裝還原二層報文。這樣就是實現了在三層網絡之上建立一張邏輯二層網絡的目的。該方案對承載網要求低,IP可達即可,不需要改變現有網絡架構和協議,具有良好的適用性。
NFV(Network FunctionVirtualization)即網絡功能虛擬化[6]。該技術源自于電信運營商,其的最終目標是以軟件方式虛擬化IT資源,讓虛擬化部署能夠提供重要的網絡功能,而不再需求專業的物理設備。這些虛擬設備在網絡中將像物理設備那樣工作,且無需特定設備即可實現多種專業功能。此外,由于 NFV可以采用虛擬機的方式提供,再結合SDN的流量控制功能,可以輕易實現功能網元的按需彈性部署及service chain功能。
SDN的集中管理控制與NFV的快速彈性部署相結合,構成了一條網絡硬件的通用性和軟件的開放性越來越高的發展道路。
4.云化演進方案
利用SDN技術和NFV技術,我們可以通過軟件方式實現對現有數據中心的云化升級,具體可分為以下幾個階段進行:
第一階段,對服務器實施虛擬化改造,并使用支持vxlan的開源OVS虛擬交換機構造大二層網絡。
圖4 傳統數據中心在服務器虛擬化改造后的效果
已有大量實踐證明,通過使用虛擬化技術可以將服務器的資源利用率提高30%以上。同時,由于將原來需要多臺服務器承載的業務集中到一臺服務器上的多臺虛擬機處理,大幅降低了所需服務器的數量。這樣也節省了網絡接口資源,使業務網絡實現“瘦”化,提高數據中心的整體承載能力。
同時由于使用了vxlan技術,使得不同的IDC站點只要IP可達,就可以在邏輯上構成大二層overlay網絡,從而實現整合多個數據中心網絡資源的目的,提高了資源利用率。且由于使用的是開源軟件,升級成本十分低廉。
第二階段,利用NFV技術提供防火墻、負載均衡、私有云等業務。
在傳統數據中心的組網方式下,為提供防火墻和負載均衡等增值業務,有兩種方式。一種是用戶自備相關硬件,串接或旁觀在其與接入交換機相連的網絡設備上。另一種則需要將相應的硬件旁掛在核心路由兩側,供所有業務共用。前一種方式,由于用戶網絡規模有限,容易導致資源浪費。后一種方式,難以針對具體各業務私網提供定制服務。
NFV技術出現后,通過在虛擬機上安裝防火墻、虛擬路由器等功能鏡像,實現了針對各業務網絡的資源彈性部署。在降低組網成本的同時,提高了服務種類、處理精度。
第三階段,增加controller,并通過controller與OVS和NFV管理平臺的對接實現對ovs和NFV設備的統一控制,提高業務的按需自動化彈性部署能力。
通過增加controller,并將其與OVS、NFV管理平臺實現對接。引入SDN集中控制功能,實現service chain的自動化部署,可以大大提高業務開通的自動化程度和速度。這里為了降低成本可以使用開源的controller,如opendaylight的產品——Hydrogen。
第四階段,當網絡規模和流量足夠大時,通過將現有接入交換機更換為支持vxlan封裝的交換機,提高業務處理能力。
由于OVS仍屬于軟件范疇,相對硬件存在性能瓶頸。在改造初期,由于運營商現有數據中心的網絡規模大多較小,對性能的要求也相對較低,OVS還能滿足使用需求。但隨著互聯數據中心站點數量的增加,對OVS的性能要求(如流表數量)也直線上升,其性能問題就可能成為業務發展的瓶頸。此時,原有的接入交換機已基本接近使用年限。可借助更換新型接入交換機的時機,將OVS對數據包的部分處理功能,如vxlan封裝,轉移到硬件的接入交換機側。從而降低OVS的性能壓力,滿足業務的使用需求。
通過以上幾個步驟,實現了在盡可能利舊現有網絡設備的情況下,用最小的代價完成傳統數據中心向云數據中心的升級。
結論
本文在分析數據中心發展趨勢和運營商數據中心現狀及問題的基礎上,結合SDN和NFV技術特點,提出了一種傳統數據中心向云數據中心的過渡方案。該方案為集團整合現有數據中心資源,發展云相關業務提供技術參考。