首先,全球數(shù)據(jù)中心數(shù)量減體量增,呈現(xiàn)出大型化、集約化的發(fā)展趨勢(shì)。超大規(guī)模的數(shù)據(jù)中心往往擁有數(shù)以百萬(wàn)級(jí)別的物理機(jī)和虛擬機(jī)節(jié)點(diǎn),這些節(jié)點(diǎn)會(huì)產(chǎn)生海量的網(wǎng)絡(luò)信息和數(shù)據(jù),同時(shí)業(yè)務(wù)的頻繁更新也使得網(wǎng)絡(luò)要不斷發(fā)生變化。
其次,云數(shù)據(jù)中心的網(wǎng)絡(luò)設(shè)備存在著諸多差異性,比如不同廠商設(shè)備、同一廠商不同型號(hào)、同一型號(hào)不同系統(tǒng)版本之間的差異等。網(wǎng)絡(luò)設(shè)備的差異性,最直接的體現(xiàn)就是網(wǎng)絡(luò)設(shè)備的配置方式難以統(tǒng)一,設(shè)備的運(yùn)維成本高,網(wǎng)絡(luò)排障定位時(shí)間長(zhǎng),網(wǎng)絡(luò)難以實(shí)現(xiàn)自動(dòng)化。
最后,承載業(yè)務(wù)的變化尤其是虛擬化技術(shù)的發(fā)展對(duì)數(shù)據(jù)中心網(wǎng)絡(luò)提出了更高的要求。傳統(tǒng)數(shù)據(jù)中心中接入、匯聚、核心劃分三層網(wǎng)絡(luò)架構(gòu)不再適用于東西向流量大幅增加的場(chǎng)景。同時(shí)5G、8K視頻等新業(yè)務(wù)對(duì)網(wǎng)絡(luò)設(shè)備的高帶寬、低時(shí)延、高可用、低成本提出了超高要求。
云數(shù)據(jù)中心面臨挑戰(zhàn),白盒交換機(jī)應(yīng)運(yùn)而生
面對(duì)云數(shù)據(jù)中心網(wǎng)絡(luò)的諸多挑戰(zhàn),在探索網(wǎng)絡(luò)演進(jìn)的過(guò)程中,SDN/ NFV等技術(shù)相繼出現(xiàn),白盒交換機(jī)(White Box)也進(jìn)入人們的視線,白盒交換機(jī)與傳統(tǒng)交換機(jī)的不同是白盒交換機(jī)采用開(kāi)放的架構(gòu)實(shí)現(xiàn)了交換機(jī)軟件與硬件的解耦,提高網(wǎng)絡(luò)開(kāi)放性,靈活性以及可編程能力。白盒交換機(jī)通常由ODM提供硬件,由用戶選擇自研或者第三方提供網(wǎng)絡(luò)操作系統(tǒng)(NOS)。通過(guò)白盒交換機(jī)可以對(duì)網(wǎng)絡(luò)控制應(yīng)用快速迭代,使用SDN的方式對(duì)網(wǎng)絡(luò)進(jìn)行深度優(yōu)化。
白盒交換機(jī)主要可分為支持OpenFlow協(xié)議的OpenFlow白盒交換機(jī)和裸白盒交換機(jī)。其中,OpenFlow白盒交換硬件開(kāi)放程度并不高,其網(wǎng)絡(luò)操作系統(tǒng)往往也被廠商綁定,相對(duì)比較封閉,該類交換機(jī)通過(guò)支持主流的OpenFlow協(xié)議如OpenFlow1.3版本,連接控制器實(shí)現(xiàn)SDN網(wǎng)絡(luò)的轉(zhuǎn)發(fā)與控制分離。OpenFlow交換機(jī)只負(fù)責(zé)根據(jù)OpenFlow流表進(jìn)行匹配轉(zhuǎn)發(fā),本身沒(méi)有控制功能,所以也可以被稱為白盒。
另外一種則是基于開(kāi)放硬件架構(gòu)的裸白盒交換機(jī),該類交換機(jī)符合OCP技術(shù)規(guī)范,提供基于ONIE的網(wǎng)絡(luò)操作系統(tǒng)安裝環(huán)境,可以部署各類開(kāi)源或者閉源的NOS。通常情況下該類交換機(jī)的硬件由ODM提供,軟件則可以根據(jù)具體場(chǎng)景需求在自研NOS、商業(yè)NOS以及開(kāi)源NOS中進(jìn)行靈活選擇。
白盒交換機(jī)硬件通過(guò)符合OCP(Open Computer Project)標(biāo)準(zhǔn)避免被少數(shù)廠家所壟斷。OCP是Facebook于2011年發(fā)起并主導(dǎo)的一個(gè)硬件開(kāi)源組織,致力于數(shù)據(jù)中心硬件設(shè)備的開(kāi)放標(biāo)準(zhǔn),目前OCP擁有超過(guò)200多家會(huì)員單位。OCP定義了交換機(jī)的硬件、芯片SAI以及開(kāi)放網(wǎng)絡(luò)安裝環(huán)境(ONIE)標(biāo)準(zhǔn)。ONIE類似于PC中的BIOS在白盒中用來(lái)加載NOS,芯片廠商如Barefoot、Broadcom等提供支持SAI接口的芯片,ODM廠商如廣達(dá)、智邦等通過(guò)加工支持ONIE標(biāo)準(zhǔn)的硬件交換機(jī)。軟件廠商或者交換機(jī)廠商開(kāi)發(fā)的交換機(jī)系統(tǒng)軟件能夠適配OCP硬件,就可以通過(guò)ONIE啟動(dòng)。
白盒交換機(jī)可以打破傳統(tǒng)NOS受到設(shè)備廠商綁定,比較封閉的局面。ODM廠商遵循了OCP硬件標(biāo)準(zhǔn),涌現(xiàn)出多種商業(yè)NOS和開(kāi)源NOS。網(wǎng)絡(luò)管理員通過(guò)NOS可以采用類似管理標(biāo)準(zhǔn)服務(wù)器一樣的方式管理白盒交換機(jī)。隨著SDN的高速發(fā)展,互聯(lián)網(wǎng)與運(yùn)營(yíng)商巨頭公司通過(guò)自研NOS并將其貢獻(xiàn)到開(kāi)源社區(qū)打造白盒生態(tài)圈,促進(jìn)整個(gè)產(chǎn)業(yè)的發(fā)展,比如微軟的SONiC、AT&T的DANOS等。
開(kāi)源與標(biāo)準(zhǔn)協(xié)同,自研NOS是關(guān)鍵
AT&T全球IP / MPLS網(wǎng)絡(luò)具有超過(guò)10萬(wàn)臺(tái)專有交換設(shè)備且流量仍然在不斷增長(zhǎng),年增長(zhǎng)率接近50%,面向5G AT&T計(jì)劃在宏網(wǎng)絡(luò)中部署超過(guò)6萬(wàn)臺(tái)白盒交換機(jī)。AT&T希望采用白盒交換機(jī)提高整個(gè)網(wǎng)絡(luò)的敏捷性,避免廠商鎖定并通過(guò)集群化部署減少開(kāi)支節(jié)約成本,其開(kāi)源主要策略體現(xiàn)在前期內(nèi)部開(kāi)發(fā),然后主導(dǎo)并加入開(kāi)源社區(qū),最后通過(guò)開(kāi)展廣泛合作促進(jìn)業(yè)界標(biāo)準(zhǔn)形成。
2017年11月AT&T推出分布式網(wǎng)絡(luò)操作系統(tǒng)dNOS開(kāi)放架構(gòu),并發(fā)布了dNOS白皮書(shū)。2018年3月AT&T宣布將其dNOS正式托管給Linux基金會(huì),改名為DANOS,從開(kāi)源社區(qū)中吸取養(yǎng)分,獲得相關(guān)社區(qū)的貢獻(xiàn),預(yù)計(jì)2018年底首次發(fā)布代碼。目前DANOS得到了各種Linux基金會(huì)團(tuán)體和成員的支持,包括博通、Inocybe、Metaswitch和Silicom等。DANOS主要是面對(duì)運(yùn)營(yíng)商網(wǎng)絡(luò)需求的場(chǎng)景,通過(guò)部署裝有DANOS操作系統(tǒng)的白盒交換機(jī)可以滿足客戶邊緣網(wǎng)絡(luò)(包括uCPE設(shè)備和小區(qū)站點(diǎn)路由器)、全局路由網(wǎng)絡(luò)(包括核心路由設(shè)備以及運(yùn)營(yíng)商邊緣PE設(shè)備)、本地路由網(wǎng)絡(luò)(包括spine-leaf網(wǎng)絡(luò)設(shè)備)等多個(gè)場(chǎng)景需求。
微軟在2015年發(fā)布了自研的白盒交換機(jī)網(wǎng)絡(luò)操作系統(tǒng)Azure Cloud Switch (ACS),并在2016年的OCP大會(huì)上將其開(kāi)源,命名為Software for Open Networking in the Cloud (SONiC)。SONiC基于微軟的交換機(jī)接口抽象(Switch Abstraction Interface,SAI),被多個(gè)芯片廠商的芯片平臺(tái)支持。SONiC是基于Linux的網(wǎng)絡(luò)操作系統(tǒng),并利用了容器化技術(shù),將各個(gè)網(wǎng)絡(luò)功能部署在容器當(dāng)中,實(shí)現(xiàn)網(wǎng)絡(luò)應(yīng)用的靈活性。SONiC的開(kāi)源使云服務(wù)運(yùn)營(yíng)商可以借鑒微軟在云數(shù)據(jù)中心網(wǎng)絡(luò)的經(jīng)驗(yàn),并利用其開(kāi)源的特性,開(kāi)發(fā)出針對(duì)性的網(wǎng)絡(luò)應(yīng)用。
目前SONiC和SAI已經(jīng)被眾多芯片廠商諸如Barefoot Networks、Broadcom Limited、Cavium、Mellanox Technologies等的ASICs芯片所支持。在國(guó)內(nèi),開(kāi)放數(shù)據(jù)中心委員會(huì)(ODCC)網(wǎng)絡(luò)工作組的鳳凰項(xiàng)目,也是依托SONiC開(kāi)源社區(qū),打造“白盒+開(kāi)源OS”的網(wǎng)絡(luò)生態(tài)。鳳凰項(xiàng)目通過(guò)選擇社區(qū)穩(wěn)定的SONiC版本軟件,發(fā)布開(kāi)源網(wǎng)絡(luò)OS發(fā)行版,已于今年9月份發(fā)布了V1.0正式版本。
開(kāi)源與標(biāo)準(zhǔn)相互協(xié)同已經(jīng)成為ICT產(chǎn)業(yè)生態(tài)的主流趨勢(shì),在白盒交換機(jī)領(lǐng)域也不例外,體現(xiàn)在軟件網(wǎng)絡(luò)操作系統(tǒng)開(kāi)源、硬件設(shè)備的標(biāo)準(zhǔn)化。開(kāi)源開(kāi)放的理念也在創(chuàng)新企業(yè)芯片廠商、ODM廠商、大型互聯(lián)網(wǎng)公司、運(yùn)營(yíng)商中形成了共識(shí)。活躍的開(kāi)源社區(qū)有利于技術(shù)的成熟與推廣,催生網(wǎng)絡(luò)創(chuàng)新應(yīng)用,縮短網(wǎng)絡(luò)開(kāi)發(fā)周期。符合統(tǒng)一標(biāo)準(zhǔn)的硬件設(shè)備有利于打破設(shè)備壟斷,簡(jiǎn)化管理員的操作,便于統(tǒng)一管理。當(dāng)前白盒交換機(jī)已經(jīng)在互聯(lián)網(wǎng)公司以及運(yùn)營(yíng)商網(wǎng)絡(luò)環(huán)境中逐步得到應(yīng)用,比如面向運(yùn)營(yíng)商場(chǎng)景的CORD平臺(tái)中Trellis項(xiàng)目等。
聯(lián)通積極推進(jìn)CORD,優(yōu)化網(wǎng)絡(luò)架構(gòu)
CORD(Central Office Re-architected as a Data center)是一個(gè)開(kāi)源平臺(tái),目標(biāo)是實(shí)現(xiàn)電信運(yùn)營(yíng)商CO傳統(tǒng)端局進(jìn)行類似云的DC化改造。CORD的場(chǎng)景主要分為家庭接入業(yè)務(wù)(R-CORD)、企業(yè)業(yè)務(wù)(E-CORD)和移動(dòng)業(yè)務(wù)(M-CORD)。中國(guó)聯(lián)通是E-CORD的主導(dǎo)運(yùn)營(yíng)商,積極推進(jìn)CORD在多個(gè)領(lǐng)域的研究和實(shí)踐。在CORD平臺(tái)中,采用Trellis子項(xiàng)目提供網(wǎng)絡(luò)服務(wù),Trellis項(xiàng)目采用支持OpenFlow協(xié)議的白盒交換機(jī)搭建spine-leaf的網(wǎng)絡(luò)模型,為CORD提供滿足收斂比的Underlay環(huán)境,同時(shí)采用了ONOS控制器對(duì)整個(gè)網(wǎng)絡(luò)進(jìn)行統(tǒng)一管理,為實(shí)現(xiàn)網(wǎng)絡(luò)虛擬化提供基于VxLAN的Overlay網(wǎng)絡(luò)。
使用傳統(tǒng)的方式構(gòu)建spine-leaf網(wǎng)絡(luò),其中的Underlay網(wǎng)絡(luò)需要依賴于在每個(gè)交換機(jī)上的復(fù)雜的控制協(xié)議(如BGP),交換機(jī)需要更強(qiáng)的CPU計(jì)算能力、內(nèi)存和復(fù)雜的軟件,這增加了成本并且很容易失敗。另外在Overlay網(wǎng)絡(luò)構(gòu)造在Underlay網(wǎng)絡(luò)上提供私有租戶能力,Overlay網(wǎng)絡(luò)完全依賴于Underlay網(wǎng)絡(luò)。這種架構(gòu)會(huì)在同一VTEP下不同VNI的虛擬機(jī)通信過(guò)程中產(chǎn)生發(fā)卡(hair-pin)流量,由此帶來(lái)不必要的網(wǎng)絡(luò)負(fù)擔(dān)。
Trellis項(xiàng)目通過(guò)采用SDN的方式可以有效解決使用傳統(tǒng)方式構(gòu)建leaf-spine帶來(lái)的問(wèn)題,具有下列特點(diǎn)。
一是簡(jiǎn)化了交換節(jié)點(diǎn),使得白盒交換機(jī)中不再需要復(fù)雜的交換機(jī)控制和路由協(xié)議;
二是簡(jiǎn)化網(wǎng)絡(luò)結(jié)構(gòu),為整個(gè)網(wǎng)絡(luò)創(chuàng)建一個(gè)單一的路由實(shí)例用于連接到外部網(wǎng)絡(luò);
三是Trellis為Overlay網(wǎng)絡(luò)對(duì)所有租戶提供分布式虛擬路由,使流量可以直達(dá)物理網(wǎng)絡(luò),避免虛擬網(wǎng)關(guān)的發(fā)卡(hair-pin)流量;
四是協(xié)調(diào)Underlay網(wǎng)絡(luò)與Overlay網(wǎng)絡(luò),優(yōu)化資源部署與連通性;
五是采用ECMP多路徑和SR路由提供細(xì)粒度的路徑選擇;
六是在每個(gè)服務(wù)器上集成軟件交換機(jī),為連接服務(wù)器、應(yīng)用程序、虛擬機(jī)、租戶動(dòng)態(tài)創(chuàng)建的容器提供完整的連接方案。
機(jī)遇與挑戰(zhàn)并存
電信運(yùn)營(yíng)商傳統(tǒng)網(wǎng)絡(luò)中網(wǎng)元封閉、資源難以共享,網(wǎng)絡(luò)建設(shè)周期長(zhǎng),隨著SDN、NFV以及云計(jì)算技術(shù)的出現(xiàn)和發(fā)展,電信運(yùn)營(yíng)商開(kāi)始尋求網(wǎng)絡(luò)轉(zhuǎn)型甚至重構(gòu)。白盒設(shè)備的出現(xiàn)對(duì)電信運(yùn)營(yíng)商網(wǎng)絡(luò)轉(zhuǎn)型至關(guān)重要,面對(duì)ICT融合的大趨勢(shì),電信運(yùn)營(yíng)商積極擁抱開(kāi)源開(kāi)放的白盒設(shè)備以構(gòu)建靈活、敏捷的基礎(chǔ)設(shè)施平臺(tái),有助于顯著降低企業(yè)的CAPEX與OPEX。
白盒交換機(jī)產(chǎn)業(yè)打造出當(dāng)前圍繞開(kāi)源軟件與標(biāo)準(zhǔn)硬件,各個(gè)芯片制造商、ODM廠商、軟件商以及用戶之間互相協(xié)同的生態(tài)圈。通過(guò)通用的硬件設(shè)備,消除對(duì)特定廠商的依賴,降低成本。通過(guò)開(kāi)放的軟件,增強(qiáng)網(wǎng)絡(luò)的靈活性、敏捷性。然而,白盒交換機(jī)仍然面臨著諸多挑戰(zhàn),比如網(wǎng)絡(luò)操作系統(tǒng)的開(kāi)發(fā)與維護(hù)需要投入大量的研發(fā)成本,目前交換機(jī)市場(chǎng)品牌機(jī)仍占據(jù)領(lǐng)導(dǎo)地位,如何向白盒設(shè)備轉(zhuǎn)變需要進(jìn)一步研究并經(jīng)過(guò)大量測(cè)試。