隨著互聯網和云計算行業的快速發展,數據中心網絡的重要性前所未有的凸顯。展望2020年,數據中心網絡技術會有哪些熱點問題受業界關注,面臨這些技術熱點問題你會如何應對?
熱點5: 下一代數據中心主干以太網演進,200G or 400G?
上榜指數:★★★★☆
上榜原因:大家都在等米下鍋。
如果說從2016年開始的大規模數據中心主干網絡升級的浪潮是從40G升級到100G,那么2020年的下一代升級浪潮應該是怎么樣的?業界因此有200G和400G兩種路線。
圖1 以太網標準進展(來源:Ethernet Alliance)
200G的優勢是所需的QSFP及50G Serdes均已成熟商用,缺點是相對100G的每G帶寬成本降低幅度不算太大;400G正好相反,預期的每G帶寬成本下降幅度足夠大,但需要QSFP搭載100G Serdes,或8通道的新標準(如OSFP、QSFP-DD)搭載50G Serdes,而100G Serdes、OSFP、QSFP-DD商用時間預計都要在2018年以后。
根據Google、Facebook等披露的數據,這些互聯網巨頭數據中心內部流量每年增長幅度接近100%,那么,部署100G較早的少數互聯網巨頭,比如Google,很可能會謀求盡快獲得200G,而其它企業則可以選擇跳過200G等待400G獲得更好的性價比。IEEE的400G以太網標準預計2017年完成,而200G以太網標準預計2018~2019年完成,也許也反應了業界大部分企業的心態——更看好400G。
考慮到即便只有Google采用200G也會有足夠的市場影響力,可以預計,2020年200G和400G均商用就緒,但400G會更加主流,性價比更優。
熱點4: 400G數據中心網絡,光纖選多模還是單模?
上榜指數:★★★★☆
上榜原因:多模和單模一直是一道沒有標準答案的選擇題
數據中心集群內布線選擇多模光纖還是單模光纖一直是一個業界在討論的話題,各大玩家也各有選擇,比如100G時代,Facebook選擇單模,Google選擇多模和單模同時部署,BAT則選擇多模。
從成本角度,多模光纖貴但多模光模塊便宜,單模光纖便宜而單模光模塊貴,因此很容易將光纖和光模塊成本進行組合評估,得出距離和成本的關系。比如100G,光纖距離在100米以內時多模解決方案的成本優勢非常明顯。
從技術角度,傳統上多模解決方案代表光纖并行方向,單模解決方案代表波長復用方向(PSM4是個新的方向,單模并行)。40G和100G時代這兩種解決方案分別在短距和中長距場景各有千秋相安無事共同發展。然而400G時代情況有了變化,并行技術路線似乎在400G時代觸碰到了天花板。
并行技術路線的特點是每一對多模光纖分別承載一路光信號。目前IEEE的400G SR16標準是16*25G并行方案,需要16對多模光纖,遠遠超過100G時代廣泛使用的12芯MPO,會導致成本大幅上升;更重要的是,多模光模塊所依賴的低成本VCSEL光芯片方案,2020年很可能仍然只能提供每路50G的能力,400G SR8的8*50G方案仍然需要超過12芯MPO的8對多模光纖。現有的12芯MPO能夠容納的400G SR4看上去遙遙無期。
圖2 400G網絡技術演講(紅色部分為IEEE 802.3bs baseline規定)
多模實際上也可以有波長復用解決方案。目前的一些私有技術,如SWDM,可以實現一對多模光纖上4路光信號的傳輸。但私有技術封閉性導致的光模塊互通性問題和成本的提升,是這類解決方案大規模普遍應用難以逾越的大山。
因此在2020年,如果沒有開放且標準化的多模波長復用技術出現,低成本VCSEL 100G技術也不能取得突破,400G多模光纖解決方案成本優勢將不再明顯,單模光纖在大規模數據中心也許將成為主流,而中短距的單模并行解決方案也許會是替代多模并行解決方案的高性價比選擇。
擁有多模波分復用私有技術的玩家,會為了避免400G多模解決方案的困境彼此妥協形成一個統一的標準嗎?讓我們拭目以待。
熱點3: 數據中心400G光模塊封裝,OSFP、QSFP-DD該如何選擇?
上榜指數:★★★★★
上榜原因:。一個小小的封裝問題,牽動多少網絡大咖的心。
歷史上光模塊封裝一直有多個標準并行,但像OSFP、QSFP-DD這樣如此受到關注的卻不多見。400G光模塊封裝目前有多個標準,除了OSFP、QSFP-DD外還包括CFP8、CDFP等,其中OSFP、QSFP-DD是面向數據中心數通網絡的兩個標準。
OSFP和QSFP-DD的共同點是都將QSFP的4通道擴展為8通道,8*50G的支持來實現400G,未來還可以通過8*100G實現800G。
OSFP的優勢是體積大散熱好工程實現相對容易,外加有Google的加持,缺點是1U面板的尺寸基本只能做32*400G。OSFP預計2018年商用
QSFP-DD的優勢是1U面板可以做到36*400G的密度,并且對QSFP前向和后向兼容,可兼容現有的QSFP28光模塊及AOC/DAC等,缺點是尺寸較緊湊對設計和散熱有更高要求(之前QSFP-DD的散熱方面認為有較大局限,但現在也可以做到12W不再是瓶頸)。QSFP-DD得到Facebook的公開支持。從OFC 2017來看,QSFP-DD得到業界越來越多的支持。QSFP-DD預計2019年商用。
圖3 QSFP-DD與QSFP對比
預計2020年,很多交換機、光模塊廠商都會同時支持兩種封裝,但QSFP-DD攜更高端口密度和前后向兼容性的優勢很可能會成為市場主流。
熱點2: 數據中心框式交換機,體系架構會如何變化?
上榜指數:★★★★★
上榜原因:昂貴而復雜的東西,天然會留下被顛覆的空間。
長久以來,框式交換機的軟硬件設計復雜,產品研發周期長,成本高昂,強烈依賴特定芯片。基于類似信元的內部轉發、大片外緩存、N+1交換矩陣冗余等都是框式交換機給人留下的特有印象。
OCP的6-Pack、Backpack的發布給業界展示了互聯網巨頭們一直在嘗試的另外的方向。Backpack采用100G以太網互聯的CLOS架構,使用Tomahawk這樣主要用于TOR的芯片而不是傳統的Dune芯片,交換矩陣無N+1冗余,實際上它們就可以看作是用一堆Wedge接入交換機像樂高積木那樣搭建起來的。
圖4 Backpack G4前視效果圖(來源Backpack_OCP_Spec_V1.10)
圖5 Backpack G4線卡與矩陣互聯架構(來源Backpack_OCP_Spec_V1.10)
從數據中心應用場景來看,不依賴特定交換芯片的以太網架構比信元架構轉發效率雖然要低10%左右但成本可以大幅降低,流數量巨大且不是同步突發、端口速率一致匹配、收斂比設計合理時對緩存要求會降低,交換矩陣無N+1冗余可以進一步降低成本。
當然,6-Pack、Backpack這樣的框式交換機每一塊線卡、交換矩陣等在管理層面實際上是獨立的一臺臺交換機,對網絡運維管理能力要求很高,實際上是以強大的架構、研發和運維能力換取成本收益。所以,是否能夠仍然作為一個管理節點進行管理對大部分用戶來說會是一個重要考量點。實際上,已經有OEM廠商開始嘗試推出類似這樣架構但仍然是一個管理節點的框式交換機產品,體系架構改變帶來的成本明顯優勢大大提升了其產品在市場上的競爭力。
可以預計,2020年,適用于大規模數據中心框式交換機的體系架構將會趨向400G以太網CLOS架構,不使用片外擴展緩存,采用和TOR一致的交換芯片種類,而且極可能取消N+1冗余交換矩陣換取更低的成本。
熱點1: 數據中心白盒交換機+開源OS的模式是否會大行其道?
上榜指數:★★★★★
上榜原因:白盒,想說愛你不容易。
白盒交換機很容易獲得,但搭載的交換機OS卻是一個難題。如果沒有很大的網絡規模和足夠的決心,單一用戶難以承受獨立進行自有交換機OS研發的長期投入成本和研發節奏。因此,大家都期盼能有一個好用的數據中心開源交換機OS。
然而開源交換機OS也不容易。首先,從社區運作角度,如果沒有用戶主導方向、用戶自己投入研發資源,僅依靠商業廠商,社區難以持久有效的運作;其次,需要有一個良好的軟件架構,具備良好擴展性可以支持未來SDN網絡的發展,同時模塊之間可以松耦合便于不同用戶的研發協同;再次,需要輕量專注,僅研發數據中心網絡必須的特性;最后,需要有同步發展和包容的生態,借助更多的用戶、芯片廠商、ODM/OEM、服務商等的有效參與,活躍相關的研發、部署、推廣。Linux、Openstack、Ceph等均是開源社區成功運作的典范。
目前,開源交換機OS的典型代表是SONiC,SONiC開源社區已經有一個良好的起步,然而還任重道遠。1.0天使階段,開源社區需要依靠有實力的社區成員共同投入較多研發資源獲得一個可用的版本并在社區成員的數據中心網絡規模部署完成驗證;2.0發展階段,更多的有一定研發能力的較大網絡規模用戶開始加入并嘗試使用,版本日趨完善和成熟;3.0普惠階段,大量普通用戶開始直接使用,眾多服務商可以提供白盒+開源OS的部署和運維服務。
可以樂觀的預計,2020年,開源OS社區將發展到2.0階段后期,白盒交換機市場將迎來井噴式發展,白盒交換機+開源OS將成為很多企業CTO/CIO的選項之一。
更多前瞻網絡技術話題和干貨,請關注并參與8月22日ODCC 2017峰會。
本文作者:楊志華,ODCC網絡工作組組長、阿里巴巴資深網絡專家