隨著互聯(lián)網(wǎng)和云計(jì)算行業(yè)的快速發(fā)展,數(shù)據(jù)中心網(wǎng)絡(luò)的重要性前所未有的凸顯。展望2020年,數(shù)據(jù)中心網(wǎng)絡(luò)技術(shù)會(huì)有哪些熱點(diǎn)問(wèn)題受業(yè)界關(guān)注,面臨這些技術(shù)熱點(diǎn)問(wèn)題你會(huì)如何應(yīng)對(duì)?
熱點(diǎn)10:SDN的浪潮下,CLI/SNMP運(yùn)維管理方式是否會(huì)被淘汰?
上榜指數(shù):★★★☆☆
上榜原因:CLI/SNMP難以滿足大規(guī)模網(wǎng)絡(luò)運(yùn)營(yíng)管理的要求。
CLI命令行和SNMP簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議可以說(shuō)是和網(wǎng)絡(luò)設(shè)備歷史一樣悠久的古老運(yùn)維管理技術(shù)手段,特別是CLI敲打如飛一度是CTO(Chief Troubleshooting Officer)的體現(xiàn)。今天大部分企業(yè)的網(wǎng)絡(luò)運(yùn)維管理系統(tǒng)仍然依賴CLI和SNMP,然而CLI和大量SNMP MIB的私有性導(dǎo)致適配工作量很大,同時(shí)CLI和SNMP在大規(guī)模網(wǎng)絡(luò)場(chǎng)景下性能和實(shí)時(shí)性差、可靠性差的缺點(diǎn)也凸顯出來(lái)。
隨著Openflow、OVSDB、gRPC、Openconfig、RestAPI等技術(shù)手段的不斷出現(xiàn)和發(fā)展,預(yù)計(jì)2020年,Telemetry的訂閱和推送機(jī)制、RestAPI、Yang model數(shù)據(jù)結(jié)構(gòu)的組合也許會(huì)成為新一代數(shù)據(jù)中心網(wǎng)絡(luò)運(yùn)維管理系統(tǒng)的主流選擇,取代CLI/SNMP。
熱點(diǎn) 9:智能網(wǎng)卡發(fā)展迅猛,會(huì)取代現(xiàn)有服務(wù)器網(wǎng)卡嗎?
上榜指數(shù):★★★☆☆
上榜原因:網(wǎng)卡容易被忽視,但它的重要性日趨明顯。
過(guò)去的幾年中,網(wǎng)卡從千兆網(wǎng)卡變成萬(wàn)兆網(wǎng)卡,以及25G網(wǎng)卡,速率不斷提升,并且網(wǎng)卡還可以通過(guò)SRIOV、TSO等技術(shù)提供性能加速。然而,工程師們對(duì)網(wǎng)卡有更高的期望,比如將Open VSwitch、DPDK、Vxlan等軟件特性由網(wǎng)卡實(shí)現(xiàn),提高服務(wù)器網(wǎng)絡(luò)性能、降低時(shí)延、節(jié)約CPU。對(duì)公有云企業(yè)來(lái)說(shuō),一臺(tái)服務(wù)器只要能節(jié)約出一個(gè)CPU核,就可以在不長(zhǎng)時(shí)間內(nèi)把服務(wù)器智能網(wǎng)卡額外的成本收回來(lái)。
可以預(yù)計(jì),在2020年,智能網(wǎng)卡將會(huì)成為公有云服務(wù)器、網(wǎng)關(guān)類服務(wù)器、NVF服務(wù)器的標(biāo)配。
熱點(diǎn) 8:核心交換機(jī)功耗越來(lái)越高,你的機(jī)架電力和散熱還撐得住嗎?
上榜指數(shù):★★★☆☆
上榜原因:機(jī)架真的快撐不住了。
在萬(wàn)兆時(shí)代,一臺(tái)滿配36*40G線卡的16槽核心交換機(jī)需要10~12KW以上的機(jī)架電力支持;在25G時(shí)代,一臺(tái)滿配36*100G線卡的16槽核心交換機(jī)將這個(gè)數(shù)字提高到18~20KW;
在2020年的50G/100G時(shí)代,一臺(tái)滿配36*400G線卡的16槽核心交換機(jī)對(duì)機(jī)架電力的要求預(yù)計(jì)很可能會(huì)高達(dá)30~40KW。30~40KW的機(jī)架不僅電力改造的成本非常巨大,而且傳統(tǒng)風(fēng)冷散熱非常困難。
可以預(yù)計(jì),如果2020年IDC機(jī)架液冷散熱技術(shù)仍然不能大規(guī)模普及,核心交換機(jī)采用8槽甚至更小的機(jī)箱降低單機(jī)功耗是更為可行的選擇,代價(jià)是需要解決網(wǎng)絡(luò)核心設(shè)備數(shù)量大幅增加帶來(lái)的額外管理、架構(gòu)設(shè)計(jì)等問(wèn)題。你的網(wǎng)絡(luò)架構(gòu)做好準(zhǔn)備了嗎?
熱點(diǎn) 7:交換芯片體系架構(gòu),緩存會(huì)成為瓶頸嗎??
上榜指數(shù):★★★★☆
上榜原因:緩存對(duì)數(shù)據(jù)中心應(yīng)用的影響不可忽視。
大部分交換芯片的片上緩存都不大,一般都是幾十MB,比如Trident 2是12MB,Trident 3是32MB,甚至有些交換芯片按pipeline分割使用緩存。網(wǎng)絡(luò)端口速率從千兆發(fā)展萬(wàn)兆再到25G,服務(wù)器的全速率發(fā)送能力增加到25倍,交換芯片緩存與此同時(shí)僅增大為2~3倍左右。如果用同樣的全速率發(fā)送流量模型進(jìn)行測(cè)試,會(huì)發(fā)現(xiàn)25G網(wǎng)絡(luò)下多打一導(dǎo)致的Tcp incast現(xiàn)象比萬(wàn)兆網(wǎng)絡(luò)更加明顯,相應(yīng)的對(duì)業(yè)務(wù)和應(yīng)用的優(yōu)化要求或丟包率容忍度要求會(huì)更高。當(dāng)然,我們知道Tcp incast并不是通過(guò)緩存能夠避免發(fā)生的,相反過(guò)大的緩存還可能會(huì)導(dǎo)致網(wǎng)絡(luò)時(shí)延的大幅增加。
預(yù)計(jì)2020年,受制于時(shí)鐘、總線帶寬的能力緩存性能難以大幅提升,考慮到功耗、成本的平衡緩存容量也不會(huì)大幅增加,而我們可能要通過(guò)適度輕載、部署優(yōu)先級(jí)、端到端實(shí)時(shí)性流控等方式盡可能優(yōu)化對(duì)時(shí)延和丟包敏感的關(guān)鍵業(yè)務(wù)流量的性能,如RDMA流量。
熱點(diǎn) 6:可編程芯片,是否會(huì)廣泛應(yīng)用?
上榜指數(shù):★★★★☆
上榜原因:P4及可編程技術(shù)打開了網(wǎng)絡(luò)的另外一扇門。
長(zhǎng)久以來(lái),網(wǎng)絡(luò)工程師們面對(duì)的是功能固化的交換芯片,即便是openflow等SDN技術(shù),也只能在傳統(tǒng)轉(zhuǎn)發(fā)pipeline上通過(guò)ACL等表項(xiàng)模擬所需的轉(zhuǎn)發(fā)行為。然而以Barefoot等為代表的新一代可編程交換芯片提供了改變這一現(xiàn)狀的機(jī)會(huì)。這類芯片在提供同等轉(zhuǎn)發(fā)性能的同時(shí),可以讓網(wǎng)絡(luò)工程師對(duì)轉(zhuǎn)發(fā)Pipeline的部分行為進(jìn)行定制化設(shè)定。
然而,我們真的需要在線的交換機(jī)隨時(shí)可以通過(guò)芯片級(jí)編程來(lái)改變轉(zhuǎn)發(fā)行為嗎?似乎網(wǎng)絡(luò)工程師們還看不到這樣的迫切需求。但毫無(wú)疑問(wèn)的是,可編程芯片已經(jīng)為自定義INT(In-band Network Telemetry)、下一次支持類似vxlan封裝等這類場(chǎng)景做好了準(zhǔn)備。
可以預(yù)計(jì),2020年,會(huì)有很多網(wǎng)絡(luò)工程師利用可編程芯片驗(yàn)證新的類似INT的運(yùn)營(yíng)管理手段,驗(yàn)證vxlan、service chain、openflow等類似應(yīng)用,以便確定線上最終部署所需的芯片工作模式。至于最終線上部署的交換芯片是否應(yīng)該是可編程芯片,我的答案是,如果價(jià)格足夠便宜、穩(wěn)定性足夠高、性能足夠好,為什么不那?
更多前瞻網(wǎng)絡(luò)技術(shù)話題,請(qǐng)關(guān)注和參與8月22日2017開放數(shù)據(jù)中心峰會(huì)。
本文作者:楊志華,ODCC網(wǎng)絡(luò)工作組組長(zhǎng)、阿里巴巴資深網(wǎng)絡(luò)專家。