數(shù)據(jù)中心內(nèi)的數(shù)據(jù)流量及其支持的服務(wù)正在迅速增長(zhǎng)。就Google而言,其數(shù)據(jù)中心的帶寬需求每年大約翻番。為此,在硬件方面已經(jīng)取得了很大的進(jìn)步。交換機(jī)Tomahawk 4剛達(dá)到25.6兆位/秒。收發(fā)器技術(shù)最近又突破了400G。
到2021年,所有數(shù)據(jù)中心流量的大約95%將來(lái)自云端,并且在云應(yīng)用中,大多數(shù)數(shù)據(jù)包都在500字節(jié)以下。隨著尺寸變小,您需要更快地切換以匹配。不幸的是,網(wǎng)絡(luò)仍在等待延遲方面掙扎。
隨著數(shù)據(jù)中心系統(tǒng)的擴(kuò)展,使用中的電子分組交換網(wǎng)絡(luò)會(huì)遇到“長(zhǎng)尾延遲”,通常會(huì)達(dá)到數(shù)百毫秒甚至更長(zhǎng),比中位數(shù)值延遲值高幾個(gè)數(shù)量級(jí)。詳細(xì)說(shuō)來(lái),正常情況下,每100名用戶(hù)中有1名的等待時(shí)間達(dá)到峰值并不是問(wèn)題,但是當(dāng)1%的用戶(hù)變成數(shù)千名用戶(hù)時(shí),這將成為一個(gè)真正的問(wèn)題。
最近發(fā)布的名為PULSE的體系結(jié)構(gòu)提供了創(chuàng)新的解決方案。本杰明(Benjamin)等人設(shè)計(jì)了一種由分布式硬件調(diào)度程序控制的光電路交換網(wǎng)絡(luò)。在MATLAB上建模時(shí),該架構(gòu)的平均延遲約為1微秒,尾部延遲約為5微秒。當(dāng)考慮到調(diào)整開(kāi)銷(xiāo)時(shí),它的吞吐量是驚人的每秒25.6Pb,盡管瞬時(shí)節(jié)點(diǎn)到節(jié)點(diǎn)的限制是100Gbps。
這是通過(guò)網(wǎng)絡(luò)的一些關(guān)鍵功能來(lái)完成的。使用了平行星形耦合器,它允許光線(xiàn)從任何端口均等地傳輸?shù)剿衅渌B接的端口。每個(gè)機(jī)架有64個(gè)節(jié)點(diǎn),總共有64個(gè)機(jī)架,每個(gè)節(jié)點(diǎn)都有多個(gè)收發(fā)器以方便子網(wǎng)。每個(gè)收發(fā)器都通過(guò)不同的星形耦合器將其節(jié)點(diǎn)連接到不同的子網(wǎng)。
在數(shù)據(jù)傳輸期間,發(fā)射器和接收器被調(diào)諧到相同的時(shí)隙和波長(zhǎng)。因此,對(duì)于每個(gè)耦合器,在同一機(jī)架中都有一個(gè)對(duì)應(yīng)的節(jié)點(diǎn)調(diào)度程序,用于處理源-目標(biāo)機(jī)架對(duì)。此外,請(qǐng)求會(huì)提前幾個(gè)時(shí)期(周期持續(xù)時(shí)間)發(fā)送到調(diào)度程序。創(chuàng)新的調(diào)度算法為每個(gè)電路周期計(jì)算一個(gè)新的波長(zhǎng)。該架構(gòu)的關(guān)鍵特征是其納秒級(jí)電路的重新配置速度。
由于子網(wǎng)是完全獨(dú)立的,因此這種獨(dú)特的設(shè)置允許重復(fù)使用波長(zhǎng)。結(jié)果,該網(wǎng)絡(luò)可以支持超過(guò)25萬(wàn)個(gè)頻道。此外,該系統(tǒng)允許100%的波長(zhǎng)使用。此架構(gòu)不需要緩沖、尋址和網(wǎng)絡(luò)內(nèi)交換。但是,它確實(shí)需要極快的過(guò)濾、調(diào)度、數(shù)據(jù)恢復(fù)、可調(diào)波長(zhǎng)切換和同步。在這種布局下,節(jié)點(diǎn)可以有效地共享資源,并使瓶頸最小化。
令人驚訝的發(fā)現(xiàn)之一是,相對(duì)于當(dāng)前的網(wǎng)絡(luò)架構(gòu),其成本約為5美元 / Gbps,實(shí)際上具有很高的成本效益。為此,該網(wǎng)絡(luò)每位僅消耗82皮焦耳。收發(fā)器的成本在下降,這將進(jìn)一步使PULSE等系統(tǒng)受益。此外,在數(shù)據(jù)中心刷新周期內(nèi),僅需要升級(jí)終端節(jié)點(diǎn)收發(fā)器,從而可以節(jié)省更多成本。