近日,Emulex聯(lián)合InfiniBand行業(yè)協(xié)會(InfiniBandTradeAssociation,IBTA),共同宣布推出了增強RoCE(RDMAover Converged Ethernet)規(guī)范,該規(guī)范將被稱為“RoCEv2”。RoCEv2在現(xiàn)有RoCE規(guī)范中添加的主要提升功能叫做可布線性(Routability),該功能可突破2層網(wǎng)絡(luò)邊界,并幫助企業(yè)通過RoCE在數(shù)據(jù)中心的任何位置實現(xiàn)應(yīng)用加速。利用這項創(chuàng)新,數(shù)據(jù)中心可以將RoCE的價值擴展到多個域和物理位置。
RDMA允許在兩臺服務(wù)器的內(nèi)存之間直接轉(zhuǎn)移數(shù)據(jù),而無需任何一臺服務(wù)器的CPU參與(也稱為零拷貝網(wǎng)絡(luò)),因此可實現(xiàn)更高效的通信。這種處理在支持RDMA的網(wǎng)絡(luò)接口卡(NetworkInterfaceCard,NIC)上進行,并且會避開TCP/IP堆棧,因而加快數(shù)據(jù)轉(zhuǎn)移。如此,就可以直接將數(shù)據(jù)傳送到目標服務(wù)器上的遠程內(nèi)存中,降低用于其他處理的服務(wù)器的CPUI/O工作負載。
雖然RDMA最初是InfiniBand網(wǎng)絡(luò)的一項功能,但許多年來,人們一直設(shè)法使以太網(wǎng)能夠支持RoCE。2010年推出的初始RoCE規(guī)范在以太網(wǎng)上實現(xiàn)了RDMA功能,但它卻需要無損網(wǎng)絡(luò),這限制了該功能的應(yīng)用范圍。目前,RoCE的主要用途之一是在WindowsServer2012上通過服務(wù)器消息塊(SMB)Direct實現(xiàn)高性能數(shù)據(jù)傳輸;同時,各種版本的Linux也支持該功能。RoCE的主要優(yōu)勢在于:由于它的延遲較低,因此可提高網(wǎng)絡(luò)利用率;同時它可避開TCP/IP并采用硬件卸載,因此CPU利用率也較低。此外,由于可以在單一線路上將服務(wù)器上的其他協(xié)議融合到網(wǎng)絡(luò)中,RoCE還進一步深化了線纜整合的概念。
但是,隨著虛擬化、云計算和分散式大數(shù)據(jù)存儲庫的持續(xù)增長,數(shù)據(jù)加速能力已經(jīng)成為全球數(shù)據(jù)中心共同面臨的問題,而不是僅局限于單一2層網(wǎng)絡(luò)的局部問題。利用可布線性,RoCEv2可填補這一差距,并跟上傳統(tǒng)本地化數(shù)據(jù)中心功能在整個數(shù)據(jù)中心內(nèi)的擴張步伐。為了實現(xiàn)上述目標,RoCEv2規(guī)范將用以太網(wǎng)鏈路層上的IP報頭和UDP報頭替代InfiniBand網(wǎng)絡(luò)層。這樣,就可以在基于IP的傳統(tǒng)路由器之間路由RoCE。下面的圖1和圖2顯示了協(xié)議堆棧比較和幀格式。
利用這項創(chuàng)新,整個業(yè)界就能夠滿足企業(yè)內(nèi)日益增長的高性能和橫向擴展架構(gòu)需求。從傳統(tǒng)企業(yè)(如華爾街銀行和超大規(guī)模云數(shù)據(jù)中心)到大型服務(wù)器和存儲OEM廠商,RoCEv2均可幫助其實現(xiàn)融合路徑的持續(xù)性并提供高度密集的數(shù)據(jù)中心。