模塊化數據中心以其易部署、低成本等優勢正日益獲得關注,但是當成千上百臺服務器以模塊化形式連接在一起時,保障網絡的可靠和安全就成為重中之重。
一種復雜的網絡結構設計方法有望幫助大型數據中心的運營人員應對硬件故障,并且讓他們得以購買不大昂貴的IT設備。許多公司試圖把多個數據中心連接起來時,一些網絡問題會隨之出現;中國國防科技大學一名攻讀博士學位的中國學生試圖解決這些問題。
這種方法試圖為由多套1000至2000臺服務器模塊組成的數據中心確保擁有可靠的網絡性能——這些數據中心相互連接起來,組成所謂的“特大數據中心”。哪怕萬一出現多個硬件故障,這種方法也讓分布式應用軟件可以保持性能。
集裝箱式數據中心可能會帶來網絡問題,于是一名中國研究人員在著手解決這些問題。
在一篇題為《SCautz:一種面向模塊化數據中心的容錯網絡架構》的論文中,首席研究員Feng Huang撰文道,由于云計算提供商看到自己管理的IT系統數量不斷增加,于是求助于這種方法:把設備塞入到貨運集裝箱中,然后把這些集裝箱連接起來。雖然谷歌和亞馬遜網絡服務公司等許多云計算公司采用了這種方法,但是Huang認為,集裝箱之間的網絡性能一旦受到限制,都會給數據中心設施帶來巨大的影響。
Huang撰文道:“作為模塊化數據中心(MDC)的關鍵部件,模塊化數據中心網絡(MDCN)不完整的結構應該盡力保持網絡性能。最重要的問題是,MDCN的性能必須比MDC的計算和存儲部件更平穩地退化,以便不至于成為致命的薄弱環節,從而使集裝箱的總體性能提前低于閾值標準。”
細述SCautz方法
為了處理這個問題,Huang及其團隊想出了一種新的網絡結構設計方法,名為“SCautz”。
SCautz讓服務器可以執行網絡交換機的許多典型功能,讓實際的交換機專門負責集裝箱之間的數據傳輸。這種方法采用了與軟件定義網絡(SDN)這個新興領域一樣的理念。像最近被VMware收購的Nicira這些公司涉足這個新興領域,試圖把網絡部分遷離專有硬件,改而轉移到基本服務器上。
SCautz方法假設:運營人員使用價格低廉的大眾化現成交換機——這種精簡版交換機并沒有各大網絡公司生產的許多額外的軟硬件。
研究團隊在模擬時將SCautz與微軟牽頭研發的為模擬化數據中心設計的試驗型網絡架構(名為BCube)進行了比較。想了解BCube,請訪問以下鏈接http://research.microsoft.com/pubs/81063/comm136-guo.pdf。
SCautz在測試中的表現幾乎與BCube一樣好,但是它所需要的交換機數量少得多,因而降低了數據中心網絡的總體成本。
此外,在10%到20%的網絡硬件出現故障的情況下,SCautz網絡的網絡吞吐量下降了6.91%到3.74%;相比之下,BCube的網絡吞吐量卻下降了15.3%到25.23%。
因而,SCautz能夠足夠巧妙地避開出現故障的硬件、進行路由傳送,因而網絡性能的下降幅度小于出現故障的硬件所占比例數。因而,SCautz網絡適應硬件故障的能力更強,為數據中心運營人員在應對硬件危機時提供了更大的靈活性。
Huang撰文道,研究的下一個階段就是,把多只基于SCautz的集裝箱連接起來,設計一種集裝箱之間的網絡。Huang目前正在中國國防科技大學攻讀博士學位。