數據中心核心交換機業界動態
核心交換機是數據中心網絡最為關鍵的節點。隨著云計算、虛擬化和大數據等趨勢逐漸走俏,數據中心網絡的建設也出現新的變化。因為企業需要不斷面對IT系統日益復雜、設備數量日益增多,數據大集中和計算能力走高的諸多挑戰。核心交換機面臨很大的數據交換壓力,由此也推動了核心交換機技術在近幾年的跨越式發展,關于技術標準、性能、架構、大二層網絡構建、虛擬機網絡策略遷移、SDN的討論,更是呈現百家爭鳴的態勢。在這期間,萬兆技術標準成為主流,40G、100G逐漸走向商用;Spine-Leaf架構已經贏得共識;SDN、NFV還未塵埃落定。每年我們都能看到技術標準博弈的不斷演進,性能不斷超越的驚艷,數據中心網絡市場走向繁榮的步伐,以及各家戰略、策略和產品的角力。
從2008年開始,業界主流的網絡設備供應商“你爭我趕”的推出了自己的數據中心核心交換機產品。迄今為止,4家在數據中心網絡市場舉足輕重的供應商,思科、華為、H3C和Arista先后推出了新一代數據中心核心交換機產品,分別是Nexus 7700系列、CloudEngine 12800系列、H3C S12500-X系列、Arista 7500E系列。與上一代各家的數據中心核心交換機產品,華為S9700、思科N7000、H3C S12500、ARISTA 7500相比較,這4大系列產品在硬件架構、性能、功能等各方面都有了質的飛躍,共同站在了目前核心交換機產品的最前端。同時,數據中心網絡市場所醞釀的火藥味越來越濃,所涉及的話題,已不是局限于談談趨勢,聊聊技術標準那么簡單,因為真正決定客戶選擇的,是技術、創新、質量和服務等硬條件。
在各大企事業的招標設備技術規格要求中,核心交換機的性能、通風散熱、系統可擴展性要求首當其沖:
在性能要求方面,要求核心交換機能夠支持足夠大的交換容量,在業務槽位數、單板帶寬等方面也有具體的要求;
在通風散熱方面,要求核心交換機遵循數據中心機房前進風、后出風的嚴格散熱風道建設規范,以保證在長期高速運行下的可靠性;
在系統可擴展性方面要求核心交換機具有持續的帶寬升級能力以及相匹配的散熱方面的擴展能力,從而保護其在數據中心方面的投資。
如果單從性能上看,思科、華為等四家的核心交換機似乎沒有太多的區別,不論在線卡、整體交換容量等方面都可以滿足客戶網絡建設的需求,甚至還可保證未來5-10年的擴展性需求。但如果我們深入到產品內部,看一看各家核心交換機內部的實現,就會發現各家在基礎架構的散熱風道、冷熱風道隔離、帶寬擴展性等實現方面存在細節上的不同,那么給用戶所帶來的價值也就不同。
正交架構下的散熱通道設計理念
正交架構已經成為數據中心核心交換機設計的共識,上述4大系列產品都不約而同的選擇了正交架構。正交架構可將背板高速鏈路走線長度有效降低,以獲得更加理想的誤碼率,從而在性能方面有了很大的提升。
但正交架構帶來性能優勢的同時,也帶來散熱設計的難度。因為在正交架構中,線卡與網板垂直對插,整個機框通過背板被分隔成兩個獨立的空間,散熱時兩個空間需要絕對隔離,并都保持前進后出的風道,這對散熱設計帶來了挑戰。而交換機遵循數據中心機房的前進風、后出風的散熱通道標準是國際數據中心通行做法,更是各大企事業標書明確提到的指標要求。如何實現在正交架構下做到冷熱風道隔離,并適配數據中心機房的前進風、后出風的散熱通道的設計,是對各家設備供應商的基礎架構設計能力的考驗。
為了更好的落地正交基礎架構的設計理念,這4大系列產品在實現細節和技術上都采用了不同的做法。主要包括三大類:1)直通風前后風道/級聯風道解決方案,思科Nexus 7700系列和Arista 7500E系列采用這樣的做法;2)直通風前后風道/區域獨立散熱風道,華為CloudEngine 12800系列所采用的專利方案;3)直通風Z型散熱風道/橫向散熱通道混合使用,H3C S12510-X和S12516-X分別采用了不同的散熱通道做法。接下來讓我們詳細了解下4款系列產品,采用不同設計理念下的差異。
直通風前后風道/級聯風道
Nexus7700系列是思科最新一代的數據中心核心交換機產品,采用正交架構設計,為了遵循嚴格的前進風、后出風的散熱風道,思科大膽的采用了直通風/級聯風道的散熱方案,即直接在線卡面板上開孔進風,在背板上打孔,風流直接穿過背板到達網板,網板的面板上開孔,風扇框安裝在機箱的后面,進行抽風散熱。同時,風扇系統可根據設備溫度自動調速,允許風扇系統熱插拔。當網板故障時,要拔出風扇框更換網板,但嚴格要求用戶在3分鐘內更換完網板,以免風扇停止散熱后造成系統掉電。而這樣的直通風設計,使得線卡散熱和網板的散熱風道并未隔離,交換網板始終處于高溫工作狀態,不得不面對級聯風道熱積累效應帶來的可靠性問題。
Arista 7500E也采用了直通風/級聯風道的散熱方案,但設計上更加大膽,直接將風扇集成在了交換網板上,而風扇屬于機械容易損壞部件,如果風扇出現故障需要更換,意味著交換網板也要隨之進行更換,這樣的集成無疑將使用戶的后期維護成本大大提高。
直通風前后風道/區域獨立散熱風道
華為CloudEngine 12800系列采用了直通風前后風道/區域獨立散熱風道的解決方案,在風道設計上擁有專利技術。將交換機的散熱區域分成了線卡區域和網板區域,線卡區域的散熱是面板進風,后面出風;網板區域的散熱是機箱前面下部進風,機箱后面上部分出風;兩個區域經過背板嚴格的隔離,這樣形成了兩個完全獨立的前進風、后出風的散熱風道。嚴格遵循風道設計的前提下,可有效規避風道級聯所帶來的可靠性問題。
直通風Z型散熱風道/橫向散熱通道混合
H3C在正交架構的散熱風道設計上,嘗試了兩種解決方案。H3C S12510-X采用了Z型散熱風道,遵循前進后出風道和冷熱風道分離原則,進風口集中在機箱下部,出風口在機箱的后上部,線卡豎插,風道從下到上問題不大,但交換網板和主控板橫插,阻礙了風道流向,因此需要在交換網板和主控板上兩邊開孔形成風道,這樣做會造成單板面積浪費,同時孔洞疊加形成的風道會產生風阻,導致散熱效率降低。思科也曾在其上一代的Nexus 7000系列產品中使用過Z型風道設計,但在Nexus 7700系列中并未沿用這一風道設計思路。H3C S12516-X在散熱風道設計上反其道而行,并未遵循目前主流的前進風、后出風的通道設計,而是采用了“復古”的橫向散熱通道,橫向散熱通道會帶來熱風回流和走線空間不足的問題,目前并不適用于數據中心的機房環境,值得商榷。
帶寬、散熱能力的可擴展性
之所以大筆墨的詳述了4家廠商正交架構下散熱風道的設計思路,是因為正交架構代表了目前核心交換機基礎架構的方向,基于正交架構的散熱風道設計、正交連接器的選擇決定了交換機單板的散熱和帶寬擴展能力。這些不僅代表了廠家在核心交換機研發的技術領先性,更關乎用戶在未來的數據中心網絡整體的擴展性、維護成本和系統可靠性。
連接器是核心交換機的基礎架構部件,伴隨著產品的整個生命周期,因此連接器選擇至關重要。在具有正交架構的交換機中,正交連接器決定了交換機的帶寬可擴展性和單板兼容性,因為正交連接器決定高速鏈路能不能升級到更高速率的重要因素,目前這4款最前沿產品的正交連接器選擇分成了兩個方向。思科Nexus 7700系列和華為CloudEngine 12800系列都選擇了ATCS的Xcede正交連接器;H3C S12500-X系列和Arista 7500E系列都選擇了Molex的上一代Impact正交連接器。Xcede正交連接器是新一代的連接器,是面向25G高速鏈路設計的,在高速連接、串擾和連接密度等方面已經考慮了更高速率的支持,所以可以應用在演進到更高速率的核心交換機上。
同時,每槽位的散熱能力的高低決定了單板端口密度的高低,而這與散熱通道設計的領先性息息相關。最具優勢的散熱風道設計,將直接影響交換機是否能支持48*40GE單板和48*100GE單板所帶來的千瓦功耗,單板的擴展能力越高則需要首先考慮系統能否帶來更好的散熱設計。所以,就目前的散熱風道設計而言,華為的直通風前后風道/區域獨立散熱風道思路,對于單板散熱可擴展性最具競爭優勢。
結語:
正交架構,前進風、后出風的散熱風道設計標準已經成為了數據中心核心交換機的標準,而在技術的細節實現上,不同廠商各顯其能。作為數據中心基礎架構的核心組件,它每一個細微的技術實現差異,也許就會給數據中心網絡的整體性能、未來的擴展性、可靠性,甚至是業務實現帶來差異。所以在企業數據中心網絡建設中,將供應商在硬件基礎架構方面的技術積累、設計理念和用戶投資、運維成本等方面的價值體現作為考量因素至關重要。