如果其機架規模設計成功,那么英特爾公司將重新定義數據中心將如何建立。
最近幾年,英特爾公司一直在大肆推廣其軟件定義的超大規模數據中心的愿景,但似乎鮮有一些有形的結果。最初被稱為服務器機柜級架構(RSA,Rack Scale architecture),現在,其最近發布的1.0版本的規格已經改名為英特爾機柜級設計(Rack Scale Design,RSD)。與這些架構相兼容的系統,預計將在2016年底之前由關鍵供應商們陸續正式推出。
與任何企業組織一樣,英特爾公司清楚的知道:現如今的數據中心正面臨著來自于云服務的大規模增長、以及物聯網(IoT)等新趨勢所帶來的空前的壓力,而這些壓力正推動著數據中心存儲容量和計算能力,以及數據處理能力的不斷增長。
對數據中心的激進的重塑改造
考慮到現如今的這些情況,英特爾已經將RSD項目作為對數據中心基礎設施的重大改造,以使數據中心的基礎設施變得更靈活,更易于管理,從而更容易實現按需擴展。
其目的是要將計算、內存和存儲從各個服務器節點分解,并將這些資源形成資源池,讓這些資源池可以在軟件的控制下進行分配,以精確匹配每項工作負載的要求。
而基于幾個方面的原因,要想實現這一最終目標已被證明是一項艱巨的挑戰。原因之一是,英特爾還打算預期其高速硅光子光學互連技術將形成一個關鍵,但由于將激光器和邏輯電路整合到同一芯片上存在制造困難,導致了這方面的延遲。
另一個原因是,傳統上,英特爾在IT行業中的角色定位是一個技術推動者,而不是一家向企業客戶銷售解決方案的基礎設施供應商,而該公司現在已經意識到,他們必須對整個基礎設施采取更整體的方法。
從解決方案開始
今年八月在舊金山召開的英特爾信息技術峰會(Intel Developer Forum,IDF 2016)上,英特爾數據中心集團副總裁Charles Wuischpard在接受Datacenterdynamics.com網站的記者采訪時表示說:“過去,我們習慣于使用我們的配置,如CPU、以太網架構和內存技術,并計劃讓這些技術的設計彼此獨立。”
“而到了現在,我們的發展目標是要開始要真正成為一家負責任的解決方案提供商,我們必須先從解決方案的理念和想法開始,然后確保我們的產品組合能夠恰當的實現相關的功能。英特爾機柜級設計是一種系統級別的思維,而為了能夠做到更好,就我們以協調的方式整合我們所有的發展路線藍圖。”他補充說。
英特爾似乎也顯得特別的謹慎和小心翼翼,因為他們需要繼續保持與其硬件供應商合作伙伴的合作。而如果RSD規范被證明過于規范,其會冒著與戴爾、愛立信和昆騰云技術(QCT)等公司漸行漸遠的風險,并開發他們自己的超大規模解決方案。 “我們不想終結當前各大主要供應商均有各自建立的專有解決方案的情況。”Wuischpard說。
基于這一原因,RSD 1.0版本的規格主要集中在頂層架構,和建立一個共同的管理框架來驅動整個基礎設施的方面。正如其名稱所暗示的那樣,英特爾機柜級設計是圍繞著使機架成為計算的基本單位。每個機架都是由抽屜組成,其中包括由計算節點或存儲單元組成的模塊。英特爾要求每個抽屜有一個混合系統管理引擎(PSME),這是一個微控制器,負責在抽屜內配置和識別硬件資源。
每個PSME都鏈接到一款機架管理模塊(RMM),并返回到總Pod管理器,而在總Pod管理器,一個Pod是用于在一個單一管理域收集機架的標簽。英特爾指定該管理硬件應該從主要的生產網絡架構使用一個單獨的網絡連接。
Pod管理器通過查詢PSME來發現Pod中的所有硬件,并將資源暴露給上面的協調層,這可以是通常可用的平臺,例如OpenStack或諸如QCT的系統管理器軟件或愛立信的命令中心之類的專有工具。
開源API
英特爾聲稱,RSD通過開源的應用程序編程接口(API)公開所有這些資源,并且基于其分布式管理任務組(DMTF)開發的Redfish管理規范的API作為智能平臺管理接口(IPMI)的替代。其還根據開源許可證發布了Pod管理器、PSME和RMM的代碼。
RSD規范要求在機架內的基于以太網的結構,但讓其處于開啟狀態,以便讓機架頂部(TOR)或機架行末端(EOR)交換機連接到主干網絡。規范還要求在機架內而不是在每個節點上共享功率和冷卻 ,類似于由開放計算項目(OCP)開發的開放機架標準。
這并不是巧合,因為英特爾的RSD和OCP的努力方向是相似的,這可以從QCT公司于今年夏天在IDF 2016上宣布推出的Rackgo X-RSD平臺中看出。
其是基于RSD的,但卻使用了21英寸OCP開放機架格式,而不是標準的19英寸機架。 Rackgo X-RSD可以安裝2U四節點計算模塊和2U存儲模塊,后者最多可容納28個3.5英寸驅動器和4個NVMe固態驅動器(SSD)。
參與的供應商
其他基于RSD的超大規模平臺包括愛立信的HDS 8000,其具有用于在其機架中互連模塊的光背板;以及戴爾的DSS 9000,后者將在今年年底之前推出。
雖然每家供應商都在追求其自己的硬件設計,但英特爾聲稱這并不重要,因為RSD中的通用管理API將允許異構數據中心中的資源混合。
“他們都在構建自己的硬件機架設計,但你可以設想一個環境,在該環境中,擁有來自多家供應商的機架,但運行相同的軟件,組成了從一家供應商的機架和存儲到另一家的虛擬服務器的計算,這不會有什么區別。”Wuischpard說。
伴隨著RSD 1.0版本的推出,全資源組合的目標仍然還有很長的路要走,但英特爾公司稱,其已經通過簡化管理帶來了數據中心運營成本的降低。RSD 2.0版本預計將在2017年推出,將增加對于集中資源如FPGA加速器的支持,未來的更新升級設定將涵蓋業務流程支持和硬件遙測功能。
關于超融合與RSD
英特爾的機柜級設計(RSD)和超融合基礎設施都旨在提供現代化的、靈活的IT基礎架構,其更易于管理和更易于擴展,但分別采用了稍微不同的方法。
超融合基礎設施將計算、存儲和網絡集成到設計為像構建塊一樣運行的類似設備的節點。為了擴展,您只需添加更多的塊,而一個軟件層則負責提供管理,并跨節點集群運行軟件定義的存儲池。
相比之下,RSD旨在解包打開傳統的服務器,以便讓數據中心機架中充滿計算和存儲資源模塊,可以動態分配,以創建具有所需配置的虛擬系統。明顯的區別是,RSD將機架作為其基本單元,而不是單個服務器,因此更多地針對最大規模的基礎設施部署。
另一個區別是,RSD的基礎設施是模塊化和可升級的,以便可以根據需要交換單獨的計算和存儲元素。對于許多數據中心操作管理人員來說,讓工程師開放大量的服務器是不切實際的,因此目前的升級通常基于叉車進行,而且是當下次服務器更新周期到來時。