互聯網企業是大型及超大型數據中心建設強有力的推動者。據互聯網數據中心(IDG)統計,2017年全球數據中心數量將達到840萬座,主要集中分布在美國、歐洲、日本和中國等地區。 2016年美國大規模數據中心占全球比例45%,中國占比8%,雖然規模上美國最大,但中國的增長潛力最強。目前超大型數據中心主要為全球24家企業所有,集中在亞馬遜、微軟、IBM和谷歌等互聯網巨頭。在云計算領域,Synergy Research數據顯示,互聯網巨頭亞馬遜、微軟、IBM、谷歌等市場占比超過60%。
這些大型、超大型的數據中心造價不菲,云計算也掀起了”降價潮“使互聯網公司不遺余力地追求IT基礎設施的低成本、低能耗、快速部署以及更加高效靈活。在硬件上,互聯網公司也是各顯神通,推出適合自己的硬件標準。目前主流的標準包括由Facebook發起的開放計算項目(Open Compute Project,“OCP”),LinkedIn推行的Open19,以及在中國由百度、騰訊、阿里巴巴、中國電信、中國移動、中國信息通信研究院、英特爾聯合發起成立的開放數據中心委員會(ODCC)的“天蝎計劃”。
(右:浪潮集團服務器產品部副總經理陳彥靈 左:浪潮集團互聯網行業產品部產品總監孫波)
OPC旨在基于“開放源代碼”,打造成本更少、效率更高的服務器和數據中心硬件。Open19開放服務器標準旨在為存儲、網絡和服務器的建設帶來一個簡化的開放設計標準,希望適用于任何規模的數據中心。ODCC的“天蝎計劃”則通過提出一種統一標準的設計規范,實現硬件的低成本的可靠靈活擴展。“這三個標準大家的思想是統一的,都是做成整機柜,讓服務器的密度更高、功耗更低、整體管理更便捷。OPC不關注外觀,追求極簡的設計;Open19定義了一個機架,只作了一個集中供電,這么做的好處是減少了機器之間的影響,一臺機器出了故障不影響到其他機器的運行,還有一個特點是,不同廠商的服務器通過最簡單的改造就能集成在一個機柜里,所以Open19 只定外形尺寸、接口定義;ODCC以在一個機柜中集成供電、散熱、交換、管理等模塊,統一接口、規范、協議,將各模塊標準化作為一個整體的平臺,此外還更注重資源的池化、高度兼容。因此各標準由于目不同各有側重。”浪潮集團服務器產品部副總經理陳彥靈接受企業網記者采訪時這樣分析這三大開放數據中心硬件標準。
浪潮整機柜服務器
“對于整機柜服務器產品的研發到今天已經歷經了五代產品。”浪潮集團互聯網行業產品部產品總監孫波表示:“ 2009年到2011年我們是整機柜服務器第一二代產品,2009年,那時候天蝎項目組還沒成立,我們主要是摸著石頭過河,2011年天蝎項目組成立之后,我們就跟著天蝎項目做,實現供電、散熱和管理的集中化,到2013年我們推出了SR4.0,也就是天蝎2.0,整個機柜實現了21寸的擴大,整體的存儲容量和計算容量大大提升。目前我們正在做的是天蝎2.5,我們已經實現了存儲資源池化、GPU資源池化以及分布式BBU的功能。并且,浪潮取得了一些成就,我們是國內最大的整機柜服務器生產廠商,市場占有率超過60%。截止到2016年底,累計出貨15000節點。”
浪潮整機柜服務器在部署快速、管理便捷、設計合理、資源池化、緊跟用戶應用場景聯合開發(JDM)方面解決互聯網用戶的痛點是取得如此成績的不二法門。
互聯網行業競爭激烈,拼的不僅是技術、創新,還有產品迭代的速度,在這個江湖里唯快不破。同樣,數據中心服務器的部署也要快速。浪潮集團互聯網行業產品部產品總監孫波介紹:“傳統服務器單日單機房交付300-500節點,我們可以做到5000個節點,支持雙線交付,單日交付10000臺服務器,可為大型的客戶大幅減低交付時間。”
一個互聯網企業的數據中心動輒幾十萬上百萬服務器,機柜服務器的設計是否合理,直接影響了運維人員的數量與運維人員工作的強度與復雜度。“浪潮的整機柜服務器采用背部無線纜大風墻設計,這也是浪潮貢獻給ODCC標準委員會的一個設計方案。”孫波表示。“天蝎1.0時各家的方案不一樣,天蝎規范并沒有把各家廠商設計規定死,大家有何大的發揮空間,有廠家機柜后面還有PUD以及一堆電源供電線,而浪潮SR(SmartRack)后面一根線路都沒有非常干凈,運維人員不會因進行維護操作時碰到銅線或者電纜導致宕機的風險。并且這種做法一直延續到SR4.0,后來在天蝎2.0規范中被明確規定了背后的風扇墻的設計。”
在電源管理方面。浪潮的RMC(機柜管理模塊)被寫入了天蝎2.0里。浪潮SR1.0、2.0就有機柜管理模塊。在此基礎上,為考慮整個機柜的整體布局和互聯網架構發現放在電源里是最優的,所以浪潮和電源廠商一起做了創新設計,把RMC嵌入到電源左側,RMC成為電源的一部分,但RMC又對整個機柜進行管理。
云計算的深入對資源的分配要求更加精細與靈活,提出了存儲資源的池化的要求。目前浪潮是國內最早展開基于天蝎3.0預研項目——存儲資源池化的廠商。陳彥靈指出,“基于SAS switch的存儲資源池化方案,可以讓計算節點統一,下行連接JBOD或者直接掛載硬盤,可連接超過200各設備,實現15PB以上的差大存儲空間,結合浪潮自研的軟件可根據負載需求匹配硬件資源,實現存儲空間的自由劃分,靈活可擴展性能同時時間機柜內與機柜間的互聯。單機柜容量可達4PB,CPU硬盤比可達到1:60,可實現單計算節點對應多JBOD,多計算節點對應多JBOD,多計算節點對應單JBOD等多種方式,通過上層存儲軟件優化寫隊列、讀寫性能,整體成本下降了31%。”
針對互聯網用戶既需要有提供免費郵箱、云盤、圖片、音視頻存儲這樣低貢獻率、不經常訪問的冷數據存儲的應用場景,又需要能提供搜索,即時訪問的熱數據應用場景,也有對大數據需求的溫數據場景,SAS池化的解決方案同樣能應對。搭配NVMe資源池及雙路存儲節點可以實現數據的分級存儲。基于Xeon-D的冷存儲節點,支持硬盤休眠實現閑置資源的超低功耗。
人工智能、圖像識別被互聯網企業廣泛應用。浪潮通過基于基于PCIe switch來進行GPU資源池化。陳彥靈表示“通過上面的公共的計算節點,采用PCIe switch方式,按照我們業務需求進行靈活配置,可以對下面所掛的IO設備靈活的往計算節點上增配。PCIe擁有更高的通信效率,延遲可降低50%以上,同時GPU之間可以直接進行同步,成本優化達15%。”
面對互聯網企業日新月異的創新技術浪潮建立了JDM(Jion Design Manufacture聯合開發)的新商業模式。更多的面向應用,融合產業鏈與客戶建立起面向未來的聯合開發定制和合作模式與客戶共同成長。
“未來浪潮整機柜服務器會向應用與硬件解耦、更進一步的資源池池化、內存資源池化等方向發展。”陳彥靈對互聯網市場以及ODCC的未來充滿信心。
據了解,浪潮整機柜服務器SR400成為首批通過天蝎黑盒子系統和管理子系統兩項測試標準的廠商。2017年加入了OPC并成為鉑金會員并發布了OR系列的整機柜服務器,同時也是Open19的第一批成員,提供19英寸的整機柜服務器。