另一方面,半導體技術在縱向提速上也已經達到了物理極限,處理器性能再也無法按照摩爾定律,以每18個月翻倍的速度持續增長。
1、異構計算崛起,2020年市場規模將達25.75億美元
在這樣的背景下,異構計算“異軍突起”,成為支撐先進和更復雜的AI、AIoT等對計算量要求巨大應用的有力武器,在產業中迅速“上位”,使得異構計算和異構計算服務器市場迎來發展的黃金時期。
據 IDC數據顯示,2019 年上半年,中國異構計算服務器市場中,GPU 加速器市場規模已達 9.37 億美元,FPFA/ASIC/其他加速器市場發展較之稍緩,規模達到 1250 萬美元。但這些數字背后,隱藏著中國異構計算服務器市場的巨大潛力。
據 IDC預測,2020 年,中國的 GPU 加速器市場將以 38.9% 的速度增長至25.75 億美元,2023 年將增長至 44.47 億美元,相比 2019 年增長近 5 倍。而在中國,GPU 服務器也已廣泛應用于各行各業,包括互聯網、服務業、政務、教育、電信、制造業、金融業,等等。
這些數字,彰顯著中國異構計算服務市場的黃金時期已然開啟。
2、浪潮商用機器FP5468G2,異構計算的弄潮兒
“時勢造英雄”,識時務者為俊杰,各大云計算和服務廠商相繼意識到異構計算是大勢所趨后,紛紛推出自己的異構計算產品和服務,其中就包括以自主研發技術實力專注于高端服務器的浪潮商用機器。
其實早在 2018 年 7 月,浪潮商用機器已經推出了面向大規模數據中心的大數據分析應用設計的高端雙路主流機架式服務器FP5280G2,以性能、存儲及拓展等多方面的卓越表現,助力企業應對數據海洋中多種IT應用帶來的挑戰。
但超算和AI的融合應用趨勢對計算性能提出了更高的要求,浪潮商用機器順應這一市場需求,于 2019 年 12 月推出了擁有全場景超強異構計算能力,能夠支持AI云平臺建設、深度學習訓練和推理等應用的FP5468G2。這款8/16 卡的服務器可以靈活調配,為HPC與AI的融合應用需求提供了更好的選擇,能夠幫助各行各業在異構計算領域作出創新。
而在這波浪潮中,嗅到商機的并非浪潮商用機器一家,其他廠商也推出過自己的異構計算服務器產品。相比之下,FP5468G2 在 CPU、硬盤等方面優勢明顯。
把一臺 FP5468G2 服務器拆開,我們可以清晰地看到其獨特的布局設計,包括最高可支持24塊3.5英寸大容量硬盤的前置存儲,其中6個硬盤槽位可支持U.2 NVMe SSD,提供高效的數據讀取和落盤速度,極致的高效大容量本地存儲和高速IO拓展性能,為企業級用戶提供了海量數據存儲的優選平臺;此外整機還支持2+2 冗余鉑金電源,后置支持4個標準PCIe x16插槽,可支持4個100Gb遠程直接內存訪問(RDMA)高速網絡。
待深入了解 FP5468G2 的內部架構之后,則會發現全新的架構,尤其其支持balance、common、cascade三種拓撲的靈活的異構拓撲配置,讓它成為一個計算力超群的“小渦輪”,以合理的設計和完善的配置支持著復雜、大量的計算,并且能夠根據應用場景/訓練模型,靈活進行拓撲切換。
FP5468G2 支持2顆POWER9 Sforza CPU,最多可支持 44 核及176線程超強調度能力,再加上8塊V100或者16塊T4 GPU,針對特定深度學習模型調優,性能相較同等X86平臺可提升多達20%,并全面兼容FPGA/AISC,提供特定應用加速。
3、賦能AI、云計算三大應用場景,成本、性能優勢盡顯
智能視頻分析:成本更低
拋開技術和其他相關因素的考量,成本一直是阻礙企業采用異構計算服務器的重要因素之一。而與同類型產品相比,FP5468G2在成本上有著明顯的優勢,尤其是在其三大應用場景之一——智能視頻分析領域。
FP5468G2可用于安防智能視頻分析,包括平安城市、智能交通、智慧社區、車輛識別、輿情分析等。在這些場景中,用戶最大的問題是獲得最優性價比存儲空間,節省TCO。
相比之下,FP5468G2在智能視頻分析領域的成本優勢主要體現在以下三方面:
1. 節省空間:平均單位GPU占用0.25U機柜空間,部署密度更高;
2. 降低采購成本:假設客戶需要16顆T4 GPU算力,一臺FP5468G2相比于4臺FP5280G2成本節省約24萬;
3. 降低運營成本:節約電力成本;假設工業用電計1元/kW·h,16卡GPU算力要求下,單臺FP5468G2三年可節省電費3.15萬元。
DL訓練:超強算力、靈活拓撲
隨著AI技術的進步,很多企業都選擇推出自己的AI產品和技術,隨之而來的是大量深度學習訓練的需求。然而,深度學習訓練需要超強的算力支持,極高的存儲IO,以及強大的數據交換能力,然而雖然市面上的產品和方案琳瑯滿目,但真正能同時具備這些能力的產品實際上是鳳毛麟角。
FP5468G2在深度學習訓練場景中則兼顧了這幾點,賦能AI企業,進行圖像檢測、語音識別和自然語言處理等,使教育行業能夠更加高效地推進科學研究、高性能計算、人工智能算法研究等。
具體說來,FP5468G2在深度學習訓練場景中的優勢體現在以下具體的數字之中:
- 超強算力
支持8 塊V100或16 塊T4 GPU卡,提供全場景超強異構計算能力
-
- 2顆POWER9處理器,具有多達44個核心、176線程超強調度能力;
- 支持4個標準 PCIe x16 插槽,支持4個100Gb高速網絡
- 靈活拓撲
- 支持balance、common、cascade三種拓撲,可根據應用場景/訓練模型,進行靈活拓撲切換;
- 合理設計、適配完善
- GPU/CPU分離散熱,保障機器高效穩定運行;
- 全面兼容FPGA/AISC, 提供特定應用加速。
值得一提的是,POWER9 采用增強的架構體系,可支持SMT4 并發多線程,110MB 片上L3 緩存,能更好應對GPU數量增加帶來的數據調度負載的提升;獨特的高寬帶設計使得片內寬帶可達 7TB/s,外聯寬帶達 25 GB/s。全新的微架構對稱數據處理引擎設計,更高效的指令流水線與單線程性能,海量的數據存儲能力,讓FP5468G2的實力不容小覷。
AI云/DL推理:海量存儲空間
FP5468G2的第三個應用場景是AI云/深度學習推理,在互聯網行業,其可用于客戶行為分析、互動娛樂、輿情分析、精準營銷、內容監控等;在金融行業,可用于智能客服、人臉識別、風險評估、智能投顧等;在電信行業,可用于智能服務、智能網絡、智能客服等。
在這些場景中,動輒數億TB的數據流量往往需要海量的存儲空間,以應對每天的日常運營。
FP5468G2支持海量的數據存儲和高速IO擴展:
- 最大支持24塊3.5英寸大容量硬盤,其中可支持6塊U.2 NVMe SSD
- 支持4個標準 PCIe x16 插槽,支持4個100Gb高速網絡
FP5468G2可用于AI 公有云、企業 AI 云、混合型 AI 計算應用,如數據源中心管理、智慧醫療一卡通、政務服務云、高性能計算等。
在人工智能領域,FP5468G2 可用于深度學習訓練和推理,是模型調優的一把好手。
在視頻智能分析領域,FP5468G2 可在平安城市、智能交通、智慧社區的安防方面發揮巨大的作用,滿足視頻流海量存儲需求,進行信息實時檢索、音視頻轉碼/壓縮等。
展望未來,像 FP5468G2 這樣的異構服務器發展前景非常可觀。據 IDC 數據顯示,2020 年之前,異構計算的應用場景和服務領域已經十分廣泛,包括發展相對成熟的智能客服、語音識別、人臉識別、風險評估等領域。但在 2020 年之后,異構計算將拓展到智能機器人、智能服務、智能工廠、IT 自動化、智能導診,甚至語言能力等更加復雜的場景中;到 2025 年,異構計算在自適應學習、智能診斷等需要謹慎決策的場景中也將發揮更大的作用。