全球AI領域的“奧運會”
近日放榜!
戴爾5款服務器
分別在各自類別的排名中拿下
“金牌”
做到這一點尤為不容易
因為今年的參與者和提交數量
分別是上一年的2倍和6倍
恭喜戴爾!
MLPerf™
AI性能基準測試
MLPerf™是由圖靈獎得主大衛•帕特森于2018年聯合頂尖學術機構發起成立,是目前最具權威性、影響力最廣的國際AI性能基準測試,也是用戶在采購AI系統時的重要參考依據。
MLPerf™ AI性能基準測試包含Training(訓練)和Inference(推理)兩大領域,分為封閉任務(Closed)賽道和開放任務(Open)賽道。
開放優化能力著重考察參測廠商的AI技術創新力,固定任務則因更公平地考察參測廠商的硬件系統和軟件優化的能力,成為更具參考價值的AI性能基準測試。誰能夠在這個測試中取得更多的領先,誰的AI能力就越突出。
在本輪MLPerf v2.0測試中,戴爾科技向各個類別提交了167份項結果,是封閉式數據中心類別里排名第二多的廠商。此外,只有戴爾提交了針對不同主機操作系統的結果。
在這里,恭喜我們的PowerEdge XE8545、PowerEdge R750xa、PowerEdge XE2420、PowerEdge XR12這四款服務器在MLPerf v2.0獲得了優異表現!
多個類別排名第一
每加速卡性能,排名第一
與同樣采用NVIDIA A100 GPU的其他系統相比,戴爾PowerEdge XE8545和PowerEdge R750xa在競爭中脫穎而出,測試結果涵蓋圖像分類、對象檢測、語音到文本、醫學成像、自然語言處理和推薦引擎等用例。
NVIDIA A100 GPU在深度學習領域廣受歡迎。測試結果表明采用NVIDIA A100 GPU的戴爾PowerEdge XE8545和PowerEdge R750xa服務器在該領域的突出優勢。
基于PCIe的服務器性能,排名第一
在基于PCIe的4-GPU服務器中,戴爾PowerEdge R750xa也在多個基準測試中(包括圖像分類、對象檢測、語音到文本、自然語言處理和推薦用例)脫穎而出,位列第一。
戴爾PowerEdge R750xa是久經盛名的PowerEdge R750服務器的GPU優化版,非常適合于AI、ML和DL工作負載。它支持4x300W雙寬或6x75 W單寬加速卡,提供多達8個PCIe Gen4插槽,并支持多達8個NVMe SSD。
最低多流延遲,排名第一
戴爾PowerEdge XE8545服務器在圖像分類和對象檢測用例,使用NVIDIA 多實例 GPU (Multi Instance GPU, MIG)獲得了最低多流(Multi-stream)延遲的第一名,顯示出PowerEdge XE8545在邊緣類別的強大優勢。
戴爾PowerEdge XE8545是人工智能工作負載的強大動力引擎,這是一款雙插槽4U機架服務器,最多包含128個第三代AMD霄龍處理器核心、四個NVIDIA A100 GPU以及NVIDIA vGPU軟件所具備的優化性能。
此外,PowerEdge XE8545在多項基準測試(包括語音到文本、對象檢測、自然語言處理和醫學圖像分割)中,還獲得了系統性能第二名的結果。
T4推理結果第一
與其他使用NVIDIA T4 GPU的系統相比,戴爾PowerEdge XE2420服務器在圖像分類、語音轉文本和推薦用例取得了最高推理結果。
戴爾PowerEdge XE2420服務器是一款專業邊緣服務器,專為環境要求苛刻的邊緣應用如流分析、制造物流、5G蜂窩處理而設計。此外,該服務器支持高達2993MT/s的16x DDR4 RDIMM/LR-DIMM,非常適合低延遲和大存儲邊緣應用。
每瓦性能第一
在功耗方面,配備A2 GPU的戴爾PowerEdge XR12服務器的能耗數據,與同為A2 GPU的其他服務器相比,在ResNet 50、 RNNT、BERT和DLRM基準測試中的每瓦性能均排名第一。
戴爾PowerEdge XR12是一款堅固耐用、符合海事要求的2U服務器,適用于電信、軍事、零售,以及其他注重能耗表現的環境。它是圖像分類、物體檢測、語音到文本、自然語言處理和推薦引擎的良好選擇。
結語
感謝權威AI基準評測組織驗證并確認了戴爾服務器在AI領域的出色表現。作為全球領先的IT端到端解決方案提供商,戴爾科技在AI領域深耕多年,積累了先進的技術和豐富的行業應用經驗,能夠與廣大客戶和合作伙伴一道,攜手共進,加快AI應用落地,加速AI創新成果轉化。
附:戴爾服務器在MLPerf Inference v2.0的基準測試結果
為了更緊密地匹配實際使用情況,MLPerf推理測試對數據中心類別有兩個必需的場景:離線和服務器。離線場景意味著任務所需的所有數據都在本地可用。服務器場景在請求時以突發形式在線交付數據。
對于服務器場景,性能指標是每秒查詢次數 (QPS)。對于離線場景,性能指標是每秒離線樣本數。一般來說,吞吐量越高表示結果越好。在下圖中,Y軸是指數比例軸,代表吞吐量,X軸代表被測系統 (SUT) 及其相應模型。
圖1至圖6分別展示各種SUT在ResNet 50、BERT、SSD、3dUnet、RNNT和DLRM模式下,服務器和離線場景的單卡性能:
圖1:MLPerf Inference v2.0 ResNet
50 per card結果
圖2:MLPerf Inference v2.0 BERT
默認和高精度per card結果
圖 3:MLPerf Inference v2.0 SSD-ResNet
34 per card 結果
圖 4:MLPerf Inference v2.0 3D U-Net
per card結果
圖 5:MLPerf Inference v2.0 RNNT
per card結果
圖 6:MLPerf Inference v2.0 DLRM
默認和高精度per card結果