英特爾聲稱,旗下的Skylake服務器處理器比上代Broadwell芯片的性能提升了65%。據悉,新的至強可擴展(Xeon Scalable)系列頂級版本的性能超越了AMD最近發布的Epyc CPU(中央處理器),但其I/O則不如Epyc CPU的充足。
結果表明,英特爾在數據中心方面仍保持統治地位,并無任何威脅。不過,預計AMD的Epyc和新興的高通基于ARM服務器芯片及其他產品亦將在廣泛而多樣化的云計算領域中占據一席之地。
Skylake白金8180和8160版本在性能/瓦特比(Performance/watt)上與AMD的Epyc 7601比提升了2%至28%,而使用Specint_rate2006基準的話,其性能/瓦特比則增加了12%至22%。這些結果極有可能因為英特爾傾向于使用優化過的編譯器進行基準測試而不是針對AMD的標準使用做的測試而受到影響。
Skylak高端8100系列內置高達3.6 GHz的28個內核、高達48個PCIe 3.0道和6個DDR4-2666內存通道。而相比之下,AMD高端Epyc最多包含32個內核,系列里全部9個產品均支持128個PCI Express 3.0道和8個DDR4-2666通道。
英特爾與二十四家公司一起做了測試,測試的工作負載各不相同。其中的一個結果是Skylake擊敗Broadwell芯片,比率為1.4,用了Ansys制造的軟件,而另一個結果的比率為2.2,應用程序用了Skylake及英特爾專有Optane固態內存驅動器。
市場觀察公司Insight64(位于加州Saratoga)負責人內森·布魯克伍德(Nathan Brookwood)表示,“令人印象深刻的是,與Broadwell比較的結果遠遠優于典型的各代產品,特別是考慮到二者都是14納米產品。
Skylake超越AMD的Epyc,不過英特爾的優化編譯器可能對結果有影響。
布魯克伍德說表示,“AMD曾擁有皓龍(Opteron)產品的絕對優勢,占了25%的服務器市場,但我認為Epyc不會比Skylake好很多。”
AMD上個月發布了Epyc的一系列基準結果,性能上平均超Broadwell 約45%。但服務器領域含各種市場和需要,在許多地方英特爾有優勢,而在有些地方AMD可能更優。
例如,AMD希望利用其PCIe和DDR4的優勢以單插槽Epyc服務器取代雙插槽Broadwell服務器。不過,Skylake新的AVX-512矢量處理擴展在浮點密集型工作上則遠超Epyc的功能。
在架構上,Skylake使用的是分立I / O芯片單處理器模。而Epyc套件內置了含I / O的四個模,在有些操作中犧牲延遲以換取AMD更大的靈活性和更低的成本。
英特爾出貨的Skylake芯片已超過50萬,芯片在阿里巴巴、亞馬遜、AT& T和Google的數據中心運行。30多個客戶在使用英特爾Skylake芯片,包括名列全球速度排名榜13位的巴塞羅超級計算機系統。
新Skylake概覽Skylake的網狀芯片網絡取代了Broadwell的雙環網絡。
Skylake的上佳性能來自各種穩步的創新,包括微架構升級和指令集擴展。Skylake芯片采用網狀網絡芯片,英特爾稱,與環形總線比,網狀網絡芯片可提供比更高的帶寬和更穩定的低延遲。
AVX-512與 Broadwell上的AVX2比,其單精度和雙精度性能分別提高了64 flops /周期和32 flops /周期。AVX-512在做到這些的同時仍保持與英特爾過去的芯片相同的功率水平并降低了對頻率的要求。
英特爾表示,這些擴展可支持高達每內核、每周期85.33個INT8和64個FP32操作,進而提高了機器學習訓練和推理運算的性能,英特爾還表示,Skylake在整數通用矩陣乘法任務可提供優于Broadwell 3.4倍的優勢。
英特爾做的不是擴展緩存,而是改進緩存方法。因此,這些芯片用的內存稍微少一些,但卻針對數據中心做過更好的優化。
Skylake配套I / O芯片名為Lewisburg,支持四個10G以太網端口,而Broadwell I/O芯片僅支持單GE端口。Lewisburg也是第一款整合了加密和壓縮功能的產品,英特爾稱其加密和壓縮功能為快速輔助(Quick Assis)技術。
英特爾還提升了處理器總線的性能,處理器總線現在叫超路徑互連(Ultra Path Interconnect),其速度由9.6 GTransfers /秒增加到10.4 GTransfers /秒。超路徑互連鏈接里的三個置于高端芯片上。
AVX-512的浮點運算性能翻番,同時功耗和頻率保持不變。
至強可擴展系列產品由50個版本組成,用的是英特爾14納米工藝的各種變種。價格各不相同, 8插槽版標價近9000美元,而入門級部件的價格為約400美元。
該系列產品的功耗范圍為70瓦到205瓦。低端青銅3100系列最多可以使用8個1.7 GHz 的內核,該系列支持DDR4-2133,但不支持雙線程。
一些新設備將英特爾的Omnipath互連與高性能計算處理器放在同一個套件里。英特爾正在打造將FPGA置于套件里的樣本,但其產品要到明年年初才可以發貨。
實用的Skylake解碼環要想在Skylake近50個版本(下圖)找到用戶使用的版本可能需要英特爾提供的產品名稱解碼環(上圖)。