近日,英特爾“Knights Mill”的低調(diào)發(fā)布了。至于為什么會低調(diào),原因很簡單,英特爾Xeon Phi x205芯片是一個生態(tài)性質(zhì)更強的產(chǎn)品。
英特爾至強Phi x205 Knights Mill發(fā)布背后的故事
英特爾Knights Mill產(chǎn)品的推出本質(zhì)上是為了實現(xiàn)英特爾對客戶的承諾——推出一款基于Xeon Phi的、針對深度學習的產(chǎn)品。英特爾已經(jīng)表示, Nervana 神經(jīng)網(wǎng)絡處理器(NNP)將會是其未來的宣傳重點。
▲英特爾 Knights Mill高級SOC概覽
Xeon Phi家族首先是一個面向HPC的產(chǎn)品線。隨著美國政府決定引入“百萬兆級”的計算程序,英特爾將其努力重心和未來的產(chǎn)品計劃轉(zhuǎn)向了新的方向。“百萬兆級”時間線推進和英Nervana NNP所帶來的影響,對于我們看到的英特爾Knights Mill系列來說,不算太好。
這類芯片的市場本質(zhì)上集中在現(xiàn)有的HPC /超級計算集群,不是像NVIDIA和AMD那樣擁有廣泛的用戶群。對于一些小型設備中的芯片,你最好使用NVIDIA GPU而不是Knights Mill,因為CUDA將在幾年內(nèi)大范圍普及,而英特爾為Knights Mill開發(fā)的許多新技術(shù),我們預計將在未來被替代。
關(guān)于英特爾Xeon Phi x205 Knights Mill系列
考慮到英特爾Xeon Phi x205 Knights Mill處理器的用戶非常有限,英特爾給出如此低的推廣強度也可以理解。
▲英特爾Xeon Phi x205 Knights Mill
可以看出,這是一個相對較小的堆棧。這里最突出的可能是TDP,為320W。英特爾LGA3647平臺是為這個高TDP范圍設計的。Knights Mill用一個較小的雙精度端口和四個向量神經(jīng)網(wǎng)絡指令(VNNI)端口,取代了Knights Landing的矢量處理單元(VPU)上的兩個大的雙精度/單精度浮點(64位/ 32位)端口。后者支持單精度浮點和混合精度整數(shù)(16位輸入/ 32位輸出)。 Knights Mill還將支持16 GB的MCDRAM——組裝在一個3D堆棧中的英特爾版on - package高帶寬內(nèi)存——以及6個DDR4內(nèi)存通道。
如果您使用的是Intel Xeon Phi x200家族集群,那么許多技術(shù)都有很好的機會來獲得更高工作效率。另一方面,如果你在這個生態(tài)系統(tǒng)之外,建議選擇NVIDIA CUDA卡或等待英特爾的Nervana NNP。