GTX 1070 Ti顯卡緊急登場(chǎng)后,NVIDIA 16nm Pascal帕斯卡家族已經(jīng)徹底完成歷史使命,接下來的一代將是12nm Volta伏特。雖然游戲卡還要等到明年春,但在高性能計(jì)算領(lǐng)域,新架構(gòu)新核心的Tesla V100早已經(jīng)登場(chǎng),并逐漸打開局面。
在此之前,Google部署了帕斯卡架構(gòu)的計(jì)算卡Tesla P100,而現(xiàn)在,亞馬遜則擁抱了新的Tesla V100,用于自家AWS云服務(wù)。
Tesla V100擁有5120個(gè)CUDA核心、640個(gè)Tensor輔助核心,面積達(dá)815平方毫米,集成了210億個(gè)晶體管,浮點(diǎn)性能半精度30TFlops、單精度15TFlops、雙精度7.5TFlops,Tensor深度學(xué)習(xí)性能則有120TFlops,搭配16GB HBM2高帶寬顯存。
相比之下, Tesla P100內(nèi)置3584個(gè)流處理器,單精度浮點(diǎn)性能剛剛接近10TFlops,而且沒有專長神經(jīng)網(wǎng)絡(luò)訓(xùn)練、推理的Tensor核心。
亞馬遜采用了三種不同的方式部署Tesla V100,分別為單路、四路、八路(后兩者采用NVLink總線互連),各搭配64GB、256GB、512GB系統(tǒng)內(nèi)存。