5月11日消息,據(jù)國外媒體VentureBeat報道,英偉達(dá)CEO黃仁勛今天發(fā)布了一款針對人工智能應(yīng)用的雄心勃勃的新處理器:Tesla V100。
該新芯片擁有210億個晶體管,性能比英偉達(dá)一年前發(fā)布的帶150億個晶體管的Pascal處理器強(qiáng)大得多。它是一款很大的芯片——815平方毫米,大小約為Apple Watch智能手表的表面。它擁有5120個CUDA(統(tǒng)計計算設(shè)備架構(gòu))處理核心,雙精度浮點(diǎn)運(yùn)算性能可達(dá)每秒7.5萬億次。
作為全球最大的圖形芯片和AI芯片廠商,總部位于加州圣克拉拉的英偉達(dá)在加州圣何塞舉行GPU技術(shù)大會,并發(fā)布了上述產(chǎn)品。
黃仁勛稱英偉達(dá)花了30億美元打造這款芯片,售價將會是14.9萬美元。
在介紹該款芯片之前,黃仁勛談到了AI近年的發(fā)展史。他指出,深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)研究大約5年前開始帶來成果,那個時候研究人員開始利用圖形處理器(GPU)來處理數(shù)據(jù),同時利用它們來快速訓(xùn)練神經(jīng)網(wǎng)絡(luò)。自那時起,深度學(xué)習(xí)技術(shù)呈現(xiàn)加速發(fā)展。今年,英偉達(dá)打算培訓(xùn)10萬個開發(fā)者使用該項技術(shù)。
Tesla V100另稱為Volta,針對深度學(xué)習(xí)而打造,Tensor性能可達(dá)每秒120萬億次浮點(diǎn)運(yùn)算。它能夠每秒傳輸300GB的數(shù)據(jù),速度相當(dāng)于時下其它處理器的20倍。該款芯片由三星代工生產(chǎn)。
該芯片針對深度學(xué)習(xí)訓(xùn)練的Tensor浮點(diǎn)運(yùn)算性能達(dá)到去年發(fā)布的Pascal處理器的12倍。這種處理速度很有必要,因為深度學(xué)習(xí)算法的進(jìn)展令人驚嘆。
2015年,微軟打造了一個名為ResNet的深度學(xué)習(xí)項目,該項目非常復(fù)雜,需要每秒7百億億次浮點(diǎn)運(yùn)算的處理能力。百度2016年打造的Deep Speech 2 AI需要每秒20百億億次浮點(diǎn)運(yùn)算的處理能力,谷歌2017年打造的NMT則需要每秒105百億億次浮點(diǎn)運(yùn)算的處理能力。
微軟正在開發(fā)一個新的ResNet版本,ResNet會同時使用64個Tesla V100芯片來進(jìn)行處理。目前還不清楚Tesla V100批量出貨的時間。