英偉達(dá)已經(jīng)正式發(fā)布CUDA 6,此次針對其專有GPU編程語言的更新?lián)Q“包含有CUDA發(fā)展史上最為引人矚目的全新特性。”
從賣點角度講,CUDA 6最為重要的特性在于其采用的統(tǒng)一內(nèi)存方案,這一點我們在去年十一月CUDA工具包6.0發(fā)布時就已經(jīng)作出過闡述。簡而言之,統(tǒng)一內(nèi)存機制能夠幫助大家免于在CPU與GPU各自獨立的內(nèi)存空間之間來回復(fù)制數(shù)據(jù)。
這一次升級也仍然延續(xù)上述思路。在CUDA 6中,“受管理的內(nèi)存可通過單一指針接受來自CPU與GPU的訪問,”英偉達(dá)公司GPU業(yè)務(wù)負(fù)責(zé)人Mark Harris在一篇博文中解釋道。
“關(guān)鍵在于這套系統(tǒng)會將統(tǒng)一內(nèi)存中的數(shù)據(jù)在主機與設(shè)備之間進(jìn)行自動化遷移與分配,從而繼續(xù)保留CPU內(nèi)存指向CPU運行代碼、GPU內(nèi)存指向GPU運行代碼的使用感受。”
雖然Harris將統(tǒng)一內(nèi)存方案放在最為顯要的位置并對此作出了非常詳盡的說明,但他同時也在這篇博文中提到“CUDA 6所帶來的其它四項重要新特性。”
首先登場的新特性是,英偉達(dá)專門針對嵌入式以及移動用例的Tegra K1系統(tǒng)芯片如今正式提供CUDA支持能力,這相當(dāng)于踐行了該公司作出的“CUDA無處不在”這一遠(yuǎn)期規(guī)劃。
作為英偉達(dá)最新推出的移動處理器,Tegra K1將192核心Kepler GPu與四核心ARM Cortex-A15 CPU相結(jié)合,此外還集成了視頻編碼與解碼、圖像/信號處理以及其它多項細(xì)節(jié)改進(jìn)。根據(jù)Harris的說法,這相當(dāng)于把“多種其它系統(tǒng)級功能匯總在一起。”英偉達(dá)最近在GPU開發(fā)大會上公開的Jetson TK1嵌入式開發(fā)組件正是由Tegra K1提供計算資源支持。
Jetson TK1嵌入式開發(fā)組件——192個CUDA核心售價192美元
Harris在博文中同時提到,“CUDA 6提供XT Library接口,它能夠為2個或者更多GPU提供3級cuBLAS以及2D/3D cuFFT程序擴展能力。”
直白地講,這意味著如果大家的系統(tǒng)擁有一塊或者多塊雙GPU顯卡——例如高性能計算環(huán)境——它們能夠在CUDA 6的幫助下實現(xiàn)更為快捷的傅立葉轉(zhuǎn)換以及矩陣-矩陣乘法運算。除此之外,那些規(guī)模過大以至于無法被容納在單獨GPU內(nèi)存中的矩陣也能借助CPU內(nèi)存實現(xiàn)運算速度提升。
再有,CUDA 6允許大家在自己的個人設(shè)備上開發(fā)軟件并通過英偉達(dá)的NSight Eclipse版本將其運行在遠(yuǎn)程設(shè)備之上——無論是性能強大的高性能計算集群還是輕量化Jetson K1組件。
“在運行在本地PC(例如筆記本電腦)上的IDE中編輯源代碼,而后以遠(yuǎn)程方式在配備CUDA兼容GPU的服務(wù)器上一步步進(jìn)行應(yīng)用程序的創(chuàng)建、運行、調(diào)試以及配置工作,”Harris寫道。
CUDA開發(fā)環(huán)境也迎來一系列重要改進(jìn),他同時也提到了CUDA API、庫乃至開發(fā)工具所獲得的一系列全新特性、改進(jìn)與漏洞修復(fù)。如果大家對上述內(nèi)容有興趣,不妨點擊此處查看CUDA工具包6.0的發(fā)布指南(PDF格式)。
如果大家更傾向于親手操作并在實際使用中進(jìn)行摸索,則可以點擊此處從英偉達(dá)的CUDA專區(qū)中下載CUDA 6。