精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

當前位置:服務器行業動態 → 正文

Nvidia GPU并行計算高級顧問羅華平演講

責任編輯:sjia |來源:企業網D1Net  2012-06-20 16:45:47 原創文章 企業網D1Net

“高效制勝、擴展無限—Dell HPC 行業應用實踐交流會”于2012年6月20日在北京悠唐皇冠假日酒店盛大召開,戴爾技術專家及行業技術精英和與會者切磋交流,共商HPC發展之大計。

以下是現場快遞。(聲明:本稿件來源為現場速記,可能有筆誤和別字,僅供參考)

主持人:今天最后一個發言的是Nvidia GPU并行計算高級顧問羅華平。


Nvidia GPU并行計算高級顧問羅華平

羅華平:大家下午好,今天我講的主要內容大概有四個方面,GPU簡單的介紹,另外應用我們Tesla產品的介紹,另外給大家簡單介紹一下GPU編程方式,另外我們GPU應用情況,主要是四個方面的內容。

什么是GPU計算?簡單講GPU計算是這幾年非常火的話題,現在正在德國漢堡舉行的國際超算年會上,GPU計算,或者加速器的計算方式也是比較熱門的話題。GPU計算簡單的講,在我們標準X86的架構上,加上GPU來做處理,為什么加GPU,GPU有非常強大的處理能力,通過它來彌補CPU處理能力的不足,可以把大量的計算任務交由GPU來計算,CPU和GPU同時協作計算。

其實我們回過頭來看一看Intel CPU發展情況,80年代初Intel剛剛發明CPU的時候,第一代8080,8086,其實那時候的CPU是沒有浮點運算能力的,后來Intel為了彌補CPU這個不足,后來又發明了另外一個芯片,8087,專門的浮點處理器,協助CPU做浮點運算工作。所以說這種CPU加GPU的架構,很多事情我們回過頭來看看有相似之處。所以說在這種架構中,我們也稱混合的計算環境。

為什么利用GPU來做并行計算,最重要的一點就是我們GPU浮點運算能力非常強大,GPU訪問帶寬速度非常快。GPU的浮點,綠色的是GPU,藍色的是CPU,CPU的浮點運算非常強。另外帶寬也是一樣,有很大的差距。上個月我們在美國硅谷我們還發布了新一代的Tesla產品,他的浮點運算能力又提高了至少一倍,我們現在跟CPU相比也能保持一個比較大的運算優勢。

我們有一個小小的圖可以看到編程的方式或者是數據流的工作模式,CPU把系統內存數據傳到GPU內存中其,傳完以后,對CPU發出指令去計算,GPU進行計算,計算完了以后再把結果傳回到CPU,CPU做進一步的處理,這是我們CPU+GPU異構架構的工作模式,這是我們基本的數據流程。現在CPU和GPU的這種架構,已經得到了業界廣泛的認可,在很多領域都得到了非常好的應用,在這里不詳細說了,前面的報告里面也都介紹了不同的應用類型,總體來講,GPU加速的方式,異構模式,對于我們絕大部分計算來說都有非常好的好處。我的印象中,我的客戶得到了加速最是中科院力學所,他的程序移到GPU以后,據他們講900倍的進行加速。

從我們每年超級計算機的排名我們也看到,這是在去年前年,我們在國內也是比較熱門的話題,上午演講中也提到過,天河一號,當初出來以后,是排名世界第一計算機,截止到這個月上個禮拜之前還保持在第二的位置,現在剛好是昨天在漢堡舉行的超算年會上,新一屆排名出來了,天河已經落到了第五位,星云已經落到第七位。這是最新的情況。但是在前十名中現在還有三名是用GPU來做的異構架構,在整個TOP500中,根據這次最新的排名,大概有13臺機器進入了前五百,在三年前,08年我們只有一臺機器進入前五百,現在已經有13臺。

總體來講,采用CPU+GPU異構架構對我們用戶有非常好的好處,用戶可以得到非常高的性能,用戶在同樣運算情況下可以得到更高性能的機器,性價比非常好,另外的話,能效非常好。同樣計算能力下為大家節約計算空間。

下面我們簡單看一下Tesla產品,我們剛剛發布新的產品,基于CUDA架構的GPU,我們每兩年性能會翻一倍。Tesla K10,這個產品主要針對單精度運算應用,不適合做雙精的應用。這個產品跟我們現在的M2090相比性能有了非常大的提高,他是在一個板上有兩個GPU,總共有三千多個核,它的浮點運算能力到了4.58個T,大概是M2090三倍左右,但是他的功耗非常低。K10我們主要是用在石油、電子資料處理、加密、解密、視頻解譯。我們今年下半年還發布了新產品,K20,雙精和單精性能都非常好的產品,大概是這樣,今年年底會推出。

現在對GPU運行修改方式三種,第一種就是利用GPU函數庫的方式,第二種是OpenACC的方式,第三種是CUDA/C Fortran的方式。這幾種方法也可以結合起來使用,也可以使用一種、兩種、三種,都可以。

我們稍微提一下OpenACC,OpenACC是一個開放的標準,現在不但要支持CPU還可以支持GPU,還有其他家的加速器,將來可以在不同的架構上運行。我們現在和PGI合作做了一個推廣,我們有一個30天免費的使用,用戶可以去下載應用。這種方式也非常有效,很多用戶用起來也非常好。還有其他的案例,OpenACC的編程方式是非常有效的,效果非常快。

另外CUDA編程在這不想多說,主要提兩點,第一點就是CUDA走向開放,以前CUDA是采用專有的編譯器,現在采用的是開源的編譯器,使CUDA支持新的硬件成為可能。第二點是開發CUDA X86。GPU的程序開發這個生態鏈是非常完善的,從硬件,Dell大廠家,然后我們的編譯器,我們的工具等等,還有軟件包等等。

GPU在幾個領域都得到了非常好的應用,工業主要在石油天然氣,GPU的機器目的成為了主流機器,最近中石油的處理中心購買了五百個GPU,我們Tesla中標了兩百個GPU,教育科研,生命科學的研究等等,性能有了比較好的加速。另外在制造業,做結構分析,流體分析都可以支持,特別是結構分析。另外在我們政府密碼破譯,指紋識別,GPU也有非常好的應用。另外在金融風險分析,股票價格定價等等都有比較好的應用。

在我們網站上有一個列表,所有支持GPU應用的軟件,我們都在這里詳細列出來了,軟件的名字,主要干什么的,然后它支持單GPU,多GPU,大概的加速是多少,我們都有一個介紹,用戶使用的軟件是否是GPU,可以到上面去查一查。

HPC最重要是并行化,從單GPU到多GPU,從單核到多核這樣的發展歷程。另外就是綜合處理器,又叫加速器這種方式,加速器的方式是我們GPU發展的方向。另外CPU和GPU的融合,現在我們的架構CPU和GPU還是獨立的,將來的發展是CPU和GPU會融合在一起,業界也做了一些工作。我的介紹就到這里,謝謝大家。

關鍵字:CPU

原創文章 企業網D1Net

x Nvidia GPU并行計算高級顧問羅華平演講 掃一掃
分享本文到朋友圈
當前位置:服務器行業動態 → 正文

Nvidia GPU并行計算高級顧問羅華平演講

責任編輯:sjia |來源:企業網D1Net  2012-06-20 16:45:47 原創文章 企業網D1Net

“高效制勝、擴展無限—Dell HPC 行業應用實踐交流會”于2012年6月20日在北京悠唐皇冠假日酒店盛大召開,戴爾技術專家及行業技術精英和與會者切磋交流,共商HPC發展之大計。

以下是現場快遞。(聲明:本稿件來源為現場速記,可能有筆誤和別字,僅供參考)

主持人:今天最后一個發言的是Nvidia GPU并行計算高級顧問羅華平。


Nvidia GPU并行計算高級顧問羅華平

羅華平:大家下午好,今天我講的主要內容大概有四個方面,GPU簡單的介紹,另外應用我們Tesla產品的介紹,另外給大家簡單介紹一下GPU編程方式,另外我們GPU應用情況,主要是四個方面的內容。

什么是GPU計算?簡單講GPU計算是這幾年非常火的話題,現在正在德國漢堡舉行的國際超算年會上,GPU計算,或者加速器的計算方式也是比較熱門的話題。GPU計算簡單的講,在我們標準X86的架構上,加上GPU來做處理,為什么加GPU,GPU有非常強大的處理能力,通過它來彌補CPU處理能力的不足,可以把大量的計算任務交由GPU來計算,CPU和GPU同時協作計算。

其實我們回過頭來看一看Intel CPU發展情況,80年代初Intel剛剛發明CPU的時候,第一代8080,8086,其實那時候的CPU是沒有浮點運算能力的,后來Intel為了彌補CPU這個不足,后來又發明了另外一個芯片,8087,專門的浮點處理器,協助CPU做浮點運算工作。所以說這種CPU加GPU的架構,很多事情我們回過頭來看看有相似之處。所以說在這種架構中,我們也稱混合的計算環境。

為什么利用GPU來做并行計算,最重要的一點就是我們GPU浮點運算能力非常強大,GPU訪問帶寬速度非常快。GPU的浮點,綠色的是GPU,藍色的是CPU,CPU的浮點運算非常強。另外帶寬也是一樣,有很大的差距。上個月我們在美國硅谷我們還發布了新一代的Tesla產品,他的浮點運算能力又提高了至少一倍,我們現在跟CPU相比也能保持一個比較大的運算優勢。

我們有一個小小的圖可以看到編程的方式或者是數據流的工作模式,CPU把系統內存數據傳到GPU內存中其,傳完以后,對CPU發出指令去計算,GPU進行計算,計算完了以后再把結果傳回到CPU,CPU做進一步的處理,這是我們CPU+GPU異構架構的工作模式,這是我們基本的數據流程。現在CPU和GPU的這種架構,已經得到了業界廣泛的認可,在很多領域都得到了非常好的應用,在這里不詳細說了,前面的報告里面也都介紹了不同的應用類型,總體來講,GPU加速的方式,異構模式,對于我們絕大部分計算來說都有非常好的好處。我的印象中,我的客戶得到了加速最是中科院力學所,他的程序移到GPU以后,據他們講900倍的進行加速。

從我們每年超級計算機的排名我們也看到,這是在去年前年,我們在國內也是比較熱門的話題,上午演講中也提到過,天河一號,當初出來以后,是排名世界第一計算機,截止到這個月上個禮拜之前還保持在第二的位置,現在剛好是昨天在漢堡舉行的超算年會上,新一屆排名出來了,天河已經落到了第五位,星云已經落到第七位。這是最新的情況。但是在前十名中現在還有三名是用GPU來做的異構架構,在整個TOP500中,根據這次最新的排名,大概有13臺機器進入了前五百,在三年前,08年我們只有一臺機器進入前五百,現在已經有13臺。

總體來講,采用CPU+GPU異構架構對我們用戶有非常好的好處,用戶可以得到非常高的性能,用戶在同樣運算情況下可以得到更高性能的機器,性價比非常好,另外的話,能效非常好。同樣計算能力下為大家節約計算空間。

下面我們簡單看一下Tesla產品,我們剛剛發布新的產品,基于CUDA架構的GPU,我們每兩年性能會翻一倍。Tesla K10,這個產品主要針對單精度運算應用,不適合做雙精的應用。這個產品跟我們現在的M2090相比性能有了非常大的提高,他是在一個板上有兩個GPU,總共有三千多個核,它的浮點運算能力到了4.58個T,大概是M2090三倍左右,但是他的功耗非常低。K10我們主要是用在石油、電子資料處理、加密、解密、視頻解譯。我們今年下半年還發布了新產品,K20,雙精和單精性能都非常好的產品,大概是這樣,今年年底會推出。

現在對GPU運行修改方式三種,第一種就是利用GPU函數庫的方式,第二種是OpenACC的方式,第三種是CUDA/C Fortran的方式。這幾種方法也可以結合起來使用,也可以使用一種、兩種、三種,都可以。

我們稍微提一下OpenACC,OpenACC是一個開放的標準,現在不但要支持CPU還可以支持GPU,還有其他家的加速器,將來可以在不同的架構上運行。我們現在和PGI合作做了一個推廣,我們有一個30天免費的使用,用戶可以去下載應用。這種方式也非常有效,很多用戶用起來也非常好。還有其他的案例,OpenACC的編程方式是非常有效的,效果非常快。

另外CUDA編程在這不想多說,主要提兩點,第一點就是CUDA走向開放,以前CUDA是采用專有的編譯器,現在采用的是開源的編譯器,使CUDA支持新的硬件成為可能。第二點是開發CUDA X86。GPU的程序開發這個生態鏈是非常完善的,從硬件,Dell大廠家,然后我們的編譯器,我們的工具等等,還有軟件包等等。

GPU在幾個領域都得到了非常好的應用,工業主要在石油天然氣,GPU的機器目的成為了主流機器,最近中石油的處理中心購買了五百個GPU,我們Tesla中標了兩百個GPU,教育科研,生命科學的研究等等,性能有了比較好的加速。另外在制造業,做結構分析,流體分析都可以支持,特別是結構分析。另外在我們政府密碼破譯,指紋識別,GPU也有非常好的應用。另外在金融風險分析,股票價格定價等等都有比較好的應用。

在我們網站上有一個列表,所有支持GPU應用的軟件,我們都在這里詳細列出來了,軟件的名字,主要干什么的,然后它支持單GPU,多GPU,大概的加速是多少,我們都有一個介紹,用戶使用的軟件是否是GPU,可以到上面去查一查。

HPC最重要是并行化,從單GPU到多GPU,從單核到多核這樣的發展歷程。另外就是綜合處理器,又叫加速器這種方式,加速器的方式是我們GPU發展的方向。另外CPU和GPU的融合,現在我們的架構CPU和GPU還是獨立的,將來的發展是CPU和GPU會融合在一起,業界也做了一些工作。我的介紹就到這里,謝謝大家。

關鍵字:CPU

原創文章 企業網D1Net

電子周刊
回到頂部

關于我們聯系我們版權聲明隱私條款廣告服務友情鏈接投稿中心招賢納士

企業網版權所有 ©2010-2024 京ICP備09108050號-6 京公網安備 11010502049343號

^
  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 龙口市| 永嘉县| 贡嘎县| 连平县| 彝良县| 綦江县| 侯马市| 山东省| 新乡县| 凤翔县| 金沙县| 礼泉县| 芦山县| 安远县| 河津市| 新闻| 邵东县| 永嘉县| 剑河县| 林西县| 巫溪县| 阿拉尔市| 商丘市| 慈利县| 灵山县| 茂名市| 衡阳县| 临沂市| 镇平县| 花垣县| 新化县| 安福县| 台安县| 大港区| 六枝特区| 霍州市| 金门县| 高要市| 千阳县| 金塔县| 册亨县|