ZDNet至頂網服務器頻道 12月16日 新聞消息(文/于澤):陽春白雪的高性能計算(High Performance Computing,HPC)何時能步入尋常百姓家,一直都是業界關注的話題。究其難點,不外乎應用單一、管理難做,而云的發展普及則給HPC的快速落地提供了很好的契機。
踏著HPC的熱浪,借著HPC China 2014(全國高性能計算學術年會)和SC14(全球超算大會)的余溫,ZDNet也邀請到了IBM HPC領域的兩位專家,一起來談談HPC發展的現狀,以及IBM對未來的見解。
總的來說,由于硬件的愈發標準化,HPC的發展正步入下一個階段,即拼的不再是硬件誰家強,而是比軟件和應用誰更強。而憑著清晰的認知以及多年的技術積累,IBM在HPC領域已經占得先機。其所提出的HPC云早已不再是概念,而實實在在地應用在了包括制造、能源等多個行業。
欲詳細了解HPC云為何物,與云及高性能計算有何區別,當前有哪些用戶在應用這種模式,以及HPC、HPC云未來的前景,請觀看視頻或閱讀訪談實錄。
以下為訪談實錄:
主持人:各位觀眾大家好,歡迎收看本期ZDNet視頻訪談節目,今天做客演播室的兩位嘉賓分別是IBM系統與科技事業部Platform Computing大中華區業務經理周立旸先生和IBM系統與科技事業部Platform Computing資深行業解決方案顧問夏冰先生。
左:夏冰 右:周立旸
請他們來主要是跟我們聊一聊HPC的那點事兒。之所以聊這個話題,也是因為HPC最近確實很火,11月5日在廣州舉辦全國高性能計算學術年會(HPC China 2014),緊接著在美國又有SC2014全球超算大會上演,在兩場大會上都展示出了全球最新、最尖端的一些HPC相關技術和解決方案,今天請兩位嘉賓來也是聊一聊HPC業內的一些發展動態,以及IBM的前沿技術和解決方案。
首先請教的是,兩位都是業內資深專家,能否先簡單談一下對HPC現狀的一些看法。
周立旸:總的來說,這些年高性能計算(HPC)在硬件方面越來越走向開放的標準化的硬件環境,無論是我們國內最新一期的高性能計算榜單,還是全球的高性能計算榜單,都可以看到排名靠前的一些系統的整個硬件環境并沒有太大的變化。在這樣的環境之下,IBM也會和其他業界廠商一樣,基于我們Power平臺,基于我們一些開放的基礎設施,繼續研制基于IBM設備的高性能計算硬件環境。
另一方面,近年來高性能計算在軟件和應用模式層面的發展變化是非常大的,每天都在不斷誕生新的應用模式、新型的應用。IBM也會繼續加大在軟件方面的研發投入,來定制更多的基于軟件定義的高性能計算環境,包括一些新的應用模式,比如HPC云就可能會作為新的一種部署方式得到更加廣泛的應用。
主持人:聽您剛才介紹IBM應該說更多在應用和軟件層面發力,其實最近關注到IBM HPC的最新動態是提出了HPC云的概念。而在我們以往印象中,HPC和云可以說是兩條平行線,IBM是怎么使兩條平行線相交叉在一起的?
周立旸:過去,高性能計算和云計算的確是兩條平行線,無論是應用還是使用模式都不一樣。比如,高性能計算一般運行在一些專屬的硬件設備上,其應用模式相對比較單一,主要以MPI應用為主。另外,高性能計算的應用大多數情況都是很多臺機器為一個應用服務。
而云計算可以說是完全不一樣的情況,云計算大多數的應用都運行在虛擬機上,有各種各樣不同種類的應用,且很多云計算的應用模式是把一臺機器當作很多臺機器供不同的用戶來使用。
近些年這一情況其實發生了一些變化,一方面高性能計算的硬件設備現在越來越走向了開放,采用了一些標準化的硬件設備。而在應用種類上除了一些MPI應用之外,也有更多的并行應用產生,所以應用的種類也越來越多樣了,用戶的數量也變得越來越多。
在傳統云計算領域,也有越來越多的分布式應用產生,由此會衍生出很多分布式應用所需要解決的問題。所以近些年來我們可以看到高性能計算和云計算這兩條平行線可能會走向一個交集,共同點越來越多,一些新的應用模式也逐漸產生,比方說高性能計算云,也就是HPC云。
所以,在我們看來高性能計算實際上是傳統高性能計算的一個自然發展階段,或者說是一個演變,實際上是為了適應于目前一些新的應用模式、新的應用需求而產生的。
主持人:聽完您對HPC云的介紹,緊接著就有兩個問題,一個是HPC云與我們現在所說的公有云、私有云和混合云有什么區別,還有一個就是其與傳統HPC高性能計算又有什么差異?
夏冰:HPC云和我們所說的云計算的區別主要有以下幾點,第一點是在性能上,HPC云我們一般都是采用物理機的模式來提供給用戶計算資源,并伴隨著高速的計算網絡,而不像傳統的云計算只是以虛擬機的方式來提供給用戶使用。
第二點是在工作負載管理上,HPC云中我們會提供專業的高性能計算工作負載管理工具來滿足整個機群的管理調度要求,而不像云計算只需要進行簡單的資源管理調度。
第三點,針對高性能計算用戶我們會提供專業的高性能運維團隊,來保證整個集群的平穩運行。
第四點就是靈活性,根據用戶實際的業務需求我們可以采用私有云、公有云,以及混合云的方式來靈活針對用戶的不同業務需求來提供不同的計算類型。
周立旸:關于高性能計算云和傳統的超算中心、高性能計算中心的區別,我覺得可以從兩個方面來講。第一個,實際上目前所有的超算中心或者高性能計算中心,從某種程度來講和云計算已經有了很多類似之處。舉例來講,它們是按照實際使用進行計費,通過網絡提供計算服務,而資源本身也具備相當大的可伸縮性和彈性。
所以,在這些方面它和云計算本身就有相當多的共同點。但是,和我們剛剛所說的高性能計算云來比,它在某些方面又有一定的局限性。舉例來講,傳統的超算中心、高性能計算中心,它的應用種類相對來講比較單一,主要以有限的一些科研和工程計算應用服務為主。另一方面在服務模式方面也有相當大的局限性,一般是以機時服務為主,如果用戶需要一些專用的虛擬機集群,或者專用的軟件堆棧,就會面臨一定的局限性。
所以,高性能計算云從這個角度來講可以作為傳統超算中心或者高性能計算中心的一個擴展,IBM可以提供一個更加靈活豐富的計算應用服務平臺來打破現有的局限性,使得超算中心、高性能計算中心能夠提供更加多樣化的服務,從而大幅提升整個資源的利用率,增加服務對象的寬度和廣度。
主持人:聽完兩位對云與HPC云,以及傳統超算中心與HPC云之間區別的解讀,其實很容易理解HPC云集合了兩者的優勢于一體,那HPC云對于傳統的一些HPC典型應用場景,比如說科研、航天航空、醫藥等領域,它能帶來什么獨特的價值?
周立旸:我覺得主要的價值可以體現在以下幾個方面,首先第一個就是靈活性,通過HPC云可以提供給用戶更多應用部署的方式和應用服務,比如IBM可以針對哪些用戶提供一個虛擬專用集群,還可以針對不同軟件的實際需求提供不同的操作系統和相應的軟件堆棧。通過這種靈活性可以使用戶更多地進行創新性實驗,更快地得到所需要的結果來推動創新成果的應用。
第二個好處當然是在成本方面,對于單個應用而言,企業不需要針對其部署一套專用的基礎設施,而是可以通過這種共享的方式來實現各種不同種類的應用服務。所以對于總體應用成本會有大幅下降,無論是軟件還是硬件。
第三個好處是在效率上面,如今很多的應用并不需要采用固定的方式去進行排隊或者是進行調度,而是可以根據實際資源使用的情況來進行動態的擴展調度。對于有需要的應用它可以得到更多的資源來完成它所需要進行的工作,所以它可以更快地得到相應的結果。
第四個是管理上的優勢,對用戶來講很多傳統需要手工操作的工作,無論是對應用進行管理還是對基礎設施進行管理,現在可以通過一種更加靈活方便的方式進行,更自動化。所以在管理層面的開銷也會大大降低。
從這四個方面來講我們認為這都是高性能計算云可以帶給用戶的一些實際價值。
主持人:IBM HPC云現在有沒有一些重點聚焦的行業,是否有一些典型的案例能給我們介紹一下?
夏冰:IBM HPC云在國內外其實都有很多的成功案例。比如,在國內石油石化行業,我們在大港油田信息中心推出了勘探開發協同云平臺,在其實際業務中,他們將處理及解釋類業務,以物理機和虛擬機相結合的模式來提供給下屬的業務部門使用。
在國外像哈里伯頓旗下的蘭德馬克,就與IBM的SoftLayer進行合作,也是將他的一些業務軟件放在我們數據中心,以SaaS的服務模式提供給客戶使用。
在制造業,我們在歐洲有一個大型汽車制造商的客戶,他自己本身就有很強的HPC計算能力,但是每年還是會有計算高峰的時間存在,他們也是跟SoftLayer進行合作,將一部分的計算峰值放在云數據中心處理。
除此之外,像日本的ANSYS也是通過與SoftLayer云數據中心合作的方式,將他的一些業務軟件放在云計算平臺上供用戶使用。
周立旸:除了夏冰剛剛介紹的傳統高性能計算的用戶外,在一些新興的應用領域里也有大量的客戶在采用高性能計算云這種方式。比如在金融領域,有些客戶可能會有大量的分析、定價,以及實時計算的需求。由于整個業務的分布性使得可能在某些時間段里,這些應用都會有一個非常高峰的計算需求。這時候同樣可以把這些類型的應用部署在HPC云環境中,來實現一個多租戶的可彈性共享的高性能計算分析環境。所以,這些也可以說是HPC云的一些新興應用領域。
主持人:聽完了兩位的介紹感覺到HPC云其實已經有著比較廣泛的應用,我們回過頭再談HPC。HPC其實更多強調的是計算,云更多強調的則是彈性,最簡單的考慮,兩者相加而來的優勢可以說在數據分析方面有著很明顯的優勢,包括現在也有人在談HPA,兩位能否談一下HPC云或者說HPC未來的前景。
周立旸:我認為高性能計算的應用范圍和應用面在未來肯定會越來越廣,可能除了傳統的一些科學計算、工程計算外,越來越多的企業計算也會采用到高性能計算的一些手段和工具。
因為用戶很多時候需要解決各種不同應用種類的融合問題,剛剛主持人也提到了HPA,大數據現在也是一個很大的話題,但是實際上隨著數據量越來越多,如果要對這些數據加以分析和利用,同樣需要龐大的計算資源來對這些數據進行處理。
所以在這種新的應用環境里面,越來越多的客戶可能他會需要一個融合的計算服務平臺。在這個計算服務平臺里,一方面要能夠滿足越來越多的數據管理需求。另一方面又要能針對各種不同類型的應用,針對所產生的數據進行處理。所以在這種情況下,用戶未來可能需要一個更加好的軟件定義的基礎設施環境,來提供這么一個融合計算服務的平臺,以同時滿足不同類型的高性能計算、高性能分析和大數據應用的需求。這也是我們認為在未來幾年中高性能計算云的一個主要的應用方向和發展領域。
在這方面我覺得有很多領域都值得我們關注,比如怎樣在融合的計算服務平臺里面來更好對基礎設施進行融合的管理,怎么樣針對不同類型的應用提供一個融合的高性能的數據服務平臺,以及在工作負載方面怎么樣來滿足各種不同類型的高性能計算、高性能分析的應用管理需求,這些可能都是未來我們值得努力或者加以研究的方向。
主持人:感謝兩位嘉賓的分享,通過兩位嘉賓的介紹讓我們對HPC、HPC云,乃至HPC未來的前景都有一個非常清晰的認識。再次感謝兩位,同時也感謝各位網友的收看,謝謝,再見。
周立旸、夏冰:謝謝,再見。