High performance computing(簡稱HPC)即高性能計算。指通常使用很多處理器或者某一集群中組織的幾臺計算機的計算系統和環境。高校中需要這種HPC,但面臨著多重巨大挑戰。具體的挑戰有哪些呢?根據分散式和集中式兩種HPC資源,總結如下:
1. 科研資源跨院系,資源分散、孤立,利用率低,資源相互之間無法共享,不斷投資擴容,消耗大量資金。
2.跨專業,各自維護資源,技術難度大,學校無法統一管理。
3.HPC部署難度大,網絡配置、操作系統安裝維護難度大,增加學習成本 。
4.數據存儲的成本攀升,性能不足。
5.平臺應用固定,靈活度差,軟件受限,難以滿足各院不同領域研究 。
6.網絡中心運維唯獨難度大,工作價值難于體現 。
海南大學與HPC海南大學,簡稱海大,是國家“211工程”重點建設大學,其特色學科包括海洋、生物、材料和制藥等學科,這些學科的科研往往需要高性能計算集群支撐,因此海大希望當前支撐學校業務系統的IT基礎設施也可以為科研高性能計算提供支撐。海大現有IT資源主要分布在網教中心和圖書館,承擔學校各類業務管理系統和公共服務平臺。除此之外,現有部分學科還配備少量高性能服務器資源支撐科研。IT資源分布分散,無法實現共享,整體IT資源的利用率偏低,投資回報率偏高。
HPC in Cloud2014年上半年,海大與國內從事網絡(含云計算)、服務器、虛擬化的多個廠家進行了溝通交流,通過組織校內外專家對廠家方案進行了嚴格的評審答辯,最后選定最好的三家方案作為基礎進行整合優化,形成公開招標方案。
最終,品高在公開招標環節勝出,為海大提供了最優的HPC與云計算融合的計算平臺解決方案(HPC in Cloud),即業務管理系統和公共服務平臺,面向目標用戶提供虛擬化服務及高性能計算服務。
包括:利用云平臺建立校級云資源服務平臺,并統一對教務和科研需求提供資源,老師可以按需申請HPC資源;通過應用自動化部署服務將常見HPC軟件打包成模板,各學科老師按需申請資源;利用閑時可以將教務系統部分資源,停機保號(關機但數據保留),將資源提供出來跑HPC業務;利用彈性服務功能,當應用負載增加時自動創建資源應對,降低業務宕機風險;利用SAN做高性能計算,用普通PC組成分布式存儲,存放結果數據,有效降低成本。