大家好,我叫吳一冰,負責品高云在教育行業的相關工作。給大家分享一個品高云在教育行業眾多方案當中非常有話題性的一個方案——HPC in Cloud,告訴大家我們的云計算是如何支撐高性能計算的。
首先來看看為什么我們需要做HPC(高性能計算)?
HPC現在用于很多科研,或者是用于需要由科研來支撐生產環境的一些具體的領域,需要大規模的計算能力來做仿真實驗,進行一些數據處理。舉個例子,比如說石油勘探,它需要根據我們現有的一些數據去算哪些地方有石油,有多少石油的儲備,這個是需要有非常大規模的計算能力的。再例如天氣預報、汽車設計及核爆實驗等,都需要采集大量的數據分析,然后進行相關數據的整合、預測以及根據歷史數據進行相關趨勢的判斷。
那在HPC具體在教育行業能做些什么呢?
對于學校來說,科研經費的申請方式是以項目為單位的,項目團隊之間的申請到的科研經費、資源可能相差很大,出現資源分配不均的問題。那項目組之間能否相互借用資源呢?答案是,比較難。為什么難?因為課題組之間相對比較獨立,我有我的科研課題組,你有你的科研課題組,我這個課題組的錢是得花在我們這里的,這是一個歸屬問題。第二點,即便我愿意借給你,我是不是真的能借給你?這就是第二個問題。
對于科研的高性能計算來說,不是用一個PC機就能把所有事情做完,它是有一個非常復雜的計算架構的。假如我是一個物理教授,我采購一套設備,只用了三個月,三個月后這些設備我就不常用了。如果我愿意借給你,當我借給你之后,你要把我的計算環境都鏟掉,如果你是化學老師的話你還要搭一套模擬化學分子實驗的環境,你可能還要花很長時間。然后你再把它還給我之后,我還要在重新搭回原來的環境。從技術層面和時間層面來說,科研資源之間的分享與借用所花費的成本都太高了。
以上問題簡單來說,就是資源交付效率比較低,資源交付效率低說一個簡單的解釋就是:資源從沒有到有的過程特別長。而云計算最好的特點,也就是它最本質的優勢,就是提高了資源交付效率。我們的資源,有硬件、軟件和各種各樣的系統,可以通過自動化的云服務的形式來支撐上層的各類應用系統,比如說它有結構的應用,同時也會有專門為了科研環境所準備的高性能計算的應用。比如說Matlab,對學校IT管理者來說,他需要做的事情非常簡單,他只需要分別配額給這些不同的科研團隊的人員讓他們自助使用就可以了,配額大家都知道,我可以分配你100個核,200G內存和500G存儲,你在這個范圍之內可以隨便去使用它,并不需要由它來做各種各樣復雜的安裝配置部署,統統由云服務自助完成就可以了。
作為一個高性能計算的平臺,它需要解決的問題很多,首先需要解決很多復雜的底層資源的環境。我們想讓網絡中心或者資源管理者只專注于做運營者而不是運維者,希望云來代替人來去解決這些復雜的問題。對用戶來說,需要他們動手做的東西,越簡單越好,越傻瓜越好。怎么才能讓那些搞生命科學的人都可以使用高性能計算呢?他們并不精通IT技術,所以對于他們來說越簡單越好。因此在這個過程中,云平臺能夠提供的服務就是,用戶只需去選擇計算規格、軟件及集群規模,剩下的事情直接交給由云來去自動的裝配所有的集群,去完成剛才的一系列復雜事情的自動化工作,能夠很好地解決用戶問題。
云計算通過提高資源的交付效率,使網絡中心IT管理員從運維者變身為運營者,也使學校網絡中心從成本中心向服務中心轉變,這就是我們品高云平臺所帶來的價值。