摘要 : 二者不是誰打敗誰。沒有超算完成大規模的基礎科學研究和計算密集型的工作,云計算也不可能給合作伙伴和用戶交付有價值的東西。
在上周五(12月12日)召開的2014年度亞馬遜AWS技術峰會上,華大科技副總裁陳鋼上臺為AWS做證言稱,由于廣州和天津兩大超算中心并不完全針對to C業務,而且沒有本地存儲,所以華大正在往云平臺上遷移。陳鋼的證言,被業內解讀為華大基因正在拋棄高性能計算。
今日,華大科技方面專程通過《在前線》對這一觀點做了反饋和澄清。
陳鋼在接受《在前線》采訪時詳細地介紹了華大科技在IT方面的布局,他指出,在高性能計算和云計算方面,華大科技有清晰的戰略,這兩者都占有舉足輕重的作用。
華大基因被妖魔化?
華大科技是華大基因的子公司,而華大基因是全球知名的生命科學研究機構、全球最大的基因組學研究機構,全球頂尖的三家基因組研究機構之一,另外兩家是美國的Broad和英國的Sanger。
近年來,中國的高性能計算水平逐年提升,來自中國的超級計算機系統成為全球超級計算機TOP 500排行榜的???。
由于高性能計算多用在科研、軍事、能源、生命科學等要害部門和行業領域,因而各個國家都對高性能計算持續投入,近年來,中國已經成為繼美國、日本等發達國家之后冉冉升起的高性能計算領域新星。
陳鋼介紹說,國家對生命科學研究方面給予了大力支持。由于有國家超算中心的大力支持,華大基因在計算資源和技術支持都能夠得到很好的保證。
說到這里,問題來了,華大基因既然并不缺資源,為何還要使用云計算?
之所以采用云計算,一方面是基因科學領域的不斷發展導致的,另外是有具體的原因。
陳鋼解釋說,大量計算密集型的工作在超算中心和華大自己的數據中心完成后,需要將結果交付給合作伙伴和分支機構。以前的做法是大量使用FTP和快遞硬盤。但是相比之下,如今云計算有著遍布各地的數據中心,顯然這是一個更好的解決方案。
另外,基因組學的科學研究成果需要大量地轉化為應用,華大為全球用戶提供服務時,自建機房顯然不是最佳選擇。因此,華大需要云計算,尤其是在海外需求更強烈。
陳鋼強調說,需要指出的是,云計算并不是要替代超算以及自己的數據中心。沒有超算完成大規模的基礎科學研究和計算密集型的工作,云計算也不可能給合作伙伴和用戶交付有價值的東西。
高性能計算和云計算缺一不可
據陳鋼介紹,華大基因在IT方面的需求主要來自三個方面,第一個是基礎研究中的大規模計算,例如大規模的腸道菌群宏基因組研究,計算量非常大,同時需要用到CPU和GPU;大規?;蚪M的組裝工作,計算復雜度高,需要不斷的探索和調整算法及算法的參數,例如最近剛剛發表的鳥類基因組和進化分析的研究成果。
這一部分需求由華大自己的數據中心和國家超算中心來滿足,其中計算密集型的項目大量使用國家超算中心資源。
第二方面的需求是致力于完成百萬人類基因組項目所需的存儲和計算資源。目前滿足這方面需求的方案,還在規劃當中。
第三方面的需求是為華大基因的全球用戶消費者交付數據和分析結果。滿足這方面的需求,之前是使用華大位于深圳、香港、武漢的自有數據中心。目前正在向以AWS為代表的公有云遷移。
陳鋼補充說,“為了完成這個遷移,更重要是為了能以華大產生的海量基因組數據為基礎構建起全球的基因組學研究平臺,我們正在共有云上分別開發面向科學研究、臨床診斷,個人基因組等不同類型用戶的系統和應用。”
陳鋼談到的這一點,正是在AWS技術峰會上引發業界議論的結點所在。“我們并沒有像外界所說的那樣,拋棄高性能計算,更沒有全面都撲到云計算上面,而是有清晰的戰略和布局。”
據悉,華大科技在數據交付方面,長期跟AWS有業務往來,但規模并不大。從去年開始,隨著華大開始構建基于云計算的生物數據分析平臺,以及AWS進入中國,其與AWS的業務開始有了大幅增長。
如今,華大科技正在積極拓展海外市場,隨著云計算生物信息平臺逐步的完善和在海外市場的推出,與AWS合作的業務量也在加速。
亞馬遜AWS如今是全球最大的公有云服務提供商,于2013年12月份AWS宣布在中國啟動測試版,當時華大基因就是AWS在中國的首批用戶。
陳鋼表示,在為華大基因服務時,AWS安排了客戶經理和技術團隊,為華大全球業務提供技術支持,從深圳、香港到加州,都可以快速地得到響應和支持。
在本次技術峰會上,AWS發布了“AWS云創計劃”(AWS Activate),并攜手重慶市政府建立AWS在中國的第三個聯合孵化器。“AWS云創計劃”是一個全球性創業加速扶持計劃,可以提供的支持包括最高可達人民幣10萬的AWS服務抵扣券、技術培訓、創業公司專項活動以及內容廣泛的開發者支持。