中科曙光公司28日在北京發布中國首個“科學大數據引擎”,旨在幫助政府部門、科研院所、教育機構、大型企業等用戶向大數據轉型。
中科曙光公司總裁歷軍說,數字化進程有力地帶動了產業升級和技術革新,大數據研究成為繼理論、實驗和計算模擬之后的第四種科學范式。不過,科學大數據的海量、多源、異構、高維等特征,也給傳統的高性能計算機帶來挑戰。
在曙光公司高性能產品事業部總工程師戴榮看來,中國的科學研究正在變成一個又一個“大數據問題”。他舉例說,“千人基因組計劃”每月產生1萬億條堿基序列信息,中國30多個在軌民用航天平臺每年有超過3PB遙感衛星數據,大型強子對撞機實驗每年產生15PB原始數據,但“傳統的數據管理模式已不能滿足需要”。
記者也注意到,中國官方發布《促進大數據發展行動綱要》,明確提出要發展科學大數據,以實現科學數據的開放共享和應用服務。7月出臺的《“十三五”國家科技創新規劃》進一步明確在人工智能、材料基因、生態環保、精準醫療等重點領域的大數據發展規劃。
中科曙光公司誕生于中國科學院,且已服務于500米口徑球面射電望遠鏡(FAST)、“地球數值模擬裝置”原型系統等多個大科學項目。他們提出,科學大數據引擎將實現計算存儲分析一體化,充當連接數據源和業務應用的“黑匣子”,架起從科學數據到科學發現的橋梁。
戴榮說,在科學大數據引擎的“黑匣子”里,部署著曙光全系列數據計算技術及服務產品,有高效敏捷的大數據處理平臺、類型豐富的高性能計算平臺、深度學習計算平臺等引擎組件,可為用戶提供實現科學數據存儲、分析和管理的一體化解決方案。
他介紹,這個“科學大數據引擎”支持PB級數據處理能力,有已經過驗證的中國最大存儲系統,還可為上萬節點提供在線、移動、實時自動監控服務。(完)