浪潮存儲承載中國天眼的海量數據(圖片來源:國家天文臺)
中國天眼:新基建的典型代表
“中國天眼”位于貴州平塘縣克度鎮深山里的“大窩凼”,坐落在幾百萬年前形成的喀斯特丘陵中,從山頂向下看,就像一口“大鍋”,其口徑達到500米;其球狀反射面相當于30個足球場,從底部到頂部垂直高度138米,超過世界上最大的胡夫金字塔。
作為涉及到天文、力學、材料、機械、無線電、IT等多個領域的科技基礎設施,“中國天眼”不僅是中國科學家砥礪奮斗二十余載的成果,更是中國在科技基礎設施領域的一次突破。國家發改委近日明確指出新型基礎設施的范圍,其中創新基礎設施是指支撐科學研究、技術開發、產品研制的具有公益屬性的基礎設施,像“中國天眼”這種重大科技基礎設無疑是新基建的典型代表。
自2020年1月11日正式投入運營以來,“中國天眼”已發現132顆優質的脈沖星候選體,其中有93顆已被確認為新發現的脈沖星。中國天眼項目科學家李菂表示,“FAST是目前世界上靈敏度最高的射電望遠鏡,是美國阿雷西博望遠鏡的2.5倍以上,巡天速度是阿雷西博的10倍。FAST預計對國際同類設備至少可以保持二十年以上的領先地位。”
更加重要的是,“中國天眼”正在著手建起觀測、科研、數據三大完整科學研究框架,將天文學研究與數字化技術緊密結合,對長期運行產生的海量數據進行存儲與計算分析,加速我國在天文學前沿科技領域更深層次課題的研究步伐,徹底擺脫我國天文學研究過去借用國外設備、只能研究邊緣課題的局面。
科研數據的要素屬性日益凸顯
數據作為新型生產要素,其重要性正在各行各業凸顯。根據最新的《中共中央國務院關于構建更加完善的要素市場化配置體制機制的意見》,數據要素成為除土地、勞動力、技術之外的新增要素,數據生產要素不僅在業界形成廣泛共識,也從政策上獲得了國家背書。
科研數據作為支撐國家科技創新的戰略資源,正在成為科學研究與發現的新型驅動力,是科研領域重要的生產要素。科研數據往往具有數據密集型范式的特點,具有不可重復性、高度不確定性、高維、計算高度復雜等特征,科研人員需要利用大量數據的相關性、可取代因果關系和理論與模型,基于數據間的相關性能夠獲得新知識、新發現。
以“中國天眼”為例,它就是人類認知宇宙萬物的一雙眼睛,通過不斷觀測宇宙暗物質、暗能量等各種信息來開展從宇宙起源到星際物質結構的探索。自正式投入科學觀測以來,“中國天眼”每天產生約500TB零級未壓縮數據,然后通過高速網絡將數據傳輸至數據中心進行存儲和處理,支撐起相關的科研工作。中科院國家天文臺副臺長鄭曉年表示,預計FAST未來十年的數據量將超過100PB。
隨著數據在科研領域的生產要素屬性日漸顯現,科研數據的高質量與完整性在“中國天眼”的日??蒲泄ぷ髦幸呀涀兊弥陵P重要。數據正在深刻改變“中國天眼”科研模式,引領著現代天文研究的最新發展趨勢。
讓FAST更FAST的秘訣何在
而隨著時間推移和科研任務的深入,“中國天眼”不斷產生海量數據,對存儲容量、性能的需求也在不斷增長。為此,國家天文臺近年來持續推進FAST科研數據中心建設。在最近一次升級中,國家天文臺攜手浪潮存儲,以分布式存儲AS13000G5構建30PB可用容量、50GB帶寬的天文大數據平臺,為中國天眼的天文大數據存儲、處理和實時分析提供有力支撐。
浪潮存儲
此次,浪潮存儲的作用不僅是讓中國天眼“裝得下”數據,更成為天文大數據分析的“加速器”,在宇宙未知領域探索中發揮積極影響。在中國天眼項目中,浪潮存儲獨創性地在一套分布式存儲平臺里部署了面向HPC和AI應用的H節點和面向高密度場景的M60兩種節點,實現冷熱數據分級存儲,高性能節點提升天文大數據處理和分析的效率;高密度節點實現單節點容量接近1PB,提供海量存儲空間;并且,不同層級存儲之間能夠根據天文業務需求實現數據自由流動,帶來更加快捷的科研體驗。
中國天眼數據中心專家表示,“這次和浪潮存儲的合作讓我們印象深刻,浪潮存儲不僅有硬核產品,還有專業生產、交付團隊。即使在疫情這樣的特殊情況下,浪潮存儲仍然能夠推進項目提前上線,這超出了我們的預期”。
未來,隨著“中國天眼”觀測、科研、數據三大完整科學研究框架加速建成,我國的天文科研實力必然會再上一個臺階,在浩瀚宇宙中展現出中國科研的實力。