天文學是最早的數據驅動學科,云計算與大數據技術是制約學科發(fā)展的關鍵因素。除了海量天文數據,在線服務、軟件工具、數據處理系統、分析挖掘環(huán)境等也都是推動天文科研、科普的重要因素。
海量的數據與先進的信息技術“融合”,在天文學領域結出碩果的同時,將在更廣闊的空間發(fā)揮引領和示范作用。比如,分布式海量數據存儲、大規(guī)模計算、新一代應用架構、機器學習和人工智能等方面的技術,幫助中國科學院國家天文臺逐步實現數據資源上云,其中包括在貴州最新落成的FAST(中國天眼)觀測的數據。
FAST是由中國人創(chuàng)造的世界上最大的單口徑射電望遠鏡,它為我國天文學研究者提供了先進的儀器設備,同時也帶來了海量大數據。有統計顯示,FAST進入正式科學觀測后,每天將產生高達50TB的數據。
在FAST早期觀測時,國家天文臺采用的是漂移掃描的觀測模式,這個模式有一個19波束的接收機,帶寬400兆赫茲,通過1G的頻率進行采集,它的原始數據的產生率是38個GB每秒,壓縮后會小到原來的1/5到1/6,也就是大約6個GB每秒。
國內除了FAST,還有“悟空”衛(wèi)星等,在國際上我國也有很多大型天文望遠鏡觀測項目,如跨越南非和澳大利亞的一平方千米的天線陣,據稱它的原始數據產生率將會超過十個PB每秒,將超過目前全球互聯網的帶寬,這都將給天文學帶來海量數據。
人類從哪里來,宇宙有哪些奧秘,這些其實是生命起源的最基本問題。研究這些基本問題的天文學是一個開放的學科,數據都向全世界開放共享。國際合作是天文學的“基因”,天文大數據將大大推動計算科學的發(fā)展。云計算技術發(fā)展到一定程度,世界上就會有更多人可以參與到人類這些基本問題的研究中來,產生全球共享的效應。
以郭守敬望遠鏡為例,它是我國天文學領域第一個國家大科學工程項目,也是世界上光譜巡天效率最高的望遠鏡。自2009年落成以來,已經獲得超過700萬天體的光譜,是世界上最大的天體光譜庫。目前,郭守敬望遠鏡的產品數據已經完成上云,并通過對外公開數據發(fā)布網站向全世界開放。上云完成后,將大大提升郭守敬望遠鏡觀測數據的顯示度和利用率。
在大數據時代,如何訪問和使用這些海量的信息成為了全世界天文學家面臨的難題。虛擬天文臺之父、美國約翰·霍普金斯大學的Alex Szalay教授提出了“虛擬天文臺”的設想。
虛擬天文臺是通過信息技術,將全球范圍內的天文數據無縫透明連接在一起,從而形成數據密集型網絡化天文研究與科普教育的平臺。多年來,我也一直致力于中國虛擬天文臺的研究和建設。
由中國虛擬天文臺與微軟研究院合作完成的“WWT北京社區(qū)”,成為了WWT官方中文門戶,正為全球的中文用戶提供各種信息和資源。
大數據時代,虛擬天文臺拉近了公眾與宇宙之間的距離,而中國虛擬天文臺和星明天文臺推出的“公眾超新星搜尋項目”,則為普通公眾在欣賞宇宙之美的同時,有了參與天文新發(fā)現的可能。也許將來國內有更多擁有天文設備的愛好者、組織團體加入到該項目中,尋找更多類型的天體,也將不斷充實虛擬天文臺為公眾服務的內容和功能。借助大數據帶來的科技進步,全民搜星的時代或許很快就會來臨。