“大數據是財富,是資源,是科研的戰略高地。大數據正在改變人們的研究方式,是人類認識自然和行星地球的新鑰匙。”
這是中國科學院院士、中科院遙感與數字地球所所長郭華東于日前在北京召開的大數據與科學發現國際研討會上做出的判斷。從數據發展歷史看,19世紀70年代以來,數據量大約每十年翻一番;從工業化時代進入信息化時代后,數據量以每三年翻一番的速度持續增長;當今社會,隨著計算機技術和互聯網的快速發展,數據存儲量、規模和種類更是飛速增長,“大數據時代”已經來臨。
“不過,在大數據概念與應用實踐中,互聯網大數據、商業大數據得到了廣泛重視和快速發展,與之相比,科學大數據的理論研究與實踐還相對較少。”
在郭華東看來,大數據有著重要的發展潛力,其中重要的一點是能夠改變人們的科研方式。“通過對大數據的挖掘,取得新的科學發現。”
實際上,科學界已經有了這樣的先例。比如上帝粒子的發現,就是歐洲強子對撞機長期數據積累的結果;而諸如人類基因組計劃、全球變化研究等,浩瀚的數據量也不斷產生著重要的科學發現。
與此同時,科技界屢現大數據相關的論文、專刊和書籍。2008年,英國《自然》雜志率先出版了“大數據”專刊,分析了大數據對當代科學的影響和意義;2011年,美國《科學》雜志推出“數據處理”專刊;2012年,聯合國發布大數據政務白皮書《大數據促發展:挑戰與機遇》……
“大數據的數量之大已經出乎了人們的預料,更重要的是,它改變了人類認識自然的方式。”郭華東告訴《中國科學報》記者,“尤其是需要巨額投資建造、運行和維護大型研究設施的大科學工程,以及需要跨學科合作的大規模、大尺度的前沿性科學研究項目,更是與大數據聯系密切。大數據+大科學=大發現。”
目前,國際上已經有一些學術組織和大型科學計劃在著力推動科學大數據的發展,如國際科學理事會下屬的國際科技數據委員會是全球最大的科技數據國際學術組織,現擁有國家會員、國際學術組織會員等50余個會員。2010年郭華東當選該組織主席。
任職期間,郭華東努力加強與各國際組織的聯系,為其提供戰略指導和專業的關鍵數據,積極推動各項工作,取得了顯著的成績。
在這些工作中,郭華東發現,科學大數據要真正引發科學上的大發現,還存在著一些瓶頸。除了數據獲取、處理、存儲、傳輸、系統控制等技術瓶頸外,理念和政策上的瓶頸更亟待突破。“對我國來說,政府已經認識到了大數據的重要性,但數據的共享工作仍然任重道遠,這座高山還遠遠沒有翻過去。”
一項統計數字顯示,中國目前擁有的數據量占全球的14%;而到2020年,這一比例將上升至21%。
可現實的情況卻是“即便同在一個單位里,兩個部門之間都很可能不相往來”,“這些部門其實都掌握了許多數據,但不共享,這就等于沒有大數據”。
郭華東呼吁,國家應將大數據上升為一項國家戰略,做好頂層設計,要從國家層面上推進中長期計劃和政策的實施。“大數據時代已經來臨,如果認識跟不上,將來落后的不止一步兩步。當我們把大數據看作與土地、森林、礦產一樣的國家資源時,這件事就能夠做好了。”