郭華東
“大數據已成為信息主權的一種表現形式,將是繼邊防、海防、空防之后大國博弈的另一個空間。”近日,中科院院士郭華東在接受《中國科學報》記者采訪時表示,大數據正在開啟一次重大的時代轉型,“它將改變人類的生活以及理解世界的方式”。
第二次工業革命的爆發,導致以文字為載體的數據量約每十年翻一番。從工業化時代進入信息化時代后,數據量以每三年翻一番的速度持續增長。而隨著計算機技術和互聯網的快速發展,半結構化、非結構化數據大量涌現,數據的產生已不受時間和空間限制。
郭華東介紹說,根據2012年互聯網絡數據中心(IDC)發布的《數字宇宙2020》報告,2011年全球數據總量已達到1.87ZB(1ZB=十萬億億字節),并且以每兩年翻一番的速度飛快增長。預計到2020年,全球數據總量將達到35~40ZB,10年間將增長20倍以上。
“1.87ZB的數據在數量上是什么概念?將這些數據刻成DVD,排起來的長度相當于從地球到月亮之間一個來回的距離。”郭華東告訴記者。
他進一步表示,作為一種技術創新,大數據符合一般的技術創新、發展、成熟規律。根據美國一家公司發布的技術分析報告,現階段大數據處于“膨脹的高峰期”,要達到“實質生產的高峰期”至少需要2~5年。
“大數據在政府層面已得到高度重視。”郭華東說,2012年美國政府啟動大數據研究與發展計劃,投資2億美元設立了若干項目。歐盟于2011年提出“開放數據戰略”,以促進經濟增長。2013年,歐盟還召開了歐盟數據論壇和大數據論壇。澳大利亞則在2013年發布了《大數據戰略報告》,將“促進數據開放和大數據發展”列為重大領域之一。在我國,政府部門也相繼啟動不同的大數據項目。
郭華東認為,大數據時代以及大數據計算的本質特征在于從模型驅動到數據驅動范式的轉變,以及數據密集型科學方法的確立。
“大數據促進了科學范式的轉化。”郭華東表示,幾千年前,科學以實驗為主要手段描述自然現象;過去數百年里,科學出現了理論研究分支,利用模型和歸納方法進行論證;過去數十年,科學出現了計算分支,對復雜現象進行仿真模擬。“今天,大數據時代的到來將理論、實驗和計算仿真等統一起來,從而形成了新的科學范式——數據密集型科學。”