“大數據的概念聽上去和云計算一樣,有些‘高大上’,但大數據絕不是一個空泛的口號,事實上它不僅改變了人們的生存面貌,更為科學研究帶來重大的機遇。”中科院遙感與數字地球所研究員郭華東說。
依托海量的數據狀態和云級別的數據處理能力,大數據以其Vol-ume(大量)、Velocity(高速)、Vari-ety(多樣)、Veracity(真實)的4V特點,帶來了一場全方位的思維變革、產業變革和管理變革。郭華東表示:“它把我們的科學研究各個領域以及各個環節都推到了一個前所未有的‘大數據時代’。”近日,以“科學大數據的前沿問題” 為主題的第507次香山科學會議在北京香山飯店舉行,會議邀請了來自全國各地多學科跨領域的專家學者,共同探討大數據時代下科學研究的基礎設施、創新模式與共享機制以及人才培養等問題。
在中國科學院計算機網絡信息中心主任黃向陽看來,計算機技術、以互聯網為代表的通信技術和以物聯網為代表的傳感技術的持續創新和廣泛應用使人類的數據化能力和范圍快速擴張。“以大科學裝置為代表的機構內部產生的數據量能夠被測量和記錄得越來越多,而我們對事物、現象等的測量、記錄也更加頻繁和細致。”他說。
“如今,這種擴張讓我們看到大量從宏觀到微觀、從自然到社會的觀察,計算、傳播等儀器設備和活動都在快速產生著海量、多樣的數據,” 黃向陽說,“比如高通量科學儀器、望遠鏡、衛星、加速器、傳感器網絡、醫療成像設備、測序儀等各種科研儀器和裝置、模擬方法、智能終端以及各種應用等,這些都使得科研領域被推到了一個前所未有的‘大數據’時代。”
海量數據的劇增,勢必讓量變引起質變,黃向陽表示,不斷增加的數據引發人們思維和行為模式的變革,而在科學研究領域,這也將直接為科研模式帶來極大的改變。“繼實驗科學、理論科學、計算科學之后出現了第四種研究范式,即‘數據密集型科學’,成為大數據時代下的新模式。”
“我們有理由相信,大數據為科學研究帶來了重大機遇,比如當所能利用的數據增加時,人們將可以做很多在小數據基礎上無法完成的事情。”黃向陽說。
盡管大數據時代的到來為諸多科研領域帶來新的曙光,然而如何將科學數據變成創新資源,并在數據共享的積極作用下有效保障國家安全與個人隱私,成為人們關心的話題。
“尤其像現在,科學數據的應用邊界,已經從傳統的科研和教育領域,向社會經濟和商業領域延伸,因此這仍然是一個復雜的、系統的問題。”中科院網絡信息中心科學數據中心主任黎建輝說。
據他介紹,為此,國際國內均在做一些有益的探索和嘗試。“在學術領域,新的數據出版模式正在逐步形成,”黎建輝說,“在商業領域,數據集市作為在云計算技術支持下的數據共享、交換與交易的模式,在國內外呈現快速發展的趨勢。”
在浩瀚的數據海洋里挖掘和捕捉能夠推動人類進步的信息,與此同時還要保障一系列的數據安全隱患,在復旦大學上海數據科學實驗室主任朱揚勇看來,培養數據科學家十分重要。“這里說的是數據科學家而非傳統的信息科學家,他們關注對數據現象和規律的研究,并開始出現在領先的企業和大學中,發揮著他們的巨大作用。”
合格的大數據人才需要具備哪些品質?中科院遙感與數字地球研究所研究員王力哲表示:“數據科學是一個多學科融合的交叉學科;數據科學是以數據為研究對象,以信息論、統計學、數據理論、數學分析等理論為研究手段,以獲取海量數據中蘊含的知識為目標的一門學科。”也正因此,他認為從事大數據研究勢必應該是復合型人才。
“除此之外,他還要關注國際數據科學領域的熱點議題,關心數據及其涉及的一系列政策、標準、技術、方法和國際發展態勢,”中科院地理科學與資源研究所研究員劉闖表示,“世界性的數據科學領域學術帶頭人正在一些熱點議題中涌現出來。”她認為,數據領域國家化人才還應對數據領域熱點問題把握準確,有一定超前的戰略思想,并在這些問題上有“開放的、獨特的學術業績”。
“我國在數據領域培養國家化人才方面與大國地位差距甚遠,特別是一些關鍵性領域尚屬空白。在這個方面,我們還有很多工作要做。”劉闖說。