什么是科學數(shù)據(jù)中心?
首先要弄明白什么是科學數(shù)據(jù)。用學術(shù)語言來說,科學數(shù)據(jù)是指在科技活動(實驗、觀測、探測、調(diào)查等)或通過其他方式所獲取的反映客觀世界的本質(zhì)、特征、變化規(guī)律等的原始基本數(shù)據(jù),以及根據(jù)不同科技活動需要進行系統(tǒng)加工整理的各類數(shù)據(jù)集。簡單來說,科學數(shù)據(jù)就是與科學活動緊密相關(guān),并服務(wù)于科學研究的數(shù)據(jù)。
在大數(shù)據(jù)時代,科技創(chuàng)新越來越依賴大量、系統(tǒng)、高信度的科學數(shù)據(jù)。科學數(shù)據(jù)已成為國家的戰(zhàn)略資源,成為整個科研活動的基石和保障。這就意味著,加強和規(guī)范科學數(shù)據(jù)管理,推動科學數(shù)據(jù)開放共享,必然成為提升我國科技創(chuàng)新能力建和保障國家安全的重要方式和手段。科學數(shù)據(jù)中心是科學數(shù)據(jù)管理的重要載體之一,是促進科學數(shù)據(jù)資源管理與共享水平持續(xù)提高的專門機構(gòu)。文獻梳理發(fā)現(xiàn),科學數(shù)據(jù)中心主要有三方面的重要作用,一是對科學數(shù)據(jù)進行收集整理;二是加強對科學數(shù)據(jù)的保護運用;三是促成科學數(shù)據(jù)的開放共享。形象一點來說,科學數(shù)據(jù)中心就是把各類躺在抽屜里的科學數(shù)據(jù)集中起來,供有需要的人檢索、使用。
國內(nèi)已有哪些科學數(shù)據(jù)中心?
從中央層面看,自2004年起,科技部、財政部先后在基礎(chǔ)科學、農(nóng)業(yè)、林業(yè)、海洋、氣象、地震、地球系統(tǒng)科學、人口與健康9個領(lǐng)域支持建成了國家科技資源共享服務(wù)平臺,初步形成了一批資源優(yōu)勢明顯的科學數(shù)據(jù)中心。這些科學數(shù)據(jù)中心都是網(wǎng)絡(luò)平臺,強調(diào)學科性、開放性和服務(wù)性,數(shù)據(jù)檢索大多是免費的。
2018年1月,中央全面深化改革領(lǐng)導小組第二次會議審議通過《科學數(shù)據(jù)管理辦法》,其中明確指出,要加強統(tǒng)籌布局,在條件好、資源優(yōu)勢明顯的科學數(shù)據(jù)中心基礎(chǔ)上,優(yōu)化整合形成國家科學數(shù)據(jù)中心。2018年4月,在科技部召開的《科學數(shù)據(jù)管理辦法》新聞通氣會上,國家科技基礎(chǔ)條件平臺中心副主任王瑞丹也明確表示,我國將建設(shè)一批有重要影響的國家科學數(shù)據(jù)中心。
從省一級來看,目前尚未有建好的省一級科學數(shù)據(jù)中心。據(jù)公開報道,除江蘇以外,重慶也明確提出建設(shè)科學數(shù)據(jù)中心。1月28日重慶日報報道,重慶市科技局相關(guān)負責人表示,“我們將建設(shè)科學數(shù)據(jù)中心平臺門戶系統(tǒng),用于科學數(shù)據(jù)信息發(fā)布和網(wǎng)絡(luò)管理。”可見,重慶市科學數(shù)據(jù)中心也將是網(wǎng)絡(luò)平臺的形式。
相較之下,貴州疑是科學數(shù)據(jù)建設(shè)布局最早的省份,不僅把科學數(shù)據(jù)中心建設(shè)寫入2018年省政府工作報告,而且將其作為本屆政府的九方面工作之一。更重要的是,貴州省科學數(shù)據(jù)中心不只是一個網(wǎng)絡(luò)平臺,還有線下的實體。據(jù)有關(guān)報道,貴州省科學數(shù)據(jù)中心建設(shè)已進入規(guī)劃設(shè)計討論階段,該項目由貴州省科技信息中心、省規(guī)劃設(shè)計院建筑一所負責,或設(shè)有超算中心、生物醫(yī)學大數(shù)據(jù)中心、SKA數(shù)據(jù)中心、遙感數(shù)據(jù)中心、科技文獻數(shù)據(jù)中心等五個中心。目前具體的投資金額和建設(shè)周期尚未找到公開資料。
美國科學數(shù)據(jù)中心建設(shè)的經(jīng)驗
總體而言,我國在科學數(shù)據(jù)中心建設(shè)上尚處于起步階段,尤其需要了解和借鑒發(fā)達國家的科學數(shù)據(jù)中心建設(shè)方面的先進理念和做法。美國是世界上科學數(shù)據(jù)擁有量最多的國家,目前已形成了一系列上至國家級下至各行業(yè)部門的科學數(shù)據(jù)中心,并在科研過程中發(fā)揮了重要作用。
一是國家層面推動大數(shù)據(jù)戰(zhàn)略,把科學數(shù)據(jù)的持續(xù)積累和開放利用能力提高到了國家科技戰(zhàn)略的高度進行部署。二是市場化競爭是主流,規(guī)模化效應是核心。美國數(shù)據(jù)中心運營商大多通過并購重組,形成規(guī)模較大的行業(yè)巨頭,利用規(guī)模效應降低成本,提高競爭力。三是科學數(shù)據(jù)共享實行兩種不同運行機制,政府擁有、產(chǎn)生和政府投資產(chǎn)生的數(shù)據(jù)納入到“完全與開放”共享管理機制;私營公司投資產(chǎn)生的數(shù)據(jù)納入到“平等競爭”市場化共享管理機制。四是建立了國有科學數(shù)據(jù)“完全與開放”共享管理機制的保障體系,包括建立和健全科學數(shù)據(jù)共享政策法規(guī)體系,強化科學數(shù)據(jù)質(zhì)量和標準,為數(shù)據(jù)的應用提供技術(shù)服務(wù)等。
江蘇建設(shè)科學數(shù)據(jù)中心的優(yōu)勢
江蘇科教資源豐富,連續(xù)7年創(chuàng)新能力居全國省區(qū)首位,全省擁有普通高校141所,各具優(yōu)勢與特色。在大數(shù)據(jù)產(chǎn)業(yè)方面,江蘇信息技術(shù)產(chǎn)業(yè)領(lǐng)跑全國,發(fā)展大數(shù)據(jù)產(chǎn)業(yè)也是先人一步。省政府公布的《大數(shù)據(jù)發(fā)展行動計劃》明確:到2020年,建成10個省級大數(shù)據(jù)產(chǎn)業(yè)園,引進培養(yǎng)100名大數(shù)據(jù)領(lǐng)軍人才,60%的軟件企業(yè)實現(xiàn)服務(wù)化轉(zhuǎn)型,培育5家業(yè)務(wù)收入超100億元、50家業(yè)務(wù)收入超10億元的大數(shù)據(jù)龍頭企業(yè)。
對科學數(shù)據(jù)中心建設(shè)的幾點擔憂
一是警惕科學數(shù)據(jù)中心建設(shè)出現(xiàn)過熱、盲目和重復建設(shè)等現(xiàn)象,比如省一級建了,各個市又要建。
二是避免重建輕管,數(shù)據(jù)維護、更新不及時,數(shù)據(jù)反哺和回報機制不完善等。
三是數(shù)據(jù)中心建設(shè)缺乏用戶思維,使用效能偏低,淪為面子工程,等等。