從IT 時代到DT 時代,大數據已成為一場革命,正在改變人們的生活、工作和思維方式。大數據標準研制作為產業發展基礎,目前仍處于起步階段。為實現數據間無歧義溝通,元數據標準研究與應用顯得更為迫切。
在研國標有10項
大數據領域的標準化工作是支撐大數據產業發展和應用的重要基礎。《中國電子報》記者近日從全國信標委大數據標準工作組第二次會議上獲悉,目前大數據相關標準研制還處于起步階段。國際上有4 大標準化組織針對大數據進行專門研究,分別是ISO/IEC JTC1 SC32、ISO/IEC JTC1 WG9、ITU 和NIST。
為了推動和規范我國大數據產業的快速發展,建立大數據的產業鏈,與國際標準接軌,我國在2014 年12 月正式成立了全國信息技術標準化技術委員會大數據標準工作組(以下簡稱工作組)。工作組主要負責制定和完善我國大數據領域標準體系,組織開展大數據相關技術和標準的研究,申報國家、行業標準,承擔國家、行業標準制修訂計劃任務,宣傳、推廣標準實施,組織推動國際標準化活動。目前,工作組正在研制的國家標準有10 項,其中《信息技術大數據術語》和《信息技術大數據技術參考模型》兩項國家標準已經完成相應的草案,準備進入征求意見階段。
“目前已有138 家單位申請成為工作組成員。”中國電子技術標準化研究院副院長高林表示,“工作組下一步將繼續完善和維護工作組工作平臺,加強元數據、數據分類、數據開放共享等方面的標準化研究,同時將積極開展測試評價、認證等相關準備工作。”
值得一提的是,在研究提出大數據技術框架的基礎上,結合數據全周期管理,數據自身標準化特點,當前各領域推動大數據應用的初步實踐,以及未來大數據發展的趨勢,工作組提出了大數據標準體系框架。大數據標準體系由五個類別的標準組成,分別為:基礎標準、技術標準、產品和平臺標準、大數據安全標準及應用和服務標準。
有專家認為,針對大數據,我國在數據管理、云計算、信息安全等方面,已經發布和在研一些標準,適用于大數據環境,提供了一定的基礎,但是缺乏標準化整體規劃; 數據分析、數據安全、數據質量管理等技術標準,數據處理平臺、開放數據集、數據服務平臺類新型產品和服務形態的標準較為缺乏,亟須研制。
需加強元數據標準研究
近年來,大數據技術已經開始步入高速發展階段,國內外從事大數據方面研究和服務的公司越來越多,行業分得越來越細。不過,在行業應用中,由于缺乏統一的數據描述,數據在解釋、同步、轉換過程中時常會存在歧義,數據擁有者不能及時地按業務要求提供正確的數據時有發生。因此,在大數據時代,借助于元數據了解數據元素含義和上下文的需求越來越強烈。
記者了解到,ISO/IEC JTC1 SC32 下設4個工作組研究不同領域的標準研制,其中就包括元數據。其范圍涉及研制開發和維護有利于規范和管理的元數據、元模型和本體的標準,此類標準有助于理解和共享數據、信息和過程,支持互操作性,電子商務以及基于模型和基于服務的開發,包括:建議用于規定和管理元數據、元模型和本體的框架;規定和管理元數據、元模型和本體;規定和管理過程、服務和行為數據;開發管理元數據、元模型和本體的機制,包括注冊和存儲;開發交換元數據、元模型和本體的機制,包括基于互聯網、局域網等的語義。
對于我國元數據標準制定,有專家就指出,我國迫切需要加強元數據標準或元數據模型的研究與應用,健全完善元數據標準規范及元數據模型。需要充分結合政府各部門現有數據資源建設情況,針對當前政務大數據資源、科技大數據資源、電子商務大數據資源等重點領域,研制元數據標準或統一的元數據標準模型框架,使得大數據向著標準化、條理化、脈絡化方向發展,實現無歧義溝通、理解和使用數據。解決當前數據在交易、使用等過程中存在的問題,更好地對數據進行管控,挖掘大數據,發揮數據價值。