全球已步入大數據時代,作為繼云計算后的新一代信息技術,大數據技術和產業的發展和應用已經對政府、企業決策和人們的生活方式產生深遠的影響。
當前,各種大數據存產品和面向各行業的大數據應用層出不窮,急需通過標準化的途徑規范認知,整合資源,促進各方達成共識,為我國大數據產業的健康發展打下基礎,為數據安全應用提供保障,同時促進大數據交易等新興服務模式規范發展。加強大數據標準化研制工作,對推動我國大數據產業進程,加快技術與標準的相互融合,落實大數據國家戰略具有重要意義。
自2012年起,ITU-T、ISO/IEC、CCSA等國內外標準化組織相繼開展大數據標準化工作,目前已發布了多項大數據標準。本文從大數據標準體系框架出發,介紹了當前國內外大數據標準化領域的重點方向及取得的成果,并分析了這些方向未來的標準化發展方向。
大數據標準化體系框架
標準化工作需要科學的頂層設計,大數據標準化也不例外。制定體現大數據技術特點的、完善的標準體系框架對制定高質量、體系化的大數據標準至關重要?;谶@一認識,在工信部和國標委的領導下,我國在2014年成立了全國信息技術標準化技術委員會大數據標準工作組(以下簡稱“信標委大數據標準工作組”),統籌開展我國大數據標準化工作。該工作組結合國內外大數據標準化情況、國內大數據技術發展現狀、大數據參考架構及標準化需求,提出了我國的大數據標準體系框架。
該大數據標準體系總體上由七個類別的標準組成,分別為:基礎標準、數據標準、技術標準、平臺和工具標準、管理標準、安全和隱私標準、行業應用標準。
在大數據不同的發展階段,有著不同的標準化需求與工作重點??偟膩碚f,在標準化的起步階段,以術語、參考架構等基礎性標準為研究重點。而隨著大數據技術的發展和應用的普及深入,其它類別的標準的重要性也不斷顯現出來,同時不同國家的標準化重點也會有不同側重。例如,隨著“中國制造2025”規劃的提出,工業大數據相關應用在我國呈現出快速發展的勢頭,相應的與工業大數據相關的標準化工作也成為行業應用標準的熱點。
當前國內外大數據標準化熱點領域
(1)基礎標準
基礎標準為整個標準體系提供包括總則、術語、參考模型等基礎性標準,是整個標準體系的基石,其重要性不言而喻。在這一領域,ISO/IEC制定了ISO/IEC 20546—《信息技術-大數據-概覽與術語》以及ISO/IEC 20547—《信息技術-大數據-參考架構》系列標準,參考架構系列標準包括框架與應用、用例與需求、參考架構、安全和隱私、標準化路線圖等5個分冊,作為大數據基礎性標準考慮得相當全面。而ITU-T的SG13也發布了ITU-T Y.3600—《基于云計算的大數據需求與能力》,作為該研究組大數據系列標準的基礎,該標準定義了大數據生態系統中的相關角色及其活動,并規范了基于云計算的大數據的需求和能力。遺憾的是,ISO/IEC與ITU-T這兩大國際標準化組織并沒有像當初制定云計算標準時那樣聯合制定術語和參考架構這樣的基礎性標準,聯合制定的標準無疑具備更大的影響力和更高的可參考性。在國內,信標委大數據標準工作組也發布了《信息技術 大數據 術語》和《信息技術 大數據 技術參考模型》等基礎性標準。可以說,在基礎標準方面,國內外都已取得了相當多的成果,為大數據標準工作的進一步發展打下了良好的基礎。
(2)數據標準
數據標準主要針對底層數據相關要素進行規范。包括數據資源和數據交換共享兩部分,其中數據資源包括元數據、數據元素、數據字典和數據目錄等,數據交換共享包括數據交易和數據開放共享相關標準。
大數據的核心價值在于對多個不同來源的數據進行關聯分析,因此包括數據交易、數據開放共享在內的相關標準就顯得尤為重要。只有參與方遵循共同的標準,數據的交易與開放共享才能更為高效。在這一領域,ITU-T已發布了Y.3601—《大數據-數據交換框架與需求》,同時以此為基礎正在制定《大數據-數據溯源需求》、《大數據-數據集成概覽和功能需求》、《大數據-數據保留概覽與需求》、《大數據-元數據框架與概念模型》等一系列數據標準。而在國內,由于政務信息開放、貴陽大數據交易所成立等事件的驅動,數據資源和數據交換共享標準成為數據標準領域的熱點,包括《信息技術 大數據開放共享》系列標準(包括總則、政府數據開放共享基本技術要求、開放程度評價、政府資源目錄體系等多個分冊)、《信息技術 數據交易服務平臺》系列標準(包括通用功能要求、交易數據描述等)在內的多個標準正在研制,未來還將研制大數據開放數據集基本要求和標識管理,數據交易的交易流程、數據管理、風險評估及交易質量評估等方面的標準。
(3)管理標準
管理標準作為數據標準的支撐體系,貫穿于數據生命周期的各個階段,主要對數據管理、運維管理和評估三個層次進行規范。
數據是企業的寶貴資產已成為業內共識,但如何對數據資產進行有效管理目前還處在非常原始的階段,業界急需數據資產管理標準對相關工作進行規范指導。ITU-T SG16在今年7月剛剛立項了一個國際標準《數據資產管理框架》,該標準主要定義了數據資產的基本概念,梳理了數據資產管理的需求,提出了數據資產管理的框架。在國內,CCSA成立了大數據技術標準推進委員會(CCSA TC601),其中的數據資產管理工作組專門從事數據資產管理方面的標準化研究工作,已發布了《數據資產管理實踐白皮書(2.0)》,目前正在編寫3.0版本。未來TC601將繼續進行主數據、數據標準和數據質量等標準制訂,并研究數據資產管理評估的模型。
(4)安全和隱私標準
數據安全和隱私保護作為數據標準體系的重要部分,貫穿于整個數據生命周期的各個階段。
大數據安全雖仍繼承了傳統數據安全保密性、完整性和可用性等特性,但也有其特殊性,主要表現在個人隱私保護、跨境數據流動等方面。歐盟于今年5月頒布的《通用數據保護條例》(General Data Protection Regulation,簡稱GDPR),也進一步凸顯了大數據時代數據隱私保護的重要性。
在安全標準領域,ITU-T SG17正在制定多個大數據安全國際標準,包括《移動互聯網服務中大數據分析的安全需求與框架》、《大數據即服務的安全指南》、《大數據基礎設施及平臺的安全指南》、《電信大數據生命周期管理安全指南》等。而在國內,全國信息安全標準化技術委員會下設了大數據安全標準特別工作組(SWG-BDS),專門進行大數據相關標準的研究,目前已發布了《信息安全技術 個人信息安全規范》、《信息安全技術 大數據服務安全能力要求》兩項國家標準,同時還在制定《大數據安全管理指南》、《個人信息安全影響評估指南》、《個人信息去標識化指南》、《數據安全能力成熟度模型》、《數據交易服務安全要求》、《數據出境安全評估指南》等多項國家標準。下一步,該工作組將重點開展大數據安全參考框架、個人信息安全、數據交換共享相關安全以及大數據安全檢測評估相關標準的研制。
(5)行業應用標準
行業應用類標準主要是針對大數據為各個行業所能提供的服務角度出發制定的規范。該類標準指的是各領域根據其領域特性產生的專用數據標準,包括工業、政務、服務等領域。
由于這一領域的標準針對性較強,因此國際標準組織較少涉及這一領域,而同樣也由于其較強的針對性和指導作用,國內熱點行業的標準化工作則比較活躍。尤其是在工業大數據領域,信標委大數據標準工作組下設工業大數據專題組,制定中的國家標準包括《信息技術 大數據 工業應用參考架構》、《信息技術 大數據 產品要素基本要求》、《智能制造 對象標識要求》、《智能制造 制造對象標識解析體系應用指南》。CCSA TC601也成立了工業大數據工作組,進行相關標準的研究。其它比較活躍的行業還有政務領域,信標委大數據標準工作組同樣下設政務大數據專題組,CCSA TC601也成立了政務大數據工作組。