編者按:當我們談數據資產管理時,我們究竟在談什么?就目前而言,我們談論得最多的非數據管理和數據治理這兩個概念莫屬。但是對于這兩個概念,兩者的準確定義是什么,具體區別又是什么,仍是困擾著許多人的關鍵問題。
數據管理和數據治理有很多地方是互相重疊的,它們都圍繞數據這個領域展開,因此這兩個術語經常被混為一談。
此外,每當人們提起數據管理和數據治理的時候,還有一對類似的術語叫信息管理和信息治理,更混淆了人們對它們的理解。關于企業信息管理這個課題,還有許多相關的子集,包括主數據管理、元數據管理、數據生命周期管理等等。
于是,出現了許多不同的理論(或理論家)描述關于在企業中數據/信息的管理以及治理如何運作:它們如何單獨運作?它們又如何一起協同工作?是“自下而上”還是“自上而下”的方法更高效?
為了幫助大家弄明白這些術語以及它們之間的關系,本文將著重定義它們的概念,并指出它們的區別,這些定義和區別源自于國際公認的以數據為中心的相關組織,同時還會在一些觀點上展開詳細的探討。
數據管理包含數據治理
在說明數據和信息的區別之前,最好從“治理是整體數據管理的一部分”這個概念開始,這個概念目前已經得到了業界的廣泛認同。數據管理包含多個不同的領域,其中一個最顯著的領域就是數據治理。CMMi協會頒布的數據管理成熟度模型(DMM)使這個概念具體化。DMM模型中包括六個有效數據管理分類,而其中一個就是數據治理。數據管理協會(DAMA)在數據管理知識體系(DMBOK)中也認為,數據治理是數據管理的一部分。在企業信息管理(EIM)這個定義上,Gartner認為EIM是“在組織和技術的邊界上結構化、描述、治理信息資產的一個綜合學科”。Gartner這個定義不僅強調了數據/信息管理和治理上的緊密關系,也重申了數據管理包含治理這個觀點。
治理與管理的區別
在明確數據治理是數據管理的一部分之后,下一個問題就是定義數據管理。治理相對容易界定,它是用來明確相關角色、工作責任和工作流程的,確保數據資產能長期有序地、可持續地得到管理。而數據管理則是一個更為廣泛的定義,它與任何時間采集和應用數據的可重復流程的方方面面都緊密相關。例如,簡單地建立和規劃一個數據倉庫,這是數據管理層面的工作。定義誰以及如何訪問這個數據倉庫,并且實施各種各樣針對元數據和資源庫管理工作的標準,這是治理層面的工作。數據管理更廣泛的定義包含DATAVERSITY上大部分主題為數據管理的文章和博客,其中有一部分是特別針對數據治理的。一個更廣泛的定義是,在數據管理過程中要保證一個組織已經將數據轉換成有用信息,這項工作所需要的流程和工具就是數據治理的工作。
信息與數據的區別
在上文關于數據管理的第三個定義中,提到了數據和信息的區別。所有的信息都是數據,但并不是所有的數據都是信息。信息是那些容易應用于業務流程并產生特定價值的數據。要成為信息,數據通常必須經歷一個嚴格的治理流程,它使有用的數據從無用數據中分離出來,以及采取若干關鍵措施增加有用數據的可信度,并將有用數據作為信息使用。數據的特殊點在于創造和使用信息。在Gartner的術語表中,沒有單獨解釋數據管理和數據治理的概念,取與代之的是重點介紹了信息治理和信息管理的概念。
數據治理主要圍繞對象:角色
與正式的數據治理流程相關的角色是有限的。這些角色通常包括高層的管理者,他們優化數據治理規劃并使資金籌集變得更為容易。這些角度也包括一個治理委員會,由個別高層管理者以及針對治理特定業務和必要流程而賦予相應職責的跨業務部門的人組成。角色也包括數據管理員,確保治理活動的持續開展以及幫忙企業實現業務目標。此外,還有部分“平民”管理員,他們雖然不會明確被指定為數據管理員,但他們仍然在各自業務領域里的治理流程中扮演活躍的角色。
有效的治理不僅需要IT的介入,這是人們的普遍共識。尤其當業務必須更主動地參與到治理方式和數據管理其他層面(例如自助數據分析)的時候,目的是要從這些工作參與中獲益。在更多的案例中,特定領域的治理可以直接應用于業務。這就是為什么治理僅需要IT的介入是一個過時且應該擯棄的觀點。
數據治理主要圍繞對象:領域
數據治理包含許多不同方面的領域:
元數據:元數據要求數據元素和術語的一致性定義,它們通常聚集于業務詞匯表上。業務詞匯表:對于企業而言,建立統一的業務術語非常關鍵,如果這些術語和上下文不能橫跨整個企業的范疇,那么它將會在不同的業務部門中出現不同的表述。生命周期管理:數據保存的時間跨度、數據保存的位置,以及數據如何使用都會隨著時間而產生變化,某些生命周期管理還會受到法律法規的影響。數據質量:數據質量的具體措施包括數據詳細檢查的流程,目的是讓業務部門信任這些數據。數據質量是非常重要的,有人認為它不同于治理,它極大提升了治理的水平。參考數據管理:參考數據提供數據的上下文,尤其是它結合元數據一起考慮的情況下。由于參考數據變更的頻率較低,參考數據的治理經常會被忽視。雖然上述提及的是數據治理在數據管理中所負責的特定領域,但一個至關重要的問題在于,所有組織里的數據必須持續堅持數據治理的原則。
數據建模
數據建模是依賴于數據治理的另一個數據管理中的關鍵領域,它結合了數據管理與數據治理兩者進行協調工作。可以說,為了將數據治理擴展到整個組織,利用一個規范化的數據建模有利于將數據治理工作擴展到其他業務部門。遵從一致性的數據建模,令數據標準變得有價值(特別是應用于大數據)。一個確保數據治理貫穿整個企業的最高效手段,就是利用數據建模技術直接關聯不同的數據治理領域,例如數據血緣關系以及數據質量。當需要合并非結構化數據時,數據建模將會更有價值。此外,數據建模加強了治理的結構和形式。
關鍵的不同點
數據管理其他方面的案例在DMM中有五個類型,包括數據管理戰略、數據質量、數據操作(生命周期管理)、平臺與架構(例如集成和架構標準),以及支持流程(聚集于其他因素之中的流程和風險管理)。在此重申一點,數據治理和數據管理非常接近是有事實支撐的,數據質量經常被視為與數據治理相結合,甚至被認為是數據治理的產物之一。也許,情景化這兩個領域的最好辦法,在于理解數據治理是負責正式化任何數據管理當中的流程,數據治理本身著重提供一整套工具和方法,確保企業在實際上治理這些數據。雖然數據治理是數據管理中的一部分,但后者必須要由前者來提供可靠的信息到核心業務流程。