專家John Ladley對(duì)市面上一些主流的數(shù)據(jù)治理軟件的功能進(jìn)行對(duì)比,了解這些對(duì)比結(jié)果,可以幫助你確定哪些工具能夠更好地滿足你的需求。
市面上可以提高數(shù)據(jù)治理效果的工具越來越多。除了現(xiàn)有的軟件供應(yīng)商,還時(shí)常有新的競爭者進(jìn)入治理軟件市場。如果你想要提高數(shù)據(jù)治理程序的效率和可持續(xù)性,要在眾多供應(yīng)商和治理軟件中做出選擇,已經(jīng)變得越來越困難。
在購買數(shù)據(jù)治理工具之前,你需要做好準(zhǔn)備;在做出購買決定之前,需要確定使用治理軟件的目的,以及如何從中獲得商業(yè)價(jià)值。一旦你做好這些準(zhǔn)備,就可以據(jù)此來評(píng)估治理產(chǎn)品。但如何考慮哪些工具能滿足你的特定治理需求呢?
為了縮小數(shù)據(jù)治理工具的選擇范圍,可以對(duì)比一下市場上主要的治理工具,這些工具主要來自于10家供應(yīng)商,我們將從使用場景和產(chǎn)品類別對(duì)這些產(chǎn)品進(jìn)行分析。
按照用例來評(píng)估數(shù)據(jù)治理工具討論數(shù)據(jù)治理工具的價(jià)值,需要結(jié)合具體的業(yè)務(wù)場景,讓我們看看供應(yīng)商是如何支持以下三個(gè)基本用例的:
受到高度監(jiān)管的行業(yè)。金融服務(wù)和醫(yī)療保健組織(尤其是在美國)是這種類型數(shù)據(jù)治理用例的代表。這個(gè)用例要求軟件提供了全面的數(shù)據(jù)管理功能,包括支持?jǐn)?shù)據(jù)意義一致性,跟蹤數(shù)據(jù)沿襲,工作流,以及高度可見的數(shù)據(jù)日常治理過程等。
提供業(yè)務(wù)術(shù)語表功能,能夠維護(hù)一般性數(shù)據(jù)定義的工具包括:Alation Data Catalog,Adaptive Metadata Manager, Collibra Data Governance Center, Data3Sixty Data Collaboration Suite,Diaku Axon,,IBM InfoSphere Information Governance Catalog 和 SAS Data Governance。在某些情況下,某些產(chǎn)品只適用于特定行業(yè);例如,IBM,Collibra和Diaku的治理軟件主要針對(duì)金融領(lǐng)域, Information Builders Omni-Gen 的軟件主要為衛(wèi)生保健供應(yīng)商和保險(xiǎn)公司服務(wù)。
此外,不同供應(yīng)商提供的術(shù)語表功能也各有不同。例如,對(duì)于某些供應(yīng)商,數(shù)據(jù)發(fā)現(xiàn)和術(shù)語集合功能是軟件的核心。而其他一些供應(yīng)商的軟件則更專注于管理同義詞和其他復(fù)雜語義。這些工具在瀏覽和導(dǎo)入元數(shù)據(jù)方面的功能也不盡相同,例如Adaptive Metadata Manager的特色在于元數(shù)據(jù)收集,而其他產(chǎn)品,如Alation,Collibra和Data3Sixty,則支持互動(dòng)性更強(qiáng)的數(shù)據(jù)發(fā)現(xiàn)方法。
對(duì)于記錄數(shù)據(jù)沿襲這個(gè)用例,不同工具所提供的功能也是不一樣的。有的工具僅僅在數(shù)據(jù)沿襲過程提供協(xié)助,而有的工具則可以幫助你從數(shù)據(jù)集提取數(shù)據(jù)沿襲信息,還有些工具只是允許你簡單地記錄數(shù)據(jù)沿襲。你所支持的數(shù)據(jù)沿襲方式,有很大程度上依賴于應(yīng)用程序的架構(gòu)(例如,你使用的是供應(yīng)商的產(chǎn)品還是和自主開發(fā)的應(yīng)用程序等),基礎(chǔ)設(shè)施和數(shù)據(jù)庫管理系統(tǒng)技術(shù)。所以一旦需要,你要保證對(duì)上面提及的領(lǐng)域有充分的認(rèn)識(shí)。
工作流和項(xiàng)目管理功能在這些主流數(shù)據(jù)管理軟件上的具體實(shí)現(xiàn)形式也是不同的。每一個(gè)供應(yīng)商都有其獨(dú)特的方法來管理流程。Collibra以工作流起家,所以對(duì)工作流管理早已駕輕就熟。SAP的治理工具主要(但不是全部)與ERP套件整合在一起。自適應(yīng)工作流功能近期也開始流行。工作流與具體行業(yè)相關(guān),所以在選擇管理軟件時(shí),請(qǐng)仔細(xì)審核你對(duì)該功能的要求,以確保最終選擇的產(chǎn)品能夠真正滿足你的需求。
迫切需要整合重要數(shù)據(jù)域。調(diào)節(jié)驅(qū)動(dòng)型的數(shù)據(jù)治理項(xiàng)目主要源自于主數(shù)據(jù)管理(MDM)和“golden copy”工作的需求。供應(yīng)商的產(chǎn)品擴(kuò)展了這一功能,他們把嵌入式MDM存儲(chǔ)庫和數(shù)據(jù)質(zhì)量維護(hù)工具與數(shù)據(jù)治理功能結(jié)合起來。像SAP這樣的供應(yīng)商們,整合了數(shù)據(jù)質(zhì)量、業(yè)務(wù)對(duì)齊,價(jià)值評(píng)估和策略管理等功能。SAS也將數(shù)據(jù)治理、數(shù)據(jù)質(zhì)量和策略管理與MDM功能整合在了一起。Information Builders則實(shí)現(xiàn)了數(shù)據(jù)質(zhì)量和數(shù)據(jù)修復(fù)與MDM管理功能的整合。
需要注意的是,許多數(shù)據(jù)治理工具只適用于特定信息管理用例,如大數(shù)據(jù)或MDM,而另一些則具有普遍適用性。你的具體用例將決定你如何做出選擇。
數(shù)據(jù)的實(shí)用性和可訪問性。大數(shù)據(jù)分析和商業(yè)智能目前使用數(shù)據(jù)治理的目的是為了保證數(shù)據(jù)遷移的高效性和數(shù)據(jù)維度的可靠性、數(shù)據(jù)安全性以及相關(guān)性等。數(shù)據(jù)治理工具在這個(gè)領(lǐng)域,與上面所提到的其他用例情況類似,只是部署方式不同而已。
Informatica Master Data Management專門提供對(duì)大數(shù)據(jù)的支持。通過使用數(shù)據(jù)管理,數(shù)據(jù)的有效性變得更有保證,大部分?jǐn)?shù)據(jù)治理工具都涵蓋了這一功能,包括Collibra。
很多工具都關(guān)聯(lián)或者直接提供基本的數(shù)據(jù)質(zhì)量保證功能。例如,SAP的Master Data Governance產(chǎn)品包含廣泛的數(shù)據(jù)質(zhì)量管理功能。正如上面提到的, Information Builder的Omni-Gen提供了數(shù)據(jù)修復(fù)和數(shù)據(jù)規(guī)范,Informatica還提供選項(xiàng),實(shí)現(xiàn)了與數(shù)據(jù)質(zhì)量管理功能的互聯(lián)。
評(píng)估數(shù)據(jù)治理工具的其他考量因素
事實(shí)上,數(shù)據(jù)治理工具反映了采集數(shù)據(jù)和處理數(shù)據(jù)的方式。反過來也意味著,數(shù)據(jù)治理工具必須與你的商業(yè)模式和所用技術(shù)具有較高的契合度。
雖然供應(yīng)商能夠提供內(nèi)容廣泛的許可和部署選項(xiàng),從本地部署,到遠(yuǎn)端服務(wù),web服務(wù)和傳統(tǒng)的客戶端服務(wù)器模式。現(xiàn)在你可以通過訂閱來試用產(chǎn)品,然后選擇是否實(shí)現(xiàn)本地部署。在基礎(chǔ)設(shè)施層面亦是如此。例如,盡管許多供應(yīng)商提供web服務(wù)選項(xiàng),但其中一些卻未必像在其他web服務(wù)中工作得那么好。許多供應(yīng)商提供各種連接選項(xiàng),但其連接到其他文件結(jié)構(gòu)的方法也相差很大。所有的選項(xiàng)都可以被用戶有選擇的添加,只不過價(jià)格也會(huì)水漲船高。選擇適合你特定基礎(chǔ)設(shè)施的工具,這一點(diǎn)非常重要。
和許多其他類型的軟件工具一樣,在你正式購買之前,你必須先試用數(shù)據(jù)治理工具,確定符合你的數(shù)據(jù)治理用例后再購買。很多時(shí)候,這些產(chǎn)品在某種環(huán)境和需求組合下,工作良好。但同樣的產(chǎn)品在另一個(gè)場景的表現(xiàn)就不盡人意。
此外,數(shù)據(jù)治理工具與相同供應(yīng)商的軟件往往配合的較好,與不同供應(yīng)商的軟件就未必如此。有時(shí)候,某些供應(yīng)商的用戶界面可能并不適合你的需求,而其他供應(yīng)商的卻適合,這種情況比比皆是。你要記住,這些工具的使用者大多是業(yè)務(wù)部門的數(shù)據(jù)管理者或其他非IT相關(guān)人員。他們對(duì)供應(yīng)商的忠誠度可能并不如在其他數(shù)據(jù)管理領(lǐng)域那么高。
部署這些工具一個(gè)關(guān)鍵考量是它們利用基礎(chǔ)設(shè)施的方式,是為一個(gè)web服務(wù)還是依賴本地服務(wù)器或云服務(wù)?坦白的講,一些數(shù)據(jù)治理產(chǎn)品可以實(shí)現(xiàn)靈活的部署,所以如果你的企業(yè)領(lǐng)導(dǎo)堅(jiān)定地選擇面向服務(wù)的體系結(jié)構(gòu),那你就需要明確這之間的不同點(diǎn)。許多供應(yīng)商提供基于云的許可,這種方式很好,它可以在避免較大內(nèi)部技術(shù)變動(dòng)的情況下,保證數(shù)據(jù)治理工具的良好運(yùn)行。
隨著時(shí)間的推移,你可能需要多個(gè)供應(yīng)商才能讓你的數(shù)據(jù)治理工具繼續(xù)滿足需求。在這種情況下,您必須確保多個(gè)供應(yīng)商的產(chǎn)品能夠協(xié)同工作。雖然幾乎所有工具都提供通用訪問選項(xiàng)(例如SQL),但他們中的一些,如Adaptive, Collibra, IBM InfoSphere Information Governance Catalog和SAS,提供了很多復(fù)雜互連選項(xiàng)。對(duì)于那些需要調(diào)整或概念驗(yàn)證項(xiàng)目,這一方面需要重點(diǎn)驗(yàn)證。你的基礎(chǔ)設(shè)施和技術(shù)堆棧的本質(zhì),將嚴(yán)重影響多個(gè)供應(yīng)商產(chǎn)品的互操作性。
一些工具套件更適合于大型企業(yè)或那些在同一家供應(yīng)商投入大量資金的企業(yè)。毫無疑問,IBM,Informatica,Information Builders,SAP和SAS所提供的套件將是這些大企業(yè)的首選。但數(shù)據(jù)治理工具市場還不夠成熟,你不能無視其他小供應(yīng)商的產(chǎn)品。Adaptive,Alation,Collibra, Data3Sixty 和Daiku所提供的功能,價(jià)格和部署選項(xiàng),也適用于很多企業(yè)。
數(shù)據(jù)治理軟件的市場可能有些混亂,希望你能夠理解數(shù)據(jù)治理工具給企業(yè)帶來的好處,正確的選擇適合企業(yè)的數(shù)據(jù)治理工具。