如今,數據已成為企業的貨幣,但管理數據不當可能會很快失去控制。麻省理工學院最近的一項研究發現,對于一些企業來說,大數據正在變成糟糕的數據,并可能導致企業損失高達25%的收入,因為這些企業不得不修復不良數據,消耗了運營費用。
處理大量混亂的數據對于企業來說可能是一個挑戰,而且隨著更多數據的創建和收集,這將變得越來越困難。這就是數據管理或數據治理非常重要的原因。
調研機構Gartner公司將主數據管理定義為“數據治理”,這是“一種技術支持的學科,其中業務和IT協同工作,以確保企業共享的主數據資產的一致性、準確性、管理性、語義一致性和問責制。”
主數據是描述企業核心實體(包括客戶、潛在客戶、公民、供應商、站點、層次結構和賬戶科目表)的一致和統一的標識符和擴展屬性。
數據治理主要是企業內部部署的解決方案,該領域的大多數領導者都是一些傳統的軟件公司,其中大部分的企業已經在某種程度上向云端過渡。而Gartner公司認為,未來幾年,數據治理也將轉向云計算。
在這個領域中,很多企業都在激烈競爭,因此在此這個領域縮小一下范圍,列舉了全球10個主要的市場參與者。如上所述,大部分公司都是傳統廠商,而其他是市場的新成員。
全球十大數據治理解決方案服務商
(1)亞馬遜網絡服務公司(AWS)
AWS公司從其簡單存儲服務(S3)開始構建數據治理解決方案,其中包括Elastic MapReduce Athena,這是一種用于存儲在S3中的數據的計量查詢引擎。為了配置企業的云環境,AWS CloudFormation允許企業使用簡單的文本文件為其應用程序建模和配置所需的全部資源。Amazon CloudWatch監控并收集所有資源的指標。AWS Systems Manager允許企業監控所有資源,并自動執行常見操作任務。此外,還有用于配置管理的AWS OpsWorks,特別是如果企業使用Chef或Puppet的話。
(2)IBM公司
由于是生產大型機的傳統廠商,IBM公司在數據治理方面經驗豐富。它提供獨立DBMS,包括各種版本的DB2、IBM PureData System for Analytics、DB2 Analytics Accelerator、Hadoop,以及IBM BigInsights、DataFirst Method和IBM Watson Data Platform。其主要數據治理系統是IBM Information Server,它提供了對數據的統一管理。它可以幫助用戶查找和搜索資產,探索資產之間的關系,搜索非結構化數據源以及結構化數據庫,并允許自動發現新數據。
(3)微軟公司
微軟公司的數據管理始于其旗艦產品套件Office 365,它允許客戶管理整個內容生命周期,從創建或導入數據到存儲數據,并創建策略以保留和永久刪除內容。它運行在一系列用于云計算的微軟產品之上,無論是內部部署還是微軟Azure。它提供了一個稱為Azure SQL數據倉庫的數據倉庫設備,一個基于Hortonworks的Hadoop發行版(稱為Azure HDInsight),一個Azure Data Lake數據收集器。Azure SQL數據倉庫也是對云計算數據存儲的興趣日益增長。
(4)Oracle公司
Oracle公司從旗艦產品Oracle Database 12c、Oracle大數據管理系統、Oracle大數據SQL和大數據連接器開始入手。對于特定的數據管理,它具有Oracle企業元數據管理器(OEMM)和Oracle企業數據質量(EDQ)。它還通過Oracle數據庫云服務器和Oracle大數據設備為其軟件堆棧提供了整套硬件系統,并且具有Oracle數據庫即服務,Exadata云服務和大數據云服務等云服務。
(5)SAP公司
SAP公司是Oracle公司的競爭對手,SAP公司提供了IQ DBMS和Hana,用于內存數據庫管理系統和分析。Hana已更新為包含備份、災難恢復、分析,與Apache Spark和多租戶集成等功能。SAP Hana是SAP平臺的一個組件。然后是SAP主數據治理,它整合和管理來自一個地點的數據,以確保數據質量和一致性。
(6)Teradata公司
Teradata公司以其分析平臺而聞名,包括DBMS、數據倉庫設備、云計算數據倉庫。它通過Hadoop Aster Analytics進行連接,并通過Teradata Listener流式傳輸數據,所有這些功能都旨在通過統一的界面呈現信息。其主數據管理是一個完整的數據治理生命周期框架。
(7)Cloudera公司
Cloudera公司是三大Hadoop發行公司之一,在這方面非常成功。它提供了Cloudera Enterprise,這是一款Hadoop發行版,其中包含用于批量分析的Hadoop和用于實時分析的Spark,以及用于治理的Cloudera Navigator,用于內部部署和云中的集群管理的Cloudera Manager和Cloudera Director,并支持AWS、微軟Azure和谷歌云等云平臺。
(8)Dell Boomi公司
Boomi是Dell公司于2010年收購的一家業務部門,專門從事內部部署和云端的主數據管理。 Boomi公司通過其Boomi過程庫提供很少甚至沒有編碼開發,該庫提供了構建治理應用程序的示例。它還支持微軟Azure、AWS和谷歌的PaaS供應商和連接器,提供用于與合作伙伴連接的EDI連接器,并支持用于DevOps開發方法的Docker容器。
(9)SAS公司
SAS公司的整個業務都基于分析。它提供了稱為SAS Data Governance的主數據管理解決方案,可幫助企業準備和管理傳統數據源和大數據源。它允許企業通過通用數據模型維護和管理數據屬性,標記元數據中的更改,創建快照、存儲和管理列表和層次結構,并創建關于數據運行狀況和所需補救的報告。
(10)TIBCO軟件公司
TIBCO MDM專門提供存儲在不同孤島中的企業數據的統一視圖,使企業能夠清楚地查看其業務數據并快速采取行動。TIBCO MDM可在企業內提供數據工作流的可視化,使企業可以根據需要觀察流程并進行改進。它可以通過TIBCO Clarity Cloud Edition在內部部署和云中使用。