隨著數據在多個系統間更加離散存儲,各企業機構不得不應對日益復雜的生態系統與數字化業務需求。全球領先的信息技術研究和顧問公司Gartner發布的數據管理技術成熟度曲線*(Hype Cycle for Data Management)將幫助首席信息官(CIO)、首席數據官(CDO)及其它數據與分析高級管理人員了解他們正在評估的數據管理技術的成熟度,以便在企業機構的內部構建內聚性數據管理生態系統。
Gartner副總裁兼杰出分析師Donald Feinberg表示:“在邁向數字化業務的過程中,數據管理仍會處在核心地位。隨著組織架構的要求發生變化以及對相關技術的需求逐漸加大,技術成熟度曲線中所強調的多項技術的成熟度與功能將迅猛發展。近些年來,許多新技術不斷被納入技術成熟度曲線(參見圖一),其中包括:內存(in-memory)、云計算(cloud)、數據虛擬化(data virtualization)、高級數據分析(advanced analytics)、數據即服務(data as a service)、機器學習(machine learning)、圖形(graph)、非關系型數據庫(non-relational)和Hadoop。”
圖一、2017年數據管理技術成熟度曲線
其中兩項技術特別引人關注,它們揭示了云計算(cloud computing)對于數據管理領域所帶來的影響力。由于整個Hadoop堆棧的復雜性與可用性導致許多企業重新考慮是否將其納入基礎架構規劃中,因此,Hadoop被認為在到達“生產成熟期”之前已經過時。相反,各企業機構正在著眼于日漸具有競爭力且便捷、按需定價的云端選項以及量身定制的數據處理選項。
作為云主導趨勢的一部分,面向云的對象存儲SQL接口已處于“技術萌芽期”。Feinberg先生認為:“我們預計這些接口代表著云數據庫平臺即服務(PaaS)的未來,并將在2至5年內達到‘成熟期’,這是因為它們是該領域內大部分云提供商及產品的重心。此類接口可以讓各企業機構運用熟悉的SQL語法與云端存儲的數據進行互動。對象存儲非常適用于存儲大量多結構數據,而這正是數據湖(data lake)的典型特征。”
在“2017年數據管理技術成熟度曲線”所列的其它35項技術中,有4項被認為具有變革性。2項技術——事件流處理(ESP)與內存計算數據庫管理系統(IMDBMS)預計將在2至5年內達到“生產成熟期”,而區塊鏈(blockchain)與分布式賬本(distributed ledgers)達到“生產成熟期”預計仍需要5至10年。
事件流處理(Event Stream Processing)
事件流處理是數字化業務、算法業務(algorithmic business)與智能商業運作(intelligent business operation)的主要支持性技術之一。包括分布式流計算平臺(DSCP)與事件處理平臺(EPP)在內的事件流處理技術正在快速成熟。通過提供可能被忽略的云信息,事件流處理軟件的流分析功能提高了決策質量。
運營性內存計算數據庫管理系統(Operational In-Memory DBMS)
雖然支持運營性內存計算數據庫管理系統(IMDBMS)技術的基礎架構仍然比較昂貴,但該項技術正在變得愈加成熟和普及。限制該技術增長的另一個因素是如何滿足聯機交易SLA所需要的高可用性。盡管如此,通過將數據交易速度從100倍提升至1000倍,面向交易的運營性內存計算數據庫管理系統仍有望對商業價值產生重大影響。
區塊鏈(Blockchain)
雖然各企業機構因為可擴展性、風險及治理問題而對公共(低權限)分布式賬本概念的發展前景依然持謹慎態度,但包括區塊鏈在內的公共分布式賬本將保持高熱度。大部分商業使用案例尚未得到驗證,且比特幣仍處于極大的價格波動中。有關分布式賬本的預想技術與商業挑戰將得到克服;短期內,各企業機構極可能通過共享信息及基礎架構而利用分布式賬本提高運營效率。長期來看,Gartner預計隨著可編程經濟的發展和賬本促進新生態系統的貨幣化,整個行業與商業活動將發生徹底變革。
分布式賬本(Distributed Ledgers)
雖然針對更多標準與企業級功能的需求正經歷緩慢演化,但分布式賬本仍無法應用于大規模的關鍵任務情景。相比現有成熟技術,其應用價值也尚不清晰,這對該技術的廣泛普及造成了一定影響。由于有望改變行業運營模式并克服困擾公共賬本的某些可擴展性、風險管理及治理問題,私有分布式賬本概念正得到推動。但是,與區塊鏈一樣,許多商業使用案例目前仍未得到驗證。
*此技術成熟度曲線之前為“2016年信息基礎架構技術成熟度曲線”(Hype Cycle for Information Infrastructure, 2016)。2017年數據管理技術成熟度曲線(Hype Cycle for Data Management, 2017)涵蓋多種可以描述、組織、整合、分享和支配數據的技術。