隨著企業擴展云原生數據庫的使用,企業陷入了數據復雜性的海洋。那么,自我識別數據能解決問題嗎?
這并不是說數據和數據庫的獲取和運行成本一直很高。僅此一項就是公共云的主要優勢。得益于按需云計算基礎設施的美好世界,企業可以在大約一天或更短的時間內從“需要數據庫”轉變為“擁有數據庫”。
但是,獲得云原生數據庫,并建立新的網絡數據庫的便捷性導致了數據復雜性問題,但存在一些核心缺點:
· 通常,對所有企業數據和該數據的場景沒有共識。數據仍然處于孤立狀態,甚至比十年前企業進入公共云的旅程還差。
· 現在面臨著意想不到的后果,例如缺乏對付安全性,數據治理甚至需要利用“單一事實來源”所需的理解。
企業確實有正在進行的項目在解決數據復雜性問題,例如鏈接開放數據云。鏈接開放數據云提供了松散耦合的數據,信息和知識的集合,任何可以訪問全球互聯網的人或機器都可以訪問。目的是創建Web提供的抽象層。它允許使用SPARQL查詢語言或SQL進行基本的和復雜的面向查找的訪問,從而提供對結構化和非結構化數據的訪問,其訪問方式與自網絡啟動以來訪問Web頁面以獲取圖像和文本頁面的方式相同。
當然,一系列技術提供商也提供解決方案,例如主數據管理,數據虛擬化以及其他允許您以改進的方式管理復雜數據的技術。換句話說,在數據庫之外(無論是否為云)提供數據語義和元數據管理。
現在所了解的是,這種用于處理云計算、跨云或混合云數據庫管理的方法無法很好地擴展或老化??紤]到創新的快速步伐,在現在以及不久或將來的需求中,數據將變得更加復雜,包括技術上的多樣化。
試圖利用如今使用的方法和工具會增加復雜性,直到系統最終因其重量而崩潰。只需考慮一下當今數據中心中導致問“他們在想什么?”的工具的數量,的確,他們的想法包括尋找戰術解決方案,最終不會提供他們曾經提供的價值,在某些情況下會提供負面價值。
但當在思考如何解決這個問題時,一種方法似乎一次又一次地出現,這是最有可能的解決方案。確實,它已經在不同的學術界被廣泛采用。這是自我識別數據的概念。
但是這里的想法是:通過將更多的智能與數據一起嵌入以及對數據本身的更多了解,將自主數據概念進一步向前發展。無論數據存儲在何處,或在何處索取信息,人們都將擁有有關數據本身可用數據使用情況的所有知識。如果人們以相同的方式實現此概念,則它將使數據復雜性降低二十倍。
一些獨特的價值包括:
· 任何企業的最終目標都是要利用其擁有的所有數據,使企業公司中需要它的任何人都可以訪問它以獲取洞察力,并利用這些洞察力使業務更好地運轉。
· 隨著自動化程度的提高,數據團隊可以處理更高層次,更有價值的問題。他們可以專注于數據而不是數據平臺,以實現數據成功。
· 這是復雜數據管理需要解決的核心問題。自我識別數據提供解決數據復雜性問題所需的細節。
要實現這一目標,需要完成許多工作。我不確定我們是否有那么多時間;錯過這樣的事情會影響當今使用云計算的效率。是時候開始工作了。