從存儲中分離數據管理有明顯的優勢。人們需要了解這種新方法如何使這些操作更簡單、運行成本更低。
在這個數字化轉型的時代,各種各樣的組織正在成為以數據為中心的信息管理者。人工智能、物聯網、5G和邊緣計算等技術正在以前所未有的速度創造數據。這些數據正被用于提供更多的見解、服務、定制服務、產品和創新。而更為嚴格的個人身份信息隱私法規和對不遵守法規的嚴厲經濟處罰正使情況變得更加復雜。
對于那些希望從比存儲和使用成本更高的數據中獲得價值的組織來說,有效的數據管理和存儲正變得比以往任何時候都更加重要。將數據管理從存儲系統中分離出來并獨立運行是一種更好的數據管理方法。
當今的數據管理系統
根據供應商的不同,數據管理有多種含義。它被定義為接收、存儲、組織和維護組織創建的數據。但這個定義已經過時了。對于傳統的存儲系統來說,它足夠作為數據管理;然而,即使這樣也不適合現代的存儲系統。
如今的數據管理意味著更多內容,其中包括:
· 對數據進行分類;
· 聚合、收集和解析數據的元數據;
· 保護數據和元數據不受自然和人為中斷的影響;
· 在內部部署和地理上移動數據,以進行共享、歸檔、復制、數據保護、存儲系統技術更新和遷移,并訪問所需的分析引擎,從而對該數據進行更深入的研究;
· 在進行一次或多次移動后,保持用戶和應用程序對數據的透明訪問;
· 提供用戶可定義的策略,這些策略可自動移動、復制和刪除數據;
· 部署人工智能和機器學習以優化和自動化大多數數據管理功能;
· 搜索數據并提供可行的信息和見解;
· 使數據符合個人識別信息法律和法規;
· 將數據管理擴展到數百PB甚至EB的快速擴展數據。
數據管理和存儲面臨的挑戰
對于數據管理系統來說,做得很好是很難做到的。需要記住,數據管理和存儲系統最重要的職責是接收、存儲、組織和維護數據。所有這些其他數據管理功能都是資源密集型的,對系統的主要職責產生了負面影響。
這些分離的數據管理系統對IT組織產生了巨大的積極影響。
而且大多數存儲系統通常不能與其他存儲系統很好地協同工作。這對存儲管理員來說不是什么新聞。而且許多系統在使用云存儲時也有問題。很少有企業積極地使用磁帶系統。
多供應商異構存儲是一個更大的問題。存儲供應商很少能彼此無縫地合作,這就是為什么以存儲系統為中心的數據管理趨向于集中于一個供應商的原因。這種方法繞過了多供應商問題,同時將用戶鎖定在該特定供應商的數據管理和存儲產品方面。
另一個數據管理存儲問題是復雜的數據管理許可結構。當然,有數據管理軟件許可,但不止于此。通常還有其他許可費用,例如存儲系統移至云存儲或其他存儲系統的數據的容量許可費用。然后,有云存儲容量許可費和數據訪問的潛在出口費。此外,當用戶和應用程序訪問移動的數據時,通常必須將其重新移動到原始存儲系統。數據移動需要時間為每個訪問請求增加大量延遲。訪問它所在的數據更有意義。
解決此問題的一種以存儲為中心的方法是將組織的所有數據放在一個向外擴展,范圍廣泛的存儲系統中,該存儲系統將具有所有存儲性能和成本層,數據保護、歸檔等,以及所有數據管理。
即使該存儲系統可以滿足每個性能要求,擴展每個層以滿足數百PB或EB的數據,并且可以完成數據管理當今需要做的所有事情,但是還有其他棘手的問題。數據管理軟件仍然會嚴重影響存儲控制器。更重要的是,仍然必須將數據從當前位置移動或遷移到該系統。它無法解決多組織數據共享問題。
將數據管理與存儲分離
這些問題導致了一種新方法,其中從存儲系統中抽象了數據管理。數據管理軟件在其自己的服務器硬件上運行。它位于帶外、帶內或兩者結合。
抽象數據管理以三種方式之一捕獲數據和元數據。它可以使用管理權限裝載所有存儲系統;DellEMCClarityNow、Hammerspace、iRODS(開源)、Komprise、SpectraLogicStorCycle,Starfish存儲和StrongBox數據解決方案StrongLink可以做到這一點。或者它可以放在存儲設備的前面,看起來像高速網絡交換機,并且像高速網絡交換機一樣工作。通過第三種方法,它像Aparavi一樣使用客戶端或代理。這些系統中的大多數系統都在優化操作的軟件中內置了一定程度的人工智能或機器學習。每種方法和供應商都有各自的優缺點。
這些抽象的數據管理系統對IT組織產生了巨大的積極影響。它們使存儲系統商品化,減少了每層存儲的數量和成本。他們通過將數據調整為適當的層大小,并消除供應商鎖定來做到這一點。
簡化的數據管理和存儲操作
存儲系統兼容性不再是問題。存儲系統僅僅是根據數據的位置、性能和成本特征將數據駐留在其中的容器。這些抽象的數據管理系統還通過以下幾種方式簡化了操作:
· 它們通過自動數據歸檔簡化了數據保護。在停機期間,無需恢復已歸檔的數據,要恢復的數據較少,恢復時間目標就越快。
· 它們有助于使用全局名稱空間進行數據訪問。數據是否移動到另一個存儲系統、云存儲或磁帶都無關緊要;用戶和應用程序仍然可以看到并直接訪問其數據。
· 它們使存儲系統的技術更新變得容易,并且在線過程無中斷。
· 它們為DevOps、DevSecOps和測試/開發提供數據副本。
· 它們以驚人的速度遷移PB甚至EB的數據。由于收集元數據,組織在一小時之內就能將12PB的數據從一個磁帶系統遷移到另一個磁帶系統。
· 他們在組織之間共享大數據——這是以前不可能做到的。
擴展和許可要求
這些數據管理系統中的每一個都有不同的擴展比例。有些被設計為可擴展到數百PB和數百EB的數據。其他的則從TB擴展到數十PB。這取決于它們的架構,并且根據定義,大多數都與存儲無關。
供應商有不同的許可要求。某些許可證通過TB的容量進行管理。其他的則根據熱數據和冷數據來改變容量許可。還有一些許可證是根據在組織所需的性能級別上運行其軟件所需的服務器和服務器核心數量來許可的。
外部分離數據管理是什么意思?這意味著IT組織可以根據成本和性能而不是數據管理功能來選擇存儲。這意味著存儲供應商將不再擁有現有優勢。這意味著簡化了IT運營并降低了成本。在數據管理和存儲方面,這一切都預示著未來的美好前景。