摘要:和從前對于應用幾乎是瞎子的數據塊存儲相比,今天的數據感知存儲產品直接就能從內部追蹤存儲操作相關的全部新型元數據。
更聰明的存儲
和從前對于應用幾乎是瞎子的數據塊存儲相比,今天的數據感知存儲產品直接就能從內部追蹤存儲操作相關的全部新型元數據。今天的存儲可能天生就知道哪個應用程序在創建、擁有和訪問存儲數據的每個數據塊;這些數據需要什么級別的安全和保護;應如何實現應用程序I/O性能(通過緩存、分層規劃等等)和容量成本(各種壓縮和重復數據消除措施)之間的最佳平衡;甚至會知道哪些用戶在訪問、共享和、或者可能很快再次請求哪一個比特的數據。存儲平臺可能還會在內部索引文本數據、分析存儲內數據的法規遵從性(或安全漏洞)、自動翻譯外國文字、轉碼數據內嵌的媒體,甚至主動學習不同分類的數據內容。
Qumulo也為前線運行的產品支持提供一套Call Home服務,但它真正的亮點是,他們的存儲會追蹤數據真實存儲過程的性能指標。基于其分布式的體系結構,Qumulo可以為存儲的每個文件和對象高效地報告歷史性能和其他關鍵指標,這有助于迅速捕獲新的使用模式、行為異常和性能影響熱點,即使是數十億的對象規模也能輕松管理。
Data Gravity在其常規的備份控制器內嵌入了一套搜索引擎,為陣列內存儲的所有數據建立索引,已經成功用于數據的監管和電子發現場景。同時,Reduxio提供幾乎無限的版本控制和按需快照,通過保存有關每個數據塊最后修改時間的元數據,存儲允許回滾到過去的任意一秒——可以視為一個細粒度的企業數據塊存儲時間機器,能有效抵御惡意病毒對數據的破壞。
融合處理
存儲和服務器在很多場景下會融合成為緊密合作的整體。融合的目的在于規避昂貴和龜速的遠程數據訪問,確保計算過程盡可能地貼近需要處理的數據。這至少是Hadoop分布式文件系統大數據存儲和VMware的虛擬化平臺集成的vSAN存儲的主要原理。類似Nutanix和Simplivity的完整超融合平臺會將軟件定義的存儲系統緊密融入優化的數據處理裝置,可以利用運行在應用服務器資源上的內置分析驅動算法獲得更大的優化。Datrium的“開放融合”機制會區分處理性能和容量優化、持續執行計算密集型存儲的優化分析,發現每臺服務器主機內消耗閃存的存儲熱點,同時通過網絡共享冷容量來實現數據容災保護。
所有這些架構雖然實現了更優化的融合,但在存儲和客戶端應用程序之間仍然會保持傳統的I/O傳輸方式。容器化和微服務技術已經開始實現計算節和數據存儲的分離,催生 新的(無服務器計算)方法,可以直接對通過的數據流進行處理。盡管最近亞馬遜的lambda云計算服務又成為熱門,實際上lambda體系結構在很久以前就存在了,那就是在許多已部署的企業數據庫中能見到的“存儲過程”,直接在數據庫內部(而不是在應用程序代碼內部)執行由事件觸發的簡短的遠程代碼。然而,在存儲層面支持容器化插件的新型存儲產品打開了無限的可能,可以實現新一代的高效、可擴展的、實時的分析和優化。一些存儲供應商正在研發的支持容器化應用程序的新型存儲產品,甚至很多存儲產品自身就是用容器應用程序代碼編寫而成。例如,新興的開源對象存儲Minio由于采用了現代的容器架構,很容易實現極高的擴展性和原生lambda計算功能。Minio對象存儲可以包含嵌入的lambda功能,實現搜索、內存緩存、消息流、模式識別、內容轉換,以及能直接在數據存儲層中高效運行的其它功能。
全面的云管理
分析功能會讓IT運維更強、更快、更智能。我堅信,我們會看到,在貼近數據存儲位置的存儲層,以及在云內實現的由許多存儲系統的元數據組成的大規模聚合(如同Call home服務模式),這些地方會有越來越多的存儲分析功能出現。
選擇一家基于云的服務提供商來全面管理和運營本地或混合基礎設施,就可以將不同的存儲世界在管理即服務(MaaS)產品的層面實現統一。例如,利用HyperGrid(之前的Gridstore)首創的一套平臺服務,你能(按需)訂閱和租用原本需要自己整套采購的集中化的超融合設備混合云群集。同樣,Galactic Exchange能以服務的方式遠程操作和管理你的大數據平臺,而實際的計算和數據節點集群可以同時分布在內部或云端。
MaaS存儲的典型例子Igneous會在客戶現場提供可訂閱的對象存儲,而這些存儲實際上以管理即服務的方式進行遠程操作管理。這種模式有助于IT存儲團隊領悟云計算與眾不同的市場游戲規則,服務在云端,而數據的實際存儲位置仍然在本地數據中心。由于MaaS供應商能積累和運用大量的操作分析經驗,在面對以數據為中心的智能化目標時,使用API直接調用云端服務(例如lambda計算或機器學習)來擴展MaaS存儲平臺,將會成為新的機遇。
數據將存到何處?
我們已經無法回避以云為中心的IT世界。我們所有人將來都必須管理跨越單設備、數據中心和全球云托管的混合存儲。隨著數據的繼續增長和傳播,我們所有的分析和智能處理能力規模也必須同步增長。
在未來的幾年中,我們將看到由新的物聯網數據源浪潮引發的數據大爆炸。如果沒有來自更智能的存儲產品和基于云計算的專業管理服務的大量支持,大多數IT組織將無法生存。