隨著軟件定義存儲的崛起,存儲服務通過軟件層實現,數據存儲正在被重新定義。隨著計算與存儲融合的發展,存儲平臺和數據處理平臺之間的差異正在進一步削弱。
存儲的新形式
我們來看看存儲進入新領域的幾種方式:
容器化。進一步說明,幾乎所有的新款存儲操作系統都被寫為容器化應用程序。事實上,我們聽說一些傳統存儲系統正在轉化為容器化形式。不只如此,它能夠更好地處理大規模擴展、提升可用性、云部署友好性以及更容易支持在存儲內進行聚合計算的能力。
兼容并蓄。超融合將軟件定義的存儲設計成便利的模塊化設備單元基礎設施。超融合基礎設施產品,如惠普Enterprise SimpliVity與Nutanix,可大大減少存儲開銷,并幫助構建混合云。我們還發現合并存儲與計算的創新的方法,即使用服務器端閃存(如Datrium)、機架基礎設施池(如Drivescale),甚至在每個磁盤驅動器上集成ARM處理器(如Igneous)。
越大越好。大數據的興起意味著掌握更多數據,就有機會從數據中挖掘價值。當今的大數據分發結合了Hadoop和Spark生態系統、各種風格的數據庫,橫向擴展系統管理成為越來越多的通用數據處理平臺,所有這些都由基礎大數據存儲工具(例如Hadoop分布式文件系統、Kudu、Alluxio)提供支持。
越快越好。除了大之外,又快就更棒了。如今又有了新型的自動分層與緩存的大數據存儲與圍繞集成數據管道而設計的數據訪問分層產品。很多這類工具是真正融合的大數據平臺,用于物聯網(IoT)規模的大數據與流數據。
基礎的改變
很多案例背后的驅動力是底層技術的轉變。 新的數據處理平臺比過去任何時間要處理更多每單位數據的元數據。更多的元數據導致了新的、高效的創新方式,例如統一對象、文件和塊服務;并提供無限的虛擬快照,自動文件歸檔和虛擬機優化的應用程序存儲。
其次是數據位置。讓計算和數據彼此接近能夠優化性能與效率。十年前,Hadoop展示了如何通過將計算映射到分區的本地數據塊來處理大數據,盡管仍然以批處理查詢方式進行。今天,我們看到新的數據處理設計,在實時流數據上保留或增加數據的位置。無論是利用密集的服務器端非易失性存儲器還是分布式內存網格,在存儲中托管用戶計算功能層或在物聯網邊緣進行計算,數據位置都是獲取成功的關鍵。
當今的技術正在模糊基礎設施存儲、后端數據庫和活動應用程序數據集之間的界限。我們現在有許多NoSQL和NewSQL變體提供不同的架構方法來擴展并保障一致性。我們有流服務,用于處理流水線和消息隊列中的數據。我們有活躍的數據湖泊、在線歸檔和分析數據庫以及更傳統的操作SQL方法并入統一數據處理平臺。將數據化作數據生命周期管理的單獨階段或環節將越來越困難。
期待已久的,且幾乎神話般的混合云存儲概念終于形成了。鑒于所有異質及多供應商難題,將存儲自動分層為緩存、彈性云存儲、本地二級存儲甚至應用程序數據本地存儲的想法看似簡單,卻很難實現。
但是,我們都希望存儲能夠無縫、自動而且跨越內部部署存儲到公共云端,從而使我們能夠根據需要輕松地使用和移動數據——無論何時何地。新的供應商正在將二級存儲與第三方公共云集成(如Igneous),但是Oracle已帶著ZFS設備領先一步,該設備已經與公共Oracle Cloud緊密集成。
何處是未來?
一些IT專家稱存儲業務正在垂死掙扎中,不過這并不完全正確。每天都有大量的數據產生,從數據保護和災難恢復到全球高性能訪問,再到永遠在線可用性的每一個存儲問題,都需要更加慎重的、以存儲為中心的專業知識。
另一方面,許多IT人士可能更喜歡沒有太多變化的世界,因為他們希望充分地維持現狀。盡管如此,這些新方法可能會替代掉很多低級別的手動任務,從而節省時間和資源,進而企業能夠更加注重增加業務價值。
新趨勢將存儲推向新領域,企業也需要跟上時代更靈活地定義存儲空間。與IT一樣,敏捷性至關重要。