在很長一段時間內,半導體廠商并沒有向數據中心運營商提供一種快速、經濟、可靠的持久性存儲技術。經過多年的等待和失望之后,技術進步終于讓采用持久性存儲器成為一個實際的主張。
大容量的持久性存儲器與動態隨機存取存儲器(DRAM)一樣,可快速直接尋址,并且即使在故意或無意關閉電源之后,仍能保留存儲的數據。這項技術可用于數據中心,以取代成本低廉卻存儲速度慢得多的傳統持久性存儲組件,如機械硬盤(HDD)和固態硬盤(SSD)。
在某些情況下,持久存儲器也可用于替換內存,而不會造成顯著的速度損失。在此角色中,持久存儲器可以提供關鍵的操作優勢,例如在維護期間、電源中斷,以及其他預期和意外重啟情況下快速恢復數據庫服務器。
許多不同類型的戰略操作應用程序和數據庫,特別是那些需要低延遲、高持久性、強數據一致性的應用程序和數據庫,都可以從持久性存儲技術中獲益。該技術還具有加速虛擬機(VM)存儲和向多節點分布式云應用程序提供更高性能的潛力。
從某種意義上說,持久性存儲標志著核心內存的重生。東芝存儲美國公司資深專家Doug Wong說,“上世紀50年代到70年代的計算機使用的是磁芯存儲器,這是一種直接存取的非易失性存儲器。磁芯存儲器隨后被SRAM內存和DRAM內存取代,它們都是易失性半導體存儲器。”
英特爾公司的Optane DC是首批上市的永久性存儲設備之一。其他已經發布或計劃發布持久性存儲器產品的供應商包括三星、東芝存儲美國和SK海力士。
持久性存儲:性能+可靠性
采用持久性存儲,數據中心擁有獲得更快性能和更低延遲的獨特機會,而不會遭受大規模技術顛覆。獨立于供應商的存儲咨詢機構StorageIO公司的高級顧問分析師Greg Schulz說,“它比常規的固態NAND閃存型存儲更快速,但也可以獲得持久性存儲的優勢,這是一個兩全其美的產品。”
然而,持久性存儲器為采用者提供的不僅僅是快速可靠的存儲。東芝內存美國公司內存業務部高級副總裁兼總經理Scott Nelson說,“在理想的IT世界中,與應用程序關聯的所有數據都將駐留在內存中以實現最高性能。由于內存容量有限,目前這是不現實的。而且當電源故障時內存數據將會丟失。”
英特爾公司數據中心內存和存儲營銷總監Kristie Mann表示,持久性存儲器將兼容的應用程序傳輸到“永遠在線”狀態,通過增加內存容量提供對大型數據集的連續訪問。她指出,Optane DC可以為數據中心提供高達三倍的系統內存容量(高達36TB),系統重啟幾秒鐘,而不是幾分鐘,每個節點虛擬機增加36%,而廣泛使用的開源分布式通用集群計算框架Apache Spark性能提升可高達8倍。
Mann說,系統內存目前占總平臺成本的60%。她指出,Optane DC持久性存儲器通過在關鍵客戶工作負載上提供1.2倍性能/成本來提供重要的客戶價值。她預測說,“這一價值將極大地改變內存/存儲的經濟性,并加速以數據為中心的時代。”
持久性存儲器將在哪里應用到企業存儲中?
持久性存儲器將進入IT主流,并作為高性能SSD的高性能緩存層。“這可以相對迅速地采用。”Nelson說。然而,這種中間角色有望成為日益關鍵的應用程序的墊腳石。
在未來幾年中,持久性存儲技術將影響服務于各個行業組織的數據中心。他說,“時間就是金錢。它可能是金融服務,但也可能是面向消費者或面向銷售的業務。”
Aerospike公司工程副總裁Andrew Gooding表示,持續性存儲器可以增加需要極端速度的高速數據相關的數據,該公司提供了第一個針對英特爾Optane DC優化的商用開放式數據庫。
Gooding指出,“機器學習只是許多受益于持久性存儲的應用程序之一。依靠機器學習來理解消費者對在線廣告活動的反應的廣告公司,應該發現他們的工作通過持久性存儲器變得更加容易和有效。當廣告活動中的用戶瀏覽網頁時,他們正在收集信息。如果他們能夠快速讀寫這些數據,那么他們就可以應用機器學習算法,并實時為用戶定制特定的廣告。”
與此同時,隨著汽車制造商越來越依賴數據洞察力,持久性存儲器有望幫助他們以驚人的速度處理數字并改進復雜的新技術。Gooding解釋說,“汽車行業的制造商在自動駕駛汽車中面臨著巨大的數據挑戰,需要實時處理20艾字節的數據,并且他們正在使用自我訓練的機器學習算法來幫助解決這個問題。有很多領域需要利用機器學習技術快速處理大量數據、欺詐檢測、天文學等行業領域。”
Mann表示,與其他持久性存儲供應商一樣,英特爾公司希望云計算服務提供商能夠成為積極的采用者,以各種類型的內存數據庫服務為目標。例如,谷歌公司正在將持久性存儲器應用于來自Aerospike和Redis實驗室等供應商的非關系數據庫上的工作負載。
如何為持久性存儲器應用在基礎設施中做好準備
在持久性存儲器成為主流之前,組織需要仔細審查其IT基礎設施,以確定任何現有數據瓶頸的精確位置。Wong指出,這項任務將主要依賴于應用程序。他解釋說,“如果由于與存儲在非易失性存儲器、SSD、HDD中的數據相關的延遲導致性能顯著下降,那么存儲級內存(SCM)層將提高性能。然而,一些應用程序可能無法從持久性存儲器中受益,例如計算綁定的應用程序,其中CPU性能是瓶頸。”
Gooding表示,“開發人員可能需要重新評估其存儲和應用程序架構的基本部分。他們需要知道如何使用持久性存儲器進行編程。例如,如何確保在必要時將寫入刷新到實際的持久性存儲器設備,而不是僅僅停留在CPU緩存中。”
為了利用持久性存儲器的潛在優勢,可能還需要對代碼的設計方式進行重大更改。將應用程序從內存和閃存移動到持久性存儲器時,開發人員需要考慮一些問題,例如當程序崩潰并重新啟動時會發生什么。Gooding解釋說,“現在,如果他們編寫泄漏內存的代碼,那么泄漏的內存會在重啟時恢復。對于持久性存儲器來說,情況不一定如此。開發人員需要確保代碼的設計能夠在程序重啟時重建一致的狀態。人們可能沒有意識到其設計依賴于快速易失性內存和塊存儲的傳統組合,因此將代碼設計更改為持久性存儲器等全新功能可能會非常棘手。”
Schulz說,“舊版本的操作系統可能還需要更新適應新技術,盡管新的操作系統逐漸變得具有持久性存儲的意識。換句話說,如果檢測到持久性存儲器可用,那么它們知道如何將其用作緩存或其他內存。”
Hyper-V和VMware等管理程序現在知道如何利用持久性存儲器來支持生產力、性能和快速重啟。數據中心運營商PhoenixNAP Global IT Services公司總裁兼首席執行官Ian McClarty表示,通過利用持久性存儲器和最新版本的VMware,整個系統可以看到速度的提升,同時最大限度地增加虛擬機的數量以適應單個主機。他說,“對于那些希望擁有較少硬件或服務提供商的公司來說,這是一個很好的用例,他們希望最大限度地利用硬件進行虛擬機部署。”
許多關鍵的企業應用程序,尤其是數據庫,也正在成為持久性存儲器的主要應用。SQL Server和SAP的旗艦HANA數據庫管理平臺都采用了持久性存儲器。Mann說,“SAP HANA平臺通常用于多個行業處理數據和交易,然后運行高級分析,以提供實時洞察。”
Schulz建議,在時間安排方面,企業和IT組織應立即開始實施持久性儲能規劃。他說,“企業應該與其供應商溝通,了解他們的路線圖和計劃,不僅支持這項技術,而且還支持存儲或內存模式。”