增加對象存儲的性能多達100倍是否是有可能的?現在,可能是時候將SSD閃存和對象存儲同時部署在一起了,在本文中,我們將為廣大讀者諸君介紹關于同時使用這兩者在性能和可靠性方面所帶來的益處。此外,我們還將為您介紹關于提高數據存儲效率的七個技巧。
現在,可能是時候將SSD閃存用于對象存儲了
對象存儲已經成為近線存儲(Nearline storage)、云存儲、Hadoop存儲,甚至NoSQL存儲的一個流行的首選。然而,用于對象存儲的主要介質類型并不是SSD閃存存儲,反而一直并將繼續是3.5英寸,7200轉速的HDD FAT硬盤。這背后的邏輯是,對象存儲主要是輔助存儲。其性能不是驅動因素。而以非常低的成本獲得可擴展性、可靠性和耐用性才是對象存儲銷售增長的主要因素。
但是,如果對象存儲所能夠提供的性能較之其當前所提供性能能夠增加高達100倍,并且是以相同或更低的成本提供相同或更好的耐久性和更密集的可擴展性占用空間呢?根據公開發布的SSD閃存存儲和FAT HDD硬盤讀取優化藍圖顯示,這一愿景有望在2016年底實現。
而這一藍圖愿景的實現首先是從在對象存儲中所使用的媒介類型開始的。由于大多數被作為對象存儲的數據都不是需要被頻繁訪問的——畢竟,這都是屬于次要的數據——而媒介最大的因素是成本和密度,而不是對象存儲的性能。這就是為什么今天的媒介是FAT驅動器且每個HDD硬盤的存儲原始容量范圍是從4 TB到10 TB,這使得其能夠以最小的占用空間每TB的成本最低。
讀取優化的SSD閃存存儲被設計為用于同一類型的數據,但僅僅只有更小的2.5英寸的足跡,這占到了3.5英寸HDD硬盤驅動器40%的容量和10%的重量。讀取優化的SSD是專為約10%的寫入和90%的讀取而設計的。新的多層3D或垂直三級單元(TLC)NAND是理想的讀取優化的SSD。目前市場上最高容量的2.5英寸,讀取優化的SSD在2015年底的原始容量大約為4 TB。而這一切改變得相當...快。
在2016年第一季度,三星公司的基于256GB的TLC NAND芯片的一款32層、16 TB、讀取優化、2.5英寸(SAS或SATA)的閃存SSD產品開始出貨。到第三季度,幾家其它的供應廠商的類似產品也紛紛出貨。而預計到2016年第四季度,24 TB和32 TB的讀取優化的2.5英寸固態硬盤閃存有望大規模上市。而預計到2017年,英特爾、Micron(美國鎂光)、 三星和東芝的48 TB和96 TB的讀取優化的2.5英寸SSD閃存產品也將出貨。到2018年,上述供應廠商都期望在128 TB和256 TB的2.5英寸的讀取優化的閃存固態硬盤市場獲得加速增長。較之FAT 3.5英寸的近線硬盤驅動容量,今天,最大容量的HDD硬盤為10 TB。根據希捷和西部數據公司預計,到2020年,這一容量將增加到20 TB。而如果他們能夠加快研發的話,則有望能夠在2020年達到40 TB的容量——但這可能是一個低概率事件。無論如何,容量差距是如此巨大,而且還在進一步被快速拉開。
可靠性如何?
最近,由多倫多大學和谷歌公司聯合進行的一項關于閃存SSD固態硬盤生產領域的研究顯示:
原始比特誤碼率(raw bit error rate,RBER)在以一個非常慢的速度增長,其要比一般認為的速率慢得多。而更重要的則是,它們對于不可校正錯誤或其他錯誤模式是不能預測的。相較于傳統HDD硬盤,閃存SSD固態硬盤在該領域具有明顯更低的替代率;然而,它們具有較高的不可校正的錯誤率。
根據Gartner公司和其他業內分析機構預測,讀取優化的閃存SSD和近線FAT HDD硬盤的成本交叉點——即每TB的計算購置成本,將在2016年出現。
這意味著這些大容量、讀取優化的閃存的閃存SSD固態硬盤對于對象存儲是最為理想的。原因如下:因為閃存NAND的本質,SSD讀寫次數(program-erase,PE)塊更有可能出現運行失敗或產生不可恢復的寫操作錯誤。而讀取操作則很少產生不可恢復的錯誤,雖然可能出現讀取受干擾的情況,但這是極為罕見的。對象存儲的糾刪碼基本上是在不同PE塊、驅動器和節點寫入對象作為多個子對象。當一個子對象有一個不可恢復的錯誤時,對象存儲會將其簡單的寫在別的地方,SSD將淘汰該PE塊。然后其在SSD中從過度配置的庫存中維持容量能力。這使得讀取優化的SSD閃存存儲非常適用于對象存儲。
這一切固然都不錯,但SSD閃存存儲——即使是讀取優化的閃存SSD固態硬盤——也要比HDD貴出很多呢?其曾經的確是的。但SSD和高性能的HDD硬盤驅動器之間的交叉拐點發生在2015年。根據Gartner和業界的其他分析師們預測,讀取優化的閃存SSD和近線FAT HDD硬盤的成本交叉點——每TB的計算購置成本將在2016年出現。請記住,讀取優化的閃存SSD功耗和每TB的原始冷卻成本平均約為10%。加上在數據中心占用空間的節省和不必使用強化地板,以處理高密度機架硬盤的重量的成本節省,使得該成本交叉點很有可能是在2016年底前出現。
使用讀取優化的閃存SSD的系統將有更好的對象存儲性能——高達2至3倍的速度、占用更少的機架和占地面積,而且最終成本低于當今的對象存儲。對于今天的對象存儲用戶的好消息是,對象存儲升級要比傳統存儲簡單,可以一次在一個節點上在線進行,而無需數據遷移。
改善數據存儲效率的七大技巧
存儲網絡、服務器端的閃存、網絡緩存、軟件定義的存儲和全閃存或混合陣列有助于存儲性能和效率的提升。
企業組織機構IT專業人員們需要長期不斷地與存儲性能進行“拉鋸戰”,以便能夠確保其應用程序能夠獲得運行所需要的資源,實現最佳性能。而回到當硬盤技術還是最先進的技術的時候,這意味著彼時的企業組織機構所采用的是成本昂貴且效率低下的技術——比如即使不是跨數以百計的硬盤的話,至少也是跨幾十個硬盤來標記數據,然后格式化這些硬盤驅動器,使得只有一半的容量能力能夠提供給應用程序。
而企業組織機構更為負擔得起的閃存的到來,有望在可預見的未來打破存儲在應用程序性能方面的瓶頸。而為了能夠充分利用閃存,您的企業組織將需要通過采用正確的方式來部署實現,并同時還需要采用正確的互補技術。這樣,您企業組織才可以從固態存儲部署和存儲網絡中獲得性能最大化和更高的效率。
例如,對于常用活躍數據而言,閃存較之硬盤驅動器有較少的移動部件,故而能夠提供更好的性能。其結果是,在主數據使用案例的情況下,閃存較之硬盤驅動器的部署成本往往更便宜,尤其是對于長距離持久存儲。固態存儲的問題是,在任何既定的時間點上,數據中心只有約5%至10%的數據是常用活躍的。所以您企業組織還不如通過將剩余的90%或更多的數據存儲在容量更高、更便宜的HDD硬盤來節省一些現金成本,或者干脆和其他越來越多的企業都在做的那樣,將這些剩余的數據存儲在云中。
正如上文的這一例子所示,閃存本身并不一定能夠提高數據存儲效率和性能。您企業組織將需要從打造一個堅實的基礎開始,而這也就引出了我們撰寫本文所想要為廣大讀者朋友們介紹的關于實現更快、更高效的存儲的七大技巧的第一點:改善存儲網絡
的確,基于硬盤的系統的延遲性并不會暴露一個網絡的弱點,但一個基于閃存的系統則會。因此,當您所在的企業組織升級到閃存或為現有的系統添加額外的固態硬盤之前,您應該首先最大限度地提高您企業存儲網絡的能力。而您所需要考慮的關于企業網絡的三個組成部分則包括:在服務器和存儲系統中的主機總線適配器(Host BusAdapter,HBA)或網絡接口卡(NIC)、網絡交換機和布線基礎設施。
人們很容易只關注帶寬能力的前兩個組成部分(NIC/HBA和交換機),其應該達到10 GbE或16 Gbps光纖通道(FC)或更快。雖然帶寬是非常重要的,延遲和交付質量更加如此。 大多數數據中心都無法產生足夠的連續交易來沖擊一個高速網絡。相反,它們會產生數百萬個非常小的交易。網絡將這些交易從服務器移動到存儲,然后再返回的效率是至關重要的,以便能夠從一個閃存的投資中提取最大的性能。
布線也是至關重要的,而且其往往是在存儲網絡的性能和數據存儲效率中一個經常被忽視的因素。您企業組織應該在光纖基礎上建立布線基礎設施,以支持當前和下一代網絡的高帶寬和低延遲能力,并對其進行構造,以便可以方便地確定端口分配。您企業還需要了解“鏈路損耗預算”,其是連接之間丟失的信號量。
一旦您已經對您企業的存儲網絡進行了微調,那么,是時候來考慮閃存的部署了。
實現服務器端的閃存
在服務器端的閃存設計中,網絡和連接到該網絡的存儲仍然是相同的,基本上安裝的是基于硬盤驅動器的存儲陣列,其存儲網絡的速度和質量并沒有當部署一個共享閃存陣列時那樣來得重要。但是,您利用服務器端的閃存的方式則是可以改變的。
當您隔離服務器閃存時,該設計對于網絡的影響是最小的。在這里,您企業安裝一個固態硬盤或閃存PCIe卡僅僅只為該服務器的I/O負責。服務器本身成為一個單一故障點,所以這個用例只適用于存儲在共享存儲陣列上的數據的讀高速緩存。
相比之下,服務器端的閃存技術,從多臺服務器聚集了內部閃存,以創建一個虛擬的閃存池。這些服務器端的閃存聚合產品建立在冗余,適用于讀和寫緩存,甚至作為一個存儲層。然而,他們確實在性能方面引入了網絡因素,因為聚合需要一個網絡來創建虛擬存儲池。
部署一個網絡緩存
不同于存儲系統的升級,其僅僅只是增加了一個單一系統的性能,一個網絡緩存則能夠提升網絡上的每個存儲系統的性能。這些設備基本上是在存儲系統和服務器之間內聯的,緩存最常見活躍的數據。許多網絡緩存在高可用性的配置中是可用的,這使得它們適合緩存讀取和寫入I/O。您也可以規模化網絡緩存,讓閃存存儲區大到足以存儲一家企業組織的整個常見活躍數據集,實際上把現有陣列納入到歸檔和數據保護存儲系統。
網絡緩存的一個重要的優勢在于其能夠提高存儲性能,而不需要更換當前的數據保護政策和程序。這些程序保持不變,因為現在的數據將同時位于高速緩存和原始存儲系統上。
需要注意的是,在快照或備份作業開始之前,尋找一個可以通過編程清空緩沖區數據的網絡緩存是很重要的。您也應該在部署之前,考慮您企業網絡基礎設施及其組件的質量。
考慮采用一款云支持的網絡緩存
網絡緩存選項的變體可以采用一種混合云的方式。一些供應廠商——比如Avere、微軟Azure StorSimple、Nasuni和來自EMC的TwinStrata,提供全閃存網絡緩存,能夠將非活躍的數據遷移到諸如亞馬遜、Azure或谷歌等云存儲位置,而不是本地存儲。事實上,這可能是通往一個全閃存數據中心的最實用的途徑之一,因為現在的數據中心可以是真正全閃存的,而舊的數據已經在云中被存儲和保護。
借助小閃存陣列部署SDS
改善存儲性能和數據存儲效率的另一種選擇是使用軟件定義的存儲(SDS)。這些產品要么運行在一款設備上;要么在一個虛擬機系統管理程序內運行,并能夠跨各種硬件陣列提供一組通用的存儲軟件功能。一些SDS系統可以利用現有的存儲硬件,并在它們之間提供數據的自動遷移。如果您企業添加一個小的閃存陣列到現有的基礎設施,您可以使用SDS自動遷移最活躍的數據集到陣列,以提高性能。而作為一個額外的獲益,其還簡化了管理,因為所有的存儲管理變得統一。
優化應用程序
在部署一款新的或增強現有存儲系統之前,務必請仔細檢查您企業打算運行的應用程序。許多存儲專業人員發現這一點尤其艱巨,因為他們既不擁有這些應用程序,也不了解這些應用程序的代碼。好消息是,可以使用某些程序來檢查應用程序的代碼,這提供了一個公正的分析其質量的方法,并能夠就需要在哪些地方進行改變提出具體的建議。
雖然人們很容易跳過這一步,并只是在這個問題上投入更多的硬件,但請千萬不要這樣做。一個與代碼相關的性能問題可能被高性能的存儲所掩蓋,但其決不允許閃存充分發揮其全部潛力——從而迫使管理員們去尋找其他潛在的性能破壞者,如存儲網絡。在部署閃存之前搞定代碼問題甚至可能避開一開始對于閃存的需求,或減少您企業所需要采購的閃存需求。
采購一個新的全閃存或混合陣列
這些對基于現有的硬盤系統仍然在使用壽命期限內、且仍在原來的保修期內的數據中心是理想的,這樣您就可以重新部署這些舊的硬盤系統,并用一個新的閃存陣列來擴充他們。但是,在某些時候,您將需要購買新的存儲系統。今天,這意味著在一個全閃存或混合陣列之間進行選擇。最初的決定是相對簡單的:如果企業組織負擔得起全閃存陣列,其將滿足企業的容量要求(假設性能要求會得到滿足是可行的),然后再購買一個。
然而,許多企業組織都很難找到一款正好適合他們預算的閃存陣列。他們可以通過選擇一款混合陣列,來獲得一款全閃存陣列相同的益處,而又無需該水平的投資。其將閃存和HDD結合進同一系統,然后,通過軟件在它們之間自動遷移數據。
對于混合陣列的主要關注:高速緩存缺失,已經是過去的事情了。當閃存容量的成本如此昂貴,以致于一個混合陣列的閃存層占總存儲容量的比例還不到5%時,其是一個需要關注的問題。但是現在,閃存層往往是容量的25%(如果沒有更多),顯著降低了高速緩存缺失的可能性。
總結
通往存儲性能提高的道路并不是從一個全閃存的投資開始的。其是從將您企業組織的存儲網絡作為一個整體,進行仔細的檢查開始的。一旦您企業這樣做了,還有很多其他的提升存儲性能和數據存儲效率的選項可以考慮,其中許多都包括了某種類型的閃存存儲的部署。該款產品的效果會因具體數據中心的不同而有所差異,而正如本文在對這些技巧進行介紹的那樣,某些企業組織的IT部門可能甚至不需要升級他們所有的存儲系統。
關于作者
Marc Staimer是位于俄勒岡州比弗頓的Dragon Slayer Consulting公司的創始人、高級分析師和CDS。該公司的咨詢業務一直專注于戰略規劃、產品開發和市場開拓等領域。憑借其在基礎設施、存儲、服務器、軟件和虛擬化領域超過30年的營銷、銷售和業務經驗,Marc被認為是業界領先的專家之一。
喬治·克倫普是Storage Switzerland公司的總裁,Storage Switzerland公司是一家專注于存儲和虛擬化的IT分析公司。