大多數(shù)企業(yè)都同時(shí)擁有多種類(lèi)型的數(shù)據(jù),每種數(shù)據(jù)在容量和應(yīng)用程序訪問(wèn)性能等方面的需求優(yōu)先級(jí)各不相同。由于需要服務(wù)于不同的數(shù)據(jù)存儲(chǔ)需求,大多數(shù)大型數(shù)據(jù)中心都會(huì)同時(shí)使用多種類(lèi)型的存儲(chǔ)設(shè)施。
鑒于成本問(wèn)題,很少有企業(yè)能夠(不計(jì)成本地)將全部數(shù)據(jù)都放在市場(chǎng)上能買(mǎi)到的最快但也最昂貴的閃存存儲(chǔ)中,因此混合使用閃存和硬盤(pán)驅(qū)動(dòng)器的混合陣列將是許多數(shù)據(jù)中心的主要存儲(chǔ)構(gòu)成。 混合存儲(chǔ)陣列整合了多種類(lèi)型的存儲(chǔ)元素,能在滿足對(duì)應(yīng)多種數(shù)據(jù)優(yōu)先級(jí)需求的同時(shí)實(shí)現(xiàn)成本控制。
隨著混合存儲(chǔ)的不斷發(fā)展,能整合的存儲(chǔ)類(lèi)型范圍已經(jīng)不僅限于閃存和硬盤(pán),還擴(kuò)大到包括多層閃存、多層硬盤(pán)、磁帶、對(duì)象和基于云的存儲(chǔ),這些存儲(chǔ)都被鏈接到單一和透明的虛擬存儲(chǔ)基礎(chǔ)架構(gòu)中,整套架構(gòu)可以針對(duì)每種類(lèi)型的數(shù)據(jù)和應(yīng)用程序優(yōu)先級(jí)自動(dòng)提供最佳的性能。
本篇文章提供的使用場(chǎng)景剖析可幫助您更好地了解混合存儲(chǔ)陣列的優(yōu)勢(shì),以及最適合混合存儲(chǔ)的各種數(shù)據(jù)類(lèi)型。這些信息可以讓您更好地設(shè)定使用場(chǎng)景,從而明確采購(gòu)選型需求。
混合存儲(chǔ)陣列適合那些數(shù)據(jù)類(lèi)型?
實(shí)時(shí)的事務(wù)處理大數(shù)據(jù)。實(shí)時(shí)數(shù)據(jù)通常具備活躍和持久的特性;當(dāng)用戶執(zhí)行搜索、銷(xiāo)售分析或其它動(dòng)作時(shí),數(shù)據(jù)庫(kù)或其他使用實(shí)時(shí)數(shù)據(jù)的應(yīng)用程序也會(huì)同時(shí)驅(qū)動(dòng)數(shù)據(jù)流轉(zhuǎn)。自動(dòng)化分層軟件通常會(huì)盡量將所有活躍數(shù)據(jù)保留在盡可能高的層,但是管理員可能希望單獨(dú)指定一些數(shù)據(jù)庫(kù)、分區(qū)或數(shù)據(jù)卷,讓這些數(shù)據(jù)集中保存在一個(gè)特定的層,以確保某些應(yīng)用獲得低延遲。如果某些數(shù)據(jù)在一段時(shí)間內(nèi)不再活躍,這些數(shù)據(jù)將向較低級(jí)的存儲(chǔ)層遷移。
對(duì)于大數(shù)據(jù)、數(shù)據(jù)湖或其他大型數(shù)據(jù)集,將數(shù)據(jù)保存在云中的舉措值得嘗試,分層體系就可根據(jù)需要在熱、溫、冷云存儲(chǔ)之間移動(dòng)數(shù)據(jù)。
典型的文件服務(wù)器數(shù)據(jù)。存儲(chǔ)在文件服務(wù)器上的常見(jiàn)數(shù)據(jù)類(lèi)型,包括文本、文字處理數(shù)據(jù)、電子表格和演示幻燈片,這些數(shù)據(jù)很少需要閃存的速度。文檔或文件被加載到用戶終端后,用戶輸入數(shù)據(jù)的帶寬通常只是每秒幾個(gè)字符的數(shù)量級(jí)別,根本不需要亞微秒的響應(yīng)時(shí)間。即使正在渲染的特效或光線追蹤圖形、或正在編譯的大型程序的性能都受到CPU或圖形處理能力的限制,數(shù)據(jù)訪問(wèn)的速度并不是瓶頸。例外情況即使存在也不會(huì)太多,完全可以由管理員單獨(dú)處理。
數(shù)據(jù)流。數(shù)據(jù)流的關(guān)鍵定義是:可預(yù)測(cè)和連續(xù)性,因此數(shù)據(jù)流不需要閃存的低延遲和隨機(jī)存取能力。即使是被大量用戶同時(shí)訪問(wèn)的流式傳輸數(shù)據(jù)也非常容易對(duì)付,無(wú)需使用大量Flash就能獲得最優(yōu)化的性能。另外,數(shù)據(jù)流通常意味著文件尺寸和數(shù)量都很大,因此數(shù)據(jù)流會(huì)大量占用和消耗存儲(chǔ)空間,并成為低層存儲(chǔ)的理想負(fù)載類(lèi)型。
虛擬系統(tǒng)數(shù)據(jù)。與流式數(shù)據(jù)相比,閃存存儲(chǔ)的最適合的負(fù)載應(yīng)該是虛擬服務(wù)器和虛擬桌面基礎(chǔ)架構(gòu)(VDI)。這些數(shù)據(jù)類(lèi)型可以充分利用閃存的低延遲特性,并提供重復(fù)數(shù)據(jù)刪除功能,因?yàn)樵S多虛擬機(jī)(VM)與其他虛擬機(jī)之間具備極高的數(shù)據(jù)重復(fù)比例。例如,一個(gè)擁有100個(gè)Windows虛擬機(jī)的VDI系統(tǒng)中,每個(gè)客戶機(jī)可能和其它虛擬機(jī)有99%的相同數(shù)據(jù),可實(shí)現(xiàn)的重復(fù)數(shù)據(jù)刪除率接近100:1,因此100個(gè)虛擬機(jī)只需占用比1個(gè)虛擬機(jī)略多一點(diǎn)的存儲(chǔ)空間。閃存存儲(chǔ)速度足以支持重復(fù)數(shù)據(jù)刪除并輕松處理典型的VDI部署的峰值負(fù)載,例如,用戶在上午8點(diǎn)登錄,在中午注銷(xiāo)午餐,下午1點(diǎn)重新登錄,并在下午5點(diǎn)重新登錄。
在不同層之間遷移數(shù)據(jù)自動(dòng)分層軟件對(duì)用戶和管理員來(lái)說(shuō)是透明的。出現(xiàn)在同一目錄中的兩個(gè)文件實(shí)際上可能位于存儲(chǔ)系統(tǒng)的不同層,甚至可能位于不同的系存儲(chǔ)統(tǒng)或數(shù)據(jù)中心。存儲(chǔ)虛擬化軟件能識(shí)別很少使用的文件并將其移動(dòng)到速度較慢、較便宜的存儲(chǔ)設(shè)備上,同時(shí)保留占位符以告知系統(tǒng)文件保存的位置。如果用戶打開(kāi)該文件,則系統(tǒng)會(huì)自動(dòng)從較慢的存儲(chǔ)中提取文件,并將其移回更快的層。
一些最早的自動(dòng)化分層系統(tǒng)完全基于數(shù)據(jù)的活躍程度執(zhí)行分層動(dòng)作。例如,在設(shè)定的時(shí)間區(qū)間內(nèi),如果文件未被打開(kāi)或更改,則該文件被移動(dòng)到較低層;如果用戶在此期間打開(kāi)過(guò)該文件,則該文件被移動(dòng)到較高層。如今有些存儲(chǔ)系統(tǒng)仍在以這種方式工作。有些系統(tǒng)會(huì)增加預(yù)測(cè)算法來(lái)遷移關(guān)聯(lián)數(shù)據(jù),例如,打開(kāi)文件夾中的一個(gè)文件的用戶很可能會(huì)需要獲取同一目錄中的其余數(shù)據(jù)。還有些系統(tǒng)在數(shù)據(jù)塊層級(jí)而不是文件級(jí)移動(dòng)數(shù)據(jù),這種方式適合常見(jiàn)的對(duì)大文件執(zhí)行少部分操作的場(chǎng)景,在數(shù)據(jù)塊級(jí)執(zhí)行分層處理可以使文件不需要讀寫(xiě)的部分繼續(xù)保存在較慢的存儲(chǔ)空間中。只有修改頻繁的塊才會(huì)保留在更快的層上。
許多指標(biāo)可以被用于確定數(shù)據(jù)應(yīng)該存放的數(shù)據(jù)層,包括服務(wù)等級(jí)協(xié)議、僅在本季度末搜索的數(shù)據(jù)、應(yīng)具有最大冗余的關(guān)鍵數(shù)據(jù)以及需要極高吞吐量的數(shù)據(jù)。自動(dòng)分層軟件可能無(wú)法正確處理這些數(shù)據(jù),因此可以考慮手動(dòng)指派特定的層。
無(wú)論是通過(guò)閃存陣列自帶的功能,還是單獨(dú)購(gòu)買(mǎi)的軟件來(lái)實(shí)現(xiàn),存儲(chǔ)管理軟件適應(yīng)復(fù)雜場(chǎng)景的能力決定了管理員處理各類(lèi)特殊分層要求的操作方式。一些混合存儲(chǔ)陣列可以讓管理員設(shè)定針對(duì)特定文件或目錄樹(shù)的響應(yīng)時(shí)間、吞吐量和延遲的最低限制,并自動(dòng)確保分層處理滿足這些最低要求,其他系統(tǒng)則無(wú)法提供這種承諾。同樣,某些系統(tǒng)可以按特定的時(shí)間間隔遷移數(shù)據(jù),以便在季末結(jié)算工作開(kāi)展之前先將數(shù)據(jù)遷移到更高層,或者將某些文件或目錄永久保存在指定的層。
混合存儲(chǔ)陣列能同時(shí)提供閃存的速度和低延遲,以及HDD,磁帶或云的經(jīng)濟(jì)性。它們必然比全閃存或全HDD系統(tǒng)復(fù)雜,但靈活性和低成本的優(yōu)勢(shì)使其值得納入選型評(píng)估。從起價(jià)低于1000美元的NAS盒子到100萬(wàn)美元的企業(yè)級(jí)系統(tǒng),大多數(shù)供應(yīng)商都開(kāi)始提供某種形式的混合存儲(chǔ)。管理員應(yīng)該熟悉這些系統(tǒng)的工作方式,選擇有潛力的技術(shù)為IT組織節(jié)省大量資金。
分層軟件是如何運(yùn)作的分層軟件是混合存儲(chǔ)系統(tǒng)的核心,它可以自動(dòng)將最常訪問(wèn)的數(shù)據(jù)放在最快的層,甚至包含更復(fù)雜的系統(tǒng)邏輯,這些系統(tǒng)可以主動(dòng)預(yù)判和抓取相關(guān)數(shù)據(jù),并根據(jù)需要將數(shù)據(jù)在不同層之間移動(dòng)。雖然也可以用手動(dòng)操作的方式將數(shù)據(jù)分層到不同類(lèi)型存儲(chǔ)的容器,但是移動(dòng)數(shù)據(jù)會(huì)占用管理員的大量工作時(shí)間,從長(zhǎng)遠(yuǎn)來(lái)看,人力成本的耗費(fèi)可能會(huì)超出分層軟件的價(jià)錢(qián)。
管理員也可以單獨(dú)購(gòu)買(mǎi)分層軟件創(chuàng)建自己的混合存儲(chǔ)系統(tǒng)。但是,考慮到管理員學(xué)習(xí)軟件和部署組合軟件和硬件的時(shí)間,購(gòu)買(mǎi)散件自己組裝仍然不具備成本優(yōu)勢(shì)。除非已經(jīng)擁有了可用于某些分層的存儲(chǔ)設(shè)施,這種情況下利用現(xiàn)有資源搭建分層存儲(chǔ)就是更經(jīng)濟(jì)有效的選擇。
除了最常見(jiàn)的具有一層閃存和一層硬盤(pán)存儲(chǔ)的兩層系統(tǒng)之外,管理員可能還要考慮更多分層。例如,即使在閃存的范圍內(nèi),也存在存儲(chǔ)器總線閃存,非易失性存儲(chǔ)器快速閃存(NVMe),寫(xiě)入優(yōu)化的閃存和讀取優(yōu)化的閃存,以上每種閃存都比前一種閃存更便宜,但性能也更有限。還有多層HDD存儲(chǔ)——不僅包括15,000 RPM、10,000 RPM和7,200 RPM驅(qū)動(dòng)器,還可以選擇在不使用驅(qū)動(dòng)器的時(shí)候關(guān)閉驅(qū)動(dòng)器,甚至在HDD上運(yùn)行對(duì)象存儲(chǔ)。不要忘記更下游還有磁帶和云存儲(chǔ),每GB的成本更低,當(dāng)然響應(yīng)時(shí)間也更慢。
雖然實(shí)際的統(tǒng)計(jì)數(shù)據(jù)可能會(huì)有所不同,但是80/20規(guī)則對(duì)于考慮層級(jí)是很有效的:寫(xiě)入存儲(chǔ)系統(tǒng)的新數(shù)據(jù)中的80%大約有30天的活躍周期,然后就很少被訪問(wèn)。活躍數(shù)據(jù)中的20%會(huì)長(zhǎng)期保持活躍,應(yīng)該固定在最快的存儲(chǔ)空間上,其余的可以在30天后遷移到較便宜的存儲(chǔ)空間,在必要時(shí)才存回更快速的存儲(chǔ)層。