分層存儲(chǔ)是一種存儲(chǔ)方法,它涉及將數(shù)據(jù)存儲(chǔ)在具有不同特性(例如性能、成本和容量)的一系列不同存儲(chǔ)介質(zhì)上。
不同的存儲(chǔ)介質(zhì)按層次結(jié)構(gòu)進(jìn)行組織,其中性能最高的存儲(chǔ)介質(zhì)被認(rèn)為是Tier 0或Tier 1,其次是Tier 2,Tier 3,依此類推。
Tier 0或Tier 1通常由閃存或基于3D XPoint的固態(tài)硬盤組成,而連續(xù)的分層存儲(chǔ)級(jí)別可能涉及高性能光纖通道或SAS驅(qū)動(dòng)器(或包含它們的RAID陣列),性能較低的SATA驅(qū)動(dòng)器、光盤、磁帶存儲(chǔ)系統(tǒng)以及基于云計(jì)算的近線或脫機(jī)存儲(chǔ)系統(tǒng)。
在SSD硬盤和云存儲(chǔ)變得司空見(jiàn)慣之前,使用磁盤和磁帶提供Tier 1層、Tier 2層和Tier 3層存儲(chǔ)的三層存儲(chǔ)模型可能是最受歡迎的層存儲(chǔ)模型。
但現(xiàn)在使用包含五個(gè)或更多分層存儲(chǔ)級(jí)別的分層存儲(chǔ)模型并不罕見(jiàn)。每一個(gè)都有微妙的差別,以產(chǎn)生三個(gè)關(guān)鍵存儲(chǔ)屬性的不同組合:成本、性能、容量。
如果不考慮費(fèi)用,企業(yè)將使用SSD硬盤滿足其所有存儲(chǔ)需求,因?yàn)樗鼈兲峁┝朔浅8叩男阅芎涂煽啃浴?/div>
但是在現(xiàn)實(shí)世界中,存儲(chǔ)成本非常重要,因?yàn)镮T部門尋求在其預(yù)算內(nèi)和組織中作為一個(gè)整體來(lái)尋求最小化成本和最大化效率。不幸的是,與機(jī)械硬盤相比,SSD硬盤存儲(chǔ)成本昂貴,并且比磁帶存儲(chǔ)昂貴得多。
這意味著需要謹(jǐn)慎使用SSD硬盤,并且僅用于存儲(chǔ)需要非常高性能的系統(tǒng)使用的數(shù)據(jù)。不太重要的數(shù)據(jù)可以存儲(chǔ)在成本較低、性能較低的系統(tǒng)(如機(jī)械硬盤)上,而很少訪問(wèn)的數(shù)據(jù)或僅出于合規(guī)性目的保留的數(shù)據(jù)可以降級(jí)存儲(chǔ)到成本非常低的離線存儲(chǔ)系統(tǒng)。
因此,分層存儲(chǔ)不是由IT部門出于運(yùn)營(yíng)原因的需求驅(qū)動(dòng)的,而是純粹出于財(cái)務(wù)原因。然后,分層存儲(chǔ)系統(tǒng)的目標(biāo)是通過(guò)使用成本最低的存儲(chǔ)選項(xiàng)(提供所需的最低性能)將存儲(chǔ)成本降至最低。
分層存儲(chǔ)是如何工作的?
只有兩個(gè)存儲(chǔ)層的分層存儲(chǔ)系統(tǒng)為存儲(chǔ)管理人員提供了一個(gè)非常有限的選擇,而不是一個(gè)給定的數(shù)據(jù)應(yīng)該存儲(chǔ)在哪里。如果該數(shù)據(jù)需要一定級(jí)別的存儲(chǔ)性能,則將在滿足要求的性能級(jí)別的情況下將其存儲(chǔ)在Tier 2層中,否則將存儲(chǔ)在更昂貴的Tier 1層中。
具有三個(gè)存儲(chǔ)層的分層存儲(chǔ)系統(tǒng)可能更高效,因?yàn)槿绻鸗ier 3層提供了所需的性能級(jí)別,則可以將同一數(shù)據(jù)存儲(chǔ)在Tier 3層中。如果沒(méi)有,則可以將其存儲(chǔ)在Tier 2層中(如果可以提供)達(dá)到所需的性能水平,并且只有在Tier 2層和Tier 3層都無(wú)法提供所需的性能水平時(shí),才需要將其存儲(chǔ)在最昂貴的Tier 1層存儲(chǔ)中。
事實(shí)上,可用的存儲(chǔ)層越多,數(shù)據(jù)塊就可以越有效地存儲(chǔ)在滿足其性能需求的適當(dāng)存儲(chǔ)層中,而不是以不必要的高成本提供不必要的高性能的存儲(chǔ)層中。使用創(chuàng)建RAID陣列或短行程硬盤等技術(shù),可以從一組不同的存儲(chǔ)介質(zhì)類型中創(chuàng)建新的層。例如,這兩種技術(shù)都以較低的存儲(chǔ)效率為代價(jià)(從而最終導(dǎo)致較高的財(cái)務(wù)成本)創(chuàng)建了更高的性能存儲(chǔ)。
分層存儲(chǔ)系統(tǒng)面臨的最大挑戰(zhàn)是將數(shù)據(jù)分類為多個(gè)類別,確定最適合給定數(shù)據(jù)類別的存儲(chǔ)層,并隨著數(shù)據(jù)的老化定期對(duì)數(shù)據(jù)進(jìn)行重新分類。
這里的關(guān)鍵點(diǎn)是,任何給定數(shù)據(jù)的存儲(chǔ)需求都可能隨著時(shí)間的推移而變化,因此,只要數(shù)據(jù)不再需要它當(dāng)前發(fā)現(xiàn)的存儲(chǔ)層的性能,就必須對(duì)其進(jìn)行監(jiān)視并將其移動(dòng)到較低(且成本更低)的存儲(chǔ)層,而不是將數(shù)據(jù)存儲(chǔ)在分層存儲(chǔ)系統(tǒng)中而忘記它。
分層存儲(chǔ)的典型數(shù)據(jù)類包括:
•關(guān)鍵任務(wù)數(shù)據(jù)。此類數(shù)據(jù)始終需要存儲(chǔ)在最高級(jí)別的分層存儲(chǔ)中,因?yàn)樗枰С指咚賾?yīng)用程序,可能支持客戶交易。訪問(wèn)數(shù)據(jù)的延遲將導(dǎo)致組織失去業(yè)務(wù)或?qū)κ找媛十a(chǎn)生負(fù)面影響。性能至關(guān)重要。
•熱門數(shù)據(jù)。此類數(shù)據(jù)需要較高級(jí)別的分層存儲(chǔ),因?yàn)樗谥T如客戶關(guān)系管理(CRM)、企業(yè)資源計(jì)劃(ERP)甚至電子郵件之類的應(yīng)用程序中不斷使用,并且在企業(yè)的日常運(yùn)營(yíng)中是必需的。在這一層的分層存儲(chǔ)中,性能很重要,但成本也是一個(gè)考慮因素。
•暖數(shù)據(jù)。這個(gè)類包括一些較舊的數(shù)據(jù),如超過(guò)幾天的電子郵件,或已完成交易的數(shù)據(jù)。這類數(shù)據(jù)的訪問(wèn)頻率相對(duì)較低,但在需要時(shí)仍需要易于訪問(wèn)。在分層存儲(chǔ)的這一層,最重要的考慮因素是成本,但必須遵循最低性能閾值。
•冷數(shù)據(jù)。此類數(shù)據(jù)可能永遠(yuǎn)不會(huì)再次訪問(wèn),但需要進(jìn)行歸檔和保留以符合法規(guī)或其他法律要求,或者僅僅是因?yàn)樗趯?lái)的某個(gè)未確定時(shí)間可能具有某些價(jià)值,也許用于大數(shù)據(jù)分析。冷數(shù)據(jù)非常適合分層存儲(chǔ)的最低層,在該層中可以接受幾分鐘或幾小時(shí)的訪問(wèn)時(shí)間,而低成本是首要考慮因素。
除了規(guī)模最小的業(yè)務(wù)外,很明顯,人工進(jìn)行存儲(chǔ)分層的方法可能會(huì)非常耗時(shí)且麻煩,無(wú)法成功。因此,大多數(shù)分層存儲(chǔ)系統(tǒng)都依賴于使用分層管理系統(tǒng)的自動(dòng)存儲(chǔ)分層,該分層管理系統(tǒng)會(huì)在整個(gè)生命周期內(nèi)監(jiān)視數(shù)據(jù),并在數(shù)據(jù)冷卻時(shí)自動(dòng)將其移動(dòng)到存儲(chǔ)層中。
該軟件可以隨同一個(gè)存儲(chǔ)系統(tǒng)一起提供并在其上運(yùn)行,也可以是一個(gè)獨(dú)立的解決方案,它可以在整個(gè)組織的存儲(chǔ)基礎(chǔ)設(shè)施中正常工作,在某些情況下還可以通過(guò)云存儲(chǔ)網(wǎng)關(guān)進(jìn)入云中。
分層存儲(chǔ)類型
Tier 1層是什么意思?
在一些使用存儲(chǔ)分層的組織中,已經(jīng)出現(xiàn)了比其現(xiàn)有Tier 1層中使用的更快的新存儲(chǔ)技術(shù)。因此,該技術(shù)被用作“Tier 0層”存儲(chǔ)。但出于本文的目的,將假定Tier 1層表示最高性能的存儲(chǔ)層。
Tier 1層
此存儲(chǔ)層旨在存儲(chǔ)高度易變且對(duì)時(shí)間敏感的數(shù)據(jù),并且需要在盡可能短的時(shí)間內(nèi)可用。通常用在金融交易環(huán)境或其他業(yè)務(wù)領(lǐng)域中,這些業(yè)務(wù)在短短幾分之一秒之內(nèi)就可以產(chǎn)生重大損失,而只有最快的存儲(chǔ)就足夠了。因此,Tier 1層存儲(chǔ)通常需要非常快的固態(tài)存儲(chǔ)硬盤介質(zhì),無(wú)論其整體存儲(chǔ)效率如何,都應(yīng)配置為具有盡可能高的性能。
Tier 2層
該存儲(chǔ)層用于存儲(chǔ)事務(wù)數(shù)據(jù),以支持高性能應(yīng)用程序,面向客戶的系統(tǒng)(例如零售應(yīng)用程序)以及其他無(wú)法接受非常短的延遲的系統(tǒng)。由于所需的性能水平不如Tier 1層那么高,因此通常使用較低成本和更高存儲(chǔ)效率的固態(tài)硬盤存儲(chǔ)系統(tǒng)來(lái)提供Tier 2存儲(chǔ)解決方案。
Tier 3層
第三個(gè)存儲(chǔ)層用于存儲(chǔ)“熱”數(shù)據(jù),例如客戶關(guān)系管理(CRM)和企業(yè)資源計(jì)劃(ERP)數(shù)據(jù),甚至是最近的電子郵件,這些數(shù)據(jù)需要經(jīng)常訪問(wèn)而不會(huì)造成不必要的延遲。這意味著它需要存儲(chǔ)在介質(zhì)(如中等到高性能硬盤驅(qū)動(dòng)器)上,與固態(tài)硬盤存儲(chǔ)介質(zhì)相比,它們的成本相對(duì)較低。在許多組織中,與Tier 2層或Tier 1層相比,Tier 3層數(shù)據(jù)要多得多,因此,每千兆字節(jié)存儲(chǔ)成本較低的大容量機(jī)械硬盤提供了理想的解決方案。
Tier 4層
該存儲(chǔ)層用于“熱”數(shù)據(jù),例如來(lái)自最近完成的事務(wù)的數(shù)據(jù),已使用了幾天的電子郵件以及不經(jīng)常訪問(wèn)的其他數(shù)據(jù)。它還可以用于存儲(chǔ)可用于業(yè)務(wù)信息和數(shù)據(jù)可視化系統(tǒng)的數(shù)據(jù),或用于創(chuàng)建月度、季度或年度報(bào)告所需的財(cái)務(wù)數(shù)據(jù)。但無(wú)論何時(shí)需要,都需要相對(duì)快速地訪問(wèn)。Tier 4層存儲(chǔ)需求可能非常大,并且由于成本是主要考慮因素,因此Tier 4層存儲(chǔ)的典型解決方案是大容量機(jī)構(gòu)硬盤存儲(chǔ)。Tier 4層存儲(chǔ)更可能使用低成本、性能相對(duì)較低的SATA硬盤驅(qū)動(dòng)器,而不是配置高性能SAS硬盤或RAID陣列。
Tier 5層
最低的存儲(chǔ)層通常用于存檔“冷”數(shù)據(jù),這些數(shù)據(jù)可能永遠(yuǎn)不會(huì)再次訪問(wèn),但仍保留一些價(jià)值(也許將來(lái)用于數(shù)據(jù)挖掘),因此值得保留。它也用于存儲(chǔ)必須保留用于合規(guī)性目的的數(shù)據(jù),這些數(shù)據(jù)僅需要在幾天或幾周內(nèi)即可訪問(wèn),而不是幾分鐘或幾秒鐘。
通常以該存儲(chǔ)層為單位使用光介質(zhì)或磁帶存儲(chǔ)系統(tǒng),該系統(tǒng)以非常低的每千兆字節(jié)成本提供存儲(chǔ),但是性能卻非常低。在過(guò)去的幾年中,基于云計(jì)算的存儲(chǔ)(例如Amazon的Glacier存儲(chǔ)服務(wù))已變得越來(lái)越受歡迎,這些公司希望將大量數(shù)據(jù)分流用于低成本存儲(chǔ),并且有可能或在幾個(gè)小時(shí)內(nèi)相對(duì)容易地對(duì)其進(jìn)行檢索(如果需要的話)。
分層存儲(chǔ)的主要優(yōu)勢(shì)
分層存儲(chǔ)帶來(lái)許多好處,其中最重要的是:
•降低的存儲(chǔ)成本:通過(guò)將每個(gè)數(shù)據(jù)類存儲(chǔ)在成本最低的存儲(chǔ)中,至少提供所需的最低性能,企業(yè)可以避免為不需要的高性能付費(fèi)。存儲(chǔ)成本的降低是采用分層存儲(chǔ)系統(tǒng)的主要驅(qū)動(dòng)因素。
•更高的存儲(chǔ)效率:依賴RAID或短行程的高性能硬盤存儲(chǔ)系統(tǒng)的存儲(chǔ)效率很低,因?yàn)榭梢栽谶@些系統(tǒng)上存儲(chǔ)的數(shù)據(jù)量比所提供的總存儲(chǔ)容量要少(在某些情況下要少得多)。由于分層存儲(chǔ)系統(tǒng)可以減輕對(duì)RAID和短存儲(chǔ)的需求(通過(guò)將不需要這種高性能的數(shù)據(jù)移至較低的存儲(chǔ)層),因此可以提高存儲(chǔ)效率。
•具有重用舊存儲(chǔ)設(shè)備的能力:存儲(chǔ)分層可以為存儲(chǔ)系統(tǒng)提供新的生命力,否則將需要更換存儲(chǔ)系統(tǒng),因?yàn)樗鼈儾辉贋樯蠈訑?shù)據(jù)使用提供足夠的性能。相反,它們可用于提供較低層的存儲(chǔ)。
版權(quán)聲明:本文為企業(yè)網(wǎng)D1Net編譯,轉(zhuǎn)載需注明出處為:企業(yè)網(wǎng)D1Net,如果不注明出處,企業(yè)網(wǎng)D1Net將保留追究其法律責(zé)任的權(quán)利。