在今天的數(shù)據(jù)環(huán)境中,雖然數(shù)據(jù)持續(xù)地保持著增長,但許多IT部門仍沒有開始利用市面上大量可供選擇的數(shù)據(jù)精簡技術(shù),諸如自動(dòng)精簡配置、重復(fù)數(shù)據(jù)刪除和壓縮技術(shù)。本篇概述了這些技術(shù)可以帶給用戶的種種優(yōu)勢,以及你可以采取的各個(gè)步驟進(jìn)行數(shù)據(jù)精簡。數(shù)據(jù)精簡技術(shù),從自動(dòng)精簡配置到壓縮技術(shù)和重復(fù)數(shù)據(jù)刪除,對于企業(yè)級IT而言并非什么新鮮的技術(shù)。那么為什么企業(yè)采取這些技術(shù)要花費(fèi)這么長時(shí)間呢?有人或許會(huì)說這是因?yàn)椴少彿皆诘却线m自己的技術(shù),不過實(shí)際的原因可能是他們只是不確定這些技術(shù)的使用效果。
在IT環(huán)境中,性能和容量利用率往往無法兼顧:當(dāng)你改善其中的一種時(shí),就會(huì)不可避免的削弱另一項(xiàng)。這項(xiàng)困境的一個(gè)經(jīng)典案例就是壓縮技術(shù)和主存儲(chǔ)之間的矛盾--雖然你可以節(jié)省一部分磁盤空間,但該技術(shù)從整體上拖累了整個(gè)計(jì)算系統(tǒng)。隨著時(shí)間的變化發(fā)展,數(shù)據(jù)正在不斷增長,而相應(yīng)的存儲(chǔ)利用率技術(shù)卻未有改善。即便服務(wù)器虛擬化從整體上改善了整個(gè)數(shù)據(jù)中心的效能,所浪費(fèi)的磁盤容量空間仍在不斷上升。這也就是為什么這么多人對存儲(chǔ)系統(tǒng)中的自動(dòng)精簡技術(shù)如此著迷,該技術(shù)從根本上直接針對利用率的問題。
自動(dòng)精簡配置技術(shù)
針對數(shù)據(jù)大爆炸,自動(dòng)精簡配置技術(shù)也并非是萬靈藥。要部署一個(gè)高效的自動(dòng)精簡配置系統(tǒng),要求從文件系統(tǒng)到操作系統(tǒng)的應(yīng)用程序到存儲(chǔ)陣列的緊密聯(lián)系,而這樣的溝通渠道才剛開始建立。
Symantec公司的Storage Foundation和VMware公司的vSphere是今天市場上僅有的基于主機(jī)的產(chǎn)品,可以主動(dòng)地和支持自動(dòng)精簡配置的存儲(chǔ)陣列進(jìn)行通訊。諸如T10的歸零存儲(chǔ)塊和SCSI UNMAP等可能在未來的操作系統(tǒng)版本涵蓋自動(dòng)精簡配置指令,因?yàn)槠洳捎昧薃TA TRIM技術(shù)支持固態(tài)存儲(chǔ)驅(qū)動(dòng)器(SSD)。
當(dāng)然,即便是所有的操作系統(tǒng)和文件系統(tǒng)對于自動(dòng)精簡配置技術(shù)“準(zhǔn)備就緒”,那又怎樣呢?自動(dòng)精簡配置技術(shù)只是容量優(yōu)化的一個(gè)方面,其并沒有解決數(shù)據(jù)增長本身。每一個(gè)創(chuàng)建出的字節(jié)都要拷貝、備份并且歸檔。這一系列負(fù)面效應(yīng)抵充掉了自動(dòng)精簡配置所帶來的各項(xiàng)好處,因此,還需要有其它的方式。
重復(fù)數(shù)據(jù)刪除和壓縮技術(shù)
重復(fù)數(shù)據(jù)刪除技術(shù)可以看成是一種特殊的數(shù)據(jù)壓縮方式,在數(shù)據(jù)保護(hù)產(chǎn)品中得以越來越多的應(yīng)用。絕大多數(shù)的備份系統(tǒng)和數(shù)據(jù)設(shè)備都支持這些技術(shù),其中包括一些類型的重復(fù)數(shù)據(jù)刪除技術(shù)。但在主存儲(chǔ)端的應(yīng)用效果如何?重復(fù)刪除和壓縮技術(shù)是否也同樣有效呢?
只有少部分供應(yīng)商開發(fā)了主存儲(chǔ)設(shè)備的重復(fù)刪除技術(shù),其效能也錯(cuò)綜復(fù)雜。雖然Moore的Law提供了充足的處理器資源來處理實(shí)時(shí)的重復(fù)刪除和壓縮操作,但這些存儲(chǔ)陣列并沒有介入數(shù)據(jù)的保護(hù)和歸檔階段,因此所帶來的好處也相對有限。簡而言之,主存儲(chǔ)優(yōu)化技術(shù)只是針對了主存儲(chǔ)本身,而非整個(gè)數(shù)據(jù)的生命周期。
不過即便如此,重復(fù)刪除和壓縮技術(shù)在存儲(chǔ)容量彌足珍貴的情況下也非常有效。近期由Nimbus Data System公司、Pure Storage公司和SolidFire公司等推出的新興的“全閃存”存儲(chǔ)設(shè)備利用各項(xiàng)數(shù)據(jù)精簡技術(shù),如實(shí)時(shí)的自動(dòng)精簡配置技術(shù)、重復(fù)刪除技術(shù)和壓縮技術(shù),配合高性能處理器和閃存芯片,使得其可以和傳統(tǒng)基于磁盤的產(chǎn)品相競爭。并且有跡象表明主流存儲(chǔ)供應(yīng)商目前也都關(guān)注應(yīng)用容量優(yōu)化的閃存產(chǎn)品的可能性。
不過,在已有的存儲(chǔ)系統(tǒng)中應(yīng)用數(shù)據(jù)精簡技術(shù)似乎收效甚微。數(shù)據(jù)精簡產(chǎn)品對于受容量限制大的系統(tǒng)可以大幅提高其使用時(shí)間,不過并非所有應(yīng)用都適合使用數(shù)據(jù)精簡產(chǎn)品。在一些特殊的情況下,比如數(shù)字圖像的辦公文件存儲(chǔ),可能非常適合使用數(shù)據(jù)精簡技術(shù)。采購者應(yīng)當(dāng)關(guān)注的是在“瘋狂”增長的數(shù)據(jù)領(lǐng)域,而非在靜態(tài)數(shù)據(jù)中應(yīng)用這些技術(shù)。
數(shù)據(jù)精簡技術(shù)在未來的企業(yè)級數(shù)據(jù)存儲(chǔ)市場上可能變得日益重要。不過在今天其仍停留在一些邊緣應(yīng)用中,比如閃存存儲(chǔ)和媒體文件存儲(chǔ)。或許在未來某天我們會(huì)看到一個(gè)完全集成的“數(shù)據(jù)精簡”的數(shù)據(jù)生命周期,不過肯定不是在今天。