伴隨著固態(tài)存儲(chǔ)在主站點(diǎn)中逐步取代傳統(tǒng)磁盤驅(qū)動(dòng)器,我們開(kāi)始漸漸認(rèn)識(shí)到傳統(tǒng)RAID陣列中所存在的些許缺陷。
與(服務(wù)器內(nèi))的內(nèi)置存儲(chǔ)相比,RAID陣列能夠?yàn)樗械腎/O操作提供毫秒級(jí)的延遲響應(yīng),在硬盤驅(qū)動(dòng)器的訪問(wèn)時(shí)間需要數(shù)十毫秒時(shí),這種響應(yīng)速度完全是可以接受的;但是,當(dāng)內(nèi)置的非易失性存儲(chǔ)(NVMe)固態(tài)閃存可以在100微秒內(nèi)完成數(shù)據(jù)傳輸時(shí),RAID陣列的性能就顯得相形見(jiàn)絀。另一方面,故障磁盤的重建時(shí)間可能會(huì)長(zhǎng)于陣列中另一驅(qū)動(dòng)器的平均故障時(shí)間——從而造成數(shù)據(jù)丟失。雖然RAID 6可以實(shí)現(xiàn)兩塊磁盤的奇偶校驗(yàn),一定程度上緩解了這一時(shí)間問(wèn)題,但單塊4TB容量及以上的磁盤故障率會(huì)使得雙重校驗(yàn)都不足以確保信息的安全性。
這些不足之處驅(qū)動(dòng)著存儲(chǔ)行業(yè)產(chǎn)生變革,引導(dǎo)我們走向超融合技術(shù)。
超融合之道
閃存的部署揭露出傳統(tǒng)設(shè)備中存在的性能與可靠性問(wèn)題,從而推動(dòng)由大量慢速驅(qū)動(dòng)器組成的陣列轉(zhuǎn)向更加緊湊型的存儲(chǔ)設(shè)備(storage appliance),這些設(shè)備內(nèi)部用單一的控制器連接8至10塊驅(qū)動(dòng)器。在設(shè)備之間復(fù)制數(shù)據(jù)來(lái)確保信息完整性,而非通過(guò)設(shè)備內(nèi)部的RAID。
設(shè)備小型化的好處在于將網(wǎng)絡(luò)性能與驅(qū)動(dòng)器的初始性能匹配了起來(lái)。伴隨著2016年NVMe驅(qū)動(dòng)器技術(shù)在單塊驅(qū)動(dòng)器上實(shí)現(xiàn)了10GBps的流速,這方面收益將得以進(jìn)一步被放大。
與這項(xiàng)趨勢(shì)一同興起的是,存儲(chǔ)軟件供應(yīng)商開(kāi)始探索新的虛擬化理念,我們將其統(tǒng)稱為軟件定義存儲(chǔ)(Software-defined storage,簡(jiǎn)稱SDS),將存儲(chǔ)服務(wù)從實(shí)際的物理存儲(chǔ)平臺(tái)中脫離出來(lái),運(yùn)行在基于通用硬件的虛擬實(shí)例池中。通過(guò)這種方式,存儲(chǔ)作為一項(xiàng)服務(wù)資源更具靈活性和擴(kuò)展性,與云端已經(jīng)相當(dāng)成熟的服務(wù)器虛擬化和資源管理調(diào)度相匹配。
在存儲(chǔ)設(shè)備上運(yùn)行虛擬化存儲(chǔ)服務(wù)的意義在于,這些設(shè)備借助于某些商業(yè)現(xiàn)成品(COTS)作為控制單元。隨著人們開(kāi)始意識(shí)到存儲(chǔ)控制器中存有大量備用計(jì)算能力,以及緊湊型的存儲(chǔ)設(shè)備與傳統(tǒng)的機(jī)架式服務(wù)器在形式和配置上幾近相同,超融合技術(shù)的理念由此而生。現(xiàn)在,越來(lái)越多的緊湊型存儲(chǔ)設(shè)備與機(jī)架式服務(wù)器相結(jié)合,從而降低了硬件的復(fù)雜程度,并使得存儲(chǔ)能夠更廣泛的擴(kuò)展。
今天的超融合系統(tǒng)
目前的超融合產(chǎn)品廠商往往使用標(biāo)準(zhǔn)的x64服務(wù)器主板與固態(tài)閃存盤組構(gòu)成2U高度的機(jī)架單元,作為超融合平臺(tái)。所有這些設(shè)備通過(guò)聯(lián)網(wǎng)構(gòu)筑起虛擬的存儲(chǔ)池。存儲(chǔ)池的創(chuàng)建會(huì)用到一些特定的技術(shù),例如存儲(chǔ)管理套件,其可跨設(shè)備運(yùn)行,將存儲(chǔ)資源呈現(xiàn)為虛擬的存儲(chǔ)區(qū)域網(wǎng)絡(luò)。
自動(dòng)化的存儲(chǔ)管理能夠找到新的驅(qū)動(dòng)器,使得系統(tǒng)擴(kuò)展過(guò)程更為便捷。當(dāng)某塊驅(qū)動(dòng)器發(fā)生故障時(shí),軟件從其它驅(qū)動(dòng)器上復(fù)制數(shù)據(jù)來(lái)保持集群系統(tǒng)的運(yùn)行,同時(shí)重構(gòu)冗余結(jié)構(gòu)。這些管理工具可以同時(shí)支持冗余復(fù)制和糾刪碼——后者我們將在后續(xù)篇章中展開(kāi)討論。
從性能角度看,任何設(shè)備內(nèi)的驅(qū)動(dòng)器都能提供非常高的I/O帶寬。一組8個(gè)NVMe驅(qū)動(dòng)器的設(shè)備可以提供80GBps或1000萬(wàn)IOPS。通常的單臺(tái)服務(wù)器使用不了這么多帶寬,可以將多余的部分進(jìn)行共享。
不過(guò),網(wǎng)絡(luò)可能會(huì)是潛在的瓶頸。理想的網(wǎng)絡(luò)環(huán)境中沒(méi)有任何額外的延遲,我們距離這個(gè)目標(biāo)并不遙遠(yuǎn)。超融合集群的理想規(guī)劃是建立在高速網(wǎng)絡(luò)的使用之上的,例如多組10或25千兆的以太網(wǎng)鏈路(甚至更快的連接)。這確實(shí)在一定程度上增加成本,但降低了數(shù)據(jù)管理的復(fù)雜性(例如不需要將關(guān)鍵數(shù)據(jù)存放本地),并使得所有服務(wù)器工作更有效率。
目前,許多超融合產(chǎn)品使用以太網(wǎng)遠(yuǎn)程直接內(nèi)存訪問(wèn)(RDMAE)或InfiniBand網(wǎng)絡(luò),從而大幅提升吞吐量,降低了90%的系統(tǒng)開(kāi)銷,并顯著減少延遲。
超融合技術(shù)洞察
緊湊型存儲(chǔ)設(shè)備分兩種類型。一種是采用“樂(lè)高式”的對(duì)象存儲(chǔ),這通常用于存儲(chǔ)容量相對(duì)較小、或作為一體化遠(yuǎn)程辦公平臺(tái),例如虛擬桌面基礎(chǔ)架構(gòu)(VDI);另一種在最近才出現(xiàn),并在超融合技術(shù)的大趨勢(shì)下顯得更為有趣。
這種方式旨在滿足虛擬化應(yīng)用實(shí)例、存儲(chǔ)服務(wù)以及軟件定義網(wǎng)絡(luò)(SDN)服務(wù)的需要。其處理器配置強(qiáng)勁——通常是具備雙處理器以及龐大的DRAM。這使得在單個(gè)設(shè)備上能夠運(yùn)行更多的實(shí)例,尤其是在上述三項(xiàng)服務(wù)都完全支持Docker容器的時(shí)候。
總體而言,超融合技術(shù)的優(yōu)勢(shì)在于方便使用。單個(gè)硬件盒子中同時(shí)整合了服務(wù)器和存儲(chǔ),而且由于具備SDN 的超融合基礎(chǔ)架構(gòu)(HCI)的準(zhǔn)系統(tǒng)性質(zhì),網(wǎng)絡(luò)方面亦更具成本效益。這種方式降低了成本并簡(jiǎn)化安裝,并且HCI軟件往往會(huì)預(yù)先加載以節(jié)省更多的啟動(dòng)時(shí)間。另外,HCI通常由單一供應(yīng)商提供,可以消除風(fēng)險(xiǎn)并減少企業(yè)內(nèi)部人員。
所有主流的IT平臺(tái)供應(yīng)商都可提供HCI產(chǎn)品,其中大多數(shù)使用第三方虛擬SAN工具(Nexenta或Simplivity)組建集群。產(chǎn)品中還可能包含其他功能,例如管理和配置工具,以加強(qiáng)產(chǎn)品競(jìng)爭(zhēng)力。目前多數(shù)超融合技術(shù)供應(yīng)商都對(duì)可配置數(shù)量進(jìn)行限制,目的是確保開(kāi)箱即用,以及對(duì)主流技術(shù)的兼容。
總之:今天踏上超融合技術(shù)的道路已不存在特別大的風(fēng)險(xiǎn)。其成本應(yīng)當(dāng)?shù)陀趥鹘y(tǒng)“點(diǎn)菜式”的配置,尤其是與傳統(tǒng)的RAID相比;另一方面市場(chǎng)上有許多供應(yīng)商可供選擇,從主流的廠商到初創(chuàng)企業(yè)。軟件定義的趨勢(shì)將在未來(lái)增加更多的服務(wù)功能,并將其應(yīng)用提升至全新的層次。
采取適合的超融合基礎(chǔ)架構(gòu)
不過(guò),在部署超融合技術(shù)時(shí)仍有需要注意的一些問(wèn)題。我們已經(jīng)談到過(guò)網(wǎng)絡(luò)絕對(duì)不是應(yīng)該省錢的地方。在不久的將來(lái),使用NVDIMM作為DRAM閃存數(shù)據(jù)的擴(kuò)充或許也會(huì)變得至關(guān)重要。
隨著業(yè)務(wù)發(fā)展,你會(huì)需要擴(kuò)展各種HCI集群。考慮到服務(wù)器與存儲(chǔ)技術(shù)正以數(shù)十年來(lái)最快的速度發(fā)展,可以確定的是,升級(jí)擴(kuò)展時(shí)使用的設(shè)備將不同于目前的,內(nèi)存和驅(qū)動(dòng)器都會(huì)變得更快、容量更大。集群軟件必須能夠適應(yīng)這種擴(kuò)展,處理不同資源之間的差異。
核心的集群軟件應(yīng)該與供應(yīng)商無(wú)關(guān),其運(yùn)行在通用的硬件之上。不過(guò),考慮到主流的HCI設(shè)備中,Dell和Hewlett Packard Enterprise占據(jù)著主導(dǎo)地位,這塊市場(chǎng)有可能長(zhǎng)期被其鎖定,特別是當(dāng)全新的設(shè)備商進(jìn)入該市場(chǎng)時(shí)。詢問(wèn)你的供應(yīng)商是否支持多家廠商的產(chǎn)品集成在一起,就像是今天的云計(jì)算那樣,以防被其鎖定。
當(dāng)然,超融合技術(shù)對(duì)于某些場(chǎng)景下仍顯不足。具有GPU的產(chǎn)品仍在HCI認(rèn)證的配置之外,這會(huì)影響大數(shù)據(jù)和高性能計(jì)算方面的市場(chǎng)需求。我們所說(shuō)的HCI配置對(duì)于許多遠(yuǎn)程辦公場(chǎng)景亦有多余之處,其添加存儲(chǔ)池時(shí)的復(fù)雜性似乎并不必要。
不過(guò),在虛擬桌面基礎(chǔ)架構(gòu)中部分使用HCI仍有其意義所在,這可以使得硬件采購(gòu)得以統(tǒng)一化,允許你大量部署相同的資源,共享給傳統(tǒng)的虛擬桌面和其它應(yīng)用,同時(shí)采取通用的體系架構(gòu)。
二級(jí)存儲(chǔ)
如何處理陳舊的數(shù)據(jù)是超融合技術(shù)應(yīng)用所面臨的問(wèn)題之一,常見(jiàn)的做法是將其遷移至二級(jí)存儲(chǔ)上。你可以大批量在這類設(shè)備中增加硬盤驅(qū)動(dòng)器,并采取壓縮與重復(fù)數(shù)據(jù)刪除等技術(shù)來(lái)增強(qiáng)存儲(chǔ)能力。例如,兩塊10TB的硬盤驅(qū)動(dòng)器可以為具備壓縮功能的二級(jí)存儲(chǔ)在單節(jié)點(diǎn)增加100TB的存儲(chǔ)能力。或者你也可以選擇將數(shù)據(jù)遷移至網(wǎng)絡(luò)上的二級(jí)存儲(chǔ)系統(tǒng)。這在今天通常會(huì)是對(duì)象存儲(chǔ)。
兩種選項(xiàng)之間,性能可能是主要的考慮因素,當(dāng)然在HCI設(shè)備的空槽位中添加驅(qū)動(dòng)器可能會(huì)更為廉價(jià)。
HCI的替代方案
事實(shí)上,在現(xiàn)代化的IT策略中,除了HCI以外僅有兩種可行方法。一種是將存儲(chǔ)完全遷移到公有云。例如借助Amazon Web Services提供的虛擬私有云——讓數(shù)據(jù)的安全性和完整性方面與數(shù)據(jù)中心保持一致。
但是,大多數(shù)企業(yè)的IT部門尚未準(zhǔn)備好全面過(guò)渡到云端,而且在企業(yè)內(nèi)部部署HCI或許能實(shí)現(xiàn)更低的總體擁有成本。
另一種可行的方案是構(gòu)建傳統(tǒng)的服務(wù)器集群,配置存儲(chǔ)網(wǎng)絡(luò)。但是作為云服務(wù),這樣的架構(gòu)遲早會(huì)遭遇I/O性能瓶頸,即便你使用全閃存陣列來(lái)提升網(wǎng)絡(luò)存儲(chǔ)性能。這種體系架構(gòu)中的延遲總是高于本地的NVMe驅(qū)動(dòng)器,也正是這個(gè)原因推動(dòng)著全閃存陣列供應(yīng)商在其產(chǎn)品的光纖接口上提供對(duì)NVMe的支持,即便這仍會(huì)慢于本地驅(qū)動(dòng)器。
存儲(chǔ)網(wǎng)絡(luò)的方式也增加了管理多家供應(yīng)商的復(fù)雜性,相比超融合技術(shù)往往需要更高的總體擁有成本。而將存儲(chǔ)網(wǎng)絡(luò)用于二級(jí)存儲(chǔ)亦代價(jià)高昂。
HCI的演變
當(dāng)前的IT有兩項(xiàng)重要趨勢(shì),大幅度的性能提升以及更為緊湊的外觀。
SSD 的性能持續(xù)地快速提升。這意味著更少數(shù)量的服務(wù)器能夠完成更多操作,承擔(dān)更高的工作負(fù)載。存儲(chǔ)級(jí)內(nèi)存(Storage-class memory,簡(jiǎn)稱SCM)以NVDIMM的形式出現(xiàn),從另一個(gè)側(cè)面改變了游戲規(guī)則。SCM可以作為DRAM的擴(kuò)充——允許服務(wù)器支持更多實(shí)例,并長(zhǎng)期存留其中數(shù)據(jù)。在未來(lái)的18個(gè)月中,隨著操作系統(tǒng)和編譯器技術(shù)的發(fā)展,這項(xiàng)技術(shù)將是加速應(yīng)用程序的關(guān)鍵所在。同樣,這會(huì)使得HCI設(shè)備變得更為強(qiáng)大,尤其是在和Docker容器配合時(shí)其支持實(shí)例的效果倍增。
這些都是在相對(duì)短期內(nèi)的改進(jìn)。數(shù)年后,混合內(nèi)存立方體(Hybrid-Memory Cube,簡(jiǎn)稱HMC)體系架構(gòu)的變化將使得DRAM和處理器更為緊密地結(jié)合起來(lái)。我們或?qū)⒃?017年看到配置16GB或32GB L4緩存的處理器,而系統(tǒng)中余下的DRAM 將以更高速的帶寬串連起來(lái)。
另外還有一些技術(shù)舉措將使得所有的內(nèi)存為一個(gè)HCI集群中所共享,從而將性能提升至全新的高度。
與此同時(shí),SSD正變得越來(lái)越小,密度越來(lái)越大。3D NAND技術(shù)將在2017年全面進(jìn)入市場(chǎng)。其結(jié)果是推動(dòng)小型SSD的巨大產(chǎn)能,藉此我們可以預(yù)計(jì)會(huì)在小型的M.2封裝內(nèi)實(shí)現(xiàn)10TB的SSD,10塊這樣的SSD可以安裝在一個(gè)3.5英寸驅(qū)動(dòng)器槽位內(nèi)。從更宏觀角度上將,100TB的2.5英寸固態(tài)業(yè)已發(fā)布,盡管發(fā)貨日期仍遲遲未有消息。
使用HMC方法的服務(wù)器引擎亦更為緊湊,因?yàn)樘幚砥骷跋嚓P(guān)配件被封裝在一塊小型模塊上。總而言之,小型的驅(qū)動(dòng)器和小型的服務(wù)器引擎促成了小型的系統(tǒng)。很有可能,在2018年1/2U的機(jī)架式服務(wù)器或單純的高密度刀片式機(jī)箱將成為主流。
那么,你是否應(yīng)當(dāng)全面擁抱超融合系統(tǒng)呢?
簡(jiǎn)而言之,答案是肯定的。這將是總體擁有成本最低、最簡(jiǎn)單(快速)的部署方式,使你搭建起面向軟件定義的基礎(chǔ)架構(gòu),全面融入混合云,超融合技術(shù)在今天可能只是好看而已,但在未來(lái)一兩年內(nèi)會(huì)令人心悅誠(chéng)服。