如果您的存儲(chǔ)數(shù)據(jù)量不大,或者對(duì)存儲(chǔ)性能要求不太高,而現(xiàn)有的NAS或SAN又恰好可以滿足應(yīng)用需求,您可能不會(huì)注意到集群存儲(chǔ)正在中國(guó)市場(chǎng)上悄然興起。
對(duì)于互聯(lián)網(wǎng)、流媒體、高性能計(jì)算、能源等數(shù)據(jù)密集型、高并發(fā)訪問(wèn)的行業(yè)用戶來(lái)說(shuō),容量與性能的線性擴(kuò)展是必須的,而對(duì)于傳統(tǒng)的存儲(chǔ)方式來(lái)說(shuō),這卻是不可逾越的鴻溝。
由若干個(gè)存儲(chǔ)系統(tǒng)組成的集群,其性能和容量等屬性可通過(guò)集群的方式得以疊加和擴(kuò)展,不但有效解決了高性能的文件共享問(wèn)題,同時(shí)兼顧了數(shù)據(jù)的高可用性及文件系統(tǒng)的高擴(kuò)展性。
用戶的迫切需求直接導(dǎo)致了集群存儲(chǔ)市場(chǎng)的興起。在集群存儲(chǔ)領(lǐng)域,有中國(guó)用戶十分熟悉的IBM、SGI、NetApp、Panasas、藍(lán)鯨,還有中國(guó)用戶不太熟悉的DataDirect、Omneon、Isilon、Verari、龍存科技等已經(jīng)摩拳擦掌,而集群存儲(chǔ)也將成為存儲(chǔ)市場(chǎng)下一個(gè)時(shí)髦字眼。
從我們接觸到的中國(guó)用戶來(lái)看,能源行業(yè)、廣電行業(yè)和科學(xué)計(jì)算等領(lǐng)域的用戶成了集群存儲(chǔ)市場(chǎng)上首批吃螃蟹的人。因?yàn)檫@些行業(yè)的用戶越來(lái)越依賴大型的和日益增長(zhǎng)的數(shù)據(jù)集,對(duì)于存儲(chǔ)的性能和可靠性要求也非常高,而且在服務(wù)器集群方面也積累了很多經(jīng)驗(yàn),這些因素都有助于上述行業(yè)的用戶了解和實(shí)施集群存儲(chǔ)。
其實(shí),集群存儲(chǔ)的應(yīng)用并不局限于某個(gè)行業(yè)或某個(gè)應(yīng)用,只要存儲(chǔ)的經(jīng)濟(jì)性與技術(shù)性能達(dá)到一定的要求,集群存儲(chǔ)就是一種不錯(cuò)的選擇。
為了讓中國(guó)用戶能夠進(jìn)一步了解集群存儲(chǔ)的相關(guān)知識(shí),我們邀請(qǐng)了多名業(yè)內(nèi)專家,就集群存儲(chǔ)的概念、采購(gòu)和部署等方面的幾個(gè)問(wèn)題進(jìn)行了解答,相信集群存儲(chǔ)在性能和擴(kuò)展性方面的特色會(huì)給您耳目一新的感覺(jué)。
什么是集群存儲(chǔ)?
所謂集群存儲(chǔ)是將多臺(tái)存儲(chǔ)設(shè)備中的存儲(chǔ)空間聚合成一個(gè)能夠給應(yīng)用服務(wù)器提供統(tǒng)一訪問(wèn)接口和管理界面的存儲(chǔ)池,應(yīng)用可以通過(guò)該訪問(wèn)接口透明地訪問(wèn)和利用所有存儲(chǔ)設(shè)備上的磁盤(pán),可以充分發(fā)揮存儲(chǔ)設(shè)備的性能和磁盤(pán)利用率。數(shù)據(jù)將會(huì)按照一定的規(guī)則從多臺(tái)存儲(chǔ)設(shè)備上存儲(chǔ)和讀取,以獲得更高的并發(fā)訪問(wèn)性能。北京龍存科技有限責(zé)任公司CEO唐榮鋒表示:“集群存儲(chǔ)能夠解決存儲(chǔ)應(yīng)用中的高帶寬、并發(fā)訪問(wèn)、高可擴(kuò)展性、易管理等各項(xiàng)需求。”
與傳統(tǒng)NAS和SAN相比集群存儲(chǔ)的優(yōu)勢(shì)何在?
傳統(tǒng)的SAN與NAS分別提供的是數(shù)據(jù)塊與文件兩個(gè)不同級(jí)別的存儲(chǔ)服務(wù),集群存儲(chǔ)也分為提供數(shù)據(jù)塊與文件兩個(gè)不同級(jí)別存儲(chǔ)服務(wù)的集群存儲(chǔ)系統(tǒng)。
集群存儲(chǔ)的優(yōu)勢(shì)主要體現(xiàn)在提高并行或分區(qū)I/O的整體性能,特別是工作流、讀密集型以及大型文件的訪問(wèn),通過(guò)采用更低成本的服務(wù)器來(lái)降低整體成本。
SAN系統(tǒng)具有很高的性能,但是構(gòu)建和維護(hù)起來(lái)很復(fù)雜。由于數(shù)據(jù)塊和網(wǎng)絡(luò)需求的原因,SAN系統(tǒng)也很難擴(kuò)容。NAS系統(tǒng)的構(gòu)建和維護(hù)雖然比較簡(jiǎn)單,但是由于其聚合設(shè)備(又叫做NAS頭)是其架構(gòu)上的瓶頸,造成其性能很有限。集群存儲(chǔ)提供了SAN和NAS結(jié)構(gòu)的優(yōu)點(diǎn)。在大多數(shù)使用集群存儲(chǔ)的案例中,隨著存儲(chǔ)系統(tǒng)的擴(kuò)容,性能也隨之提升。一個(gè)大的集群存儲(chǔ)的性能往往勝過(guò)一個(gè)SAN系統(tǒng),但是價(jià)格也會(huì)更高。集群存儲(chǔ)系統(tǒng)像NAS系統(tǒng)一樣易于構(gòu)建、操作和擴(kuò)容。大多數(shù)集群存儲(chǔ)系統(tǒng)沒(méi)有傳統(tǒng)NAS系統(tǒng)的固有瓶頸。
集群存儲(chǔ)有兩種實(shí)現(xiàn)方式:一種是硬件基礎(chǔ)架構(gòu)加上軟件,典型代表是SAN架構(gòu)+IBM GPFS;另一種是專用集群存儲(chǔ),典型代表是Isilon、NetApp GX以及Panasas,其中NetApp GX是構(gòu)建在NAS基礎(chǔ)架構(gòu)之上的,但是通過(guò)操作系統(tǒng)實(shí)現(xiàn)集群存儲(chǔ)。從這個(gè)角度講,集群存儲(chǔ)與SAN或NAS不存在競(jìng)爭(zhēng)關(guān)系,是實(shí)現(xiàn)不同存儲(chǔ)需求的解決方案。”
集群存儲(chǔ)和NAS的概念是在文件系統(tǒng)層面上的,而SAN是在LUN層面上的,集群存儲(chǔ)可以利用SAN環(huán)境實(shí)現(xiàn)。因此,集群存儲(chǔ)與SAN解決的問(wèn)題不同。如果一定要比較這兩者的優(yōu)缺點(diǎn)的話,可以說(shuō)SAN做到的是多個(gè)服務(wù)器節(jié)點(diǎn)可以同時(shí)看到SAN環(huán)境中的同一個(gè)LUN,還不能做到多服務(wù)器節(jié)點(diǎn)間的文件級(jí)共享。
集群存儲(chǔ)在性能、可靠性及擴(kuò)展性等多個(gè)方面都遠(yuǎn)遠(yuǎn)優(yōu)于 NAS。[nextpage]
集群存儲(chǔ)在部署時(shí)有沒(méi)有特別要求?
總體來(lái)說(shuō),部署集群存儲(chǔ)并無(wú)特別之處。集群存儲(chǔ)中的所有節(jié)點(diǎn)都必須安裝好操作系統(tǒng),并保障網(wǎng)絡(luò)暢通。整套系統(tǒng)的配置管理一般都可以通過(guò)單一節(jié)點(diǎn)進(jìn)行,不會(huì)像SAN那樣復(fù)雜。
采用集群存儲(chǔ)的客戶一定要懂得應(yīng)用,對(duì)現(xiàn)有的基礎(chǔ)架構(gòu)非常熟悉,因?yàn)榧捍鎯?chǔ)在實(shí)施時(shí)可能要用到網(wǎng)絡(luò)、服務(wù)器、操作系統(tǒng)等多種知識(shí)。在采用集群存儲(chǔ)架構(gòu)時(shí),必須考慮以下三方面問(wèn)題:存儲(chǔ)成本對(duì)整個(gè)業(yè)務(wù)模型的影響;應(yīng)用系統(tǒng)架構(gòu)和輸入/輸出負(fù)載的特點(diǎn);在評(píng)估集群方案時(shí),原有系統(tǒng)本身的性能、成本、可用性如何。
為了盡可能減少風(fēng)險(xiǎn),用戶在部署集群存儲(chǔ)系統(tǒng)時(shí),最好與廠商的專業(yè)技術(shù)人員進(jìn)行充分溝通,根據(jù)具體應(yīng)用需求進(jìn)行有針對(duì)性的設(shè)計(jì)和部署,這樣才能達(dá)到預(yù)期效果。
集群存儲(chǔ)是否僅限于Linux平臺(tái)?
由于Linux具有價(jià)格低廉以及性能優(yōu)良、穩(wěn)定性好等優(yōu)勢(shì),因此很快融入了集群領(lǐng)域,并且占據(jù)了較大的市場(chǎng)份額。Omneon公司認(rèn)為,由于價(jià)格的因素,多數(shù)集群存儲(chǔ)基于Linux操作系統(tǒng)。其實(shí),存儲(chǔ)集群與操作系統(tǒng)沒(méi)有什么關(guān)系,只要能被各種類(lèi)型的客戶端訪問(wèn)到就可以。在許多案例中,用戶會(huì)提供客戶端代理,允許從客戶端到存儲(chǔ)集群的直接訪問(wèn)。
可以這樣說(shuō),是需求拉動(dòng)了Linux平臺(tái)上集群存儲(chǔ)的發(fā)展,但是集群存儲(chǔ)并不僅局限于Linux平臺(tái),但Linux服務(wù)器集群確實(shí)是主流發(fā)展方向。在 Unix領(lǐng)域,提供集群解決方案的包括IBM、SGI,微軟也推出了自己的服務(wù)器集群系統(tǒng)。Unix領(lǐng)域集群市場(chǎng)日漸萎縮主要是因?yàn)長(zhǎng)inux集群的性價(jià)比適合目前所有的集群應(yīng)用。Windows集群系統(tǒng)主要應(yīng)用于小型系統(tǒng)。
Isilon采用Linux作為核心操作系統(tǒng),主要是因?yàn)長(zhǎng)inux開(kāi)放的資源、靈活性以及市場(chǎng)的適用性,非常適合集群存儲(chǔ)系統(tǒng)的應(yīng)用。但是用戶必須明確,操作系統(tǒng)級(jí)和應(yīng)用軟件層是截然不同。存儲(chǔ)集群的應(yīng)用性與應(yīng)用系統(tǒng)之間的架構(gòu)存在更為密切的聯(lián)系,而不是操作系統(tǒng)。Unix、Windows、Linux甚至Macintosh的環(huán)境與Isilon集群存儲(chǔ)系統(tǒng)之間沒(méi)有任何必然關(guān)系。 Isilon的集群存儲(chǔ)解決方案是基于業(yè)內(nèi)標(biāo)準(zhǔn)協(xié)議進(jìn)行連接的,能夠支持任何軟件。
選擇集群存儲(chǔ)時(shí)應(yīng)注意哪些問(wèn)題?
用戶應(yīng)該從自己的實(shí)際應(yīng)用需求(如性能需求及可靠性需求等)出發(fā)來(lái)判斷是否需要構(gòu)建集群存儲(chǔ)。在選擇集群存儲(chǔ)解決方案時(shí),應(yīng)該著重考慮避免性能瓶頸。集群存儲(chǔ)解決方案中最容易產(chǎn)生性能瓶頸的地方是元數(shù)據(jù)管理服務(wù)器(Metadata Server),因?yàn)樵獢?shù)據(jù)服務(wù)器的數(shù)量通常都有限制,而且其工作負(fù)載又很大。另外,在方案設(shè)計(jì)和項(xiàng)目實(shí)施的過(guò)程中,一定要注意避免單一故障點(diǎn)。好的方案可以從服務(wù)器、網(wǎng)絡(luò)及存儲(chǔ)系統(tǒng)的各個(gè)方面消除單一故障點(diǎn)。
中國(guó)用戶對(duì)集群存儲(chǔ)的接受程度如何?
用戶對(duì)SAN和NAS比較熟悉,但是對(duì)集群存儲(chǔ)解決方案比較陌生,特別是對(duì)集群存儲(chǔ)的可靠性存在疑問(wèn)。從目前情況看,集群存儲(chǔ)還處于導(dǎo)入期,用戶接受需要一定的時(shí)間。
一些比較成熟的行業(yè),如石油勘探行業(yè)的用戶對(duì)硬件架構(gòu)+并行文件系統(tǒng)的模式就非常認(rèn)可。Isilon公司也認(rèn)為,集群存儲(chǔ)已經(jīng)在國(guó)內(nèi)的某些特定商業(yè)領(lǐng)域得到了成功應(yīng)用,如能源、科學(xué)、廣電、娛樂(lè)等。在這些行業(yè)中,客戶需要存儲(chǔ)系統(tǒng)的功能、特點(diǎn)能夠適應(yīng)其業(yè)務(wù)應(yīng)用環(huán)境,并且不能影響過(guò)去的投資,更重要的是不能影響整個(gè)業(yè)務(wù)的運(yùn)作。
因?yàn)榧捍鎯?chǔ)可以在底層為用戶應(yīng)用提供強(qiáng)大的支持,所以當(dāng)用戶真正理解了其概念和優(yōu)勢(shì)后,是非常容易接受的。
與歐美市場(chǎng)相比,中國(guó)市場(chǎng)受到傳統(tǒng)或比較陳舊的系統(tǒng)架構(gòu)的阻礙相對(duì)較少。因此中國(guó)市場(chǎng)能夠比西歐或美國(guó)市場(chǎng)更易接受集群存儲(chǔ)。
能源、廣電等領(lǐng)域的用戶是中國(guó)集群存儲(chǔ)市場(chǎng)上首批吃螃蟹的人。