軟件定義存儲(chǔ),當(dāng)下存儲(chǔ)行業(yè)最火熱的話題,沒(méi)有之一。從最開(kāi)始的軟件定義數(shù)據(jù)中心,到軟件定義網(wǎng)絡(luò)與網(wǎng)絡(luò)功能虛擬化(SDN和NFV),這場(chǎng)浪潮最終燒到了數(shù)據(jù)中心最核心也是最復(fù)雜的組成部分——存儲(chǔ)。于是,軟件定義存儲(chǔ)的理念隨之而來(lái)。
在這一理念下,軟件應(yīng)當(dāng)在企業(yè)存儲(chǔ)系統(tǒng)中發(fā)揮重要的作用,它可以建立、管理、控制和協(xié)調(diào)存儲(chǔ)資源,而不僅僅是存儲(chǔ)系統(tǒng)的附屬品或是邊緣。
與此同時(shí),有一個(gè)經(jīng)久不衰的話題持續(xù)存在,那就是“雙活”。作為保障業(yè)務(wù)連續(xù)性最堅(jiān)實(shí)的基礎(chǔ),越來(lái)越多的企業(yè)開(kāi)始付諸行動(dòng),正如某業(yè)內(nèi)媒體所撰寫(xiě)的那樣:“2014年,一個(gè)最顯著的變化是,雙活數(shù)據(jù)中心跨越了概念炒作的階段,被很多企業(yè)用戶所接受。”
存儲(chǔ)系統(tǒng)的雙活解決方案長(zhǎng)期以來(lái)就是數(shù)據(jù)中心雙活架構(gòu)中的重點(diǎn),這其中的原因不僅是因?yàn)榇鎯?chǔ)系統(tǒng)中存儲(chǔ)了企業(yè)最核心的生產(chǎn)數(shù)據(jù),是“萬(wàn)萬(wàn)馬虎不得”的核心系統(tǒng),更因?yàn)榕c服務(wù)器(主機(jī)端)雙活、應(yīng)用程序雙活(如Oracle RAC)相比,存儲(chǔ)系統(tǒng)的雙活不僅架構(gòu)復(fù)雜、實(shí)施復(fù)雜,而且往往存在這樣或那樣的問(wèn)題,
在“臨門(mén)一腳”的時(shí)候,往往“活不過(guò)來(lái)”。
但即便是這樣,存儲(chǔ)系統(tǒng)的雙活解決方案仍然在企業(yè)客戶的數(shù)據(jù)中心遍地開(kāi)花,可是,許多企業(yè)客戶發(fā)現(xiàn),在軟件定義存儲(chǔ)的大思路之下,數(shù)據(jù)中心內(nèi)的存儲(chǔ)雙活方案,卻成了軟件定義存儲(chǔ)的攔路虎、擋路石。
“嗨!我們還能不能好好的在一起玩耍了?”軟件定義存儲(chǔ)對(duì)存儲(chǔ)雙活說(shuō)到。
存儲(chǔ)雙活 阻礙軟件定義存儲(chǔ)的發(fā)展?
軟件定義存儲(chǔ)和存儲(chǔ)雙活,看起來(lái)是八竿子打不著的事情,這兩者之間怎么就產(chǎn)生了互相影響?憑什么說(shuō)“(某些)存儲(chǔ)雙活解決方案,阻礙了軟件定義存儲(chǔ)的發(fā)展”?這事兒還要從業(yè)界主流的幾種存儲(chǔ)雙活架構(gòu)說(shuō)起。
存儲(chǔ)雙活的架構(gòu)設(shè)計(jì),從不同的供應(yīng)商的產(chǎn)品特點(diǎn)出發(fā),大致可以歸納為幾類(lèi):主機(jī)卷鏡像、虛擬化存儲(chǔ)網(wǎng)關(guān)、外置雙活存儲(chǔ)網(wǎng)關(guān)和存儲(chǔ)內(nèi)嵌雙活+CDP等幾種架構(gòu),其中絕大多數(shù)存儲(chǔ)雙活選擇,由于其架構(gòu)設(shè)計(jì),在實(shí)現(xiàn)存儲(chǔ)雙活后,主機(jī)端與存儲(chǔ)(功能)端被人為的分割開(kāi)來(lái),從而無(wú)法利用陣列本身軟件,軟件定義存儲(chǔ)也就無(wú)從談起了。
為什么會(huì)發(fā)生這樣的事情呢?還要從其中幾種架構(gòu)的設(shè)計(jì)思路說(shuō)起。
主機(jī)卷鏡像的方式是早期存儲(chǔ)雙活方案選擇較多的方式,企業(yè)客戶通過(guò)采購(gòu)主機(jī)卷鏡像軟件,保證數(shù)據(jù)從主存儲(chǔ)鏡像到備存儲(chǔ),這一方案不依賴(lài)于具體的存儲(chǔ)品牌,支持存儲(chǔ)雙活,但由于卷鏡像軟件只將存儲(chǔ)系統(tǒng)作為一個(gè)“硬盤(pán)池”來(lái)使用,無(wú)法利用存儲(chǔ)陣列本身的軟件。
除此以外,這一方案還存在額外采購(gòu)鏡像軟件安裝在所有主機(jī)端所造成的成本和消耗主機(jī)資源、存儲(chǔ)系統(tǒng)/主機(jī)操作系統(tǒng)/虛擬化平臺(tái)多平臺(tái)兼容性等問(wèn)題。
更進(jìn)一步,業(yè)內(nèi)一些存儲(chǔ)廠商提出了虛擬化網(wǎng)關(guān)的存儲(chǔ)雙活解決方案,這一方案利用兩層SAN交換機(jī)內(nèi)的存儲(chǔ)網(wǎng)關(guān),將后端存儲(chǔ)進(jìn)行虛擬化,變成虛擬化資源池來(lái)使用其容量,將主機(jī)端的IO通過(guò)SAN交換機(jī)分發(fā)給兩套存儲(chǔ)系統(tǒng),從而達(dá)到存儲(chǔ)“雙活”的目的——在這一架構(gòu)中,存儲(chǔ)系統(tǒng)只是被虛擬化的資源池,同樣無(wú)法利用陣列本身的軟件。
但更為關(guān)鍵的是,在付出了額外購(gòu)買(mǎi)存儲(chǔ)網(wǎng)關(guān)的成本、接受了新增網(wǎng)關(guān)層可能存在的性能瓶頸問(wèn)題以及網(wǎng)關(guān)往往不能跨代混用等問(wèn)題之后,虛擬化存儲(chǔ)網(wǎng)關(guān)的存儲(chǔ)雙活卻并不能夠真正支持存儲(chǔ)雙活——以x86服務(wù)器為基礎(chǔ)的虛擬化存儲(chǔ)網(wǎng)關(guān)雙活控制器集群,雙活的只是網(wǎng)關(guān)內(nèi)的控制器,而不是虛擬化存儲(chǔ)網(wǎng)關(guān)。
基于對(duì)虛擬化存儲(chǔ)網(wǎng)關(guān)進(jìn)一步優(yōu)化,外置雙活存儲(chǔ)網(wǎng)關(guān)架構(gòu)被設(shè)計(jì)出來(lái),它采用外置雙活存儲(chǔ)網(wǎng)關(guān),在采購(gòu)至少兩對(duì)(四個(gè))網(wǎng)關(guān)的前提下,這一方案確實(shí)可以提供行業(yè)內(nèi)可靠性幾近最佳的存儲(chǔ)雙活支持,但是,由于存儲(chǔ)系統(tǒng)仍然是依靠存儲(chǔ)網(wǎng)關(guān)實(shí)現(xiàn)數(shù)據(jù)的分配和系統(tǒng)的利用,它仍然無(wú)法利用陣列本身的軟件。
在這一方案中,決不可忽略的是成本問(wèn)題。相對(duì)于之前談到的兩個(gè)方案,由于架構(gòu)設(shè)計(jì)的問(wèn)題,每對(duì)網(wǎng)關(guān)對(duì)應(yīng)一套存儲(chǔ)系統(tǒng),這意味著必須采購(gòu)兩對(duì)也就是四個(gè)外置存儲(chǔ)網(wǎng)關(guān),“四引擎,八個(gè)控制器”的采購(gòu)成本,幾乎是此前兩個(gè)方案的兩倍之多。
傳統(tǒng)的三種雙活方式,不僅存在架構(gòu)復(fù)雜、陣列軟件不能復(fù)用等問(wèn)題,且只對(duì)物理故障有效。
那么,有沒(méi)有什么辦法,既能夠保證存儲(chǔ)雙活,又能夠利用陣列本身軟件,不破壞“軟件定義存儲(chǔ)的良好愿景”呢?
當(dāng)然有了!你把存儲(chǔ)網(wǎng)關(guān)取消掉,讓主機(jī)端直接連接存儲(chǔ)系統(tǒng)不就得了?!
存儲(chǔ)內(nèi)嵌雙活+CDP:這才是軟件定義存儲(chǔ)的思路
讓存儲(chǔ)雙活回到軟件定義存儲(chǔ)的思路上來(lái),其實(shí)并不像想象中的那么難,一方面,存儲(chǔ)雙活與軟件定義存儲(chǔ)不是對(duì)立的,即便是剛才談到的幾種解決方案,都是以軟件為核心的,軟件怎么會(huì)“為難”軟件呢?另一方面,之前幾種方案之所以無(wú)法釋放陣列的軟件能力,核心原因在于其只是將存儲(chǔ)作為容量池使用,而是將復(fù)雜的軟件功能交付給了存儲(chǔ)網(wǎng)關(guān)或是主機(jī)端,從這個(gè)角度來(lái)說(shuō),“直連”不就得了?
但主機(jī)端直接連接存儲(chǔ),實(shí)現(xiàn)存儲(chǔ)雙活是有條件的,這個(gè)條件就是:存儲(chǔ)系統(tǒng)必須要內(nèi)嵌雙活,也就是將原本存儲(chǔ)網(wǎng)關(guān)干的事情納入到存儲(chǔ)系統(tǒng)中去,這就是我們?cè)谇拔闹刑岬降?ldquo;存儲(chǔ)內(nèi)嵌雙活+CDP”的模式——咦?為什么要CDP?這件事情我們暫時(shí)按下不表,先把話題集中到雙活架構(gòu)上來(lái)。
戴爾Live Volume的“存儲(chǔ)內(nèi)嵌雙活+CDP”架構(gòu)
在戴爾Compellent存儲(chǔ)系統(tǒng)中,有一項(xiàng)內(nèi)嵌技術(shù)叫做LV,這不是LOUIS VUITTON,而是Live Volume,以這一技術(shù)為核心的雙活解決方案是“比純粹數(shù)據(jù)復(fù)制更高級(jí)的數(shù)據(jù)中心級(jí)別的雙活保護(hù)方案”:Live Volume以流動(dòng)、虛擬化的方式,維持戴爾Compellent SC系列存儲(chǔ)系統(tǒng)之間的數(shù)據(jù)關(guān)系,數(shù)據(jù)卷可以在系統(tǒng)之間以非中斷方式在線數(shù)據(jù)遷移,或者說(shuō)叫“漂移”。
在雙活架構(gòu)中,主存儲(chǔ)的每一次IO操作,都通過(guò)FC或iSCSI鏈路以同步(遠(yuǎn)程站點(diǎn)可以選擇異步)復(fù)制的方式,投射到備(從)存儲(chǔ)上,使兩邊的數(shù)據(jù)保持高度的一致性。
當(dāng)主存儲(chǔ)站點(diǎn)或是通向其的路徑發(fā)生故障,主機(jī)端的IO無(wú)法到達(dá)主存儲(chǔ)時(shí),戴爾Compellent SC存儲(chǔ)系統(tǒng)會(huì)感知到來(lái)自主機(jī)端IO的下降甚至是丟失,在滿足一定的條件時(shí),即完成從動(dòng)態(tài)的交換路徑到自動(dòng)進(jìn)行動(dòng)態(tài)角色交換等一系列動(dòng)作,也就是說(shuō),原有的主存儲(chǔ)和備(從)存儲(chǔ)之間交換了身份。
Live Volume的站點(diǎn)交換過(guò)程,可以完全保證數(shù)據(jù)的同步。
這一“交換身份”的過(guò)程,對(duì)主機(jī)來(lái)說(shuō)就像是讓卷動(dòng)態(tài)漂移到了新的主存儲(chǔ)(也就是原來(lái)的備份(從)存儲(chǔ))那里,其技術(shù)實(shí)現(xiàn)和應(yīng)用體驗(yàn)就像是VMware上實(shí)時(shí)在線遷移一臺(tái)虛擬機(jī)——Live Volume就像是在主存儲(chǔ)/備(從)存儲(chǔ)系統(tǒng)中創(chuàng)造一個(gè)類(lèi)似VMware的Hypervisor虛擬化層的存儲(chǔ)抽象層——讓卷可以就像是VMotion一樣,自由的在存儲(chǔ)系統(tǒng)之間漂移。
在這樣的架構(gòu)下,主機(jī)端所分配的卷,就像是在兩套存儲(chǔ)系統(tǒng)之間“漂移”,對(duì)主機(jī)端來(lái)說(shuō),主卷永遠(yuǎn)存儲(chǔ)在主存儲(chǔ)上,從未改變。哪怕主存儲(chǔ)和備(從)存儲(chǔ)之間的角色在1分鐘前剛剛發(fā)生了改變,這正是作為“存儲(chǔ)Hypervisor”的Live Volume的核心技術(shù)優(yōu)勢(shì)之一。
虛擬化環(huán)境中,戴爾Compellent SC系列存儲(chǔ)系統(tǒng)基于其應(yīng)用和數(shù)據(jù)流量感知技術(shù),可以感知虛擬機(jī)的在線遷移,在虛擬機(jī)遷移之后,主機(jī)端IO出現(xiàn)變化時(shí),“以最靠近的一套存儲(chǔ)自動(dòng)進(jìn)行動(dòng)態(tài)角色交換”,讓虛擬機(jī)永遠(yuǎn)連接的都是“主存儲(chǔ)系統(tǒng)”。
更進(jìn)一步:兩地三中心和邏輯故障的雙活
說(shuō)到數(shù)據(jù)中心的故障,IDC有一個(gè)大致的統(tǒng)計(jì)數(shù)字,邏輯故障占53%,硬件故障占47%,這也就意味著,大多數(shù)情況下存儲(chǔ)雙活面對(duì)的問(wèn)題,不是系統(tǒng)宕機(jī)或是站點(diǎn)損毀,而是數(shù)據(jù)壓根兒就是錯(cuò)的——這往往是邏輯故障所造成的。
對(duì)于高端存儲(chǔ)應(yīng)用來(lái)說(shuō),傳統(tǒng)的備份技術(shù)已經(jīng)不能滿足實(shí)時(shí)恢復(fù)邏輯故障的需求,因此,CDP技術(shù)應(yīng)運(yùn)而生,成為企業(yè)客戶避免存儲(chǔ)系統(tǒng)邏輯故障的重要解決方案:CDP技術(shù)通過(guò)對(duì)數(shù)據(jù)進(jìn)行大量的、高頻率的“拍照”,讓管理員可以選擇將數(shù)據(jù)恢復(fù)到任意時(shí)間點(diǎn)(往往是分鐘級(jí))。
這就是戴爾Compellent SC存儲(chǔ)的“LV”之所以被稱(chēng)為“存儲(chǔ)內(nèi)嵌雙活+CDP”存儲(chǔ)雙活技術(shù)的原因,通過(guò)在Live Volume中內(nèi)嵌CDP技術(shù),一旦發(fā)生存儲(chǔ)雙活系統(tǒng)的邏輯故障,管理員可以從內(nèi)嵌的CDP“設(shè)備(空間)”將數(shù)據(jù)恢復(fù)到主存儲(chǔ)并快速同步到備(從)存儲(chǔ)——與外置CDP不同,這是在存儲(chǔ)系統(tǒng)內(nèi)部進(jìn)行復(fù)制,傳輸速度、延遲和可恢復(fù)性的水平更高。
基于戴爾Live Volume的兩地三中心解決方案示意圖。
兩地三中心解決方案是存儲(chǔ)雙活解決方案的擴(kuò)展,通過(guò)在遠(yuǎn)程站點(diǎn)增加一套存儲(chǔ)系統(tǒng),極大的提高了地域接近(大部分情況下就是在同一個(gè)數(shù)據(jù)中心)的雙活存儲(chǔ)在應(yīng)對(duì)災(zāi)難災(zāi)害時(shí)的應(yīng)對(duì)能力,Live Volume的兩地三中心方案,可以簡(jiǎn)單的通過(guò)級(jí)聯(lián)(近線DR站點(diǎn)異步復(fù)制連接遠(yuǎn)程DR站點(diǎn))和混合(主站點(diǎn)與近線DR站點(diǎn)同步復(fù)制,與遠(yuǎn)程DR站點(diǎn)異步復(fù)制)兩種模式建立,完全不需要調(diào)整原有的雙活架構(gòu),只需要為主存儲(chǔ)增加一個(gè)遠(yuǎn)程連接的外部站點(diǎn)即可。
這就是以Live Volume為基礎(chǔ)的戴爾Compellent SC系列存儲(chǔ)所構(gòu)建的支持硬件故障和邏輯故障的高可用性存儲(chǔ)雙活和兩地三中心災(zāi)難恢復(fù)功能的組合,作為一款可以感知主機(jī)端IO和虛擬機(jī)位置變化的解決方案,它可以支持動(dòng)態(tài)性能調(diào)整、零停機(jī)存儲(chǔ)維護(hù)、跨數(shù)據(jù)中心數(shù)據(jù)遷移以及虛擬機(jī)(微軟、VMware或是其他Hypervisor)動(dòng)態(tài)遷移等多種對(duì)存儲(chǔ)系統(tǒng)頗有點(diǎn)考驗(yàn)的需求。
原生存儲(chǔ)雙活:架構(gòu)簡(jiǎn)單 功能強(qiáng)大
戴爾Live Volume為企業(yè)客戶實(shí)現(xiàn)存儲(chǔ)雙活及兩地三中心高可用性,提供了一整套完整的解決方案,滿足了企業(yè)客戶在邏輯故障和物理故障兩個(gè)層面對(duì)存儲(chǔ)系統(tǒng)高可用性的需求,但在企業(yè)級(jí)IT市場(chǎng),最終實(shí)現(xiàn)的結(jié)果只占企業(yè)客戶實(shí)際意義的百分之五十,另有百分之五十在意的,是實(shí)現(xiàn)的過(guò)程——是否簡(jiǎn)單?是否風(fēng)險(xiǎn)小?是否具有良好的延續(xù)性?
這正是戴爾Live Volume技術(shù)廣泛受到戴爾Compellent系列存儲(chǔ)用戶歡迎的原因,在全球主流存儲(chǔ)廠商中第一個(gè)將存儲(chǔ)雙活高可用性技術(shù)加入到存儲(chǔ)系統(tǒng)的軟件平臺(tái)中,戴爾必然是經(jīng)過(guò)深思熟慮的(被戴爾公司收購(gòu)以前,Live Volume就是Compellent流動(dòng)數(shù)據(jù)跨越多套存儲(chǔ)構(gòu)建存儲(chǔ)云的核心技術(shù))。
一方面,在前面我們就提到過(guò),作為“存儲(chǔ)內(nèi)嵌雙活+CDP”,戴爾Live Volume既不需要從外部設(shè)備恢復(fù)數(shù)據(jù),也不需要經(jīng)由復(fù)雜的路徑進(jìn)行數(shù)據(jù)復(fù)制和恢復(fù),這意味著更好的效率,更快的傳輸速度和更低的恢復(fù)風(fēng)險(xiǎn)。
另一方面,在一個(gè)經(jīng)典的計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)三層模型中,戴爾Live Volume “原生雙活”的實(shí)現(xiàn)架構(gòu)中避免了增加外置虛擬化網(wǎng)關(guān)或其他IT設(shè)備,避免了對(duì)數(shù)據(jù)中心存儲(chǔ)架構(gòu)的后天改造,更降低了方案的復(fù)雜性——既然存儲(chǔ)系統(tǒng)自帶“原生雙活”,為什么還要去選擇復(fù)雜的非原生方案?
第三,戴爾Live Volume的雙活解決方案具有極高的靈活性和經(jīng)濟(jì)性,在鏈路選擇方面,企業(yè)客戶可以選擇FC或是IP路徑連接,復(fù)用裸光纖iSCSI遠(yuǎn)程復(fù)制這樣的架構(gòu)“容忍度”,可以幫助企業(yè)客戶節(jié)省昂貴的FC直連費(fèi)用;另一方面,無(wú)論是本地站點(diǎn)還是遠(yuǎn)程站點(diǎn),戴爾的方案都支持同步或異步兩種方式,且支持動(dòng)態(tài)調(diào)整,在鏈路狀況不穩(wěn)定(這種事情在中國(guó)非常常見(jiàn))的情況下,企業(yè)客戶可以選擇不同的復(fù)制方式。
第四,也是最重要的,Live Volume不是以“屏蔽”存儲(chǔ)陣列自身的軟件為條件的雙活甚至多活方案,豐富的存儲(chǔ)軟件功能是戴爾存儲(chǔ)在市場(chǎng)上的核心競(jìng)爭(zhēng)力之一,如果為了增加一項(xiàng)功能而放棄整個(gè)“森林”,不僅企業(yè)客戶不會(huì)答應(yīng),對(duì)于將數(shù)據(jù)中心業(yè)務(wù)重點(diǎn)放在存儲(chǔ)上的戴爾公司來(lái)說(shuō),也是一個(gè)絕對(duì)不能夠承受的損失。
試想,如果未來(lái)真的實(shí)現(xiàn)了“控制平面與數(shù)據(jù)平面分離”的軟件定義存儲(chǔ),控制平面具有極強(qiáng)的存儲(chǔ)軟件甚至是多融合平臺(tái)軟件能力(這從當(dāng)前新的企業(yè)級(jí)高端存儲(chǔ)特性就能看出),難道就要如此白白放棄這部分昂貴的價(jià)值么?
做云時(shí)代的存儲(chǔ)雙活
在本文最后的這一部分,我們終于涉及到討論存儲(chǔ)雙活話題時(shí)經(jīng)常會(huì)提到的一個(gè)概念:“(第三站點(diǎn))仲裁”,在部分供應(yīng)商的解決方案中,“(第三站點(diǎn))仲裁”作為一個(gè)判定雙活切換的“裁判”角色,得到了非常重要的位置。
但是,這樣一個(gè)“裁判”真的必不可少,或者是,必須要以一個(gè)站點(diǎn)的形式存在么?
一方面,以中國(guó)企業(yè)客戶的實(shí)際情況來(lái)看,獨(dú)立的第三方仲裁(站點(diǎn))幾乎不可能,在一個(gè)雙活數(shù)據(jù)中心(構(gòu)建存儲(chǔ)雙活)之外,建立獨(dú)立的數(shù)據(jù)中心站點(diǎn)容納仲裁端,絕大多數(shù)企業(yè)都是承受不起的,而如果將“裁判”置于任何一方(站點(diǎn)),在發(fā)生數(shù)據(jù)中心鏈路或其他物理故障時(shí),不過(guò)是徒勞無(wú)用。
另一方面,隨著云計(jì)算技術(shù)的普及,存儲(chǔ)雙活站點(diǎn)判定正常狀態(tài)的“Pulse(心跳)”,完全可以脫離開(kāi)實(shí)際的物理站點(diǎn),進(jìn)入到一個(gè)可靠、可信、具備高速鏈路的云平臺(tái)上——位于云的仲裁站點(diǎn)通過(guò)判斷來(lái)自不同存儲(chǔ)系統(tǒng)的“Pulse”信號(hào)——以更具有經(jīng)濟(jì)性和可靠性的方式,保障存儲(chǔ)雙活站點(diǎn)的高可用性。
軟件定義的甚至是云定義的“(第三方站點(diǎn))仲裁”才是企業(yè)客戶最需要的,傳統(tǒng)的基于物理設(shè)備的存儲(chǔ)雙活判斷方式,是無(wú)法滿足企業(yè)客戶的需要的,它不僅昂貴,而且受限于物理空間的限制,而以存儲(chǔ)系統(tǒng)軟件功能形態(tài)存在的戴爾Live Volume則完全不存在于任何的限制——讓數(shù)據(jù)最終流動(dòng)到云端,正是戴爾存儲(chǔ)業(yè)已成型的流動(dòng)數(shù)據(jù)架構(gòu)的價(jià)值。
另外,除了支持不同型號(hào)Compellent存儲(chǔ)系統(tǒng)的雙活解決方案,還有支持跨越不同的網(wǎng)絡(luò)接口協(xié)議來(lái)實(shí)現(xiàn)的雙活切換,小編先埋個(gè)伏筆,很快就會(huì)有后續(xù)文章詳細(xì)介紹哦!