企業(yè)架構(gòu)高級經(jīng)理Brenden Bryan稱,在政府雇員健康協(xié)會(GEHA)徹底調(diào)整數(shù)據(jù)中心并部署Fabric網(wǎng)絡(luò)架構(gòu)基礎(chǔ)設(shè)施后,程序變得“真的是相當(dāng)簡單”,再也不像許多其它的IT項(xiàng)目那樣復(fù)雜了。“在回顧整個過程并且說‘我希望做出不同的決定’時,我們沒有遇到任何問題或麻煩。”
位于密蘇里州堪薩斯城的GEHA作為全美第二大的健康計(jì)劃與牙齒健康計(jì)劃正在處理著100多萬名聯(lián)邦政府雇員、退休職員和他們的家庭成員的醫(yī)療費(fèi)用報(bào)銷工作。Bryan稱,轉(zhuǎn)向Fabric網(wǎng)絡(luò)架構(gòu)的主要原因是簡化、鞏固和移除遺留的光纖通道SAN環(huán)境。
Bryan在2010年8月份開始為GEHA工作。他稱,當(dāng)時他接手的是一個相當(dāng)?shù)湫偷幕A(chǔ)設(shè)施:由眾多廠商生產(chǎn)并且?guī)в性S多故障的部件拼湊而成。該協(xié)會還希望虛擬化其大型機(jī)環(huán)境,讓其變成一個分布式架構(gòu)。Bryan 稱:“我需要的是一個擁有冗余性和高可獲得性的基礎(chǔ)設(shè)施。”一旦新的基礎(chǔ)設(shè)施就位并穩(wěn)定運(yùn)行,下一步計(jì)劃就是將所有的GEHA Tier 2和Tier 3應(yīng)用轉(zhuǎn)移到這上面,最終將Tier 1報(bào)銷處理系統(tǒng)也轉(zhuǎn)移到這上面。
GEHA部署了由博科生產(chǎn)的以太網(wǎng)交換機(jī)和路由器。目前距這個為期六個月的項(xiàng)目結(jié)束日期已經(jīng)過了一年多時間。他稱,它們提供了一個高速環(huán)境和一個20比1的虛擬機(jī)與刀片服務(wù)器硬件的比例。
Bryan 稱:“我能夠保持最低限度的物理服務(wù)器數(shù)量,盡可有的利用它們。它們讓我能夠提高存儲效率和計(jì)算效率。”
部署數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)需要一些規(guī)劃。ZK Research 的首席分析師Zeus Kerravala稱,這意味著必須要用新的交換機(jī)設(shè)備升級和替代老式的交換機(jī),因?yàn)樵诠饫w通道網(wǎng)絡(luò)中使用了不同的流量配置。“你必須要重新搭建你的網(wǎng)絡(luò),以及重新連接服務(wù)器。”
實(shí)現(xiàn)扁平化
數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)是一個針對橫向信息流優(yōu)化過網(wǎng)絡(luò),相對于傳統(tǒng)網(wǎng)絡(luò)來說,其更為扁平,更為簡單。Kerravala解釋稱,其更多的是針對客戶端/服務(wù)器設(shè)置進(jìn)行設(shè)計(jì)的,為的是實(shí)現(xiàn)服務(wù)器與網(wǎng)絡(luò)核心實(shí)現(xiàn)信息往來。
Fabric網(wǎng)絡(luò)模式中,流量在網(wǎng)絡(luò)和虛擬機(jī)之間橫向流通。“因此其更多的是一種服務(wù)器對服務(wù)器的連接。”fabric網(wǎng)絡(luò)更為扁平,并且不超過兩層。相比之下,遺留的網(wǎng)絡(luò)至少擁有三層或甚至更多的層。Kerravala稱,這些年來,存儲網(wǎng)絡(luò)也采用了這種設(shè)計(jì)方式,如今數(shù)據(jù)網(wǎng)絡(luò)也需要采用這種設(shè)計(jì)方式。
推動向fabric網(wǎng)絡(luò)轉(zhuǎn)型的一個因素是,在財(cái)富2000排行榜上的公司,有半數(shù)的企業(yè)數(shù)據(jù)中心工作負(fù)載被進(jìn)行了虛擬化。當(dāng)實(shí)現(xiàn)了數(shù)據(jù)中心負(fù)載實(shí)現(xiàn)了虛擬化后,他們開始關(guān)注如何讓他們的服務(wù)器與其它的服務(wù)器以及網(wǎng)絡(luò)進(jìn)行通信。
企業(yè)存儲集團(tuán)高級分析師Bob Laliberte 稱:“我們將這視為數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)方面的發(fā)展。推動因素是越來越多的服務(wù)器對服務(wù)器連接。這些不同的服務(wù)器需要彼此對話,與網(wǎng)絡(luò)核心進(jìn)行通信。這些都增加了處理負(fù)載和延時。”
虛擬化增加了復(fù)雜性,因?yàn)檫@意味著動態(tài)移動許多東西,“因此網(wǎng)絡(luò)廠商正在努力簡化這些復(fù)雜環(huán)境。”
當(dāng)數(shù)據(jù)中心無法擴(kuò)展
隨著房屋止贖事件在2006年達(dá)到頂峰,Walz集團(tuán)發(fā)現(xiàn)他們的數(shù)據(jù)中心無法擴(kuò)展以有效應(yīng)對額外的服務(wù)增長需求。該公司負(fù)責(zé)為多個行業(yè)提供文檔管理、履約和合規(guī)服務(wù)。公司的首席信息安全官Bart Falzarano稱:“這妨礙了業(yè)務(wù)的增長。”
Falzarano稱,公司招聘了額外的IT員工以應(yīng)對這些不同的系統(tǒng)和管理措施,建立新的服務(wù)器,擴(kuò)展網(wǎng)絡(luò),增加災(zāi)難恢復(fù)服務(wù)。“但是管理這些技術(shù)問題非常困難,尤其是隨著我們開始嘗試向虛擬環(huán)境轉(zhuǎn)移。”他稱。公司還有許多無法被虛擬化的應(yīng)用,這些必須要被分別管理。“這些系統(tǒng)、存儲和網(wǎng)絡(luò)都有著不同的切入點(diǎn)。我們已經(jīng)變得無法實(shí)現(xiàn)預(yù)期的目標(biāo)了。”
[page]
為了減少復(fù)雜性,Walz集團(tuán)在2009年部署了思科的統(tǒng)一數(shù)據(jù)中心平臺,這是一個統(tǒng)一的數(shù)據(jù)中心Fabric架構(gòu),其將計(jì)算、存儲、網(wǎng)絡(luò)和管理綜合到了一個平臺中,以實(shí)現(xiàn)IT自動化,讓其成為一個跨越物理和虛擬環(huán)境的服務(wù)。目前這一平臺在公司中已經(jīng)與NetApp SAN Storage Flexpod平臺連接在了一起。
Falzarano回憶稱,此前他們使用的是惠普的技術(shù),當(dāng)數(shù)據(jù)庫的一個節(jié)點(diǎn)出現(xiàn)故障,就需要給廠商打電話,最終需要取出四個CPU中的三個,并且需要花上四個小時才能排除故障。直到恢復(fù)正常運(yùn)行,14個小時已經(jīng)過去了。
“現(xiàn)在,對于同樣的故障,如果我們發(fā)現(xiàn)了出問題的刀片服務(wù)器節(jié)點(diǎn),我們在4分鐘內(nèi)就可以斷開這一SQL應(yīng)用并重新連接SQL應(yīng)用。在虛擬管理層也可以這樣做。”他稱。
IT一直在追蹤數(shù)據(jù)中心性能,記錄一些關(guān)鍵的指標(biāo)。Falzarano稱,他們發(fā)現(xiàn)密集度變成了8比1,這意味著更少的纜線復(fù)雜度和更低的纜線需求量。老技術(shù)的虛擬化效率為4比1,新技術(shù)具有更高的效率,達(dá)到了15比1。團(tuán)隊(duì)能夠虛擬化以前他們所無法虛擬化的應(yīng)用。
其它的優(yōu)勢還包括機(jī)架減少了50%,系統(tǒng)管理更為集中化——目前一個IT工程師可以管理50個系統(tǒng)。。
“在使用老技術(shù)時,我們遇到了大量的硬件故障問題。在我們的多數(shù)據(jù)中心中,每隔30天就會出現(xiàn)一個故障。現(xiàn)在一年都可能不會出現(xiàn)一個故障。”他稱。
容易部署
與Walz集團(tuán)的IT執(zhí)行官一樣,GEHA 的IT團(tuán)隊(duì)領(lǐng)導(dǎo)人認(rèn)為部署fabric網(wǎng)絡(luò)模式不僅能夠滿足業(yè)務(wù)需求,還降低了復(fù)雜性、成本和管理數(shù)據(jù)中心所需要的人員數(shù)量。Bryan稱協(xié)會還獲得了規(guī)模效益,兩個人即可管理所有的以太網(wǎng)環(huán)境,這與以往需要熟悉fabric的額外人員截然不同。
“在我們的團(tuán)隊(duì)中,沒有任何一個人是光纖通道的專家。讓報(bào)銷程序系統(tǒng)具有冗余性與高可獲得性的唯一辦法是依靠以太網(wǎng)fabric網(wǎng)絡(luò)架構(gòu)技術(shù)。我們的員工熟悉這種技術(shù)。”他稱。
Bryan稱,自從無需購買任何光纖通道交換機(jī),協(xié)會能夠省下了近50多萬美元的資金預(yù)算,由于不需要人員管理光纖通道,協(xié)會運(yùn)營開銷減少了約25萬美元。“自從改用fabric網(wǎng)絡(luò)架構(gòu),我們能夠取消成堆的設(shè)備。” Bryan稱。
GEHA使用了一個本地托管服務(wù)提供商以幫助安裝架構(gòu)中一些更為復(fù)雜的部分。“但是從我們打開設(shè)備包裝箱到整個環(huán)境運(yùn)行起來,只需要兩天的時間。過程非常簡單。” Bryan稱。
他補(bǔ)充道,新架構(gòu)的性能讓人感到十分震驚。他們做了一個測試,通過網(wǎng)絡(luò)將一個4G的ISO文件從一個刀片服務(wù)器拷貝到另一個刀片服務(wù)器上。在網(wǎng)絡(luò)和存儲都通過相同的光纖通道網(wǎng)絡(luò)架構(gòu)的情況下,耗時低于1秒鐘。他稱:“我們沒有看到遷移,我不認(rèn)為它們被真正拷貝了。”
IT正在使用這一架構(gòu)通過CommVault的軟件備份他們的環(huán)境。Bryan,協(xié)會正在關(guān)注網(wǎng)絡(luò)吞吐量能在1小時內(nèi)達(dá)到1太字節(jié)這一性能。“與以前的架構(gòu)相比,吞吐量提升了8至10倍。”
今天,GEHA所有的產(chǎn)品流量正在fabric網(wǎng)絡(luò)架構(gòu)上。Bryan稱,他對這一基礎(chǔ)設(shè)施已經(jīng)非常滿意了。他稱,基礎(chǔ)設(shè)施的擴(kuò)展已經(jīng)不再是一個問題,通過聚合架構(gòu)與速度,已經(jīng)成為了一大重要優(yōu)勢。GEHA也能夠在單一刀片服務(wù)器上運(yùn)行繁重的虛擬機(jī)工作負(fù)載,他稱。“不用在大量的刀片服務(wù)器上花大量的資金,取而代之的是你無需犧牲性能就能夠增加這些刀片服務(wù)器的投資回報(bào)率。”Bryan稱。
Laliberte稱,他觀察了數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)的未來,發(fā)現(xiàn)這類架構(gòu)僅僅剛剛起步。如果你考慮的是復(fù)雜性和規(guī)模,并且在你的環(huán)境中擁有數(shù)千臺服務(wù)器和交換機(jī),那么任何類型的架構(gòu)調(diào)整都耗時耗力。
僅僅是花時間對三層架構(gòu)進(jìn)行改良,就需要花上三個階段。“這些情況已經(jīng)變成了現(xiàn)實(shí)并得到了宣傳,但是要被大規(guī)模部署還需要幾年時間。”
[page]
案例研究:正在使用中的Fabric網(wǎng)絡(luò)架構(gòu)
Dan Shipley以往巡視數(shù)據(jù)中心時,他所看到的全部是一堆雜亂無章的線纜和交換機(jī)。它們管理起來即費(fèi)錢又容易出錯。Shipley為一家名為供應(yīng)網(wǎng)絡(luò)公司的架構(gòu)師。該公司總部位于圣路易斯市,是一家總資產(chǎn)達(dá)6億美元的辦公用品批發(fā)商。Shipley稱,公司遇到的所有典型問題都與傳統(tǒng)的基礎(chǔ)設(shè)施有關(guān):300臺服務(wù)器消耗掉了大量的電力,占用了大量的空間,在硬件維護(hù)時必須要停止運(yùn)行。
“我們主要使用的是惠普的產(chǎn)品。我們從惠普那里訂購了這些服務(wù)器。由于這些服務(wù)器的研發(fā)時代都不盡相同,因此如果一臺服務(wù)器的主要出現(xiàn)了故障,那么我們的員工就要為此忙上一晚上,這非常痛苦。所以我們說,‘看啊,我們終于擺脫了這種痛苦。’虛擬化已經(jīng)成為了主流,我們需要從這個傳統(tǒng)游戲中跳出來。”
目前,供應(yīng)網(wǎng)絡(luò)在他們的數(shù)據(jù)中心中所創(chuàng)建的東西與傳統(tǒng)方式有著很大的不同。公司沒有部署以太網(wǎng)和架構(gòu)交換機(jī),而是選擇了Xsigo的I/O Director,其位于服務(wù)器機(jī)架頂層,負(fù)責(zé)定向流量。機(jī)架上的所有服務(wù)器都被插入到一個盒子里,這個盒子能夠動態(tài)地建立與其它所有數(shù)據(jù)中心資源的連接。與其它的數(shù)據(jù)中心架構(gòu)不同,I/O Director提供了InfiniBand架構(gòu)。InfiniBand為一種基于開源標(biāo)準(zhǔn),用于高速通信的交換式光纖通信鏈路。
Shipley稱:“在你的所有服務(wù)器上,你可以去除所有的線纜、以太網(wǎng)和架構(gòu)交換機(jī),將其與一個InfiniBand線纜連接,出于冗余考慮你可以連接兩個,這就是我們所做的工作。”這些線纜將被插入I/O Director中。“我希望將所有的這些都連接至一個外部光纖通道存儲,創(chuàng)建一個虛擬化fabric存儲網(wǎng)絡(luò)。實(shí)際上,這些都通過InfiniBand架構(gòu)運(yùn)行,而服務(wù)器……我認(rèn)為它們?nèi)匀辉谕ㄟ^fabric進(jìn)行連接。”
這一配置意味著他們現(xiàn)在僅僅使用兩條線纜,而不是多條線纜,同時擁有大量的帶寬。
供應(yīng)網(wǎng)絡(luò)公司實(shí)現(xiàn)了徹底的虛擬化,他們的數(shù)據(jù)中心數(shù)量由大約20個架構(gòu)縮減到了4個。電力消耗和冷卻能耗也得到了降低。
Shipley稱,InfiniBand已經(jīng)在超級計(jì)算機(jī)領(lǐng)域被應(yīng)用了十年時間,其具有低成本和開放性。然而相反的是,其它的廠商都在對以太網(wǎng)進(jìn)行投資,因?yàn)樗麄儾幌M吹絀nfiniBand勝出。目前I/O Director傳輸速度為每秒56G,而最快的以太網(wǎng)連接也不過每秒10G。
在成本方面,Shipley稱一個端口的10G以太網(wǎng)網(wǎng)卡的價(jià)格約為600美元,同時在另一端還需要一個以太網(wǎng)交換機(jī)端口,其成本為每個端口大約為1000美元。“因此對于每一個以太網(wǎng)連接來說,你需要1600美元。”一個40G單個端口InfiniBand適配器價(jià)格大約為450至500美元。他稱,36端口的InfiniBand交換機(jī)為6000美元,平均下來每個端口的價(jià)格為167美元。
Shipley稱,公司已經(jīng)取消了所有的核心以太網(wǎng)交換機(jī),以支持InfiniBand技術(shù)。
他承認(rèn):“我首先擔(dān)心的是……怕我自己不了解InfiniBand。”當(dāng)時大多數(shù)企業(yè)架構(gòu)為fabric和以太網(wǎng)。他稱:“我們帶來了I/O Director,并且與思科的統(tǒng)一數(shù)據(jù)中心進(jìn)行了對比。前者不僅成本低,速度快,而且簡單易用。同時Xsigo的支持也非常的不錯。”
Shipley稱,此前的大型數(shù)據(jù)中心工作需要花上12個小時。自從部署了I/O Director,同樣的工作所需要時間不超過3個小時。現(xiàn)在將虛擬機(jī)從一個托管主機(jī)遷移至另一個上只需要幾秒鐘時間,而以往要花上數(shù)分鐘才行。
他稱,他最初擔(dān)憂的是,由于Xsigo是一家規(guī)模較小的廠商,擔(dān)心它們用不了多長時間就會倒閉。但是,他們發(fā)現(xiàn)連VMware都是Xsigo的客戶。
企業(yè)戰(zhàn)略集團(tuán)高級分析師Bob Laliberte 稱:“Xsigo宣稱,你還可以使用他們的產(chǎn)品替代使用以太網(wǎng)和fabric,并創(chuàng)建一個fabric網(wǎng)絡(luò)架構(gòu)。他們的說法是對的。當(dāng)你談?wù)摂?shù)據(jù)中心網(wǎng)絡(luò)和數(shù)據(jù)中心架構(gòu)時,Xsigo正在幫助創(chuàng)建一個兩層的架構(gòu)。不過,瞻博、思科和博科正在嘗試創(chuàng)建更為扁平的網(wǎng)絡(luò)架構(gòu)。”
Laliberte 稱,InfiniBand是一個優(yōu)秀的協(xié)議,但是這一協(xié)議未必會被大規(guī)模使用。“它們目前主要還是應(yīng)用在需要進(jìn)行極快計(jì)算的超級計(jì)算領(lǐng)域。”