2017 CCS企業(yè)云計算高峰論壇(ccs.d1net.com)于4月26日在北京新世紀(jì)日航飯店盛大舉行,這是國內(nèi)面向政企客戶的最重要的一個云計算會展。CCS企業(yè)云計算高峰論壇的主題為云計算的生態(tài)鏈。
以下是現(xiàn)場速遞。
書生云 首席體系結(jié)構(gòu)技術(shù)官 夏御杰
主持人:接下來的發(fā)言來自書生云,發(fā)言的領(lǐng)域是超融合,超融合是一個新興的領(lǐng)域,在大家都還在了解和熟悉超融合的時候,我想大家可能都被前兩周這個領(lǐng)域迄今最大的一個價值十億元的單子給震到了。什么樣的公司拿到了這個單?
接下來,書生云首席體系結(jié)構(gòu)技術(shù)官夏御杰將為我們帶來:用超融合技術(shù)打造EB級云平臺,大家掌聲歡迎!
夏御杰:各位好! 我是書生云的首席技術(shù)官,今天要分享的是我們最近在運行的一個項目,就是為浙江紹興鳳凰創(chuàng)新園打造一個1EB的數(shù)據(jù)中心,這個數(shù)據(jù)中心有什么特別之處,接下來跟各位分享。
首先,1EB是一個什么概念? 整體來看1EB的數(shù)據(jù)中心,它實際上可以同時容納200萬個虛擬機(jī)或者是容器的計算運作能力。而存儲容量上若以較常見的家庭的存儲容量需求,它可以存儲3000萬個家庭的數(shù)據(jù)存儲。同時每秒也可以執(zhí)行數(shù)千萬的交易服務(wù)。在系統(tǒng)與數(shù)據(jù)的可靠性方面,它能夠保證這個系統(tǒng)全年不間斷的運行,24小時的提供服務(wù),而不會因為系統(tǒng)故障,無法服務(wù)客戶的情況。
我們在建構(gòu)1EB云的數(shù)據(jù)中心時,發(fā)現(xiàn)投入是非常巨大的,一般投入從十億開始,甚至到數(shù)十億的投入。所以,我們會發(fā)現(xiàn)建構(gòu)一個1EB的云,除了相關(guān)的技術(shù)很重要,以及建構(gòu)的架構(gòu)很重要以外,建構(gòu)成本與運維成本更是重要。
談到云數(shù)據(jù)中心的成本,我們來看成本包含哪幾個部分?
第一,時間成本,建構(gòu)1EB云數(shù)據(jù)中心需要耗費很多的時間,很多的人力。我們有沒有什么方法能夠簡化建構(gòu)過程,讓建構(gòu)云能更容易,讓建構(gòu)云能更快速。
第二,設(shè)備與系統(tǒng)的成本。我們在建構(gòu)云數(shù)據(jù)中心的時候,若我們在架構(gòu)上、設(shè)計上、硬件上選擇使用很多企業(yè)級高端設(shè)備,也就是單點高可靠性的設(shè)備,這些高可靠性的設(shè)備雖然云數(shù)據(jù)中心建構(gòu)的需求,但是設(shè)備的成本非常高,所以直接造成云的建構(gòu)與運維成本嚴(yán)重提高。然而在云的建設(shè)與運維過程中,成本掌控是很重要的,這直接關(guān)系到客戶的云成本。還有另一個常乎略的成本是我們采用企業(yè)級的設(shè)備,用的也是企業(yè)級的系統(tǒng),所以在云的運營上面需要很多熟悉企業(yè)級設(shè)備與系統(tǒng)的專業(yè)人員 , 須要付出高昂服務(wù)費與培訓(xùn)費的專業(yè)人員 , 也直接增加了運維上的高成本。所以,從成本整體看來,中國如果在運維云方面存在這樣一個成本問題,怎么跟國外像亞馬遜這樣大型的云數(shù)據(jù)公司在中國和全球市場競爭,我們面臨的挑戰(zhàn)是很大的。
我們書生云在建立整個1EB云的數(shù)據(jù)中心上面有我們自己的方法。我們的方法簡單來說就是減法。也就是把整個數(shù)據(jù)云的架構(gòu)與設(shè)計層級盡可能的簡化,這個簡化除了是技術(shù)上的簡化,也是運維上的簡化,同時也是成本上的簡化。
簡化的技術(shù)上有什么樣的特點。
首先,我們在簡化的架構(gòu)上,我們其實采取了分布式的架構(gòu)。分布式的架構(gòu)跟一般的分布式也有不同之處。第二部分,我們采取超融合的設(shè)計,把建構(gòu)云所需要的建全機(jī)制以機(jī)柜的方式來提供,并開機(jī)即用,并集群成云服務(wù)。這樣的方式能夠很快速的建立一個完整的云服務(wù)。第三,我們體會到客戶的使用方便性,所以我們在整個數(shù)據(jù)中心建構(gòu)管理方面采用超融合用戶管理中心,這個管理中心只需要一般的運維人員就可以維運,不用特別找熟悉數(shù)據(jù)庫的,或者是網(wǎng)絡(luò)的專家,配合很多培訓(xùn)與認(rèn)證才能開始運維,我們只需要懂IT的人就可以運維整個云數(shù)據(jù)中心。
在架構(gòu)上面,我們跟傳統(tǒng)的數(shù)據(jù)中心有什么不同呢? 剛剛提到我們是一個超融合、分布式的數(shù)據(jù)中心架構(gòu)。所以,它跟傳統(tǒng)的數(shù)據(jù)中心一央樣是個高可靠性的數(shù)據(jù)中心,甚至可以提供更高的可靠性。主因是用分布式的架構(gòu)去做,在分布式的這樣的基礎(chǔ)上,我們也做了很多的優(yōu)化,在架構(gòu)上我們也做了很多的改變與簡化。
所以,過去我們依靠傳統(tǒng)要靠商業(yè)的服務(wù)器,雙控的架構(gòu),或者是垂直擴(kuò)展集群的服務(wù)器來提高可靠度。我們現(xiàn)在是用所謂的分布式架構(gòu),設(shè)備故障完全不影響其可用與可靠性,并且基于共享存儲架構(gòu)的方式也能夠達(dá)到傳統(tǒng)企業(yè)級高端服務(wù)器可靠性。甚至超越,在經(jīng)過驗證的測試發(fā)現(xiàn)它的可靠性是傳統(tǒng)企業(yè)級服務(wù)器的1000倍,而實際只增加20%的成本,比傳統(tǒng)的企業(yè)級架構(gòu)有很多成本優(yōu)勢。
談到超融合,為什么我們建構(gòu)1EB的云數(shù)據(jù)中心需要用超融合?首先,考慮到超融合的方便性,超融合的方便性能夠快速建構(gòu)云數(shù)據(jù)中心。過去在建構(gòu)數(shù)據(jù)中心的經(jīng)驗中,從部署服務(wù)器與存儲,還有網(wǎng)絡(luò)的建構(gòu),到整個系統(tǒng)的調(diào)試,以及各方面參數(shù)的調(diào)整與測式,包括應(yīng)用和虛擬化各方面的整合,并建立集群進(jìn)行服務(wù)。這個建構(gòu)的過程,我們最快也需要6個月以上。正常的情況是需要一年的時間,甚至一年以上的時間來建構(gòu)。
使用超融合建構(gòu) , 能省去傳統(tǒng)在布署、調(diào)適、優(yōu)化的時間,將建構(gòu)時間縮短為3個月內(nèi),大大減少了建構(gòu)云的時間成本。
第二,在建構(gòu)1EB云數(shù)據(jù)中心的傳統(tǒng)方式,我們會用很多不同廠商的設(shè)備,每個廠商的設(shè)備里面都有不同的應(yīng)用,接口與管理方式,我們要如何整合這些廠商的產(chǎn)品,廠商的應(yīng)用,因為每個廠商的方式都不一樣。所以,在超融合的云管理設(shè)計上我們采取的方式是支持開源,同時可以用軟件去定義設(shè)備。定義什么呢?第一,定義計算池,定義虛擬化的應(yīng)用。第二,定義網(wǎng)絡(luò)的應(yīng)用。第三,定義存儲池與相關(guān)的應(yīng)用。也就是我們通過一個超融合技術(shù)與管理中心系統(tǒng),已經(jīng)把網(wǎng)絡(luò)、計算、存儲融合在一起,甚至系統(tǒng)布署上能夠在線實時的部署,這樣可以不受到硬件廠商,或者國外硬件廠商的技術(shù)或標(biāo)準(zhǔn)限制,我們能夠自己定義我們網(wǎng)絡(luò)管理,或定義存儲,計算這方面故障遷移,故障處理的方式,這都是我們透過軟件來定義與管理來提供云數(shù)據(jù)中心的服務(wù)與應(yīng)用。
所以,為了不讓我們在建構(gòu)云的時候我們受到這些生態(tài)鏈,或是供應(yīng)商,廠商技術(shù)與標(biāo)準(zhǔn)方面的捆綁和限制,我們在超融合的管理技術(shù)方案還有系統(tǒng)技術(shù)方案采取開源方式,這也是國內(nèi)少數(shù)幾家愿意把技術(shù)源代碼,架構(gòu)開源出來的廠商。這樣的理念主要是讓客戶在使用我們的系統(tǒng),技術(shù)人員也能夠完全掌握與處理運維需求,也能夠在上面進(jìn)行二次開發(fā)與應(yīng)用開發(fā)來符合運維需求,同時在技術(shù)支持上也是開放性的。我們的客戶有自己的運維與開發(fā)團(tuán)隊,他們可以利用我們開源的技術(shù)與方式來滿足運維上的需求。
第三,我們的超融合是基于商業(yè)化的架構(gòu)設(shè)計,并不是完全依賴開源的架構(gòu)去做的,而是把我們商業(yè)化超融合產(chǎn)品的設(shè)計與代碼進(jìn)行開源,所以這是一個反向運作。前一場演講中京東云提到,國內(nèi)有很多云廠商的產(chǎn)品與技術(shù)同質(zhì)性很高,主要的原因是因為云廠商以開源為主來建構(gòu)他們的云產(chǎn)品與云服務(wù),所以技術(shù)與產(chǎn)品會大同小異。我們的做法不一樣,我們是以商業(yè)化設(shè)計與開發(fā)為主,然后開源給開源的社區(qū)使用,這是我們在產(chǎn)品與技術(shù)上提供給開源的理念。
第四,用戶體驗是一個很重要的環(huán)節(jié),建構(gòu)一個超大型的數(shù)據(jù)中心如何去管理,如何讓它能夠持續(xù)的運維,其實很重要。我們做了一個事情,就是我們在超融合的系統(tǒng)管理上做了很人性化,一個高用戶體驗的管理中心,這個管理中心的系統(tǒng)也是開源,讓用戶能夠在這樣的基礎(chǔ)上能夠開發(fā)自己的界面。我們也提供能管理運維的界面,這個界面讓用戶很容易,可以用觸控的方式來管理,我們每臺機(jī)柜上面有一個觸控面板,可以很快速的檢查設(shè)備與服務(wù)狀態(tài),或是透過一臺筆電登入管理中心,不需要另外購買昂貴的專業(yè)設(shè)備或軟件就可以控管數(shù)已千計,數(shù)以萬計的服務(wù)器計算節(jié)點、存儲跟網(wǎng)絡(luò)。
第五,超融合產(chǎn)品有一個特性,就是它在硬件方面使用的是標(biāo)準(zhǔn)硬件,這樣做的目的是希望在建構(gòu)超融合體柜的過程中能讓客戶參與并可以自己選擇所要的配置,而不會因為硬件的捆綁造成客戶的選擇變得很受限制。所以我們采用了標(biāo)準(zhǔn)的硬件服務(wù)器、存儲設(shè)備與網(wǎng)絡(luò)設(shè)備等等來建構(gòu)超融合數(shù)據(jù)云。
如何發(fā)揮硬件的性能?其實是我們一直在努力的方向。我們從軟件的架構(gòu)來看,系統(tǒng)軟件在硬件上面運作架構(gòu)與性能,硬件從過去的十年來,我們看到機(jī)械磁盤,到現(xiàn)在的固態(tài)硬盤,從CPU計算能力、內(nèi)存容量與性能,到現(xiàn)在已經(jīng)將近有100倍的成長。可是在軟件方面,如果我們?nèi)匀灰蕾囬_源的架構(gòu),就會發(fā)現(xiàn)軟件架構(gòu)與設(shè)計并沒有很大的進(jìn)步,因此我們采用商業(yè)化的做法,在軟件上進(jìn)行了重構(gòu),這個重構(gòu)的概念就是我們?nèi)绻越煌▉砜矗浖泻芏鄥f(xié)議,有很多溝通的機(jī)制,甚至為了容災(zāi),為了監(jiān)控,為了管理做了非常多的控制。這個控制就很像一個主要的道路上我們設(shè)了很多紅綠燈跟柵欄,并設(shè)置管理人員,指揮交通。可是我們知道尤其在北京這樣的交通環(huán)境里面,越控制越堵車,管理愈嚴(yán)密性能越低。
所以,軟件設(shè)計與架構(gòu)也是這樣的情況,我們在看到開源社區(qū)里面,軟件設(shè)計與框架,有些為了能夠全面的控管這些服務(wù)做了很多很多控制的機(jī)制。我們的做法是反其道而行,我們打通軟件與硬件的整合,比如利用RDMA,PCIe,又例如虛擬內(nèi)存之間數(shù)據(jù)交換與控制,減少高速的IO間的復(fù)雜協(xié)議,我們通過這樣的機(jī)制,我們在每個應(yīng)用,每個系統(tǒng),包括網(wǎng)絡(luò),計算,存儲,我們都建構(gòu)了所謂的高速公路。這樣的高速公路是用軟件的方式去建構(gòu)的。也就是當(dāng)我們進(jìn)行服務(wù)運作的時候,我們其實排除掉很多中間所謂傳統(tǒng)方式管理的環(huán)節(jié),而用更先進(jìn)的技術(shù)來進(jìn)行這方面的管理。所以,它在監(jiān)控、調(diào)試、調(diào)度、遷移的時候,它對于性能的影響是微乎其微的。這就是我們在超融合方面做了很多技術(shù)上的加強(qiáng)跟技術(shù)上的突破。
講到分布式架構(gòu),我想最有名的就是Google。Google在分布式架構(gòu),它建構(gòu)了一個很完善的分布式機(jī)制。我們用的是更先進(jìn)的超融合方式,它是將一個機(jī)柜作為一個數(shù)據(jù)中心重要的節(jié)點,所以每個機(jī)柜之間都是以分布式架構(gòu)與集群去服務(wù),我們做了很多的努力來加速與簡化各節(jié)點之間的運行和數(shù)據(jù)交換方式,使整體運作性能能夠更順暢。
在整個超融合里面,計算節(jié)點,包括網(wǎng)絡(luò)與存儲之間我們怎么去做這方面的簡化跟架構(gòu)上的改變呢?首先,在超融合的服務(wù)器上,存儲跟計算節(jié)點融合外,我們采用SAS3為存儲交換網(wǎng)絡(luò),這跟傳統(tǒng)的分布式不太一樣,傳統(tǒng)的分布式它的架構(gòu)是每個節(jié)點都會有自帶的硬盤,或者是所謂的固態(tài)盤,也就是數(shù)據(jù),在這個節(jié)點上,數(shù)據(jù)跟其它節(jié)點之間是獨立的。如果是節(jié)點之間要做訊息的互換,或者訊息的交換,就要去走傳統(tǒng)的TCP/IP這樣的網(wǎng)絡(luò),或者走IB的這樣一個網(wǎng)絡(luò)架構(gòu)。
我們的做法是直接透過SAS3存儲交換網(wǎng)絡(luò)設(shè)計共享存儲架構(gòu),這樣的好處是SAS比對于TCP/IP是一個非常低延時、高帶寬的方式。同時,SAS性能增長速度也是以倍數(shù)的性能在增長,我們過去從SAS 2.0 6G到現(xiàn)在的SAS3.0 12G,在短時間內(nèi)已經(jīng)在性能上翻了一倍,并且在成本與性價比上要比萬兆網(wǎng)絡(luò)或IB網(wǎng)絡(luò)更有優(yōu)勢。
同時,我們在存儲網(wǎng)絡(luò)基礎(chǔ)上,又跟傳統(tǒng)分布式存儲采取不一樣的技術(shù)與方式,傳統(tǒng)分布式存儲與計算因為透過網(wǎng)絡(luò)交換,它的數(shù)據(jù)獨立在各個節(jié)點上,所以在數(shù)據(jù)交換的過程中是采取副本的方式來保護(hù)數(shù)據(jù),我們知道副本的方式保護(hù)數(shù)據(jù),多一個副本對磁盤陣列空間來說存儲空間就直接減一半。網(wǎng)路性能也因此增加一倍的負(fù)荷,如果我們用傳統(tǒng)的分布式技術(shù)要提供高可靠數(shù)據(jù)保護(hù)方式,要達(dá)到5個9,甚至11個9這樣的一個數(shù)據(jù)可靠性的要求,我們最少就要用三個副本。也就是說,整個數(shù)據(jù)中心的存儲能力,因為我們運用了三個副本,總數(shù)據(jù)容量就直接變?yōu)樵瓉淼?/3。
然而用我們超融合的架構(gòu)去做,我們不再采取用副本的方式來保護(hù)數(shù)據(jù),而我們是采取另外一種更好的方式來保護(hù)數(shù)據(jù)。這樣的保護(hù)數(shù)據(jù)的方式,我們也可以提供高可用、高可靠11個9的要求,并且只使用了總?cè)萘康?5%的冗余空間。這個冗余空間所帶來的直接效果是匹配于三個副本這樣的一個數(shù)據(jù)保護(hù)與可靠性的機(jī)制。這也是超融合存儲架構(gòu)上我們做的創(chuàng)新。
這個創(chuàng)新還有一個特點,就是因它在磁盤的整體數(shù)量上比傳統(tǒng)的架構(gòu)要減少了將近2倍,甚至3倍,所以它在總體的設(shè)備成本上,與數(shù)據(jù)中心的節(jié)能上是很有優(yōu)勢的。因為各位都知道,硬盤成本在數(shù)據(jù)中心里面占比是很高的,同時也是最容易故障的設(shè)備,跟CPU與內(nèi)存比較起來,硬盤相對來說是脆弱的。所以,我們在這方面透過先進(jìn)的機(jī)制架構(gòu),能夠更節(jié)省磁盤的使用,同時也降低了整個數(shù)據(jù)中心的成本與節(jié)能。
關(guān)于我們采取SAS存儲網(wǎng)絡(luò)的架構(gòu),同時也能夠提高整體的運作性能。這邊我們做了一個比較,就是傳統(tǒng)分布式的網(wǎng)絡(luò)的方式,也就是友商常用的架構(gòu),它透過網(wǎng)絡(luò)讓存儲跟計算節(jié)點之間透過TCP/IP的方式交換數(shù)據(jù),和我們透過SAS3的方式,在性能上會有很大的不同。
為了做到分布式的運作,我們SAS存儲與計算節(jié)點之間,每個計算節(jié)點對接SAS盤陣都是全局性的,這個全局性的SAS對接能夠保證每個超融合節(jié)點即使其中有幾個節(jié)點在故障情況下,其它正常運行的超融合節(jié)點能夠快速的接手故障節(jié)點的運作。因為每個節(jié)點都是能夠接手控制或管理存儲數(shù)據(jù)的。所以在整個路徑上會非常快速,因為SAS協(xié)議沒有那么多復(fù)雜的監(jiān)管控制要求,在協(xié)議方面的運作路徑非常短,所以讀寫速度非常快。如果是透過傳統(tǒng)的TCP/IP網(wǎng)絡(luò)運作,每次交換就需要多次CPU的介入與處理,這樣就會會影響運作性能,所以采用我們超融合的架構(gòu)與傳統(tǒng)分布架構(gòu)就有實質(zhì)性的差異。
所以,在我們超融合一體機(jī)的優(yōu)勢上面,整理了三個優(yōu)勢。第一個優(yōu)勢,我們雖然采取了分布式系統(tǒng),并且我們分布式系統(tǒng)內(nèi)部是利用軟件架構(gòu)減法技術(shù)與高速通道進(jìn)行節(jié)點之間數(shù)據(jù)交換。第二個優(yōu)勢,基于SAS存儲網(wǎng)絡(luò),將共享存儲架構(gòu)做高效的直接讀寫,也能夠提供相當(dāng)高的數(shù)據(jù)交換性能。第三個優(yōu)勢,這時各位就會想到數(shù)據(jù)安全性與可靠性怎么保證? 上場演講友商提到,對于數(shù)據(jù)中心來說安全性是很重要的,數(shù)據(jù)可靠性也是很高的要求,所以我們自主研發(fā)技術(shù)來提供高可靠、高安全的機(jī)制,包括存儲數(shù)據(jù)遷移與虛擬機(jī)的遷移,以及網(wǎng)絡(luò)故障的轉(zhuǎn)移,還有整個集群的遷移,我們都透過自主研發(fā)的機(jī)制,并商業(yè)化的產(chǎn)品設(shè)計整合,來進(jìn)行云數(shù)據(jù)中心整體的管理。
所以,我們超融合一體機(jī)的架構(gòu) 可以總結(jié)五個特點。第一,它和企業(yè)級高端系統(tǒng)與設(shè)備一樣高可用,但成本更低。第二,它很容易使用,不依賴專家的支持便可運維。第三,可以節(jié)能。因為整個架構(gòu)上已經(jīng)進(jìn)行了優(yōu)化跟簡化。第四,數(shù)據(jù)可靠性可以達(dá)到11個9。第五,在技術(shù)上面做了很多突破,所以它的IOPS可以輕松的達(dá)到百萬的性能。
提到用超融合來去運作1EB數(shù)據(jù)中心,我們測算過,在設(shè)備成本,運維成本,電力的節(jié)省,溫控成本,還有整個部署的時間成本等等,實際的結(jié)果是節(jié)省50%,跟傳統(tǒng)的數(shù)據(jù)中心比較起來節(jié)省一半。所以,總體成本一個1EB數(shù)據(jù)中心運維的非常重要一點,用較低的成本達(dá)到比較高的性能,同時也確保運維的可用性,還有數(shù)據(jù)的可靠性。
簡單介紹一下我們公司。我們公司有20多年的歷史,過去在數(shù)據(jù)的保護(hù),文件的保護(hù),還有超融合數(shù)據(jù)云的建設(shè),都有多年的經(jīng)驗。早在幾年前我們就已經(jīng)開始進(jìn)行超融合一體機(jī)的這樣一個建構(gòu)與開發(fā)。
因為我們超融合技術(shù)投入與產(chǎn)品的因素,我們很榮幸的能夠得到鳳凰大數(shù)據(jù)中心的青睞,我們很榮幸于今年4月份簽下一個十億的數(shù)據(jù)中心訂單,讓我們在浙江紹興能夠建構(gòu)一個1EB存儲跟計算能力的數(shù)據(jù)中心。
最后說明超融合數(shù)據(jù)中心的建設(shè)架構(gòu)上,我們采取了以每個機(jī)柜為一個重要的節(jié)點,然后形成一個集群,這個集群是可以擴(kuò)充的,并且可以夠擴(kuò)充成所謂的超大型數(shù)據(jù)中心。為什么我們可以這么容易的擴(kuò)充呢?是因為我們是用超融合的結(jié)構(gòu),把計算,網(wǎng)絡(luò),存儲都用軟件定義。同時,我們把整個集群的功能已經(jīng)融合在我們的產(chǎn)品里面。并在公有云,或者私有云的運作機(jī)制上,也把相關(guān)的功能與管理營運融入,還有系統(tǒng)控制管理跟用戶的界面也都整合到超融合的產(chǎn)品里面。
所以,當(dāng)客戶需要擴(kuò)建,需要增建整個數(shù)據(jù)中心的運作與設(shè)備時,只需要以機(jī)柜的方式購買就可以很快的加入現(xiàn)有的數(shù)據(jù)中心運作。透過我們的安全跟遷移的機(jī)制,能夠很快的讓客戶的系統(tǒng)進(jìn)行快速的遷移并達(dá)成負(fù)載均衡。所以,這就是我們建設(shè)超大型數(shù)據(jù)中心所用到的超融合架構(gòu),這種架構(gòu)能夠快速的建構(gòu)云數(shù)據(jù)中心,所以無論企業(yè)需要建立私有云,或者是大型機(jī)構(gòu)需要建立公有云,都能夠以很快的方式建立起來,不再是過去傳統(tǒng)需要6個月,或者是一年以上的時間,我們可能只需要三個月的時間,甚至更短的時間就能夠建立數(shù)據(jù)中心。
這是書生云的最終目標(biāo),讓天下沒有難建的云,今天我就介紹到這里,謝謝各位!