位于英國(guó)劍橋的歐洲生物信息研究所(以下簡(jiǎn)稱EBI)為全球科研人員提供免費(fèi)的生物信息,讓他們可以隨時(shí)訪問(wèn)并將其用于科研工作。這家非盈利機(jī)構(gòu)所存儲(chǔ)的生物學(xué)數(shù)據(jù)竟然達(dá)到了將近50 PB的規(guī)模,并分布在三個(gè)數(shù)據(jù)中心當(dāng)中。無(wú)論是高校還是商業(yè)機(jī)構(gòu),都可以訪問(wèn)這些數(shù)據(jù),用來(lái)進(jìn)行研究、應(yīng)用開(kāi)發(fā)或者培訓(xùn)。
根據(jù)EBI推算,他們每個(gè)月都要應(yīng)對(duì)超過(guò)1200萬(wàn)個(gè)數(shù)據(jù)請(qǐng)求。
用戶可以將數(shù)據(jù)下載到本地然后再做處理,也可以使用EBI的IaaS [注] 服務(wù),免去了將數(shù)據(jù)存儲(chǔ)到本地的麻煩。“這是一個(gè)相對(duì)新鮮的方式,這也讓生命科學(xué)研究人員使用和消費(fèi)數(shù)據(jù)的方法得到了改變。這種模式也可以推廣到各個(gè)領(lǐng)域。”EBI的技術(shù)服務(wù)團(tuán)隊(duì)主管Steven Newhouse說(shuō)。
EBI的570名員工中有將近20%的人都在從事以調(diào)查或協(xié)作為主的生命科學(xué)研究工作,因此整個(gè)機(jī)構(gòu)的數(shù)據(jù)量幾乎每年都會(huì)翻一翻。如果以這種速度增長(zhǎng),就意味著五年后的數(shù)據(jù)量將達(dá)到1500 PB,EBI的基礎(chǔ)設(shè)施將面臨嚴(yán)峻考驗(yàn)。
數(shù)據(jù)庫(kù)虛擬化的經(jīng)濟(jì)性
為了解決這個(gè)問(wèn)題,EBI決定采用虛擬化技術(shù)來(lái)對(duì)數(shù)據(jù)庫(kù)進(jìn)行精簡(jiǎn),并最終選擇部署了Delphix的數(shù)據(jù)即服務(wù)(DaaS)。這一技術(shù)能夠捕獲數(shù)據(jù)庫(kù)元數(shù)據(jù),并將其存儲(chǔ)在一個(gè)單一的副本上,然后為提出請(qǐng)求的用戶提供一個(gè)虛擬副本,而免去了數(shù)據(jù)復(fù)制這一步。
EBI預(yù)測(cè),通過(guò)部署數(shù)據(jù)庫(kù)虛擬化技術(shù),使得他們能夠減小將近70%的存儲(chǔ)空間。Newhouse表示:“隨著不斷地生成數(shù)據(jù),所有的基礎(chǔ)設(shè)施都必須針對(duì)數(shù)據(jù)庫(kù)進(jìn)行調(diào)配并不斷地?cái)U(kuò)展存儲(chǔ)空間。而在使用Delphix的服務(wù)之后,我們的存儲(chǔ)需求得到了控制,更關(guān)鍵的是我們不再需要大量的人力來(lái)管理這些數(shù)據(jù)。”
此外,數(shù)據(jù)庫(kù)虛擬化還可以減少在企業(yè)內(nèi)網(wǎng)之中流動(dòng)的數(shù)據(jù)量,同時(shí)創(chuàng)建數(shù)據(jù)庫(kù)實(shí)例也變得更快、更簡(jiǎn)單。“許多我們內(nèi)部的用戶都是開(kāi)發(fā)人員,他們使用我們的元數(shù)據(jù)來(lái)開(kāi)發(fā)應(yīng)用,然后全世界的企業(yè)都會(huì)用到這些應(yīng)用。開(kāi)發(fā)人員需要?jiǎng)?chuàng)建一些數(shù)據(jù)庫(kù)實(shí)例來(lái)支撐他們的開(kāi)發(fā)工作,而Delphix所提供的,是快速克隆數(shù)據(jù)庫(kù)的能力。” Newhouse說(shuō)。
數(shù)據(jù)庫(kù)虛擬化讓IT團(tuán)隊(duì)可以加速創(chuàng)建數(shù)據(jù)庫(kù)實(shí)例,然后把更新提交給開(kāi)發(fā)人員,讓他們的工作能夠更加高效。
“Delphix使得我們可以看到不同數(shù)據(jù)庫(kù)版本之間的區(qū)別,這樣我們就可以根據(jù)不同來(lái)進(jìn)行調(diào)整,不用再對(duì)整個(gè)數(shù)據(jù)庫(kù)進(jìn)行這樣的操作,這就大大提升了部署新數(shù)據(jù)庫(kù)的速度。IT團(tuán)隊(duì)的反饋越來(lái)越快,我們數(shù)據(jù)庫(kù)更新的頻率也得到了提高。這使得全球的科研人員都能夠因此獲益。” Newhouse說(shuō)。
試點(diǎn)項(xiàng)目
據(jù)了解,EBI大約在一年之前開(kāi)始了部署Delphix數(shù)據(jù)即服務(wù)的項(xiàng)目(+本站微信networkworldweixin),而在此之前,他們已經(jīng)對(duì)數(shù)據(jù)庫(kù)虛擬化技術(shù)進(jìn)行了3-4年的測(cè)試和試用。
“在過(guò)去幾年中,我們進(jìn)行了多次的試點(diǎn)項(xiàng)目,并從中收獲了一些經(jīng)驗(yàn)和信心。從反饋情況來(lái)看,用戶提供的信息非常積極,因此我們最終決定這就是我們未來(lái)幾年將要大規(guī)模部署的技術(shù)。” Newhouse說(shuō)。
Newhouse表示,最終說(shuō)服EBI做出決策的并不是Delphix所提供的服務(wù),而是數(shù)據(jù)庫(kù)虛擬化這個(gè)技術(shù)是正確的方向。“EBI內(nèi)部的人大都比較保守,要說(shuō)服他們采用新的技術(shù),則需要許多年的時(shí)間。在最初提出的時(shí)候,不僅有許多人持懷疑態(tài)度,而且我們要確保新技術(shù)能夠發(fā)揮它的作用,并在未來(lái)幾年之內(nèi)都提供完善的支持。” Newhouse說(shuō)。
對(duì)服務(wù)器和數(shù)據(jù)庫(kù)基礎(chǔ)架構(gòu)的虛擬化,使得EBI能夠?qū)Ω嗟牧鞒踢M(jìn)行自動(dòng)化處理。Newhouse希望利用這個(gè)機(jī)會(huì)來(lái)讓EBI接受更多敏捷方法,并應(yīng)用到在未來(lái)的app交付領(lǐng)域。
“我們希望未來(lái)的整體服務(wù)能夠支持移動(dòng)化,同時(shí)可以在不同的虛擬架構(gòu)中進(jìn)行部署。也就是說(shuō)我們將打造一個(gè)混合云 [注] 環(huán)境。” Newhouse說(shuō)。