位于英國劍橋的歐洲生物信息研究所(以下簡稱EBI)為全球科研人員提供免費的生物信息,讓他們可以隨時訪問并將其用于科研工作。這家非盈利機構所存儲的生物學數據竟然達到了將近50 PB的規模,并分布在三個數據中心當中。無論是高校還是商業機構,都可以訪問這些數據,用來進行研究、應用開發或者培訓。
根據EBI推算,他們每個月都要應對超過1200萬個數據請求。
用戶可以將數據下載到本地然后再做處理,也可以使用EBI的IaaS服務,免去了將數據存儲到本地的麻煩。“這是一個相對新鮮的方式,這也讓生命科學研究人員使用和消費數據的方法得到了改變。這種模式也可以推廣到各個領域。”EBI的技術服務團隊主管Steven Newhouse說。
EBI的570名員工中有將近20%的人都在從事以調查或協作為主的生命科學研究工作,因此整個機構的數據量幾乎每年都會翻一翻。如果以這種速度增長,就意味著五年后的數據量將達到1500 PB,EBI的基礎設施將面臨嚴峻考驗。
數據庫虛擬化的經濟性
為了解決這個問題,EBI決定采用虛擬化技術來對數據庫進行精簡,并最終選擇部署了Delphix的數據即服務(DaaS)。這一技術能夠捕獲數據庫元數據,并將其存儲在一個單一的副本上,然后為提出請求的用戶提供一個虛擬副本,而免去了數據復制這一步。
EBI預測,通過部署數據庫虛擬化技術,使得他們能夠減小將近70%的存儲空間。Newhouse表示:“隨著不斷地生成數據,所有的基礎設施都必須針對數據庫進行調配并不斷地擴展存儲空間。而在使用Delphix的服務之后,我們的存儲需求得到了控制,更關鍵的是我們不再需要大量的人力來管理這些數據。”
此外,數據庫虛擬化還可以減少在企業內網之中流動的數據量,同時創建數據庫實例也變得更快、更簡單。“許多我們內部的用戶都是開發人員,他們使用我們的元數據來開發應用,然后全世界的企業都會用到這些應用。開發人員需要創建一些數據庫實例來支撐他們的開發工作,而Delphix所提供的,是快速克隆數據庫的能力。” Newhouse說。
數據庫虛擬化讓IT團隊可以加速創建數據庫實例,然后把更新提交給開發人員,讓他們的工作能夠更加高效。
“Delphix使得我們可以看到不同數據庫版本之間的區別,這樣我們就可以根據不同來進行調整,不用再對整個數據庫進行這樣的操作,這就大大提升了部署新數據庫的速度。IT團隊的反饋越來越快,我們數據庫更新的頻率也得到了提高。這使得全球的科研人員都能夠因此獲益。” Newhouse說。
試點項目
據了解,EBI大約在一年之前開始了部署Delphix數據即服務的項目,而在此之前,他們已經對數據庫虛擬化技術進行了3-4年的測試和試用。
“在過去幾年中,我們進行了多次的試點項目,并從中收獲了一些經驗和信心。從反饋情況來看,用戶提供的信息非常積極,因此我們最終決定這就是我們未來幾年將要大規模部署的技術。” Newhouse說。
Newhouse表示,最終說服EBI做出決策的并不是Delphix所提供的服務,而是數據庫虛擬化這個技術是正確的方向。“EBI內部的人大都比較保守,要說服他們采用新的技術,則需要許多年的時間。在最初提出的時候,不僅有許多人持懷疑態度,而且我們要確保新技術能夠發揮它的作用,并在未來幾年之內都提供完善的支持。” Newhouse說。
對服務器和數據庫基礎架構的虛擬化,使得EBI能夠對更多的流程進行自動化處理。Newhouse希望利用這個機會來讓EBI接受更多敏捷方法,并應用到在未來的app交付領域。
“我們希望未來的整體服務能夠支持移動化,同時可以在不同的虛擬架構中進行部署。也就是說我們將打造一個混合云環境。” Newhouse說。