盡管許多人認為軟件定義存儲[注]和大數據[注]都是還處于概念炒作階段的熱門詞匯,東方物探(中國石油集團東方地球物理勘探有限責任公司)卻已經率先利用軟件定義存儲技術解決所遇到的大數據難題——
在9月4日舉行的IBM 存儲大會“ROCK EDGE CHINA 2014”上,中國石油集團東方地球物理勘探有限責任公司研究院副總工程師賴能和表示,東方物探采用IBM GPFS并行文件系統和FlashSystem全閃存陣列組成的軟件定義存儲解決方案,為地震數據分析提供了大容量、快速、穩定的存儲支撐,在大幅提升元數據查詢速度的同時,還提高了地震數據處理和分析的效率,讓石油勘探工作變得更高效。
“隨著高性能計算技術的發展和寬方位高密度采集技術的采用,我們油氣勘探業已經進入大數據時代。例如,在地震采集數據中,不少單一數據體高達30~50TB,傳統存儲設備與技術很難解決我們的問題。”賴能和說。
通過反復調研,東方物探將目光鎖定閃存陣列與軟件定義存儲等新型存儲技術,并最終采用了IBM軟件定義存儲解決方案來解決海量數據并行處理難題。
據悉,IBM軟件定義存儲解決方案實際上是一套可橫向擴展的文件存儲系統,包括軟件和硬件兩部分:軟件就是IBM GPFS并行文件系統,存儲硬件系統主要由大容量、低成本的IBM DCS3700存儲陣列與IBM FlasySystem 810閃存陣列組成。東方物探目前部署了兩套IBM軟件定義存儲系統,總存儲容量達到1.4PB。單套系統包括集群NAS機頭(配置16 臺IBM X3650 M4)、加速模塊(配置2臺IBM Flashsystem 810+2臺3650 M4)和存儲柜(8臺IBM DCS3700磁盤陣列)三部分。
為提升存儲訪問體驗,東方物探將元數據與生產數據分離,元數據存儲在高性能的IBM Flashsystem 810上,海量的生產數據則存儲在大容量、低成本的IBM DCS3700磁盤陣列上,這樣一來可以將元數據的查詢速度提升上千倍。經測試,將元數據集中式存放在高速閃存陣上,順序讀性能提升了1495倍 。以1.4PB的數據處理總量計算,其中元數據大約為3TB-4TB,而單臺IBM Flashsystem 810的可用容量是6TB,不僅可以滿足當前的元數據存儲需求,而且預留了足夠的擴展空間。東方物探共部署了兩套IBM Flashsystem 810,通過IBM GPFS的鏡像復制功能實現了系統冗余,進一步提高了數據處理的可靠性。
IBM相關專家則表示,IBM軟件定義存儲解決方案在并發存儲訪問、數據的分層,以及數據在不同層級間的遷移全部都是以軟件為核心實現的,其獨特的優勢表現在以下三個方面:第一,系統的伸縮性好,可實現模塊化的靈活擴展,存儲容量能夠隨著用戶的需求從幾十TB擴展到PB級;第二,實現靈活的配置和功能的調整(+微信關注網絡世界),可以針對客戶的具體需求進行調整和優化;第三,架構靈活,系統的所有組件都是松耦合的關系,交換模塊、存儲模塊等不同模塊可以自由組合,不受限制,比如存儲模塊既可以是大容量、低成本的磁盤陣列,也可以是高性能的固態硬盤(SSD)。
“簡言之,閃存陣列的效果還是非常明顯的,解決了很多用普通的磁盤陣列很難解決的疑難問題。軟件定義存儲技術,比如說像IBM的SOSS+FlashS810,架構很靈活,非常的簡單,性價比也是非常好的。而且可以根據需要,隨時進行橫向擴展,而且對其擴展性我們做過對比,性能是線性增加的。因此它的可靠性、可擴展性完全能夠滿足我們海量數據的并行處理。”賴能和說。
此外,賴能和還透露,未來計劃將東方物探不同區域的數據中心整合到一起,其間也打算利用IBM軟件定義存儲技術。