IDC的2011年全球專用備份設備市場份額統(tǒng)計,EMC憑借著Data Domain、Avamar的前期努力已經(jīng)占據(jù)了壓倒性的優(yōu)勢。不過我們應該看到這還是一個處于發(fā)展中而未完全成熟的市場,因為競爭對手之前給予的重視還不夠,像惠普這樣的廠商仍在完善產(chǎn)品線布局的過程中,而戴爾可以說才剛剛開始試水。
我們認為,EMC仍然會在未來3、5年甚至更長的時間排在第一位。但正如目前他們在外部存儲系統(tǒng)市場中30%左右的占有率那樣,同樣沒有哪家廠商在重復數(shù)據(jù)刪除磁盤備份領域有絕對的技術優(yōu)勢,而且參與者眾多。不出意外的話,EMC去年65.5%的份額將有一部分會陸續(xù)“流失”到其他廠商,那么以惠普4.1%、戴爾1.0%的基數(shù)來看,可以增長的空間還是蠻大的。下面,我們就來看看惠普的StoreOnce產(chǎn)品組合如今發(fā)展到了什么程度。
在《重復數(shù)據(jù)刪除競爭白熱化:軟硬結合成關鍵》一文中,筆者對惠普最近更新的StoreOnce B6200磁盤備份系統(tǒng)、加入的StoreOnce Catalyst軟件,以及EMC Data Domain 990、SEPATON等競爭對手的產(chǎn)品已經(jīng)有過比較深入的討論。
不過在我的腦海中,關于惠普整個去重備份產(chǎn)品線還有一些疑問:
1. StoreOnce Catalyst軟件目前只提供對B6200的支持,未來會支持定位較低的StoreOnce 2500和4000系列產(chǎn)品線嗎?
2. “根據(jù)惠普對公開數(shù)據(jù)和專家意見所做的對比,據(jù)Evaluator Group稱,對于大多數(shù)競爭對手來說,恢復大約是吸納性能的50%。”惠普的StoreOnce和EMC DD等重復數(shù)據(jù)刪除技術都屬于in-line(線內)的處理方式,為什么惠普的恢復速度能達到與本機備份速度(不使用Catalyst)相同的水平?
3. B6200 StoreOnce的8個節(jié)點(4對)配置一共有4個單獨的重復數(shù)據(jù)刪除索引,將來會合并到一個全局重復數(shù)據(jù)刪除池嗎?
4. “HP Data Protector 7軟件采用Intelligent Data Operating Layer (IDOL),配備管理工具提供情境性備份和恢復功能。客戶第一次能夠基于數(shù)據(jù)的語義和概念來精確地保護、尋找并恢復信息。”這里應該如何理解“語義”?
5. 惠普憑借StoreOnce單一技術,是否具備全面挑戰(zhàn)EMC Data Domain + Avamar + Netwoker產(chǎn)品組合的實力?
下文中,筆者將陸續(xù)嘗試解答這些問題:
最小配置的HP StoreOnce B6200備份系統(tǒng)(從后方拍攝)
近日,在惠普大廈9層我第一次看到了StoreOnce B6200的真機。照片里,中間的2臺服務器引擎節(jié)點分別通過2塊SAS HBA卡上的接口,連接最上面和最下面的兩臺P2000 MSA陣列的雙控制器上,以實現(xiàn)冗余。這樣的組合我早在《重復數(shù)據(jù)刪除進入橫向擴展和高可用時代》一文中就已經(jīng)介紹過,后來還專門對磁盤備份系統(tǒng)的HA實現(xiàn)進行過簡要分析。
StoreOnce Catalyst支持將擴展至全線
最新的惠普存儲備份軟、硬件產(chǎn)品線(點擊放大)
曾經(jīng)有業(yè)內人士對筆者表示:像EMC DD990、惠普B6200和SEPATON S2100-ES2這些高端磁盤備份系統(tǒng),面對的用戶群和市場相對比較小,而主流和中低端產(chǎn)品的需求量則大得多。我們曾經(jīng)對比過惠普的StoreOnce Catalyst和EMC DD Boost這兩種將數(shù)據(jù)傳輸至專用備份設備之前,在應用服務器或備份服務器上預處理重復數(shù)據(jù)刪除的技術。DD Boost從開始推出就支持Data Domain全線產(chǎn)品,而StoreOnce Catalyst目前只支持B6200。
如上圖,對于StoreOnce 2500、41XX和43XX(即D2D系列),惠普計劃在今年底支持StoreOnce Catalyst。
B6200的本地備份(不使用StoreOnce Catalyst時)和恢復速度最高都是40TB/小時,這里還可以看到StoreOnce 2500和4000系列的恢復速度大約為備份速度的80%。再聯(lián)想到B6200的本地性能從一開始發(fā)布時的28TB/小時提升到40TB/小時,通過的是軟件算法優(yōu)化而不是硬件更新。筆者想在這里重復申明一點:所有廠商宣稱的性能指標都可能是在理想環(huán)境下測試或者推算得出,而用戶實際體驗到的速度會受到數(shù)據(jù)類型等多種因素的影響,惠普等也不否認這一點。
我們還曾提到過,IBM TS7650G ProtecTIER重復數(shù)據(jù)刪除網(wǎng)關最近更新后的性能為9TB/小時,而其持續(xù)恢復性能比備份性能還要高(3200MB/s vs. 2500MB/s),達到了11.4TB/小時。這些可能與每一家廠商采用了不同的測試方法有關。
至于Data Protector 7備份軟件的1.8TB/小時,這是利用備份服務器或者應用服務器(源端去重方式)的處理資源以純軟件方式進行重復數(shù)據(jù)刪除的性能,并且該數(shù)字可能會隨著硬件性能的不斷增強而提高。
B6200與StoreOnce 43XX之間的速度和容量差距都達到或者接近了10倍,那么它們之間的空檔由什么來填補呢?EMC Data Domain產(chǎn)品線通過單個節(jié)點不同的性能規(guī)格等來區(qū)分定位,惠普則有些不同,其整個中高端產(chǎn)品線,可以說是由B6200的橫向擴展來覆蓋的。
對于我們在文章開頭提到的“B6200 StoreOnce的8個節(jié)點(4對)配置一共有4個單獨的重復數(shù)據(jù)刪除索引,也就是說全局命名空間下的4個池之間的冗余數(shù)據(jù)不會得到去重處理”。這一點得到了中國惠普有限公司存儲產(chǎn)品部產(chǎn)品經(jīng)理張梅生女士的認同,她還表示未來還有(在統(tǒng)一管理基礎上)進一步整合的計劃。
惠普StoreOnce B6200性能規(guī)格表
用戶可以選擇購買1~4組B6200基本引擎對(Base couplet),即2臺服務器加上P2000磁盤陣列,上表中分別為本機和帶有StoreOnce Catalyst License情況下的最高性能水平。筆者就不多解釋了。
單一技術挑戰(zhàn)EMC DD+Netwoker+Avamar
根據(jù)這張圖,最上方的代表在StoreOnce設備上經(jīng)過重復數(shù)據(jù)刪除的數(shù)據(jù),無需還原直接以精簡后的狀態(tài)通過廣域網(wǎng)復制到災難恢復站點的StoreOnce設備。中間則是在Data Protector 7或者賽門鐵克備份服務器上經(jīng)過StoreOnce Catalyst重復數(shù)據(jù)刪除的數(shù)據(jù),通過廣域網(wǎng)(WAN)備份到StoreOnce設備能夠節(jié)約帶寬,還可以再行復制到災難恢復站點。最下方即“源端重復數(shù)據(jù)刪除”,去重工作直接在安裝DP7代理的應用服務器上進行,然后經(jīng)由WAN(當然也可以是數(shù)據(jù)中心內的LAN)備份到StoreOnce設備。
筆者注意到這里的源端去重流程不再經(jīng)過備份軟件的介質服務器,也就是不像上面那些傳統(tǒng)的3層架構,而是簡化的2層架構。以EMC的產(chǎn)品為例,Avamar源端重復數(shù)據(jù)刪除方案可以包含硬件,也可以在應用服務器上通過軟件直接備份到存儲設備。而在Avamar與Data Domain配合工作時,就需要DD Boost的支持。
按照同樣的方式來理解,惠普Data Protector 7代理與StoreOnce設備之間的去重配合也是由StoreOnce Catalyst來實現(xiàn)的。因此我認為在DP7之前的版本應該不支持這樣的源端重復數(shù)據(jù)刪除,這一點得到了惠普的確認。
以此類推,中間的方案對應了EMC的Netwoker(DD Boost)+ Data Domian組合;而上方的對備份軟件就沒有限制了。
惠普在官方新聞稿中表示:“包含HP Data Protector 7的惠普StoreOnce Catalyst軟件讓遠程地點的應用服務器可以把重復數(shù)據(jù)刪除后的備份直接傳輸至中央數(shù)據(jù)中心,無需額外硬件即可在本地保留副本以便進行快速恢復。”
根據(jù)上面這張演講資料,可以看出Data Protector 7軟件采用的Intelligent Data Operating Layer (IDOL,智能數(shù)據(jù)操作層)技術來自惠普花費超過100億美元巨資收購的Autonomy。對“基于語義的保護”,惠普是這樣說的:
“采用Autonomy IDOL,全新HP Data Protector 7軟件提供業(yè)內唯一基于語義的信息保護解決方案。HP Data Protector 7軟件自動理解數(shù)據(jù)中的概念,這將顯著改變數(shù)據(jù)保護的范圍和優(yōu)勢。現(xiàn)在用戶可以檢索到所有與特定想法或主題相關的信息,無論是關鍵字還是其他搜索參數(shù)。”
根據(jù)筆者的理解,所謂DP7與IDOL的結合,就是提供了在重復數(shù)據(jù)刪除的索引中,根據(jù)關鍵字或者其它參數(shù)來搜索想要恢復數(shù)據(jù)的功能。而在此之前,人們只能恢復整個數(shù)據(jù)集,或者在備份的目錄結構中手動查找文件等目標。也可以說這一點有些類似于Windows搜索等工具或者像Google、百度那樣搜索引擎。
與EMC競爭——HP StoreOnce任重道遠
最后,我們再看一下市場方面的情況。
來自IDC的2011年全球專用(磁盤)備份設備市場份額統(tǒng)計