IT巨頭小聲嘟囔著:我們不喜歡炫耀……
NEC公司擁有目前世界上規模最大且最具向外擴展能力的重復數據刪除備份型磁盤陣列,但我們幾乎從來沒有聽說過這一消息。而且根據IDC方面的統計,NEC公司無論是在出貨量層面還是營收層面,都算不上是世界前六大備份設備供應商。
不過其擁有掌握著1100家客戶與1800套裝機容量,管理有約3 EB存儲數據,且始終靜靜地守護著這一切。
這套方案的擴展能力由單節點到165節點,且具備全局重復數據刪除功能——事實上,這一點在目前磁盤備份市場領導者EMC的Data Domain產品中從未能實現。
為什么NEC公司要對自身掌握的技術如此低調?
事實上,NEC是一家非常典型的大型日本企業集團,其一直在不斷制造各類技術方案并將其銷售至全球市場。這家歷史超過130年的企業擁有99000名員工并掌握著超過64000項專業,在全球設有9個研發實驗室,但卻僅僅提出一句看似空洞的使命性口號:構建一個美好的世界。
NEC公司表示,其技術創新“使得我們讓人們擁有更為美好的生活。”
該公司的電信技術部門價值62.16億美元,公共部門業務價值68.5億美元,系統平臺業務價值60.7億美元,而即使是規模相對較小的企業業務部門也擁有22.5億美元價值。
與日立不同,NEC公司并非采取美國的管理及企業文化在美國境內設置類似于HDS的子公司。其NEC美國集團,簡稱NECAM,仍然由日本方面直接領導。
一位造訪其硅谷辦事處的新聞記者先后采訪了NEC公司IT平臺運營副總裁Hide Senta、產品經理Nobu Morita、執行首席工程師兼HYDRAstor CTO Hiroaki Mizumachi,希望借此了解該公司的企業文化。當然,這里也聚焦著眾多來自美國及歐洲的員工。
正如我們對于日本企業的一貫印象,NEC公司最大的優勢在于其日式管理文化,而最大的缺點……同樣是以平靜、量化及低調著稱的日式管理文化。
在NEC公司的眾多“智能化企業”產品當中,M系列SAN陣列包含磁盤與全閃存類產品,WB系列為光纖交換機,HS系列則為以HYDRAstor品牌銷售的備份與歸檔存儲產品。
HYDRAstor這款產品源自2002年的一個研究項目,其于2006年進行beta測試階段并于2007年推出第一代HYDRA產品。該系列方案隨后一直保持著穩定的更新周期:2008年推出HYDRA2,2010年推出MiniHYDRA(HS3)、2011年推出HYDRA3,2013年推出HYDRA4,2014年推出第五代以及歸檔專用HS6產品。憑借著重復數據刪除技術的配合,其性能提升達46倍。
該產品擁有內聯全局重復數據刪除、在線節點擴展、NEC自有擦除編碼保護、廣域網優化型同步壓縮后復制以及多生成節點支持能力。其初步設計主要面向高性能計算市場以及對于速度要求較高的并行數據提取用例。
其采用的前端訪問協議包括NFS、CIFS、OST、UEI以及REST。
NEC公司剛剛發布了一套純軟件版本——HYDRAstor Virtual Appliance(簡稱VA)。其能夠部署在vSphere或者Hyper-V環境當中,且可支持1到16 TB容量區間。其設計思路在于由遠程及分支機構加以使用,并可通過災難恢復鏈接返回中央站點。其定價為2000美元起,其中包含全部軟件并配備有復制、加密、WORM以及重復數據刪除功能。
技術這套系統擁有兩類節點——混合加速節點(x86服務器)與存儲節點——用于提供相互獨立的性能與容量擴展能力。其中存儲節點目前采用6 TB SATA驅動器。該系統采用對象存儲配合NEC自家擦除編碼以實現數據保護。重復數據刪除技術適用于全部節點上的全部數據。其中亦包含一套分布式哈希表,且重復數據刪除與哈希表皆可隨節點增加實現線性處理規模提升。
下面來看數據進入該陣列后的整個處理流程。
首先,全部數據都會采用可變塊大小經過重復數據刪除處理, NEC方面表示HYDRAstor擁有目前業界最快的單控制器寫入速度,每小時達63 TB; 而系統整體的每小時5.2 PB速度更是高達業界其它同類解決方案的25倍。
擦除編碼原理
在此之后,其會利用基于柯西公式的里德索羅門編碼進行代碼擦除。具體來講,代碼會被拆分成多個片段,并通過數學處理以生成在數量上等同于所需保護驅動器的額外及冗余碎片。如果輸入數據被拆分成10個片段外加6個新增保護片段,那么這16個片段將被寫入16臺獨立的驅動器或者節點當中,而其中任意6塊驅動器故障后數據皆可實現完整恢復。
這一數學處理方法被稱為前向糾錯,且通常基于里德索羅門編碼機制。其需要額外存儲的數據量低于RAID模式,且可保護同等數量的故障驅動器。這里最值得關注的參數有二,其一為計算擦除編碼及數據恢復時占用的CPU資源量,其二為存儲原始數據額外片段所需要的具體磁盤容量。
NEC公司指出,HYDRAstor模式——即分布式彈性數據——較其它擦除編碼方案更為高效。其能夠實現相當于RAID 10到50倍的驅動器/節點故障恢復速度。默認設置可防止3臺驅動器故障,需要額外占用25%存儲容量; 但大家也可以將故障驅動器數量設置為6塊或者1塊。大家可以為不同應用場景設置不同的彈性水平。在3級彈性水平(相當于9數據片段與3奇偶校驗片段),NEC方面表示大家可以實現1.5倍于RAID 6的保護效果,且恢復速度更快、占用資源量更低。
這項技術會將輸入數據立足子空間概念進行分發,而后將其寫入至磁盤上的日志類存儲桶內。單一節點可容納超過一套子空間。
大型系統客戶HYDRAstor到底有多出色?NECAM方面提到,某家南非銀行(很可能是南非第一國家銀行)已經利用HYDRAstor方案取代了12套DD890與6套DD990 Data Domain系統,外加6套5330 NetBackup Appliances方案。
來自美國的全球支付協會亦于2010年利用18臺HYDRAstor節點替代了原有LTO磁帶。其目前在多座數據中心內使用108臺節點。
在我看來,NECAM確實已經在這一領域占得優勢,特別是考慮到包括Data Domain在內的任何其它磁盤備份系統都根本無法應對不斷增長的超大規模客戶數據存儲需求。日立數據系統公司于2014年收購了HYDRAstor的競爭對手Sepaton,其目前被命名為日立保護平臺公司,且主要針對RAID 6開發重復數據刪除與復制功能——而非擦除編碼。
在一份白皮書中,HDS方面宣稱這是“目前業界最為強大且靈活的數據保護平臺,”能夠憑借其網格擴展性架構提供“無與倫比的性能與容量可擴展性。”
如果大家需要一套高端、基于磁盤的備份與歸檔向外擴展系統,那么HYDRAstor與HDS系統無疑是您最理想的兩個選項——而考慮到擦除編碼功能的存在,NEC無疑更勝一籌。