有道是“巨變傷巨頭”,思科老大錢伯斯認為未來5年,微軟、IBM、惠普、SAP、甲骨文和思科中有兩三家將退出巨頭行列。規模至少差一個數量級的小公司或許調頭快,但往往在所涉行業中以技術先進立足,遇上閃存挑戰硬盤這類顛覆性變革,稍有不慎即滿盤皆輸的可能性更大。如果一家30年還不到30億的老牌非主流半導體公司,能做到:本是硬盤行業內的重要供應商,在閃存來襲時成功構筑防線,為把優勢延續過來贏得時間;因服務器市場需求不足進軍存儲系統OEM,成為IBM與Dell的主要供應商,卻在云計算和大數據浪潮推動服務器與存儲融合時果斷抽身,并成為Faceook重要的合作伙伴……通過分析一個傳統意義上的硬件廠商,應對閃存、服務器與存儲融合、云計算和大數據變局的過程,梳理出過去十年存儲行業的發展主線,是否也能對我們有所啟發?
云計算成為風潮以來,IT行業的氛圍發生了很多變化。個人感受最強烈的一點是,現在沒有誰是絕對安全的。
與十年前相比,英特爾的至強(Intel Xeon)已成為后端市場上的主導品牌,這一定程度上得益于云計算和大數據,但是前端市場也受到ARM的突襲,市值就被高通超過,唱衰之風四起;
微軟的情況是真不妙:據統計,2004年在微軟操作系統在消費類計算設備中的份額還高達95%,短短七八年就掉到了20%,這顯然要拜包括智能手機和平板電腦在內的移動設備大爆炸所賜;
想想在iPhone之前的最后一款“街機”是誰?我以為是2008年末、2009年初的E71。當時誰能想到,只用了兩年的時間,諾基亞就拋棄了Symian,投入微軟的懷抱?而且,這才是噩夢的開始……
龐大如IBM,內部的有識之士也從Nokia的快速墜落,有了強烈的危機感;
相比之下,過去五六年一直在折騰的惠普,居然還沒有垮掉,足可見底蘊之深厚了。
短短八年間,微軟在消費計算市場的份額下降了75個百分點!不難想見,微軟不是在自己的主領地——PC市場被擊敗,而是PC受到了智能手機、平板電腦的沖擊……微軟開拓新戰場不力,導致總的地盤變小
巨頭們的危機源于游戲規則的改變。剛剛轉向64位的時候,AMD曾經給Intel制造了不小的麻煩,但事實證明,要顛覆Intel的霸權,需要一套完全不同的體系——譬如…ARM…
當然話也要分兩頭說。就單個領先的產品線來說,安全區變薄了:Vista犯下的錯誤,Windows 7基本可以彌補,但若Windows 8重演Vista那一幕,微軟還有機會挽救么?可另一方面,在Windows的傳統市場PC萎靡,Windows Phone也未見明顯起色的情況下,應用軟件(如Office)和Windows Azure等的表現,讓微軟的小日子過得還行,尚存足夠的轉圜余地,要全線失守不是那么容易。
道理同樣適用于英特爾:至強的強勢和先進的生產工藝、強大的生產能力,保證Atom還來得及組織有力的反擊。市值有時只是浮云,只要不像前兩年的諾基亞那樣慌了神自亂陣腳,時間還是有的。
陣地(產品線/解決方案/服務)的厚度和寬度,是巨頭的兩大法寶(參見HP)。但如果并非巨頭,厚度不夠,縱有多條線之也是關聯業務,形勢變化怎辦?難道一損俱損?
不妨看一個真實的例子:某老牌半導體企業,經過多年的苦心經營,通過并購和甩賣使存儲業務占到每年25億美元收入中的70%,是:
硬盤控制器市場上的前兩位提供商之一,特別在高性能硬盤控制器市場占據統治地位——正面臨迅速崛起的SSD挑戰,發展空間何在?
積極推動SAS成為高性能驅動器接口標準,并成為SAS控制器市場的領跑者——還是SSD“搗亂”,讓原本是協作性質的PCIe(PCI Express),有可能壓SAS一頭!
借SAS的東風,成為服務器市場領先的RAID卡提供商——原本目標用戶的需求,要么可以用PCIe SSD取代,要么開始用大量廉價SATA硬盤驅動器,并擔心RAID漫長的重建時間……更多的選擇,令傳統RAID技術的重要性受到質疑;
為拓寬業務進軍外部存儲市場,一度成為中低端市場上主要的OEM供應商——服務器與存儲融合的趨勢,使得其最大OEM客戶IBM與Dell紛紛另起爐灶……
簡而言之,在SSD、服務器與存儲融合的大趨勢下,圍繞硬盤驅動器構建起技術優勢(如SAS、RAID)的“傳統”企業,該如何化解威脅,把握機會?或許,我們可以從LSI公司的經驗和教訓中,對行業的發展方向,有一個更清晰的認識。
LSI公司在前仙童半導體CEO Wilfred Corrigan的主導下創立于1981年,EMC、希捷(Seagate)和早期存儲標準如SCSI都建立于1980年前后,堪稱存儲行業發軔的年代。不過,LSI初期的業務與存儲關聯不是很大,主要是半導體ASIC(Application-Specific Integrated Circuit,一種特定用途的集成電路),也曾活躍于盛極一時的MIPS聯盟。上世紀90年代末開始,LSI借助一系列收購,成為存儲市場上的核心器件供應商之一。
<>收購:閃存難擋,選擇加持
LSI有兩個業務很好的體現了ASIC與存儲的結合。其一是硬盤控制器(Hard Disk Controller,HDC),LSI Logic早就是高性能企業級硬盤驅動器市場上主要的硬盤控制器供應商,這個市場不大但缺乏競爭者,利潤還算不錯。原英特爾數字企業事業部(Intel Digital Enterprise Group)副總裁兼總經理Ahijit Y. Talwalkar于2005年出任LSI Logic總裁兼CEO之后,并購了在硬盤控制器市場中出貨量第一、收入則少于Marvell排名第二的Agere Systems(杰爾系統)。與當時的LSI不同的是,Agere的存儲收入大部分來自為臺式機和筆記本電腦的硬盤驅動器提供硬盤控制器,競爭也更激烈。2008年,LSI又收購了Infineon(英飛凌)的硬盤控制器業務,以求得對Marvell的優勢。
希捷是高性能企業級硬盤驅動器市場上的王者,也是LSI公司的大客戶。這兩款2.5英寸15K/10K RPM SAS硬盤驅動器都采用LSI的硬盤控制器芯片(IC),可以看到上面還是LSI Logic的老名字,下面則換成了新的Logo(2007年4月初完成收購Agere后去掉“Logic”,并且更生動)。有趣的是,還可以看到老對頭Marvell的PRML讀/寫通道芯片配合工作……
硬盤控制器是負責CPU與硬盤驅動器(Hard disk drive,HDD,通常簡稱為“硬盤”)通訊的集成電路(IC),對于硬盤行業的重要性可想而知。反之亦然,如果對硬盤驅動器的需求減少,LSI的硬盤控制器業務也會受影響。
在LSI增強硬盤控制器業務的同時,硬盤驅動器的“對手”固態盤(Solid State Drive,SSD)也逐漸成長起來了。與硬盤驅動器相比,基于閃存的固態盤具有很高的I/O性能,劣勢在于容量和價格。不難想見,SSD的出現,對一直以IOPS(I/O per second,每秒I/O數)立命的高性能企業級硬盤驅動器是很大的打擊,也搶去了PC(筆記本電腦/臺式機)上的增長機會,更不要提飛速發展的平板電腦市場了。
硬盤控制器相關業務能為LSI公司貢獻四分之一左右的收入,是每年5億美元以上的“大生意”,不要說萎縮,就是增長放緩,也值得警惕。既然SSD的崛起不可阻擋,打不過不如加入,于是LSI公司在2011年10月底出手,3億多美金拿下SSD控制器廠商SandForce。
放棄消費電子業務之后,LSI公司有一半的產品線與硬盤驅動器密切相關(硬盤控制器、SAS、RAID),而且都是行業內最重要的供應商。但是SSD的迅速崛起勢不可擋,因此對SandForce(虛線框內)的收購至關重要
從硬盤控制器到閃存控制器,LSI做的還是控制器的生意,但“腳踩兩條船”,顯然安全了許多。SandForce并入LSI公司后成為FCD(Flash Components Division,閃存組件分部),其閃存控制器主打在“計算機”(PC、服務器)的SSD市場,據稱份額占到35%。目前SandForce SF-1000/2000系列閃存處理器(Flash Storage Processor,FSP)都采用在驅動器市場(包括硬盤驅動器和同樣“驅動器外觀”的SSD)占絕對數量優勢的SATA接口,也正積極向Windows To Go這樣需要高速USB 3.0存儲設備的市場拓展。
硬盤和SSD兩邊下注,這樣不管哪個市場有增長,LSI都能從中獲益。不過,SandForce的加入,暫時還不能很好填補LSI在高性能企業級硬盤控制器業務上可能出現的缺口。
這話是怎么講的呢?
前面說SF-2000系列都是SATA接口的閃存控制器,細究的話,不能說完全正確。譬如,SF-2600是6G/s SATA接口,但又為SAS接口做了優化,包括支持512字節以上的扇區。
SF-2600是“為SAS優化的”6G/s SATA閃存控制器,已經部分體現出了SandForce對SAS閃存控制器的態度
一定程度上拜SSD所賜,現在業界興起4K扇區風,512字節以上了不起嘛?非也,很多企業級存儲產品要求硬盤的物理扇區略大于512字節,譬如520或528字節,多出來的部分保存扇區校驗信息。作為面向企業級市場的產品,SAS驅動器應該具備這個能力。
SAS是Serial Attached SCSI的簡稱,它兼容并行SCSI的指令集,借鑒了Serial ATA(SATA)的物理層和FC-AL的雙端口特性。SAS技術標準于10年前開始制訂,LSI公司是積極推動者之一。如今,SAS已經成功的取代服務器端的并行SCSI(如Ultra320)和存儲系統端的FC-AL,統一了服務器與存儲系統的驅動器接口,LSI也追隨這一變革,只剩下PMC-Sierra一個競爭對手。
這就是LSI另一個很好體現ASIC與存儲結合的業務——SAS IC/HBA。采用LSI SAS硬盤控制器的硬盤驅動器,通過LSI的SAS IC/HBA連接到服務器或存儲系統控制器的PCIe總線上……看起來,LSI幾乎壟斷了企業級存儲的數據通路。
果真如此,為何完成收購SandForce都快一年了,LSI還沒有推出一款SAS接口的閃存控制器?閃存控制和SAS接口技術都齊了,很難嘛?
LSI亞太區閃存存儲業務銷售總監林治宏的回答是:SAS目前的市場分布比較偏在存儲端,市場份額還相對較小,從經濟性上考慮,目前是做到SAS整合的程度。也就是說,如果客戶有SAS SSD的開發計劃,LSI的建議還是以外接的橋接器為主——SAS向下兼容SATA,橋接器可以完成單雙端口和必要的協議轉換,SF-2600就得益于此。
因為,原來大量使用高性能企業級硬盤驅動器來獲得高I/O性能的用戶,有了直接跨過SAS SSD的選擇——PCIe SSD,或曰PCIe閃存卡。
<>組合:渾水摸魚,爭取時間
PCIe閃存卡濫觴于Fusion-io,思路很簡單:閃存芯片與PCIe總線之間,為什么要經過先通過閃存控制器轉換成SAS協議,再經SAS IC/HBA轉換成PCIe協議呢?省去兩次SAS轉換的中間環節,直接用閃存控制器連接閃存芯片和PCIe總線就好了嘛!
Fusion-io列出的RAID/SAS控制器橋接方案(上)與原生PCIe控制器方案(下)的數據處理流程對比圖。理論上,少掉了不必要的中間環節,確實有助于縮短延遲
這樣做起碼有三大好處:
縮短延遲——少了中間環節,延遲自然更短;
提高帶寬——SAS 2.0是6G/s,對高性能SSD已經是瓶頸;PCIe 2.0 x8是40G/s,6倍以上;
降低成本——只用一個閃存控制器芯片就可以搞定,不需要SAS IC什么的,對供應商而言,省錢省空間。
有道是知易行難,道理都明白,但目前Fusion-io仍然享受著先發優勢。林治宏表示,PCIe接口的閃存控制器在SandForce的發展路線圖上,但何時推出還不能透露。
開發原生(Native,不需經SAS/SATA轉換)的PCIe閃存控制器,對于已經有SATA閃存控制器和SAS技術的LSI來說,難度是要大于SAS閃存控制器的。可是市場不等人,架構不先進總好過連產品都拿不出來。因此,在收購SandForce之前,LSI就用自家的SAS IC LSISAS2008加上6個使用SandForce控制器的SATA閃存模塊(其實就是SATA SSD),推出了PCIe閃存卡WarpDrive。完成對SandForce的收購之后,LSI又以類似的手法,推出了第二代的Nytro WarpDrive應用加速卡。
Nytro WarpDrive應用加速卡與第一代WarpDrive SLP-300采用相同的架構——通過SAS控制器LSISAS2008,轉接幾個SATA閃存模塊。主要區別在于,閃存模塊增加了eMLC,閃存控制器也從SF-1500升級為SF-2500
這么做的還有英特爾,與Nytro WarpDrive同期推出的Intel SSD 910,也用了LSISAS2008,帶著最多4個SAS閃存模塊(Intel和Hitachi GST合作開發的SAS閃存控制器)。在這種SAS IC + SAS/SATA SSD的組合下,后者接口是SAS還是SATA,基本沒有區別。
經過SAS轉換的組合方案會比原生PCIe增加多少延遲?LSI公司加速存儲事業部總監Michael Chang認為,決定延遲并不在接口轉換,而在于閃存控制器與后面NAND閃存的通訊,這方面SandForce有優勢。不過,除了少數對延遲特別苛刻的場景(譬如雙十一的淘寶),也頗有人在了解這兩種架構的差異之后問:這能增加多少延遲?要求至于這么高嗎?
Oracle上一代數據庫一體機Exadata X2采用的Sun Flash Accelerator F20PCIe卡,4個采用Marvell閃存控制器的SATA閃存模塊,通過LSISAS1068E連接到PCI Express總線上。作為LSISAS2008的上一代產品,LSISAS1068E是一款3G/s SAS IC(LSISAS2008為6G/sSAS),一方面可見在SAS IC + SAS/SATA閃存模塊的“組合”PCIe閃存卡方案中LSI之“無處不在”,也說明Marvell在閃存控制器上的布局要早于LSI
LSI公司院士、CIO辦公室系統架構師Roert Oer則以美國銀行的Jeff為佐證:Jeff是華爾街最有名的架構師之一,他所在的美國銀行每年在服務器機房方面的花費大約是50億美元,同時他還是Fusion-io的技術咨詢師。去年11月他參加了美國銀行創新峰會,展示了目前市場上PCIe閃存卡的性能圖表,他在現場問觀眾“這些卡的區別是什么?”大家說法不一。他說,對我們現在的應用來說,這些卡的性能都差不多,已經足夠快了。我們現在應該專注于做“有用”的解決方案,這就是LSI所選擇的方向。現在業界已經有了足夠快的方案,但還存在著很多其他問題,這就是系統專家要為客戶解決的。
獨家專訪LSI公司院士、CIO辦公室系統架構師Roert Oer,和LSI公司加速存儲事業部總監Michael Chang。此次會面根據他們拜訪百度的時間做了調整,騰訊、阿里巴巴這樣的大型互聯網公司也與LSI有很密切的合作關系,文章后半部分會談到相關話題
既然增加這個轉換對延遲的影響一時說不清楚,那就看看實際的市場表現吧。Nytro WarpDrive應用加速卡推出以來,贏得了兩個大OEM客戶:
EMC的服務器閃存緩存解決方案VFCache,入選的PCIe閃存卡還有Micron RealSSD P320h——采用IDT開發的原生PCIe閃存控制器,總體架構更貼近Fusion-io的ioDrive。這樣看來,起碼EMC不認為兩種架構之間有多大差異;
Oracle的新一代數據庫一體機Exadata X3。之前的Exadata,配備的PCIe閃存卡Sun Flash Accelerator F20部分使用了Marvell的技術。能把在閃存控制器上先行一步的“死敵”Marvell踢出局,于LSI也是樂事一件。
Micron RealSSD P320h PCIe閃存卡采用一枚IDT的ASIC作為閃存控制器,直接將美光的閃存芯片連到PCI Express總線上。這個IDT ASIC遵循制訂中的NVMe標準,FIO曾是該組織的重點打擊對象
當然,就像前面所提到的,LSI很清楚,沒有SAS/SATA這個中間環節的所謂Native(原生)PCIe閃存卡是大勢所趨,自己推出這樣的產品也只是時間問題。問題是組合方案可以爭取時間,哪怕只是一兩年。LSI/SandForce參與了包括NVMe在內的多個PCI Express SSD接口相關標準組織,個人認為或許一年內LSI就能推出原生的PCIe閃存控制器,畢竟競爭對手如Marvell也不會閑著,譬如Intel的920……
<>放棄:RAID與外部存儲的回歸
十年前,在SAS標準仍處于初創階段的時候,LSI就通過一年之內的兩次收購,獲得了AMI的RAID適配器部,從IBM手里拿下了Mylex,大大增強了在RAID領域的實力。
當時LSI在RAID卡領域的主要競爭對手是Adaptec,雙方都希望能開拓服務器以外的市場。確切的說,雖然中高端服務器普遍配備SCSI RAID卡,但受Ultra160/320為代表的并行SCSI技術所限,一個雙通道的RAID,真正能接的硬盤驅動器數量也不多。這很大程度上促使對存儲性能要求較高的服務器,更傾向于使用外部的存儲系統,服務器內置的RAID卡和硬盤驅動器,基本只用來安裝操作系統和軟件。空間受限的刀片式服務器出現后,加劇了這一趨勢,甚至索性放棄內置硬盤驅動器,直接從SAN啟動。
服務器市場對高性能RAID卡的需求不足,而當時的中低端存儲系統還沒有太多軟件功能,其控制器的主要任務也是處理RAID、搬運數據,與RAID卡頗有共通之處。理論上,結合Fire Channel、iSCSI等主機接口技術之后,RAID卡廠商做低端存儲系統至少沒技術障礙。Adaptec先行一步,在2004年以OEM的方式向IBM提供兩款iSCSI存儲系統,名為DS300和DS400。
也是在2004年,LSI公司把存儲系統業務獨立出來,成立了Engenio存儲部門。此舉目的有點不純——上市,你懂的。但是那兩年的金融環境不是很理想,加之OEM業務不容易吸引投資者的眼球,Ahi上任后徹底放棄了這一打算。
<>小貼士:要明白LSI RAID業務的變遷,有必要不太嚴謹的說一下RAID與JBOD的關系。從字面來看,RAID是Redundant Array of Independent Disks(獨立磁盤冗余陣列)的縮寫,JBOD則是Just a Bunch Of Disks的縮寫,兩者內涵都比較豐富,這里不展開。但是,在很多情況下,我們可以把JBOD理解為很多硬盤驅動器的物理聚合,包括必要的電路連接(如擴展器和磁盤背板)和供電、散熱等,而RAID則通過運行在專用處理引擎(如RAID卡或CPU的XOR加速功能)上的軟件賦予其智能。這就出現以下幾種可能的組合:
RAID和JBOD都在服務器內部實現,則共同構成服務器的存儲子系統——于LSI而言,就是RAID卡業務;
RAID由存儲系統的控制器實現,連上JBOD,則構成完整的存儲系統——于LSI而言,就是外部存儲系統業務;
RAID在服務器內部或沒有RAID(如SAS HBA),JBOD在服務器外部——譬如,后面將要提到的Open Vault……
RAID卡通過線纜和/或磁盤背板把硬盤驅動器連在一起(相當于JBOD),放在服務器內部(上);存儲系統控制器包含或基本等同于RAID卡的功能,與JBOD組合在一起,就構成存儲系統(下)
目的不純也要有本錢,當時Engenio已經拿下IBM中端FC存儲系統的OEM,號稱業界第二大OEM存儲供應商。反觀Adaptec,因為DS300/400的反響不佳,丟掉了IBM的合同,繼而被迫放棄了外部存儲業務。Engenio順勢把IBM的低端存儲系統業務也接了過來,即DS3000家族。
雖然IPO未成,不妨礙Engenio的業績斐然。除了IBM的DS4000,StorageTek、Sun、SGI等廠商的中低端存儲,主要都OEM自Engenio,包括戴爾低端的PowerVault也是(中端轉銷EMC),生意紅火得很。
IBM入門級存儲系統DS3500是Engenio部門的作品(現NetApp E-2600),其控制器(下半部分)相當于一個加強版的RAID卡:核心處理器③是LSISAS2116,這枚ASIC是集SAS控制器與RAID處理引擎于一身的所謂RoC(RAID on Chip),內置800MHz的PowerPC 440處理器內核,并提供16個6G/s SAS端口。而LSI同時期的SAS RAID卡(上半部分)采用的LSISAS2108,處理器內核也是800MHz的PowerPC 440,但只提供8個6G/s SAS端口。至于SAS擴展器(SASExpander④),兩者更是一樣的LSISAS2x36。順便說一句,LSISAS2116還用在了LSISAS9200-16e、9201-16e和9201-16i等16端口6G/s SAS HBA上,但沒有使用RAID功能……如此種種,足以說明LSI的RAID卡與外部存儲業務之間的血緣關系
不過好景不長。還記得四年前,我向來京的LSI高管提了一個很長的問題,大意就是:Engenio的OEM客戶中,規模小一些的如SGI狀況不好,StorageTek被Sun收購,兩家變成一家(通常1+1<2);大一些的如Dell收購了EqualLogic,肯定大力發展,合作范圍不減小就不錯……如此一來,Engenio的業務將變得高度依賴IBM這么一個大客戶,潛藏著巨大的風險,你們如何應對?
沒過多久,Oracle收購了Sun,逐漸加大對其ZFS存儲系統的扶持力度,OEM過來的存儲逐漸被邊緣化,可謂雪上加霜。
LSI的應對之策包括拓展銷售渠道,2010年LSI準備通過自己的渠道銷售自有品牌的低端存儲系統。但是工作還沒有鋪開,2011年3月初,LSI宣布將Engenio業務出售給NetApp!
饒是問過那樣的問題,聽到這個消息時,我還是頗感意外。一是不到半年前(2010年12月)的LSI存儲論壇上,還談論到了正在開發基于英特爾至強平臺的下一代中端存儲系統,NetApp應該不需要這個;二是4.8億美元的價格與Engenio業務每年能帶來的營收相比,有賤賣的意思。
我的問題部分應驗——Engenio的生意不好做了。不過我們也不能刻舟求劍,行業環境已是此一時,彼一時。我相信LSI出售Engenio業務,一定也有出于技術發展趨勢的考慮。既然如此,對于Engenio這部分業務所對應的市場需求,應該會有填補的手段。
在LSI的大力推動下,SAS成功取代服務器內部的并行SCSI和存儲系統內部的FC-AL,統一了服務器與存儲系統內部的接口。隨后,在Intel的不懈努力下,以至強為代表的x86也在存儲系統控制器領域壓倒了PowerPC,有一統服務器與存儲之勢。
單論RAID處理能力(如XOR和P+Q運算),x86的效率不如PowerPC。但若運行更上層的軟件功能如重復數據刪除,甚至運行虛擬機,x86在處理能力、發展前景和生態環境上的優勢明顯。隨著存儲越來越趨向于成為軟件行業,英特爾的強勢入侵已不可避免。
換句話說,獨立的存儲行業,正在演變為在標準化或通用的硬件平臺上,比拼專業數據處理能力的軟件。LSI擅長的RAID已經“淪為”底層軟件功能,缺乏相應的上層軟件能力,繼續做存儲系統生意,競爭優勢將不復存在。
IBM Storwize V7000的控制器,CPU是四核2.13GHz的Intel Xeon EC3539處理器,集成XOR等RAID加速功能,但主要是滿足Easy Tier自動分層存儲等軟件的需要。在這個架構中,LSI只能爭取SAS IC + SAS擴展器(紅色橢圓框中)的生意,喪失了核心地位
此消彼長。既然存儲系統的硬件平臺逐漸與服務器趨同,服務器廠商為什么還要找OEM代勞呢?縱使軟件能力有欠缺,大廠也有更雄厚的財力,通過收購來補齊短板。Engenio現存的兩大客戶,Dell已經與EMC分手,IBM則以自家SVC(SAN Volume Controller)軟件為核心,開發了可以替代DS5000系列(Engenio開發的DS4000接班者)的Storwize V7000,近半年來又推出了與DS3000系列市場定位重合的Storwize V3700/3500,拋棄Engenio只是時間問題。可能因為存儲實力還不夠,Dell與NetApp仍延續著較為緊密的OEM合作關系,但也是早晚的事。
簡而言之,以軟件為主導的發展方向,不僅讓LSI無法體現優勢,也促使其OEM客戶選擇自力更生。二者存其一,就夠讓LSI做出放棄的決定了,何況雙管齊下?OEM是LSI多年來主要的業務模式,沒有OEM要的產品,即使LSI想自己銷售給用戶,也不知道該怎么賣。Engenio并入NetApp之后,起碼不存在這個問題。
有道是“關上一扇門,打開一扇窗。”服務器與存儲走向融合,意味著LSI可以在服務器市場尋覓更多的機會。多端口數的SAS IC和擴展器(SAS Expander),使得服務器內部可以容納的驅動器數量,大為增加。現在的2U機架式服務器,像IBM System x3650 M4和Dell PowerEdge R720這樣的主流產品都能安裝16個2.5英寸驅動器,而Dell PowerEdge R720xd和IBM System x3630 M4,更是可以配置多達26個2.5英寸驅動器,或者14個3.5英寸驅動器。
服務器內部要連接這么多的硬盤驅動器,對于RAID的要求高過以前,給LSI提供了更大的機會。LSI公司存儲解決方案部門執行副總裁Phil Brace就自豪的表示,數得上的服務器OEM,只有惠普用的不是LSI的RAID方案(注:其實前一代產品還是,但現在HP的路線有分歧)。
LSI公司存儲解決方案部門執行副總裁Phil Brace原任Intel公司擔任服務器平臺部市場總經理,2005年追隨Ahi加入LSI公司
站在存儲系統的角度,服務器與存儲融合,更“激進”的做法是,根本不用外部存儲系統。既然每臺服務器都可以接那么多硬盤,用大量的服務器做成分布式系統如Hadoop,還能滿足數據盡量存儲在服務器本地的要求。而這對LSI來說,相當于是個可以把存儲系統“丟掉”的業務“搶”回來的機會。
互聯網和大數據的興起,使得像Amazon、Google、Faceook等互聯網巨頭,需要大量的服務器。他們的規模大到已經可以考慮自己定制服務器,更直接的向Intel、LSI等組件供應商采購,而無需傳統的服務器廠商作為中間環節。一定程度上,他們對LSI這樣的組件供應商,依賴度比傳統服務器廠商更高。
如果說,對于Dell、HP、IBM等服務器大廠來說,存儲業務也完全成了“自家的孩子”,手心手背都是肉。那么,起碼Faceook不用考慮這個問題。如果LSI能幫Faceook簡單高效的增強服務器的存儲能力,他們才不在乎什么存儲系統呢。
NetApp E2660就是原Engenio的高密度存儲系統,NetApp的Hadoop開放解決方案(NetApp Open Solutionfor Hadoop)用E2660通過6G/s SAS直連多個數據節點(外部DAS),代替服務器內部的存儲,可以提供更好的RAID保護、可維護性和存儲利用率
不過,即便對希望把數據就近存儲的HDFS來說,能夠被幾臺服務器共享的外部存儲仍然有利用率和靈活性等方面的優勢。因此,作為折中方案,曾經被SAN“擠兌”多年的DAS(Direct Attached Storage,直連存儲)煥發了第二春。SAS是個很好的直連技術(也可以小范圍的使用交換機,這個不表),但典型的外部DAS仍是需要具備完整RAID功能的存儲系統,而這個業務LSI已經隨Engenio一同放棄。不過,LSI有辦法——把DAS的RAID功能拿掉,變成JBOD的系統!
Faceook提出的Open Vault草案是Open Compute項目的一部分,能夠在2U機架的空間里容納30個3.5英寸硬盤驅動器,要用到4個28端口(可根據配置不同選擇24或20端口)的LSI SAS擴展器。每個SAS擴展器上接出的一個x4外部Mini-SAS連接器可以用來連接一臺或多臺服務器,兩個x4內部Mini-SAS擴展器用來級聯其他的Open Vault存儲單元。它看起來就像是把存儲控制器拿出來放到服務器里(SAS RAID卡或HBA)的JBOD,可以搶一部分存儲系統的生意(包括已屬于NetApp的E-2600,如前一幅圖)
所以,我們可以看到,在Faceook提出的Open Vault存儲單元草案中,是4個來自LSI的SAS擴展器來完成把30個硬盤驅動器(考慮雙端口)與服務器連在一起的任務。沒有RAID,這就是一個JBOD。那么,服務器用什么與之相連?
HDFS可以把一份數據在不同地點(服務器、機柜、數據中心)保存三個副本,這樣可以不用RAID,但需要具有較多外部端口的SAS HBA,這在HBA中屬于高端產品;大型的存儲系統如EMC的Isilon或Atmos,因不能忍受大容量SATA硬盤驅動器漫長的RAID重建時間,選擇擦除編碼(erasure coding)作為替代。但就服務器內部,以及Open Vault存儲單元這種雖有二三十個硬盤驅動器,卻可能分屬多個RAID卡的情況而言,RAID重建并非不可接受。為了提高存儲空間的利用率,從Faceook到淘寶,都越來越認可RAID的價值。
無論SAS HBA還是RAID,LSI都是更占優勢的那個供應商。
如果,一部分原來要通過存儲系統才能滿足的需求,現在用服務器就可以解決;那么,這個存儲需求的“回流”,意味著隨Engenio一同丟掉的,LSI可以從服務器市場補回來,甚至更多……?!
<>競合:守硬件專長,做軟件支撐
外部存儲系統已經演變成捆綁在標準硬件平臺上的軟件業務,如果不具備相應的軟件能力,那就把硬件做好。
出售Engenio業務,至少從客觀上看,由于缺乏新形勢下所需的軟件能力,LSI放棄了直接做完整系統,提供給OEM客戶的路線。專心做組件,至多是子系統供應商。
對于有足夠軟件開發和整合能力的大型客戶,如Oracle、EMC、Faceook,LSI只提供硬件產品如Nytro加速卡、SAS擴展器和RAID卡(底層軟件作為硬件的一部分),當然設計上的要求必須滿足,還有深度合作開發,但提供的只是硬件,而非軟件。
LSI推介其企業級閃存解決方案(左)和HA-DAS(右)的目標市場分析,兩個金字塔,有立體和平面的不同呈現,主旨卻是相同。金字塔的頂尖,LSI要么只能提供物美價廉的硬件(如高性能PCIe閃存卡),或根本無力染指(企業級數據中心HA),但金字塔的中下層(中小型企業的目標市場)更大,也更需要LSI的幫助
LSI的子系統級解決方案主要針對更多能力不足的中小型客戶,旨在利用驅動程序或固件級別貼近硬件的底層軟件,譬如緩存功能可以把PCIe閃存卡與RAID緊密結合,讓兩者各盡其才。增加這些硬件適用的場景,提高系統整體效能,進而擴大市場。典型的例子如2012年推出的Nytro家族應用加速產品和Syncro家族共享存儲產品。
Nytro家族已經是LSI的第三代緩存產品。Roert Oer表示,“我們和每一家閃存制造商都有緊密關系,所以我們在SSD控制器市場有很強的存在感,但是你不能用SSD完全取代HDD,真正的創新在于如何將兩者混合到一起,優化性能、密度、可靠性、管理,從中創建一個能夠真正啟用人們所需應用的解決方案。”
他認為,Nytro家族的緩存方案,價值主要體現在兩個方面。“一個當然是軟件,管理數據所在位置,如何被放置在這,如何利用閃存優化生命周期,需要很多智能的特性。不過也體現著很多硬件的價值,因為如何架構系統不僅僅是加速,而且還可以解決一些問題,例如在服務器發生故障情況下的數據可用性,如何池化資源并將這些有用的閃存資源從一個服務器轉移到另一個服務器,如何遷移虛擬機,這樣遷移的不僅是虛擬機還有熱數據集,你怎么在毫秒級的時間內遷移可能達到TB級的數據?”
我們知道,EMC的VFCache只選擇了Nytro WarpDrive應用加速卡(硬件)。“如果讓我與EMC等廠商對比的話,我很欣賞它進軍這個市場的舉動,但我知道,大多數大型企業正在慢慢地淘汰他們的SAN。EMC的問題在于,他們正在嘗試用緩存把SAN推向服務器,在服務器中管理數據,而我們的方法是將數據放在臨近應用的地方,讓SAN消失、變得對應用透明化,讓人們獲得價值、敏捷性、SAN的可管理性,擺脫陳舊的基礎設施。”那么,Nytro XD特別是Nytro MegaRAID離實現這一愿景有多遠?
LSI的Nytro家族應用加速產品,核心思想是利用PCIe閃存緩存最常訪問的熱數據(Hot Data),達到應用加速的目的。最左邊的Nytro WarpDrive最高端(金字塔的塔尖),OEM客戶(如EMC、Oracle)有找出熱數據并調度到其上的軟件,不需要LSI提供軟件;中間的Nytro XD加上了緩存軟件,可以對中小型企業的入門級存儲(如DS3500/E-2600)上的熱數據進行加速;右邊的Nytro MegaRAID看名字就知道還有RAID卡的功用,可以緩存服務器本地硬盤(理論上也可以包括外接的Open Vault存儲單元)上的熱數據……分別對應金字塔的中層和下層
如果可能,LSI不想放過任何可以挖外部存儲(包括SAN)墻角的機會,至少希望把入門級外部存儲的RAID控制權搶過來,由服務器里的RAID卡負責。一定程度上順著Open Vault的思路,LSI希望把小規模高可用性(HA)集群使用的共享存儲,也變成直連的DAS——確切地說,還是SAS JBOD。外部DAS的成本降低了,但LSI的SAS擴展器仍有用武之地,更重要的是證明提供外部SAS接口的RAID卡具備更高的價值……高可用性(HA)方案通常需要至少一臺共享的外部存儲系統(左),而LSI的HA-DAS(高可用性直連存儲,右)架構,相當于把外部的共享存儲由RAID降級為更簡單的JBOD,由于服務器臺數不多(面向中小型企業的入門級方案),還可以把SAN換成DAS,理論上又省下了交換機的錢。但是服務器的花費可能會增加,因為(SAS或FC)HBA要換成支持外部SAS接口的RAID卡。目前基于該思路的Syncro共享存儲產品有雙服務器RAID卡(目前是LSI Syncro CS 9286-8e Solution)配JBOD和單機箱雙系統集群(Cluster-in-Box,由OEM客戶銷售)的方案
原則上說,LSI的HA-DAS解決方案并不依賴于具體的操作系統,但是其基于MegaRAID SAS 9286CV-8eCC RAID卡的LSI Syncro CS 9286-8e解決方案,目前聲明支持的操作系統仍只有微軟Windows Server 2008 R2和Server 2012。Phil Brace表示,LSI的確是在與VMware合作一些特殊的產品,但是還不方便透露細節。“但是我可以告訴你的是,對于Syncro來說,我們的目標市場可能比VMware所推出的產品目標市場范圍更小一點,因為我們的產品更多的是關注小的零售店和中小企業,還有一些超大型數據中心(注:用Syncro MX滿足),而基本上這些用戶裝的VMware產品數量并不是特別多。所以我們覺得VMware的產品環境更多的是適用于一些更高端的市場,至少要比我們這個市場層級更高的市場。像我剛才所描述的那樣,我們希望今后能夠推出更多的產品,能夠適用于VMware的產品環境。”
與Syncro CS相比,Syncro MX有點反其道而行之的意思——這個1U的機架引導設備,可以連接多達48臺服務器,用其RAID 10卷保存48個獨立的引導卷。也就是說,整個機柜內的服務器,都可以不用本地存儲了。如果將整個機柜看作一臺刀片式服務器,那么Syncro MX-B就是其共享存儲。當然,Syncro MX的核心仍然是LSI擅長的RAID和SAS相關技術
確實,以HA-DAS的定位,面向的市場多以Windows Server為平臺構建小型的高可用性環境。現在VMware還不能很好的覆蓋這一市場,不過已有了一些初步的嘗試,譬如其vSphere Storage Appliance(VSA)雖然定位不盡相同,但順著VMware軟件定義存儲的路走下去,類似于HA-DAS的功能完全可以在vSphere操作系統之上的軟件層面(如VSA),而非之下的偏硬件層面(如HA-DAS的RAID卡)實現。固然,同樣的功能由硬件來實現會具有更高的效率,卻也要面對靈活性等方面的質疑。無論如何,作為底層的硬件供應商,LSI應該與VMware這個企業級操作系統市場上的新貴有更密切的合作。
Phil Brace對此表示認同:“我們現在正在創建一個獨立的部門,這個部門就是由我們的一些人員和專門的資源、專門的工程師所構成,這個部門主要工作任務就是深入到我們的客戶中去,比如像VMware、微軟、Oracle這樣的客戶,專門跟他們打交道。具體的了解他們需要我們為他們做些什么,之后我們就知道我們能夠為他們做些什么。在此基礎上,我們在提交產品和技術解決方案的時候,能夠讓我們的產品更加無縫的與他們的產品進行連接。”
與直接競爭對手Marvell和PMC-Sierra相比,LSI公司因涉足存儲領域較早,存儲業務所占比例越來越高,特別是還做過存儲系統的生意,相對更善于與最終用戶溝通,也懂得如何宣傳解決方案。但是,歸根結底,賣掉Engenio之后的LSI,仍是一家半導體公司。Phil Brace在回答我問題的時候也承認,“我們在做Engenio業務的時候,最大的挑戰是Engenio是一個系統的業務。當然我們自己了解出售它背后真實的故事,但是很多用戶和投資者不理解,為什么我們會有這樣的舉動。他們不知道對于LSI來說,出售這個業務的話,到底對于我們的系統和半導體業務意味著什么。但是我想告訴你的是,LSI更多的還是關注我們的半導體業務,我們是一個半導體公司。”
在叫囂軟件為王的時代,承認自己是家半導體公司并不丟人。Intel也是家半導體公司,但云計算和大數據的騰飛,離不開以至強家族為代表的CPU給力。問題在于,LSI從規模和影響力上,都無法與Intel相比。
不過,做同一個大行業(半導體),不意味著大魚可以吃掉小魚。LSI的核心業務如SAS和RAID,Intel都曾經認真的想要做好過。先說RAID:2001年,Intel通過現金加股票收購了在高性能RAID卡開發上頗有造詣的德國公司ICP vortex,比LSI收購AMI RAID適配器部門和Mylex還早,Intel IOP(I/O處理器)在RAID卡市場的采用率更是超過LSI。不過,只過了兩年時間,Intel就把ICP vortex出給了LSI的競爭對手Adaptec(現屬于PMC-Sierra),IOP也在轉入SAS時代后,經過IOP348(代號Sunrise Lake)的多次延期,而逐漸凋零。
說到SAS,本來比RAID更貼近Intel的核心業務(“繼續專注于核心產品的研發”是其出售ICP vortex時的理由)。十年前,SAS標準剛剛進入草案階段,我一句“個人認為SAS技術比并行SCSI更便于芯片組集成,有沒有想過,如果Intel這么干了,你們的HBA業務怎么辦?”問得在座的LSI公司高層啞口無言。在去年推出的至強E5平臺上,Intel真的這么干了!值得LSI慶幸的是,C600芯片組集成的SAS非常不給力,所以,至今在SAS和RAID上,LSI仍是Intel最親密的合作伙伴。(關于Intel為何搞不定SAS,請參考我去年的文章“Intel的搞不定與不搞定”)
這意味著LSI的SAS和RAID產品可以繼續搭至強平臺的車通行無阻,但Intel的CPU技術對LSI卻沒有什么利用價值。正如前面所說,如果使用至強等主流的x86處理器,這行業基本就變成軟件業務了,LSI沒法玩。LSI的ASIC需要處理器內核,可直到目前Atom仍不是做控制器的料——如果能行的話,LSI的情況恐將大大的不妙。
正如前面所說,LSI是二十年前曾活躍一時的MIPS陣營的一員,現在又高度依賴于PowerPC(PPC),不幸的是這二者的發展前景是五十步笑百步。有處理器架構師背景的Roert Oer承認這一點,他表示:“我們有MIPS許可,但MIPS有些過時了,PowerPC做的很好,對于網絡業務是很重要的。但是,做磁盤控制器也很重要,我們也參與了一些ARM的開發工作,長期來看,這是我們的發展方向。PowerPC的確有一些性能局限性,但我們集成了它強大的引擎。所以我們的硬件可以輕松應對百萬IOPS,沒有服務器和應用能夠創造那么多流量,我們只對某些控制特性利用這種處理器,奇偶校驗、數據糾錯、數據流,這些都是自動的硬件,不是性能的問題。我們的確有遷移到ARM上的計劃,這對我們的產品線來說更加方便,最重要的是運行在這些處理器上的軟件,從這一點上來說,我們的客戶不關注運行什么處理器,只要軟件和性能都是他們所需要的。”
SandForce的閃存控制器已經基于ARM內核,從長遠來說,LSI將更多地使用ARM,也更傾向于使用ARM(特別是相對于生態系統越來越弱的MIPS,PPC的發展前景亦不容樂觀)。
LSI是一家半導體公司,其核心競爭力是面向硬盤/閃存控制器、SAS、RAID等特定存儲應用的ASIC。除了不斷根據應用和行業的變化調整自己的布局,讓已有產品組合覆蓋盡可能大的市場,繼續走在相關標準制訂的前線,并為ASIC們找到一顆適用的“芯”也是LSI長久發展的要點之一。