相關(guān)的關(guān)鍵詞有十個:分布式存儲、云存儲、容器存儲、全閃存、AI存儲、區(qū)塊鏈存儲、邊緣存儲、量子存儲、生物存儲或基因存儲等等。
一、 鑒往事
我們先回顧一下歷史,過去十年(2010-2019)存儲發(fā)生了什么事件?
2010年:EMC收購Isilon,22.5億美元 ;
2010年:惠普收購3Par,23.5億美元 ;
2011年:戴爾收購Compellent,9.6億美元 ;
2011年:希捷收購三星硬盤,13.75億美元 ;
2011年:西部數(shù)據(jù)收購日立GST,48億美元 ;
2012年:VMware提出SDDC(軟件定義數(shù)據(jù)中心)和SDS(軟件定義存儲)的概念,之后推出SDS產(chǎn)品 – Virtual SAN的預(yù)覽版 ;
2013年:Avago收購LSI,66億美元 ;
2014年:閃迪收購Fusion-io,11億美元 ;
2015年:戴爾收購EMC,630億美元 ;
2015年:西部數(shù)據(jù)收購閃迪,160億美元 ;
2016年:IBM收購對象存儲,約13億美元 ;
2016年:HCI(超融合)概念提出者Nutanix上市;
2016年:博通收購博科,59億美元 ;
2016年:OpenText收購Dell EMC企業(yè)內(nèi)容部門(包括Documentum等),16.2億美元 ;
2017年:HPE收購Nimble Storage,10.9億美元 ;
2018年:微軟收購混合云數(shù)據(jù)存儲公司Avere Systems ;
2019年: AWS收購E8 Storage,估計在5000萬美元至6000萬美元之間 ;
2019年: 谷歌收購存儲企業(yè)Elastifile, 2億美元 ;
2019年: IBM收購 RedHat, 340億美元,RedHat有兩款開源存儲產(chǎn)品:Ceph和Gluster。
站在企業(yè)存儲系統(tǒng)的角度,有幾件事值得注意:HCI、SDDC、SDS的相聚出現(xiàn)、戴爾收購EMC、西部數(shù)據(jù)收購閃迪、HPE收購3Par和Nimble Storage,以及云計算廠商微軟、AWS和谷歌的收購。這些事件體現(xiàn)了全球存儲發(fā)展的幾大趨勢:分布式、云化、閃存化、智能等。
1、分布式存儲
軟件定義存儲,為云而生。軟件定義存儲就是將硬件的可操控成分按需求,分階段的,通過編程接口或者以服務(wù)的方式逐步暴露給前端應(yīng)用,分階段地滿足應(yīng)用對資源的不同程度、不同方面的靈活調(diào)用。軟件定義存儲其實是一個過程,不是一蹴而就的目標(biāo),它分成不同階段:抽象、池化和自動化。目前,軟件定義存儲最顯著的特征是呈現(xiàn)分布式,根據(jù)近年來IDC的報告,軟件定義存儲按照訪問方式,分為三類:分布式塊存儲、分布式文件存儲、分布式對象存儲。未來十年,分布式存儲的相對市場份額將不斷增長,預(yù)計將超過集中存儲的市場份額,然而兩者將長期并存。
戴爾收購的Compellent、HP收購的3Par,實現(xiàn)了塊級虛擬化,將硬盤和RAID解耦;VMware Virtual SAN(現(xiàn)命名為vSAN)、Nutanix有別于以往的專用存儲,將文件系統(tǒng)軟件與服務(wù)器解耦,體現(xiàn)了分布式存儲征程中的不同階段
回顧一下Gartner 在2015年7月發(fā)布的技術(shù)成熟度曲線,彼時處于曲線的最高點,也即階段二(過高期望的峰值,Peak of Inflated Expectations)。四、五年左右的時間,才被市場廣泛認(rèn)可,但迄今離占據(jù)市場主流份額還需一段時間。好消息是,分布式存儲發(fā)展非常迅猛,遠(yuǎn)超平均值。
2、云化 (含容器、超融合、混合云)
據(jù)報道,全球云存儲市場2017年為307億美元,預(yù)計到2022年889.1億美元,CAGR為23.7%;中國云存儲市場2017年規(guī)模為88.68億人民幣,同比增長71.8%,2018年同比增長率將上升至72.8%,市場規(guī)模為158.5億元人民幣。
Gartner在2019年的報告中顯示:到2024年,40%的企業(yè)將實施至少一種混合云存儲方式,高于2019年的10% 。
上述提到的云存儲主要是以AWS S3、EBS、阿里云塊存儲、OSS為代表的公有云存儲。在本篇文章里,云化的概念更廣泛,包括了公有云和私有云。
云的特點包括彈性靈活、按需交付、按用付費等,除了眾所周知的公有云之外,還要看到私有云。AWS CEO Andy Jessy在AWS 2019 re:Invent大會上分享了如下消息:公有云的總支出只占到總IT支出的3% 。也就是說,全球IT支出總,私有云仍占絕大多數(shù)。我曾在2017年看到一篇文章提到:預(yù)計到2040年,公有云大約占整個IT開支的1/3和1/2之間。如果真是如此,也就是說即使二十年后,私有云仍占半壁江山。
1)私有云的云化對接
存儲如何更好的服務(wù)私有云,成為企業(yè)級存儲的一個重要課題。除了存儲自身的池化、自動化之外,向上提供API,方便私有云管理平臺按需驅(qū)動存儲資源的創(chuàng)建、調(diào)整、優(yōu)化甚至回收,將逐漸成為必備配置。云化對接包含兩大塊,一是對接開源的云管理平臺,例如OpenStack的塊接口Cinder、文件接口Manila、對象接口Swift和幾乎成為標(biāo)準(zhǔn)的AWS S3接口;二是對接商業(yè)的云管理平臺,首當(dāng)其沖的是能夠被主流Hypervisor識別,如VMware ESXi、Microsoft Hyper-V。國內(nèi)存儲廠商中,浪潮的AS13000在云化對接中做得更齊全。
容器對接也可以視為云化對接的一部分,我們看到越來越多的用戶,包括互聯(lián)網(wǎng)、金融、電信等行業(yè),開始部署容器技術(shù)。因此存儲支持CSI(Container Storage Interface)接口也將逐漸成為企業(yè)級存儲的必備配置。
超融合可以視為私有云的一種部署形態(tài),當(dāng)計算資源池和存儲資源池在初次采購以及后續(xù)擴(kuò)容的過程中,計算和存儲的比例比較適中,也即,不會出現(xiàn)少量計算資源需要搭配大量存儲空間;也不會出現(xiàn)大量計算資源需要搭配很少的存儲空間,此時超融合是不錯的選擇。
2)公私相互滲透
在云計算領(lǐng)域,開始出現(xiàn)To C和To B的融合。
早期公有云的用戶主要是一些C端,或者小B的用戶,隨著云計算的深入和普及,云巨頭開始希望吸引大B用戶。但是,出于隱私保護(hù)、安全性、政府合規(guī)、管理、兼容性、慣性、遷移成本等多種因素的考慮,原有大B用戶遷移到公有云的進(jìn)展比預(yù)期要緩慢。
因此,云巨頭早在幾年前就開始通過構(gòu)建混合云或者私有云的方式來瓜分B端IT市場的大蛋糕。AWS收購E8和推出Outposts,微軟收購混合云數(shù)據(jù)存儲公司Avere,阿里云推出混合云存儲方案,騰訊云、金山云、京東云也不甘人后。
另外,因為成本、空間、能耗等因素,逐漸有更多用戶希望To B的存儲廠商,能夠支持將歷史數(shù)據(jù)備份或歸檔到公有云存儲上。
3、閃存化
根據(jù)IDC 在2019年12月31日的報道:“2019前三個季度,中國企業(yè)級全閃存存儲陣列市場同比增長超過60%。IDC預(yù)測, 2019年全閃存存儲市場仍將達(dá)到近50%的增長”。
據(jù)報道,閃存顆粒價格逐年下降(按照30%~40%的降幅),如下圖所示。
國內(nèi)的長江存儲或?qū)⒓铀匍W存顆粒下降趨勢;
當(dāng)全閃存相比機(jī)械盤價格差距不大時,更多用戶愿意為延時縮短而買單(目前和15k轉(zhuǎn),10k轉(zhuǎn)的機(jī)械盤價格相差不多;7.2k轉(zhuǎn)的機(jī)械盤當(dāng)下價格還有一些優(yōu)勢);
機(jī)械硬盤逐漸退化成類似磁帶地位的介質(zhì)。
而且在當(dāng)前的大背景下,因為機(jī)械硬盤的核心技術(shù)欠缺的原因,大力發(fā)展和推進(jìn)閃存落地具有重要的意義。國內(nèi)大的存儲廠商中,華為和浪潮都推出了自己的NVMe閃存盤。
閃存化的過程中,必然催生全閃存陣列的發(fā)展,其中的相關(guān)技術(shù)NVMe Over Fabric(簡稱NVMe-oF)借助RDMA等超低延時的傳輸協(xié)議,可遠(yuǎn)程訪問SSD,解決了下一代數(shù)據(jù)中心在橫向擴(kuò)展 (Scale-out) 時所遭遇的性能、功能、容量三者之間難以取舍的權(quán)衡問題。
4、智能
這里包括兩個方面,一是存儲的智能化;二是存儲如何為智能應(yīng)用進(jìn)行優(yōu)化,也即AI存儲應(yīng)該如何優(yōu)化。
1)存儲智能化
存儲智能化所希望達(dá)到的就是能夠根據(jù)業(yè)務(wù)負(fù)載、運維管理等的歷史記錄,預(yù)測未來可能會發(fā)生什么,再據(jù)此動態(tài)地調(diào)整存儲資源池,做到物盡其用;以及提供預(yù)警信息和執(zhí)行動作,做到防患于未然。然而這個道路非常漫長,因為廠商需要在安全性穩(wěn)定性和性價比(也即動態(tài)調(diào)整存儲資源)之間做取舍;另外要想取得根據(jù)負(fù)載自動調(diào)整存儲,其實不亞于將AI算法植入存儲系統(tǒng)之中,難度不小。目前,存儲廠商中,做得比較好的有HPE的Infosight和浪潮的InView。
2)AI存儲
Gartner報告顯示,到2022年,企業(yè)高管中將有半數(shù)以上會規(guī)劃AI技術(shù)的部署,而這一數(shù)字在2018年的時候僅有4% 。
根據(jù)IDC數(shù)據(jù),2018年上半年,中國AI基礎(chǔ)架構(gòu)市場銷售額和出貨量分別同比增長176%和129% 。
AI所需存儲,可以分為準(zhǔn)備、訓(xùn)練、推理和歸檔等階段,每個階段的IO特征不一樣,對于存儲的要求也不一樣。例如,在推理階段,IO的特征是讀寫混合,并且要求存儲的延時低,能快速響應(yīng)。
國內(nèi)的AI公司針對不同行業(yè)不同細(xì)分場景,通過AI訓(xùn)練導(dǎo)出的模型,銷售給最終用戶。為了增加營收,降低部署難度,有不少AI公司將模型以及所需的軟硬件打包,以一體機(jī)的方式銷售。其中的存儲系統(tǒng)多采用OEM或者轉(zhuǎn)售的方式,因為AI公司的主業(yè)是它的算法以及針對場景不斷優(yōu)化,自研存儲納入到一體機(jī)里,性價比不高。
總結(jié)而言,過去的這些年,解決了數(shù)據(jù)的存放、保護(hù)和優(yōu)化,尤其是在數(shù)字宇宙迅猛膨脹的過程中,如何低成本、高效率地存放。
Peter Ye(葉毓睿),浪潮資深存儲架構(gòu)師。區(qū)塊鏈存儲概念首倡者之一 。國內(nèi)第一本SDS書籍 ---《軟件定義存儲:原理,實踐與生態(tài)》的作者,該書由倪光南院士親自撰寫序言,重印多次?!禫Mware軟件定義存儲:原理剖析和設(shè)計指南》的譯者。曾任職于EMC、DELL、VMware等公司的系統(tǒng)顧問、存儲架構(gòu)師,對存儲、云計算、區(qū)塊鏈等IT行業(yè)的歷史發(fā)展和未來趨勢有著深入的了解。同時也是"樂生活與愛IT" 微信公眾號的作者。