美國歷史學家詹姆斯·哈威魯濱遜曾經說過,我們所謂的大多數推理活動,是為找到論據,以繼續相信我們認為正確的事物,就像我們一貫的做法那樣。我在參加的許多會議上多次引用這個語句,特別是當被邀請對存儲趨勢的預測做出解讀的時候。即當被問道:
正如Wikibon公司的員工聲稱的,存儲區域網絡SAN要走向沒落,將要被服務器端虛擬存儲網絡VSAN和軟件定義存儲取代,這是真的嗎?
如果是真的,如IDC和Gartner公司預測的,對虛擬服務器的需求將推動存儲容量需求的爆炸性增長,那為什么磁盤和存儲陣列的銷售沒有跟著增長呢,反而在縮減?
在下一個20年里,固態存儲會將真正取代所有的基于硬盤的存儲嗎?云存儲呢?
通常情況下,我盡量避免回答這類問題,因為大多數咨詢的人苦惱于驗證性偏差,而且他們幾乎經常想以確定的方式把一些數字加起來,以試圖理解某些現象。如果我的態度與他們已經存在的傾向一致,我就被認為是一個精通算法的人。如果我的觀點與他們的不相容,就被認為有點遜色了。
分析存儲趨勢和驅動力的算法的四個步驟
相對于存儲趨勢及其推動力,這四步是市場分析師們看起來遵循的基本的算法。
定理1:服務器虛擬化大張旗鼓,擠壓非虛擬的應用環境的市場空間。
定理2:服務器虛擬化用虛擬機hypervisor傾向于采用服務器端存儲資源,而不是共享的,不變的存儲網絡基礎設施如基本的SAN。
定理3:存儲市場往服務器端存儲架構轉變,再加上大量的存儲到存儲的復制(同步復制、異步復制)需求,推動存儲容量的需求,并且提高了收購存儲公司的必要。
定理4:未來的存儲銷售期望是越來越高,盡管也會看到來自對閃存的逐步增多的采用和高價值軟件在中心化的軟件定義存儲層的集中化導致的成本縮減。
我對以上分析師采用的算法的分析,表明以下問題需要考慮:
首先,我想知道服務器虛擬化是否實際上在增長,還有到底增長多少呢。IDC和Gartner聲稱虛擬負載數——即在一個服務器虛擬機hypervisor上實例化的虛擬機個數——每年增長大約45%,而且到2016年,我們將會有80%的服務器負載是虛擬化的。這看起來很不錯。
但以另一種方式來問——有多少物理服務器實際上運行著虛擬機hypervisor呢——從服務器虛擬化推崇者的角度來看,得到的結果并不那么令他們信服。具體結果如是:根據上面分析結果的同一個領先的行業分析,我們發現運行虛擬機hypervisor的物理服務器的個數增長相當的慢,從2009年10%到2012年的17%,并預測在2016年達到21%。從現在到2016年,這個運行虛擬機hypervisor的物理服務器數量有1.25%的年度增長率,但實際上是可以忽略的。
結合虛擬化負載的百分比和運行虛擬機hypervisor的服務器的百分比等年增長數據,我們必然得出結論:在2016年,21%的運行虛擬機hypervisor的物理服務器將處理所有服務器負載的80%(即虛擬化負載),同時,剩余20%的非虛擬化的服務器負載將運行在79%的物理服務器上。分析師們并沒有回答的問題有三方面:
什么應用將不會被虛擬化?
相對來說,這些非虛擬化應用有多重要或者多關鍵?
這些非虛擬化應用將生產多少數據量?
如果非虛擬化應用是代表業務中大多數關鍵任務的高性能事務處理系統的應用,且生產的數據是公司中最盈利的話,這些應用也許最適合在網絡化、硬連線、面向塊存儲的基礎設施比如光纖通道存儲區域網絡FC SAN上允許。所以,也許我們不能預測到SAN的沒落是因為它是實際被虛擬化的負載和沒有被虛擬化的負載兩者相互作用的結果。
所有的存儲都是本地的
這個算法的第二步說明,虛擬機hypervisor會優先管理管理本地連接的存儲設施,支持VSAN和其他服務器端存儲架構。這也許是真理或者錯誤的,但是實際上所有的存儲是直接連到服務器上的。并行SCSI是直連存儲(DAS)接口,而串行SCSI ,不管是FC,iSCSI或者其他協議,僅僅是有交換功能的直連存儲協議或接口。沒有一樣東西是真正的存儲網絡,至少兼容ISO網絡模型的存儲就不是。存儲fabrics如有交換功能的DAS,即形成存儲區域網絡SAN。而DAS如果具有瘦文件服務器設施就形成了網絡附加存儲NAS。所以,虛擬服務器不會使用任何非服務器端直連的存儲的想法是荒謬的。
即便這個想法是對的:虛擬機hypervisor在處理iSCSI或者FC的SAN方面的有困難。此想法,可以追溯到這樣一個概念:虛擬機遷移時,每次要遷移一個虛擬機,需要再次給虛擬機提供存儲,而這導致了虛擬機模版的剪切和粘貼技術的無用。用另一種說法,遷移后,需要通知應用給其提供路由到相對其服務器地址的存儲的指令,而這,至少很令人頭疼。
然而,如果把存儲虛擬化了,我們就可以操作虛擬卷,而這個卷包含此虛擬機的數據并且卷可以隨著虛擬機在物理服務器間遷移,同時自動調整到實際保存數據的存儲的最佳路由。因而,有了真正的存儲虛擬化,定理2也許就完全的失效了。也許我們可以聽到遷移到VSAN的需要,不是因為其必要,而是因為有些廠家想賣給我們新的功能。
不幸的是,存儲虛擬化軟件自從90年代末出現以來,其價值就受到所謂的軟件定義存儲SDS的廠商的挑戰。SDS擁躉聲稱SDS把以前位于存儲陣列控制器的有價值的服務匯聚到一個中心化的軟件層,以便這些服務部署后可以更容易的支持存儲方面的需求。
其最高目標是匯聚存儲容量作為一個虛擬卷提供給客戶,但是其目標缺乏存儲虛擬化提供的其他功能。這些其他功能提供如下好處:保護對現有存儲基礎設施的投資同時提供與軟件定義存儲SDS倡導者所宣稱提供的產品優點——服務匯聚能力。然而,可惜的是,此類討論實際上并沒有出現過。我個人懷疑,原因是虛擬機hypervisor的開發者們其實并不熟悉存儲虛擬化。
越來越多的復制需求意味著更多的存儲需求
定理3是絕對正確的。因為軟件定義服務器端存儲將會需要很多的數據復制因而推動存儲容量的需求增長。在任何很可能作為某個虛擬機的宿主服務器間的數據都可能需要復制。VSAN需要數據的兩份拷貝,盡管其專家宣稱為達高可用性需要三個副本。明白了嗎?這就是為什么IDC得出300%的容量增長預測的原因。Garter把備份和遠程站點復制的需求也算上了,預測出存儲容量增長達到650%。
定理4是說將來的存儲銷售額將會越來越高。但是投資不一定在SAN和NAS設施方面,而且很可能也不在傳統的磁盤方面。這里面真真假假,也許需要開辟另一個專欄來討論這個問題。肯定的是:存儲銷售收入并不能反映存儲需求的任何快速增長,但是其事實上表明了縮減的利潤,因為生產商進行了嚴謹的減價策略以達到他們的銷售額目標。
我對磁盤銷售數據的減少并不太感興趣,因為這表明了由服務器和PC機銷售的低迷、大量的其他庫存縮減,物流/供應鏈,貨幣成本等對市場造成的的壓力。固態盤和其他閃存元件有可能也會減少對存儲磁盤的需求,因為它們能以較少的硬件提供更高的IOPS。而且,不久以后,借助于價格大戰,經過洗牌就剩幾個主要廠家的時候,應該是對磁盤銷售影響最大的時候。無論如何,目前關于存儲預測的表述和意圖驗證其正確性的算法,本身就是有趣的但虛構的的。如果不在乎這些預測對于行業主導者意味著什么,也就沒必要覺得有意思。這會僅僅要求我們暫停懷疑,先買了再說。