曾經一度被認為是難以實施(即并不是完全不可能)的高性能云存儲正在成為某些企業IT部門中的實際存在。
現在有云存儲,有高性能存儲,但是是否真正存在高性能的云存儲呢?
長期以來,對于這個問題的回答是否定的。
“無論何時用戶把他們的基礎設施移出數據中心以外,總是會涉及延遲問題,這樣他們就不得不面對速度問題了,”總部位于馬薩諸塞州Milford的企業戰略集團的分析師Scott Sinclair說。“速度,似乎是個不小的問題。”
“如果那些用戶寄希望于他們的云供應商能夠提供高性能的云存儲,那么他們就要學會妥協,要么部分地放棄對高性能的要求,要么就只有選擇內部部署。但是,現在有越來越多的新興技術紛紛問世,它們可以讓用戶魚與熊掌兼得,也就是說用戶可以使用基于云的基礎設施運行IO密集型和對延遲敏感型的應用。
高性能云存儲可以讓企業用戶在受到云存儲限制所制約的云中運行高要求的數據庫應用。它不僅可以讓用戶實現應用的本地部署,而且能夠通過廣域網利用廉價的可擴展云存儲。最后,它能夠讓用戶在云中通過訪問私有數據中心中的存儲基礎設施實現重要的計算。
但是,與大多數的存儲問題不同的是,實現高性能云存儲的關鍵并不只是在于投巨資購買更多的硬盤或閃存設備,Sinclair說。當我們要解決速度問題時,新技術“需要依靠特定的創新來解決問題,”Sinclair說,即將數據部署在離計算較近的位置、或者引入某種形式的網絡優化或緩存機制。一些解決方案綜合了上述這三種方式。雖然這一新技術仍處于其發展的初期階段,但是一些早期的試水者已經得到了可觀的回報。
本地計算、云存儲
“一直以來,我們業內似乎存在著一個共識,存儲是一種成本較低的資源,如果需要更多的存儲資源,那么只需要去多買一些存儲設備就是了,”Sentinel Benefits &Financial Group 的COO David Scarpello說,這是一家總部位于馬薩諸塞州Wakefield的福利管理公司。“之后,我就逐漸意識到存儲其實并不便宜,之前的認知是非常錯誤的。”
Sentinel每年在購買額外的硬件、支持與維護、人員、備份、維持一個數據中心和災難恢復站點上的投入在25萬美元以上,公司維持的本地存儲資源約為40TB,那么其單位投入為六千美元/TB。“這是一筆巨大的投入,”他說,那么這么做的意義何在?
“存儲是非常重要的,它會讓我們感到安全,但是這并不是我們真正想要有大投入的方向。”
與此同時,公共云供應商提供的存儲資源足以媲美消費類硬盤。亞馬遜網絡服務(AWS)所提供的簡單存儲服務(S3)的定價為每月每GB 3美分起——這適用于較多容量較低訪問頻率的應用,或者托管復制TB級的存儲服務為每年240美元。
但低價高容量存儲服務是基于對象存儲的,其性能表現并不穩定,有時可以表現良好,但是在跨廣域網進行訪問時其速度之慢簡直令人難以忍受。因此,眾多IT企業所面臨的挑戰是如何在用好云可擴展性和低成本這兩大優勢的同時,還能保持較高的性能表現。
對于Sentinel來說,一個潛在的解決方案就是使用總部位于波士頓的初創公司ClearSky所提供的數據緩存與加速工具,這個工具包括了一個本地緩存設備和一個位于入網點(POP)位置直接連接至高容量公共云存儲服務的孿生設備。通過在本地對熱點數據進行緩存和使用專用低延遲連接來訪問云計算,用戶們能夠針對本地計算應用充分利用好廉價的云存儲服務,而且還不會犧牲性能表現。
在最初的發布版本中,ClearSky向其位于波士頓、費城和拉斯維加斯POP以外的客戶承諾,他們的IOPS指標可以接近于本地用戶,其延遲時間低于2毫秒。這個計劃就是要增加其地理分布,為更多的云存儲供應商提供支持,ClearSky數據公司的聯合創始人兼CEO Ellen Rubin說。
Sentinel已經開始通過ClearSky向AWS遷移了約7TB的測試和開發數據,相關開發人員對此全無怨言。在理想情況下,公司將會逐漸地遷移它的所有數據,從而省去支付給NetApp每月五千美元的維護費用,同時還不需要實施備份和異地災難恢復。
云和云存儲
如果用戶正在云中運行一個對延遲敏感的數據庫應用程序,那么最佳實踐建議使用云計算供應商的塊存儲產品,例如AWS的彈性塊存儲(EBS)。這類服務曾經對于大型數據庫工作負載來說就如同墓地喪鐘一般,因為其運行性能會受到有限IOPS和更小容量存儲單元的極大影響。
當房地產數據公司的母公司——國家房地產公司在2012年宣告破產時,它不得不快速地針對它的數據中心作出決策:選擇另一家數據中心、租用托管空間或者選擇云。
“做出這樣的決定是頗費思量的,其中選擇云是最具經濟意義的,”這家總部位于伊利諾伊州Naperville的企業的經理Craig Loop說。
首先,房地產數據公司匆忙對其應用進行了遷移,但是對其40TB的圖像數據庫卻猶猶豫豫地從EMC存儲陣列遷往云。S3的延遲時間和性能表現是無法讓用戶接受的,這就意味著應當對其內部應用程序進行重新開發以支持對象存儲方式。
“即便是使用Shim,我們也無法讓它正常工作,”Loop說。同時,AWS的EBS也不是一個真正的可選項,因為在當時EBS支持的存儲硬盤區容量只有區區1TB。“EBS就成為了管理人員的一個心病,” Loop說。
在得到云咨詢公司RightBrain Networks的幫助后,房地產數據公司使用了一個Zadara 虛擬專用存儲陣列(VPSA),這是一個毗鄰云數據中心的專用單租戶存儲服務,兩者通過光纖鏈路連接,其購買模式為所用即所付。Zadara的VPSA使用了與我們所熟悉的SAN和NAS相類似的接口,開發人員認為其存儲性能與一臺內部部署的EMC存儲陣列相同。Zadara與其他云供應商合作推出了VPSA服務 ,而其本地部署版也采用了與云類似的所用即所付的消費方式。
本地云塊存儲服務供應商也提升了他們的競爭硬實力。例如,AWS EBS現在可支持的存儲硬盤區容量已高達16TB,而采用固態硬盤備份的EBS布建IOPS硬盤區可提供高達每區20000的IOPS。不過,雖然這樣的技術指標已經足以應對很多數據庫工作負載了,但是還是有些工作負載是它們無法承擔的。
Lawter公司是一家總部設在伊利諾伊州芝加哥市的特種化學用品公司,這家企業于近期將其SAP和SharePoint基礎設施遷往了Dimension數據公司提供的一個公共云服務,它選擇Zadara VPSA的原因是它需要確保它的SAP環境能夠具有最低20,000的 IOPS。“Dimension數據公司的標準存儲服務無法滿足我們對于IOPS的要求,”該公司的全球網絡和虛擬化總監Antony Poppe說。
同時,傳統的存儲廠商也看到了他們在云計服務供應商那里的大商機。不僅一些云塊存儲產品無法滿足IOPS和延遲性的需求,很多云用戶也紛紛表示在多租戶環境中飽受“IOPS競爭”(與其他租戶競爭IOPS資源)之疼,EMC公司彈性云存儲產品營銷總監Varun Chhabra說。
讓云和專用存儲設備兩者相結合就能夠實現可預測的性能表現。
同時,針對基于云工作負載使用專用存儲設備也能夠讓一些企業用戶感到放心,Virdata公司業務開發、渠道和合作伙伴負責人Catherine Van Aken說。Virdata公司是一家為物聯網(IoT)應用程序開發大數據與分析平臺的企業,它的平臺是基于運行在NetApp FlexPod融合基礎設施上的OpenStack的。
“并不是所有的客戶都對使用公共云做好了準備,”Van Aken說。“這個市場正在經歷從無到有的發展歷程,但是隨著時間的推移市場還是最終會選擇云計算的,”她說,援引IDC的一個預測,在五年內九成以上的物聯網數據都將在云中托管。通過這中方式,Virdata公司為其客戶提供了一個階梯式的漸進方法,從而實現從全內部部署環境到在云中計算(存儲設備在一邊)的轉變。
此外,在云中使用專用存儲設備可為管理人員提供熟悉的管理方式,Data Fabric集團NetApp副總裁Phil Brotherton說。他說:“即便計算是在云中進行的,但是數據還是存儲在專用存儲設備中的。”數以百計的NetApp客戶擁有著NetApp專用服務器,它們可提供媲美“近乎云”的高速度和低延遲性能,其中包括了AWS、微軟Azure、IBM Softlayer以及阿里巴巴集團,Brotherton說。
云、本地存儲
但是,對于一些企業來說,云中的任何存儲都是難以接受的。數據容量越大,對于本地存儲基礎設施的投入也就越大,或者考慮到企業行為規定過于嚴格而完全不會考慮把數據置于云中。
但是,計算則是另一個故事了。有很多應用場景是企業可能想要在云中運行應用,但把其數據保留在企業內部,一家主要從事數據與應用去耦合化工作的初創公司Velostrata 的CEO Issy Ben-Shaul說。他們可能想要使用云的計算資源實現應用程序現代化,以供測試或開發使用,或者應對使用率高峰的出現。同時,把數據保留在企業內部可以實現投資保護、滿足合規性要求,或者實現在不同云中的應用遷移以免受制于某一云供應商,而且不需要對他們的數據存儲做出任何修改。
“對計算和存儲實現去耦合化有著很大的影響,” Ben-Shaul說。
除了切斷存儲與計算之間的連接以外,Velostrata軟件流和換成應用都要從本地存儲映射至云計算。它包含了兩臺虛擬機:一臺運行VMware vCenter控制對本地存儲的訪問以供讀寫操作使用,而另一臺在云中與正在運行的計算過程進行通信,并與監控引擎集成。“整個想法就是要與云無關,并且允許虛擬機能夠在目標云環境中實現本地運行,” Ben-Shaul說。
企業戰略集團的Sinclair預測,存儲業將繼續提出創造性的解決方案以便于推出高性能云存儲。根據其研究表明,使用外部云資源是IT企業在2016年的首選。
“很顯然,這是一個大金礦,但是同時,你必須要解決這個速度的問題。”