典型的數據存儲和管理的“企業級特征”在IT架構創新上不斷推成出新。存儲架構師意識到這些特征對于關鍵業務和生產應用非常重要,但目前的云計算還缺乏這些特征。本篇白皮書的目標是描述企業云計算中存儲必備的6個要素。
一、要素1:性能
性能需要付出成本。在一個架構良好的應用里,性能和成本處于平衡狀態。達到這點的關鍵是使用合適的技術去匹配企業業務應用的性能,首先要求將企業的業務語言轉換成IT模式。因為這種轉換困難,通常企業止步于靜態的IT架構,無法應對業務變化著的性能需求。企業云計算提供了一個更能應對變化著的性能需求的平臺。
在早期的云計算平臺里,存儲I/O一般都會有較高的延遲。這是因為廠商注意到使云計算的數據更容易訪問,但沒注意到提高與性能、帶寬和IOPS相關的服務級別。有兩個原因導致延遲較高:訪問的模式和類型,以及存儲分布的配置。
訪問模式包括位于OSI模型物理層之上的多層協議的組合(如SOAP, NFS, TCP, IP和FCP)。數據訪問包括共享的物理服務層(如以太網)和幾個協議層(如SOAP或NFS),一般比專門的物理層(如FC)產生更多的延遲。市場上大多數云計算平臺包括Internet的數據訪問,產生了更多的數據訪問延遲。
對于存儲介質,大多數云計算的市場在RAID或JBOD配置中使用SATA磁盤。因為SATA(有段時間被視為近線磁盤)的性能一般比企業磁盤(一般指FC盤)稍差一些,導致存儲設備的性能低于應用的需求。
當你采用低性能存儲介質的相對低帶寬和高延遲的訪問模式時,使用整個存儲子系統的企業無法支持更多的關鍵業務應用的需求。其結果是,這種方案通常僅適用于測試和開發。
相比來說,企業云計算平臺需要提供更多不同性能存儲層的選擇。當性能需求的變化時,例如,應用從測試遷移到生產環境,存儲平臺應該能使用這種變化。理想的企業云計算的存儲應該有多種性能區,能夠被調整,以提供合適的I/O性能級別給業務性能的需求。
最后,為了滿足企業高端存儲的性能需求,云計算方案必須采用高于或者目前正在使用的企業級技術。一般使用FC SAN。此外,如何使用技術與技術本身同等重要。在一個系統管理環境里,企業級需求下的虛擬機配置必須能夠持續提供高性能
二、要素2:安全性
安全性和虛擬化通常被視為相互矛盾的。畢竟虛擬化使得應用從物理硬件和網絡邊界中解放出來。安全性,換而言之,就是建立邊界。企業需要考慮虛擬化設計的初始架構。
在大多數云計算市場里,無論公有的還是私有的,數據安全性都是基于信任的,這信任通常都在管理程序里。當多數虛機共享物理LUN,CPU和內存時,由管理程序確保數據是否毀壞或者被錯誤的虛機訪問。這與集群服務器多年來面臨的基本挑戰相同。任何也許需要接管進程的物理服務器必須能訪問數據/應用/操作系統的權限。例如,為了主機外備份,LUN也許需要映射給公共的備份服務器。
在企業云計算中,有兩種方式去保護業務數據。第一種涉及系統程序管理安全。主要的目標是:系統盡可能少地被使用,避免任何虛擬機被其他虛擬機造成負面的影響。企業也需要保護LUN被其他服務器訪問,如同主機外備份服務器。
其他需要注意的地方是數據通道。企業必須注意只能給需要維護必要功能的物理服務器提供訪問路徑。這可以通過NPIV(SAN N端口 ID虛擬化)使用得Zoning、LUN Masking、訪問列表、權限配置來完成。
三、要素3:自動ILM存儲
信息生命周期管理(ILM)曾經成為非常有效的市場行為的重心,被那些出售分層存儲的廠商所推崇。雖然ILM本質上非常簡單 - 存儲的成本與數據的業務價值相匹配,實際的挑戰來自于真正的執行效果,眾多所謂的ILM方案,粒度都不夠細,難以達到這樣的目標。
今天,傳統的ILM并沒有部署到市場上的大多數云計算平臺中。原因有兩個,第一,在許多云計算中,大部分磁盤介質采用處于典型ILM方案中的最低層存儲,這樣就沒法把數據往更底層遷移,ILM也就無法部署。第二,許多企業不需要為云計算常用的計算類型而更長時間地管理數據,因為傳統云計算通常用于功能測試/開發、概念驗證(POC)、Web服務器測試等。考慮到多種因素,實施ILM策略所需細粒度的復雜性和成本與經濟節省的云計算不相符。
根據一些行業報告,70%的數據是靜態的。通過將合適的數據存儲在合適的介質上,企業能削減成本。他們能意識到通過部署云平臺能節省成本,在云計算中實施ILM帶來的經濟效益意義重大。但前提是無需中斷應用,而且不能增加不必要的操作復雜性。
為了做到這些,企業必須使用基于策略的塊級ILM方法,無論訪問方式和應用類型。通過在數據塊一級跟蹤數據的屬性,就無需在操作系統這一級執行數據歸檔或數據遷移。這種方法還能獨立于操作系統類型,且獨立于用于存儲數據的訪問方式。它不僅在保持性能(所有的數據寫入都在高速層完成)的同時優化存儲的成本,而且通過將不使用的數據塊沉淀到低速層減少電能的消耗。這很合理,因為近線存儲僅消耗企業存儲的大約20%的能耗。為此,要做到真正適合企業級應用的自動分級存儲,卷級或文件級數據遷移無法勝任,顆粒度必須細化到數據塊級。只有數據塊級的數據遷移才可能獨立于操作系統類型,且獨立于存儲數據的訪問方式,做到對應用支持的隨需相應。
四、要素4:存儲訪問模式
訪問存儲空間有三種主流方式:基于數據塊(FC SAN或iSCSI)、基于文件(CIFS/NFS)、或通過Web服務。基于塊和文件的訪問方式在企業應用中最常見,能更好地控制性能、可用性和安全性。在這點上,市場上大多數云計算平臺利用Web服務的接口,如SOAP和REST(代表性狀態傳輸)訪問數據。雖然,這是最靈活的方式,但有性能的影響。理想的情況是,企業云提供全部的三種訪問存儲的方式來支持不同應用架構。
五、要素5:可用性
IT架構的維護窗口被大量的縮減,因為企業需要支持在不同時區的用戶并保證全天候的可用性。雖然服務級別協議(SLA)一般與可用性密不可分,從業務角度看,它難以衡量,因為有著多種架構的復合SLA的重疊。
在前面提到,在市場上大多數云計算平臺中,I/O性能最先得到考慮。如果云平臺依賴于不被內部IT集團管理的部分架構,那么冗余的架構部分和途徑是減少停機風險的最佳方式。雖然,云存儲服務提供商在考慮成本的同時繼續增加可用性,但是目前市場上的服務級別協議不能滿足企業關鍵應用的需求。
在高端的企業級云計算中,存儲系統夠出來企業內的企業級存儲方案,包括多路徑、控制器、不同的光纖網、RAID技術、端到端的架構控制/監控,和成熟的變更管理過程。在低端的企業級云計算中,存儲可用性與今天市場上云計算平臺的服務水平相當。為了提供企業需要的服務水平,企業級云存儲供應商必須利用健全的架構設計和被充分驗證過的創新技術。
六、要素6:主數據保護
主數據指的是在線運行的數據。主數據能夠采用單一技術,或者結合多種技術進行保護。一些常用的方法包括:RAID保護、多份拷貝、遠程復制、快照、和持續數據保護。
在市場上大多數云計算平臺里,主數據保護的問題常常留給用戶。今天,很少發現上述的方法在大眾云計算平臺中使用,因為技術的復雜性和成本。有一些大眾云存儲方案通過維護數據的多份拷貝來保護主數據,整個系統運行沒有RAID保護的存儲里,以此降低成本。
企業級云的主數據保護應該基于內部企業級方案。當方案的業務影響分析(BIA)需要時,例如快照和容災等可靠的技術應該就緒。
內部企業方案和企業云存儲的主要差別在于,主數據保護在方案中是如何綁定的。為了延續根據需要部署云環境的經驗,各種選項必須打包,這樣服務能自動部署。其結果是,將一系列綁定的選項打包,能夠應對大量需求。也許不存在可以利用快照、遠程復制等與客戶需求相匹配的技術。無論如何,多數用戶將意識到,常常需要犧牲靈活性去獲取在企業云中其它的管理好處。