隨著服務器虛擬化的廣泛應用,云計算技術已經成為效用計算的下一個發展方向,在云計算時代,我們能夠像使用電力資源一樣消費計算資源,并且按需付費。云存儲的應用則脫胎于Amazon的S3服務(Simple Storage Service),而且很快就被其他服務運營商所效仿。然而,較差的性能以及出于對安全問題的擔憂始終籠罩著云存儲,讓它的眾多優點黯然失色,同時也阻礙了這項技術進入主流的企業級市場。云存儲最早的一批用戶主要是創業型公司、開發團隊以及消費類用戶。不過,“云存儲”自身也在不斷發展,并且有望成為數據中心應用的一個有效補充。
天性保守的企業IT管理者認為使用公有云存儲風險太大。但是,這種傳統的認識正在悄然改變,并非是因為人們改變了對公有云存儲安全問題的看法,而是因為內部私有云存儲的出現。私有云提供了將企業關鍵數據應用安全地擴展到外部公有云存儲服務的解決方案。隨著云計算及相關技術熱潮的來臨,客戶的關注度不斷提高、各種分析預測和新聞報道也大量涌現,這一切都顯示出云計算市場已經步入重要的轉折階段,不久之后我們就能見到,企業客戶采納云存儲的步伐會越來越快。
云存儲的定義
對于廠商來說,把他們的技術與熱門的云計算應用捆綁在一起,提高關注度,無疑是巨大的誘惑。而將原有產品簡單的重新命名為“云XX”則是常見的手段。但通常情況下,我們不能簡單地把傳統的SAN和NAS設備看做云存儲,因為它們提供的是共享模式的存儲資源。“SAN實際上并不具備云存儲的特點--動態性、彈性與靈活性。云存儲可以隨時、隨地的隨需訪問,而SAN系統則通過Zoning分區,使用WWN(world wide names)地址。本質上SAN的應用是靜態的。”ESG高級分析師Terri McClure說。傳統的垂直擴展模式的SAN和NAS產品更是如此。而有些采用Scale-out橫向擴展架構的block協議存儲設備,如3PAR公司的InServ Storage Server,可以實現自動優化和負載均衡,在SAN層面實現負載的動態分配;橫向擴展的NAS產品也大同小異。不過,即使能夠橫向擴展,SAN和NAS也并不適合做大規模公有云存儲應用。
真正的云存儲產品應該具備如下特點:
- 通過網絡訪問
- 可共享
- 以服務的形式銷售,并且按需付費
- 具有非常大的彈性,容量可以動態縮減或者按需增長
- 系統規模可以按需擴展或者縮減
目前,云存儲主要用于保存非結構化數據。非結構化數據是增長速度最快、最多也是最難管理的數據類型 .云存儲技術并不適合結構化數據應用,比如數據庫。因此,結構化數據應用的主要平臺還是傳統的企業級存儲設備。
云存儲的好處
對于非結構化數據應用來說,使用云存儲的好處顯而易見--存儲的總體成本更低。云存儲屬于一種服務,因此不需要采購、管理和維護存儲硬件設備。根據服務類型的不同,云存儲即使不能完全消除成本,也能夠大幅降低數據中心的成本和存儲管理員的負擔。使用云存儲服務還可以避免昂貴的技術升級開銷,這種技術升級一般3至5年就要進行一次,有的是為了獲得最新的技術,有的只是為了給舊存儲設備購買代價不菲的維保服務。
為了滿足預期的數據增長量以及處理應用峰值的要求,傳統存儲系統往往需要預留大量的空間資源。云存儲應用通過削減這部分閑置的空間資源,通常能夠達到接近100%的存儲資源利用率。除了降低存儲的總成本之外,云存儲的可擴展性,以及從基本應用到峰值負載的線性處理能力,都是其引人注目的特點。
公有云存儲
目前,公共云存儲服務商的數量在快速增長,包括AT&T、Amazon、Iron Mountain、Microsoft、Nirvanix、Rackspace Hosting等許多公司。他們使用的存儲架構通常由低成本的存儲節點附加直連的消費級硬盤組成,通過基于對象的存儲堆棧管理進行跨節點的數據內容分發。對云存儲的數據訪問一般使用Internet協議,常見的協議是REST(Representational State Transfer),少數情況下會使用SOAP(Simple Object Access Protocol)。在云存儲上,每個數據對象至少同時在兩個節點上保存,以獲得最佳的可恢復性和冗余度。云存儲服務的基本收費模式一般以“X美元/GB/月”為單位進行計算,各服務商的收費模式略有差異,也許會有一些附加費用,包括按數據傳輸量計費以及網絡接入費用。
海量的多租戶安全應用是公有云存儲設計的基礎。在云存儲平臺中,每個客戶的數據以及所進行的訪問都是相互隔離的。公有云存儲上可存放的數據類型非常廣泛,從靜態的非核心應用數據、需要在線保存的歸檔數據、到備份數據和容災數據等等。而對那些隨時會發生改變的活動數據,云存儲并不適合。企業用戶對云存儲應用最主要的擔心是安全問題,其次是性能問題。
私有云存儲
私有云存儲系統通常運行在企業數據中心內部的專用硬件設施上,它不但具有同公有云存儲一樣的優點,還能夠解決安全性以及性能這兩個最關鍵的問題。私有云存儲的用戶(租戶)通常只有一個,即使是大型企業,也僅僅是利用多租戶的特性,將不同部門或分支機構的訪問進行隔離。與公有云存儲相比,私有云存儲系統對擴展性的要求不高,因此私有云存儲引擎的后端連接的很可能是傳統的存儲硬件設備。有個恰當的例子可以說明這一點,HP的CloudStart平臺就是由HP BladeSystem Matrix刀片服務器、HP StorageWorks EVA系列磁盤陣列以及Cloud Service Automation(CSA)軟件整合而成的私有云存儲架構。HP的CloudStart本身不是私有云存儲,因為它缺乏一個關鍵的元素,即“以服務為基礎”;不過,HP自己或他的合作伙伴都可以使用這套基礎設施,這些企業甚至可以把CloudStart當做一個具備完善管理功能,隨用即付費的云存儲產品提供給客戶。
另一個私有云存儲的例子是HDS的Cloud Service for Private File Tiering(面向私有文件層的云服務),一個源自HCP(Hitachi Content Platform日立內容平臺)產品的私有云存儲系統。HDS的私有云存儲設施放在客戶的數據中心里,但它歸Hitachi所有,并由Hitachi負責管理。除了初始安裝費用之外,用戶只需按照使用的空間支付費用。類似的產品還有Nirvanix公司的hNode,同樣在企業數據中心提供私有云服務。hNode也能提供完善的管理功能并采用隨用即付費的銷售模式。Nirvanix的技術架構叫做SDN(Storage Delivery Network),跟HDS的很相似。
混合云存儲模型
雖然私有云存儲的出現化解了用戶對公有云應用性能和安全性方面的擔憂,但是對于非結構化數據應用來說,私有云的必要性不大。首先,私有云存儲系統在設計上并沒有利用已有的存儲設施。事實上,構建它有一定的前提,需要數據中心的場地、電力、機架空間以及冷卻系統。私有云存儲運行在專用的硬件平臺之上,因此也不可能擴展到像公有云存儲那么大的規模。大多數的非結構化數據是靜態不變的,很少使用,因此沒有必要在數據中心本地部署前置設備或私有云。
因為這個原因,混合云存儲應運而生。混合云的形式一般以傳統存儲系統或私有云存儲為主,公有云存儲作為補充。然而,一個理想的混合云存儲平臺必須滿足幾個關鍵的條件:首先,混合云存儲的整體表現必須均衡,除了會產生一點網絡延遲之外,訪問公有云上的數據應該是無縫透明的。此外,數據遷移的機制必須保證活動的和經常訪問的數據能夠快速被訪問,而靜態數據則被推向云存儲。因此,混合云一定要有智能的引擎,用來定義數據的移動策略,即何時推向云,以及何時從云端遷移回來。
實施混合云存儲,主要通過三個途徑:
- 利用云存儲軟件,將本地存儲和公有云存儲整合在一起
- 使用云存儲網關設備
- 通過應用程序集成
基于軟件的混合云存儲架構
目前,在不使用網關設備,用戶也不能自己動手集成的情況下實現混合云存儲只有一種可能,就是通過在私有云和公有云存儲上運行一套軟件,將兩個存儲系統結合在一起,構成一個單一的非對稱存儲云。相關技術的標準化工作正在積極地制定過程中,比如SNIA(Storage Networking Industry Association)定義的CDMI(Cloud Data Management Interface)。如果缺乏統一的技術標準,集成這種非對稱的云存儲是無法實現的。因此,我們看到,云軟件廠商把他們的產品銷售給硬件制造商以及服務運營商的產業模式是創造混合云的必要前提。同時,還有些云存儲廠商把他們的硬件堆疊打包并以私有云存儲的名義推向市場,這種產品一般可以跟他們的公有云存儲服務方便地進行集成。
后一種類型的典型代表是Nirvanix.直到不久之前,Nirvanix還只能提供純粹的公有云存儲服務,但在該公司發布hNode私有云存儲產品之后,用戶現在既可以在企業內部使用Nirvanix的云存儲系統,又可以根據需要補充Nirvanix Storage Delivery Network公有云存儲。
Rackspace公司此前提供基于云文件系統(Cloud Files)的公有云存儲服務,現在,它把自己的Cloud Files轉為開源項目,并創建了OpenStack.org以推進該項目的標準化進程。Rackspace試圖建立用戶端到服務運營商之間的混合云架構,就像他們之前提供的公有云存儲服務一樣。
以前,構建一套云存儲服務平臺只有兩種選擇:要么自己開發解決方案;要么使用開源的云存儲軟件,比如Luster或MogileFS,但使用開源產品的同時也必須接受它的特性和局限性。最近1、2年,商業化的云存儲軟件越來越多,相關廠商也都把企業級用戶和運營服務商作為目標客戶。
在目前可用的商業化產品之中,EMC的Atmos是最突出的一個。Atmos是一個以軟件為核心,支持硬件跨平臺,基于對象的堆疊存儲系統。它的結構包括三層松散耦合的服務進程:表示層提供客戶端接口,包括REST、SOAP和傳統的文件系統協議;元數據管理層決定數據對象保存在哪個存儲節點,以及數據冗余保護和分布的策略;最下面的存儲層是存儲節點的接口。Atmos可以運行在專用的硬件或VMware虛擬機之上。作為一個使用scale-out橫向擴展架構的系統,通過簡單的增加存儲節點,最大可以擴展到PB級的存儲規模。EMC通常向企業級用戶和運營服務商推銷Atmos,在客戶端部署的前置系統能夠同Atmos云服務相互綁定。
EMC最大的客戶是AT&T.AT&T的Synaptic Storage是虛擬的私有云。然而,作為混合云存儲,它的模式與其他公司的產品差別很大。Synaptic Storage運行在AT&T自己的數據中心內,客戶卻可以通過AT&T的MPLS網絡訪問該系統。通過這種方式,AT&T將私有云的安全性和高性能與公有云的經濟性和擴展性很好的結合在一起。
除了EMC的Atmos,還有幾種云存儲軟件產品值得我們介紹。Caringo公司的CAStor Content Storage Software軟件是一個定位于CAS(content addressable storage)內容尋址應用的云存儲產品解決方案。Cleversafe公司的云存儲平臺則利用IDA(information dispersal algorithms)算法將數據切片,并分散保存在云存儲平臺的多個節點上,這樣可以降低數據復本的需求。Cleversafe宣稱與那些為了保證冗余度而必須在存儲節點上保存多份數據拷貝的產品相比,他能做到更高的存儲資源利用率。
混合云存儲網關
云存儲網關位于企業內部的存儲系統與公有云存儲之間。它的主要功能是將傳統的存儲協議轉換成專用的云存儲協議和API.以前,公有云存儲只有在和應用定制集成之后才能被訪問。現在,通過云存儲網關,企業內部存儲上的數據就可以遷移到公有云存儲上,反向亦然,這通常取決于策略引擎的設置。
各廠商提供的云存儲網關之間的差別主要體現在幾個方面,首先要看產品是基于block協議還是基于文件協議,這決定了它們在企業數據中心的角色,是塊存儲設備還是NAS裝置。數據去重和壓縮功能是云存儲網關的關鍵特性,因為這兩種功能對云存儲的使用成本影響非常大,而且傳輸過程中和云存儲端的數據加密是非常必要的。有些網關對備份和歸檔應用做了特殊的設計和優化,有些則與Microsoft Exchange和SharePoint之類的應用緊密集成,還有的產品被設計成交易處理型的存儲結構中的一層,作為企業內部存儲的補充。
與應用集成的混合云存儲
所有的公有云存儲服務都提供API,以便私有云存儲軟件和云存儲網關與其進行互聯。但這些API也可以直接被應用程序調用,實現應用程序與公有云存儲的集成。云存儲API能夠幫助企業內部應用或商業應用系統通過REST接口充分利用公有云存儲的資源。
舉個例子,備份軟件廠商已經開始在他們的備份產品套件中提供對公有云的支持。比如Symantec的NetBackup和Backup Exec,以及CommVault的Simpana備份軟件都可以同公有云存儲集成。
企業級客戶的態度--樂于接受云存儲
過去,企業級用戶在很大程度上是遠離云存儲應用的。不過,隨著私有云存儲的出現,以及企業內部存儲應用逐步附加了安全集成公有/混合云存儲的功能,企業安全地將現有存儲應用擴展到云存儲之上已經變得越來越現實。
最近云存儲被熱炒,不過主要是在消費、移動應用領域,以及像Google、Dropbox之類的公共云服務。根據Gartner的估計,即使再過5年,主流的企業級用戶也不可能完全采用云存儲。但在此期間,企業級用戶很可能策略性地增加一些混合云存儲作為他們現有存儲設施的補充