信息技術(IT,Information Technology)發展至今天,相信大家都已經明白,其最根本的實質就是和數據打交道--CPU用來處理數據,內存用來暫存數據,硬盤/存儲系統用來保存或備份數據,光盤/磁帶用來歸檔數據,只不過在這些IT設備上,數據的狀態(高速生成、變化還是靜止保存)不一樣而已,也因此有些廠商將如今的時代定義為數據技術時代(DT,Data Technology),從某種角度上講,的確有一定道理,當然在我眼中,并沒有超過IT時代的頂層設計。
為什么說DT不如IT高級,原因就在于信息是數據的提煉、濃縮與精華,原始的數據通過相關的應用進行更新,在以CPU+內存為核心的處理系統中與其他數據進一步產生交集,進而為人類提供更為有價值的信息,它才是真正為人類所需要的,也是真正為人類所服務的,可是它所存在于世的狀態可能并不是由01組成數據,而是給決策者或使用者的啟發且不會存放于IT系統中,顯然--信息并不等同于數據,雖然它在很多時候可以以電腦數據的形式存在。當然,有關這個話題并非本文的重點,就止打住。
但不可否認的是,信息的提煉需要以數據為基礎,這個數據基礎平臺的堅固性與可訪問的性能,也將影響到上層信息的提取與處理速度,這個道理其實很簡單,在IT誕生之初,或者說在馮-諾伊曼計算機體系架構確立之后,數據的存儲與整體系統性能之間的關系就也就已經固定了。只是,當處理系統的速度還不夠快,或者當數據量還并不大的時候,存儲與計算之間的瓶頸與矛盾并不明顯,然而,現在不同了。當IT越來越成為人類生活、工作、生產之必需時,企業也就越來越離不開IT,換句話說,IT正進入越來越多的企業經營與生產領域。另一方面,隨著互聯網的普及,它與越來越多的傳統IT產生了交集, 并隨之帶來了海量的數據,它們需要更大的存儲空間,而CPU與內存的發展也日新月異,這一切都讓作為數據基礎平臺的存儲系統承受著越來越多的壓力。
傳統行業企業的數據存儲到底怎么變?如何在新的IT時代,保持數據基礎平臺的不掉隊,以進一步支撐起企業的經營與生產需求,對于很多很早就購置了存儲系統的企業來說,都是一個愈加不可回避的話題。
有人可能會說,跟著互聯網公司走呀,看他們的IT多厲害,哪家傳統行業的企業的IT需求能比得上他們?話是這么說,互聯網企業在在面對海量數據方面,的確有一手。但在我看來,就如工作技能上的隔行如隔山,在IT領域也是如此,不同行業對于IT的需求也大相徑庭,不是所有的企業都適用于互聯網的IT架構,因為他們所依賴的行業應用、他們的IT人員的技術技能與知識結構,往往不允許也不支持底層架構的脫胎換骨般的調整。況且他們又并非像互聯網公司那樣以IT為核心競爭力,所以對傳統的存儲架構進行優化與升級,才是最佳的選擇。
那么,傳統企業的傳統存儲架構又是怎樣的呢?答案很明顯--以集中式共享存儲為主流,這對于非互聯網企業來說,仍然是最省時省力的一種選擇。雖然集中式存儲廣受互聯網公司的鄙視,但以業務特點來分析,它對于絕大多數,數據量不大或數據增長量率遠沒有互聯網企業那么瘋狂的用戶來說,在很長一段時間里,的確是較為理想的架構,并不需要徹底變革。尤其是比較敏感、關鍵的應用平臺,如ERP、核心數據庫等,在現有的集中共享式存儲架構之上進行升級改造,應該是首選。
從IBM的SVF看傳統存儲改造的三大要點IBM的SVF這一提法出現的時間并不長,它并不是一個新的產品或技術,它在IBM的官方網站上也沒有專門的介紹, 其實它更像是一種用戶經驗的歸納,簡單來說就是IBM三大產品線的組合:Storwize磁盤存儲+Virtualization存儲虛擬化+Flash閃存存儲。
為什么要把這三大產品線組合起來,也緣于越來越多用戶的最終選擇,從中我們可以總結出一些規律。筆者認為,IBM的SVF似乎也代表了傳統存儲改造的三大要點,如果也用英文表達,同樣是SVF,但我將其換成了:Software-defined(軟件定義)、Volume(容量)、Fast(速度)
一、軟件定義:存儲資源虛擬化整合這一點源于Virtualization,即存儲虛擬化,但并不僅限于此。在IBM SVF的組合中,存儲虛擬化的前身就是大名鼎鼎的SAN存儲卷控制器(SVC,SAN Volume Controller),現在則成為了IBM軟件定義存儲(SDS,Software Defined Storage)家族Spectrum中的一部分,即Spectrum Virtualize Software,也就是說它把SVC的精華提煉為單獨的軟件產品,成為了SDS的一部分,所以說它是軟件定義存儲并不為過,這也是為什么我將它表示為SVF中的S的原因。而在IBM的SVF理念中,Spectrum Virtualize以V表示,即強調了它的了虛擬化的能力。
對于歷史悠久的SVC,相信很多人都非常清楚,我也就不再多言。其核心的作用與現在流行的VSAN(虛擬SAN)很相像,只是VSAN是將分布于集群內各服務器上的硬盤/閃存虛擬成一個大的虛擬SAN,SVC則是將不同存儲廠商的SAN系列,整合為一個大的虛擬SAN,這也是其SAN存儲卷控制器名稱的由來。而對于數據訪問,即服務器一端,SVC也支持當前主流的計算環境,包括已經基本成為常態的虛擬化環境,確保整體應用環境的兼容性。
總而言之,Spectrum Virtualize為傳統存儲系統的改造提供一個基礎的軟件定義的平臺,其根本的用意在于可以將傳統存儲架構中,可能分散、相互獨立的SAN存儲資源進行有效的整合,從而更有效的利用存儲資源,以降低成本,這可以說是傳統存儲系統改造的一個基礎。
IBM SVC(Spectrum Virtualize Software)支持所有主流的應用環境,并可虛擬化整合主流的SAN存儲資源
除了能整合異構SAN存儲卷(不同廠商的SAN架構),并可在異構存儲系統間移動數據,而不造成數據破壞這一關鍵的虛擬化能力之外,多年發展下來的SVC(Spectrum Virtualize)在其他方面的能力也不容忽視,比如利用 IBM Real-time Compression 將可存儲的主要活動數據容量提升多達 5倍;使用 IBM Easy Tier自動優化包括閃存在內的分層存儲; 利用創新的復制技術,提高遠程鏡像網絡利用率;實施多站點配置,以實現高可用性和數據中心之間的數據移動;可對現有的存儲池中的數據進行AES256等級的加密,以大幅度提高數據安全性。對于這最后一點我認為也是非常重要,畢竟互聯網的普及也讓企業的數據安全性日益受到高度重視,把存儲系統改造的一個重點定為安全(Security)也并不為過,而這也可以說是IBM SVF第一個S的另一層含義。
二、容量:靈活的擴容數據的不斷積累,所帶的問題之一就是必然的容量擴展,這基本上是遲早的事情,但互聯網的普及,讓這一進程明顯加快了,傳統行業的企業也無法獨善其身。這就需要有一個長遠的且靈活的擴容準備。
一談到集中式共享存儲 ,很多人就會想到"高大上"的高端SAN存儲,對它們進行擴容總會與高昂的成本相掛鉤。其實在傳統企業中,采購這類存儲的也不并不多見。更主流的則是中端存儲,IBM在這一層面所主推的就是Storwize產品家族,目前最新的產品型號就Storwize V7000系列。 它就是IBM所提出SVF理念的S,而在我的定義里,它代表了V,即容量。
Storwize V系列的一大特點就是自帶IBM Spectrum Virtualize功能,當然這其中用到的更多的是包括上文提到的Spectrum Virtualize在內的高級功能,如高級復制、高性能精簡配置、加密、 Real-time Compression 和 IBM Easy Tier等等。
除此之外,對于組建大容量存儲池(我在此稱之為Volume,強調容量)來說,Storwize 也很有代表性。以V7000為例,它每個控制盒支持使用高性能的 12 Gbps SAS接口,最多可支持20 個附加的擴展機箱,可以擴展至 504 個硬盤驅動器,大約2PB 容量,在集群模式下,最多可以擴展至44個存儲機箱,最大容量超過4PB。這一容量的可擴展能力對于絕大多數的用戶來說,完全是足夠了。
顯然,集成了Spectrum Virtualize的Storwize V7000系列,在高級存儲功能、存儲容量、性能以及存儲成本方面,達到了較好的平衡,對于傳統存儲架構的擴容來說,是一個較好的選擇。
Storwize V7000借助于虛擬化的功能,與傳統的SVC一樣,具備整合異構SAN平臺的功能
需要強調的是,Storwize V7000本身就具備Spectrum Virtualize的能力,所以它完全可以代替單獨的SVC(Spectrum Virtualize)來使用,有可能就此覺得這個是不是與前文介紹的Spectrum Virtualize重復了,直接用Storwize V7000不就全解決了?事實上,的確如此,但在一些應用環境里,可能就需要一個完善的解決的方案,除了有單獨的Spectrum Virtualize與Storwize,還有一個必須的補充--全閃存陣列。
三、速度:永遠的追求還記得本文的開頭所提到的存儲系統主機系統之間,因后者性能的提升以及處理數據量的顯著增加而帶來的矛盾嗎?沒錯,最關鍵的矛盾就是速度,不管容量大小,用戶最終關心的就是能不能在更短的時間里,處理更多的數據,但前提是,存儲系統可以支撐起相應的數據讀寫請求。
在這一層面Storwize就力不從心了,雖然其支持SSD+硬盤混合存儲,支持Easy Tier分層存儲,但對于某些關鍵業務應用環境,尤其是OLTP應用--無論在整體方案架構、性能還是成本效益上,單獨的全閃存陣列都是更好的選擇,而這顯然也是大勢所趨--當閃存越來越便宜,當用戶對速度的追求越來越高,全閃存陣列的引入絕對是必要的。
這就是IBM SVF中的F,即FlashSystem 全閃存陣列家族。目前其最新的產品型號為FlashSystem 900,而在我看來,F就是更快的速度。
FlashSystem 900 最多包含 12 個 MicroLatency 閃存模塊,這些閃存模塊是大規模并行閃存陣列,可提供比之前的FlashSystem 型號高將近 40% 的存儲容量密度。因此,FlashSystem 900 可以在單個系統中將可用容量從 2 TB 擴展到多達 57 TB。此外,MicroLatency 模塊還支持卸載 AES-256加密引擎。
FlashSystem 900還有一個集成Spectrum Virtualize的型號,即FlashSystem V9000,對于兩者的區別,可參見上文Storwize的描述,它可管理高達32PB容量的外部異構存儲。
純粹以性能為訴求的FlashSystem 900與集成了Spectrum Virtualize,具備高能存儲功能的FlashSystem V9000
很顯然,就像Storwize V7000一樣,FlashSystem V9000也可以成為SVC(Spectrum Virtualize)的替代者,直接統領異構的SAN存儲環境。所以,可能又會有人說,這所謂的SVF并非都要一起上馬才行吧。對此,我可能需要再次強調我個人對SVF的理解定義--Software-defined(軟件定義)、Volume(容量)、Fast(速度)。SVC(Spectrum Virtualize)、Storwize硬盤存儲與FlashSystem全閃存存儲,雖然都可以具備SVC的能力,但各自還是有明顯的分工,下面這個真實的案例可能更說明問題。
安徽合力ERP應用系統性能優化方案與優化前后的性能對比
安徽合力是目前中國叉車行業唯一的上市公司,目前是中國規模最大、產業鏈條最完整的工業車輛和運搬機械研發、制造和出口基地。 由于業務增長迅速,其ERP應用系統面臨著數據存儲容量不足與性能瓶頸的雙重挑戰。
在安徽合力ERP應用系統性能優化改造中,主要就是對其存儲系統進行了升級,重點措施包括:
1、增加兩個SVC控制節點,以進行異構存儲平臺的管控,并提高快照等高級功能
2、通過對Storwize V7000的擴容,平滑支持現有的ERP應用的容量需求
3、增加FlashSystem全閃存陣列(型號840,無高級存儲功能),以提升數據庫性能
從方案圖中可以看出,FlashSystem與Storwize V7000,和原來的EMC備份平臺共同處于SVC的層級之下,方便統一管理。Storwize V7000只升級了一個擴展柜,離規格的上限(單機最高20個擴展柜)還有很大的距離,后續的可擴展性完全可以保證,而FlashSystem的加入,則極大的提高了應用性能,我相信這肯定也是Storwize V7000配備SSD無法達到的效果。
從方案中可以看出,安徽合力并沒有用Storwize V7000來完全取代單獨的SVC節點,這也是從全局角度來考慮的,SVC與V7000在虛擬化與增容方面,各伺其職。SVC負責全局存儲架構的軟件定義與管理,而V7000上除了虛擬化以外的高級存儲功能,對于V7000本身也是非常需要的,單獨的FlashSystem則保證了速度,而如果換成V9000的話,其在整體架構上的地位會進一步提升,但在大容量分層存儲方面,也必然要有Storwize V7000的支持。
因此,對于IBM SVF來說,雖然在某些具體的產品上,可以具備其中的2項能力,但這一概念所面對的是全局的意識,即從"軟件定義(虛擬化算是其中的一個典型)--容量的靈活擴展--整體應用速度的提升"這三個總體的要點進行綜合考慮,再在各具體的方向上進行成本與關聯設計,也因此SVF無論在局部還是全局存儲上,都可算是一種組合。
綜上所述,在我看來,雖然SVF這一理念,是以IBM的產品家族為提出的,但對于實際的傳統存儲架構的優化,仍然具有通用的參考價值。無論您是否對SVF感興趣,都建議從上述的三個要點,來考慮自身傳統存儲架構的升級與改造。
了解更多IBM SVF精彩內容,請點擊查看“新年五部曲 豈止于快”。