【TechTarget中國原創】在虛擬時代,存儲性能相當關鍵,而借助已有的一項技術可以讓大型機得到新生。數據條帶技術的使用打破了幾個卷之間相鄰模塊的順序,其目的是要降低設備對I/O的競爭,提高I/O并行性,使得更多的I/Os能夠在多個設備上同時運行。本文將討論IBM針對大型機啟用的名為VSAM(虛擬存儲訪問方法)的條帶技術軟件。
數據條帶技術基本要素
要弄明白數據條帶的優點,就有必要了解一下這種技術的原理。參看圖1,這里展示的是一個普通集群,VSAM在控制區(CA)里按順序擺放了I/O基礎單元--控制間隔(CIs)。在本例中,諸如CA1,CA2等等控制區,它們包含了15個磁道,這些磁道呈直線安放在直接存取存儲器(DASD)圓柱體上。如果集群擴展到其它卷,VSAM仍遵循同一規則在控制區里有序安放控制間隔--例如C46,C47,C48等。
圖1 常見磁盤組織方式,把相鄰模塊放在同一個卷中
這種結構本身就存在多種潛在瓶頸問題。例如,按順序處理數據,系統就要讓I/O每次與一臺設備的一個磁道對應排序。即使直接存儲可能也要排序,假如兩個在線進程想要辨識位于相同磁道上的兩個不同控制間隔。
現在思考一下圖2 ,該圖顯示了橫跨四個卷提取到的一個數據組。
圖2 數據條帶可識別控制間隔,允許磁盤I/O平行發生,提高了存儲性能
在上述數據條帶例子中,VSAM從邏輯上把控制區延展到了四個卷而不僅局限在一個圓柱體或是單獨一個卷。并且,VSAM在設備中采用了循環方式的控制間隔,例如C1在卷1上,C2在卷2上,等等。如果數據組擴展了,VSAM會給四個新擴展區分配出空間,同時能夠保持四個卷原有的條帶結構。
條帶式排列提高了按序處理效率,因為系統可以同時發起針對多卷的并行I/O訪問動作。條帶化幫助關鍵訪問比如在線應用能夠實現即時訪問一個卷的數據,而無需等待I/O結束對另一個數據卷的訪問。
VSAM還支持“層級”理念。IBM把該理念定義為將會包含在“I/O包”中的數據卷。實際上,一層代表了一個數據組擴展區,它們共享相同的數據記錄。當一個數據組擴展時,擴展區可能延伸到不同的數據卷上。VSAM可能會得到進一步優化,識別出每個層分別屬于哪個數據卷。
用戶可以對除AIXs(輔助索引)之外幾乎所有類型的VSAM集群進行條帶化。IBM也可以把條帶化限制在一個集群的數據組件上。
IBM提醒VSAM要支持多達16條帶。這意味著控制區可能伸展至16個磁道而非傳統的15個磁道,并且包含更多的控制間隔。對于(KSDS)關鍵性排序數據組,這就意味著指向數據模塊(索引序列組)的索引控制間隔可能沒有足夠空間引用控制區的控制間隔。這就表明其本身是控制區末端不使用的控制間隔,或者說是某種空間浪費。為了充分利用這部分空間,存儲管理員一定要用較大的控制間隔來覆蓋默認的索引控制間隔。
定義條帶集群
條帶集群必須是由系統管理存儲器(SMS)來管理。數據以及存儲類特性組合起來決定了一個集群是如何條帶化的。概況如下表1。
Table 1 一個集群是如何進行條帶化的取決于數據和存儲類特性
首先,條帶化集群要在數據類中用數據組名類型設定EXT。在數據類中設定了EXT屬性標簽后,存儲類就掌控了有關條帶化的細節內容。
在存儲類中,根據是否設定了“有保證的空間”這一特性,相應就有兩種方法可以進行條帶化。如果“有保證的空間”這一設定處于關閉狀態,那么可以選擇通過設置持續數據速率(SDR)值大于另一個。VSAM把SDR除以四就能得出條帶數。因此,存儲類SDR值是12時,三個條帶就能生成集群。另外,VSAM在分配數據組時,會在所有數據卷范圍內對主要分配內容進行均衡分配。
如果啟用了有保證空間設置,任何大于零的持續數據速率(SDR)都將導致VSAM分配一個新條帶號,其中包含在數據存儲類分配列表中卷數相同的數據卷,最多可分配到16個。相反,如果啟用了無保證空間設置,VSAM將使用每個數據卷上全部主用空間生成一個集群。
數據條帶有用性
今天,RAID技術通過廣泛的與各類基于現代DASD技術框架的緩存技術結合解決了大部分存儲問題,但還是沒能消除過去一直困擾大型機性能的磁盤“熱點”問題,當太多活動的數據類共存于同一設備時產生的“熱點”會嚴重損耗大型機性能。IBM也引入了并行訪問卷(PAVs)技術,基本上是克隆了設備控制塊用以允許同步訪問DASD單元。通過使用更小的數據類空間臨界點,有人可能會想訪問層級的條帶是否仍然相關。
我認為這是因為DASD框架內的瓶頸仍然存在。舉個例子,DASD框架里的與I/O通道接口的處理器可能被迫忙于提供鏈接服務而無法迅速的響應。此外,在DASD框架微碼中的優化算法相對于直接I/O和小數據塊可能偏好在大的數據塊和有序的處理,是典型的批處理,因此影響了在線性能。對于這兩種情況,精心設置在卷上的條帶化的數據類能夠確保接口處理器不會太忙,并能夠傳輸在線數據,從而花更少的時間去完成批處理任務。
另外,I/O性能仍然與應用數據訪問模型息息相關。例如,一個在線應用可能會在一秒鐘內對一個相關的小集群更新幾十次,這就會對DASD框架內外都產生了瓶頸。條帶技術可以幫助解決這個瓶頸,通過使用交錯的控制間隔把數據擴展到幾個數據卷上,從而減輕任何一個I/O通道的負擔。
因此,在訪問方法層面的條帶化技術顯然應該被看作管理大型機性能的另一個有效工具。