為提高主機處理器的容量和速度,IBM開始應用垂直極化(vertical polarization)。閱讀本文,了解如何通過名為HiperDispatch的功能充分利用該技術(shù)提升性能。 為了應對即將失效的摩爾定律(Moore's Law),IBM正在尋找其他方法來提升處理器的處理能力。其采取的策略包括指令流水,超線程和處理器高速緩存。這些新技術(shù)有時會使主機性能發(fā)生改變,如果足夠穩(wěn)定,性能的改變情況要取決于系統(tǒng)中發(fā)生的事件。要獲得主機最佳性能的方法之一即是優(yōu)化處理器的垂直極化。
不為人知的主機處理器內(nèi)情
近期的主機處理器型號很大程度上依賴于高速緩存來供給指令流水。IBM最新型號的主機處理器,z13,根據(jù)與中央處理器(central processor,CP)的距離不同劃分為四個層級的高速緩存。每個核心擁有1級(L1)和2級高速緩存。3級高速緩存由芯片上的每個核心共享使用,而4級高速緩存在總線上可供任意處理器訪問。數(shù)據(jù)必須在1級高速緩存中,處理器才可以使用。
眾所周知的是主機可以高效率地運行不同的工作負載。這意味著在硬件狀態(tài)之間的大量的內(nèi)容切換,舉例來說一項在線交易和一項批處理的工作要進行切換就需要大量的文件。
例如,只要某一生產(chǎn)邏輯分區(qū)(logical partition, LPAR)運行,它便會建立自己的緩存工作集,以促進更好的性能,主機處理器從內(nèi)存或較低緩存上檢索數(shù)據(jù)就會花更少的時間。接著,在某一點上,生產(chǎn)邏輯分區(qū)失去對測試系統(tǒng)中央處理器的控制。開發(fā)邏輯分區(qū)通過相同的處理流程將自己偏好的數(shù)據(jù)收集到緩存中,獲得的效率只會將控制交還到生產(chǎn)系統(tǒng)上。在滿載的處理器上,這一曲折的過程將導致緩慢的性能和更高的CPU功耗。
要解決這一問題,主機可以利用垂直極化的理念,其目的是使在物理處理器維持相同的生產(chǎn)邏輯分區(qū),并且花費較少的時間進行緩存的加載和清除。為了推動垂直極化的應用,IBM引入了名為hiperdispatch的功能,同時還推出一組方法進行應用效果的測量。
當HiperDispatch功能啟用時,操作系統(tǒng)的調(diào)度會與主機的虛擬機管理程序、處理器資源/系統(tǒng)管理器(Processor Resource/System Manager,PR/SM)相互協(xié)同。雙方共同工作確保任何的邏輯分區(qū)能夠在同一組物理處理器上連續(xù)運行,因此需要保存緩存中的內(nèi)容,降低緩存丟失并提升處理效率。
衡量緩存效率的首要指標是相對巢強度(RNI,relative nest intensity)。IBM的RNI公式較為復雜,并且在計算每個型號的主機處理器上的RNI時會有差異,根據(jù)從不同層級的高速緩存和內(nèi)存獲取數(shù)據(jù)的時間來計算。較低的RNI表明比較有效的緩存利用率,這意味著CPU在等待指令和數(shù)據(jù)方面花費的時間會更少。
衡量的次要指標是每條指令的時鐘頻率(clocks per instruction,CPI)。這一測量方法會計算執(zhí)行一條指令所需時鐘循環(huán)的數(shù)量。處理器越深入高速緩存或內(nèi)容
計算垂直中央處理器的數(shù)量
中央處理器垂直度有三類名稱: 高度垂直(Vertical High)——物理處理器在某一邏輯分區(qū)上高效地投入工作; 中度垂直(Vertical Medium)——物理處理器在多個邏輯分區(qū)間可以實現(xiàn)共享; 低度垂直(Vertical Low)——物理處理器在沒有計算需求時將停止。 一般來說,處理器資源/系統(tǒng)管理器分配垂直極性是基于邏輯分區(qū)的權(quán)重以及邏輯和物理處理器的數(shù)量。當處理器變得忙碌時,邏輯分區(qū)權(quán)重決定了分區(qū)的相對重要性和CPU共享份額。
當HiperDispatch功能啟用時,各邏輯分區(qū)根據(jù)自己占總邏輯分區(qū)權(quán)重的情況以及總的物理處理器數(shù)量,來分配各自可以使用的中央處理器的數(shù)量。在實際業(yè)務中,有了z/OS系統(tǒng)和處理器資源/系統(tǒng)管理器的協(xié)調(diào),每個z/OS操作系統(tǒng)在自己的垂直極化處理器上盡最大努力來協(xié)調(diào)工作。
如果垂直極化的中央處理器過于忙碌,它可能會將工作發(fā)送至中高級處理器進行處理。
由于處理器資源/系統(tǒng)管理器能理解處理器底層的緩存結(jié)構(gòu),它將把中央處理器分配給相同或相鄰芯片上的邏輯分區(qū)以縮短檢索數(shù)據(jù)所需要的時間。鑒于處理器資源/系統(tǒng)管理器的復雜性以及決策的不透明性,系統(tǒng)程序員的最佳選擇是下載IBM的邏輯分區(qū)設計工具。該工具采用復雜的Excel電子表格的形式,幫助用戶來規(guī)劃他們自己的邏輯分區(qū)配置以優(yōu)化硬件性能。