如同其它領域的存儲區域網絡管理,虛擬服務器的蔓延使得存儲性能監測的工作更加困難。傳統的工具可以幫助你跟蹤I/O資源以及當性能超出閾值時發出警告,但它無法區分虛擬機和物理主機,從而導致不準確的數據。
不過,最新的存儲性能監測產品已經可以適應虛擬環境,并且其中的某些產品專門為虛擬監控技術而設計。
虛擬環境下的性能監控已經不再是隔離的工具集,即單獨的監測存儲、網絡和網絡主機性能。 取而代之,VMware和第三方廠商如BlueStripe軟件公司開發了一種以應用為中心的方法,將性能度量進行合計,并為虛擬化、存儲和網絡管理人員提供系統健康的總體全面的視圖。當問題發生時,這些工具可以深入挖掘詳細信息并找到問題的根源。
虛擬化環境下的存儲性能監測工具
在物理服務器環境中,存儲性能監測工具通過監視操作系統來計量服務器的性能統計參數。典型情況下,只有兩個端口用于數據流入和流出物理服務器。確定到存儲的物理鏈路,包括應用和LUN之間的直接連接都比較容易。
在虛擬環境下,由于在每一個物理主機中引入了操作系統仿真和多個虛擬端口,使得物理環境下的性能監測工具可信度下降。
“虛擬化對于應用平臺的經濟型以及在何處部署應用的靈活性提供了很大的便利”,Vic Nyman,BlueStripe的創始人和首席運營官說。“不過對于評估業務應用在存儲方面的使用,如何測量可用性和性能等方面也日益成為挑戰”。
典型的虛擬環境下存儲問題包括存儲映射和錯誤的配置。存儲映射問題是指當存在存儲相關的性能問題時,你卻無法知曉應用的存儲位于那臺物理主機上。錯誤配置問題是指管理員在分配虛擬機存儲時發生錯誤,或在最初分配時所做的假定不再生效。
“事情發展的太快”,Bob Laliberte, ESG高級分析師說,“過去你擁有很多嚴重隔離的區域,而現在所有的一切都在一瞬間轟然倒塌”。
SCSI保留問題也困擾著數據存儲管理員。vSphere和微軟的集群服務使用SCSI保留來保證在虛擬機寫入元數據變化時可以獨占對于共享存儲LUN的訪問。如果多個主機可以同時訪問并更新共享資源的元數據文件,則很容易導致數據損壞。不過如果存在太多的SCSI保留,試圖訪問鎖定存儲LUN的主機可能會返回I/O錯誤,經過多次嘗試后,最終操作可能會失敗。
根據Paul Turner,NetApp公司SANscreen業務單元的總經理的意見,這些物理環境下的工具必須轉變為具有虛擬化感知的能力。“在虛擬環境下,大部分現有的工具都可以工作得很好”,他說,“它們只需要變得虛擬化感知,它們需要了解虛擬機是如何映射到它們的存儲的”。
虛擬化感知的性能監測工具
盡管對于虛擬化感知性能監測工具的需求已經為大家所了解,但在市場上相應的產品卻并不多。根據Jeff Boles,Taneja集團的高級分析師和驗證服務總監的意見,“虛擬環境下的性能監測工具仍處于嚴重不足的狀態”。
關于虛擬化環境下存儲性能監測工具的討論由VMware vSphere內置的工具開始。vSphere客戶端可以為整個數據中心,集群,物理主機或單獨的虛擬機監測存儲性能。在vSphere客戶端儀表板中的性能標簽頁可同時顯示全局視圖和高級視圖。全局視圖顯示關鍵統計參數,而高級視圖提供更詳細的信息。如果僅使用vSphere客戶端,它僅能提供有限的歷史統計數據用于趨勢分析和規劃用途。
VMware vCenter服務器,之前稱為VMware VirtualCenter, 可以提供更詳細的信息,以及更完善的報警。vCenter AppSpeed,由VMware于2008年5月通過收購B-hive網絡公司獲得,在vCenter中以標簽頁的形式可以在虛擬環境下跟蹤交易的性能和測量延時及吞吐量。它同時可以直接在vCenter中給出應用的服務水準協議的狀態以及應用性能問題的診斷和排錯。
廠商提供的在虛擬世界中的存儲性能監測手段
數個廠商可以處理虛擬環境下的存儲性能監測,包括BlueStripe軟件、NetApp、VMware和Virtual Instruments。
BlueStripe的FactFinder v5:BlueStripe軟件在存儲性能監測上采用了不同的方法。公司的旗艦產品,FactFinder v5,作為一個以專注于應用的管理軟件包于3月份正式發布。“我們采用一種全新的方法來管理應用系統”,來自BlueStripe的Nyman說道,“我們將自動地發現應用和事務的路徑。同時我們將檢查整個堆棧并告知你事務在何處阻塞。它就像架接在用戶事務和支持其的技術和系統之間的橋梁。”
BlueStripe的代理和被動式觀測器可以監測應用性能的各個層面,包括虛擬監控器、網絡和異構的存儲系統。“我們可以看到應用,它對存儲系統的依賴關系,以及它的性能和交互”,Nyman說。不過它不一定會深入挖掘以找到問題的根本原因。“當應用遇到存儲的問題時我們可以發現,”他解釋道,“當其存在性能瓶頸時我們可以發現,我們不必知道為何在那個存儲上執行得不好”。
BlueStripe并不打算替代傳統的存儲性能監測工具。就像VMware的vCenter Operations,它將數據總計并呈現整體的系統健康視圖。當性能問題發生時,管理員可以對所依賴的系統深入挖掘,并找到相應的系統管理員來查看性能監測和診斷工具以做進一步的特定分析。
BlueStripe的FactFinder和vCenter Operations這兩個產品顯示出市場對整體系統監控工具的興趣不斷上升,而對單獨的系統監控孤島系統興趣逐漸下降。不過在現今日益復雜的虛擬環境下,一個經驗證的和強健的存儲性能監測工具如Virtual Instruments的VirtualWisdom也必不可少。不管哪種方式,對于存儲性能的監測在如今都是非常重要的。
NetApp的Akorri BalancePoint:NetApp 于二月份收購了Akorri Networks 公司。并將Akorri BalancePoint中的存儲性能監測技術融入到現有的SANscreen Service Insight存儲管理解方案里的OnCommand 管理軟件套件中。SANscreen可完成虛擬機環境下的容量規劃和趨勢分析。它可以看到當前所有虛擬機使用的容量,每一個虛擬機以及集群使用的容量。它還可以提供容量規劃報告和分析。
“我們之所以收購Akorri是因為我們看到對于虛擬化環境下更優質工具的大量需求,”NetApp的Turner如是說。“特別是對于優秀的性能建模工具和性能預測工具的需求”。
Turner說Akorri性能指數通過監測CPU和內存的動態余量并利用隊列原理,一種基于模擬交易和隊列的數學模型來確定服務器合適會突破設定的閾值。同時警告會發送到vCenter控制臺或通過郵件發送。
VMware的vCenter Operations:VMware于三月份發布了自有的的高級分析引擎,vCenter Operations。VMware新的高級分析引擎匯集了vSphere虛擬機監控器中存儲,網絡,CPU和內存性能數據并以作為系統整體健康指標在一個視圖中展示。
“我們將其視為基礎架構和運用管理的新的方式”,Rob Smoot,VMware的產品市場管理總監說,“它可以幫你得到當前環境的健康,性能和容量的總體視圖,逐漸的,我們認為性能、容量管理以及配置管理這三方面將會融合到一起”。
vCenter Operations使用復雜的算法來確定系統整體運行是否正常。然后你可以深入挖掘具體細節來查看是那個系統-存儲、網絡還是物理主機導致瓶頸。Smoot說目標是將報警系統整合為三個核心:工作負載、容量和系統健康。
“當前運維團隊所處理的警報來自于特定的孤立系統及其基礎架構的相關方面”,Smooth說,“因此在他們得到的如洪水般的巨量信息中大部分只是對環境的干擾,vCenter Operations所做的就是消除這些噪音,并在發現有性能問題橫跨所有這些獨立系統時發出警報”。
Virtual Instruments的 VirtualWisdom:Virtual Instruments的 VirtualWisdom的SAN優化和故障檢測軟件專注于虛擬環境下的存儲性能監測。作為NetWisdom的后繼者,VirtualWisdom為異構環境下的光纖通道存儲網絡提供了監測、優化和故障檢測功能。
Skip Bacon,Virtual Instruments的首席技術官表示,如果對于底層所發生的事情沒有深入的理解,服務器虛擬化將很快陷入困境。“關于服務器虛擬化的好消息和壞消息是,你可以非常快的啟動新虛擬機,你可以非常快的移動虛擬機,在某些情形下還可以用vMotion自動移動”,Bacon說。“壞消息則是,如果從容量和性能的角度,對底層的存儲局面沒有強有力的控制,那么所有的這些動態計算所做的只是更快的讓你被問題纏繞”。
VirtualWisdom的平臺有多個組件可以解決這個問題。VirtualWisdom服務器運行于Windows server平臺之上。ProbeVM軟件從物理服務器和虛擬化中獲取性能指標。ProbeV軟件從SAN光纖交換機網絡中得到數據,而ProbeFCX則發生基準服務器SCSI設備交易和鏈路指標參數。VirtualWisdom的警報是基于策略的并且可以觸發郵件通知和SNMP捕獲,以及執行腳本和使用vMotion遷移。