很多人都熟悉預測數據分析的強大功能、便利性,以及無經倫比的精確性。無論是在Netflix網站上尋找新內容,還是瀏覽近日在亞馬遜網站購買的物品,預測分析越來越多地用于自動化日常任務,過濾信息,做出更好的決策,并改善客戶支持。
預測分析的大多數早期用途都集中在消費者應用程序上,在這些應用程序中可以從大量用戶那里收集大量數據,從而更容易證明在數據采集、處理和模型開發方面的大量投資是合理的。很難了解預測分析的投資回報率,因為這是一項復雜的工作。它遠遠超越了傳統的統計和概率技術,通常使用機器學習,甚至在某些情況下,采用基于神經網絡的深度學習來訓練模型,并根據大量數據集進行預測。數據驅動的方法非常適合于自動化IT系統管理,因為現在的基礎設施可以提供大量的事件日志、系統遙測、性能指標。
制造、物流和設施控制系統開創了預測分析的工業應用。例如,勞斯萊斯公司使用預測分析來主動安排維護,并提高其飛機發動機的效率。在存儲應用中,預測分析用于預測和主動修復設備故障,識別性能瓶頸,并基于歷史測量優化系統配置。
消化所有數據
毫無疑問,無論是Netflix網站還是谷歌智能助理,企業的使用數據越多,其提供的建議就越好,因為逐步提高準確性主要取決于是否有更多數據可供使用。這同樣適用于預測性存儲分析。該軟件的準確性與它所擁有的數據一樣,無論是數量還是質量都很重要;基于不準確或不精確數據的預測模型都將失敗。
對于預測性存儲分析軟件,數據需求轉化為收集大量系統事件、內部參數、性能度量和特定于工作負載的度量。其基線遙測包括:
•事件和錯誤日志,例如系統故障和異常;
•性能測量,例如總體IOPS和每卷IOPS、各種操作(如順序讀取、隨機讀取和順序寫入)的吞吐量以及延遲;
•按工作負載劃分的帶寬使用和延遲;
•工作集(熱數據)和緩存利用率。
用于模型開發和培訓的數據集越大,預測統計模型或機器學習模型的精度越高??紤]到這一點,許多供應商對來自其所有客戶的數據進行匯總和匿名。使用更廣泛和多樣的安裝示例中的數據,供應商可以顯著提高預測,更好地檢測性能、安全性和硬件異常。
例如,Hewlett Packard Enterprise InfoSight是HPE公司收購Nimble的產物,每天從幾乎每個部署的Nimble陣列收集來自3000萬到7000萬個傳感器的數據。該公司聲稱,在客戶發現問題之前,它發現的90%的問題都可以得到解決。
HPE公司的InfoSight每天從部署的Nimble陣列收集多達7000萬個傳感器的數據。
由于訓練數據集僅由存儲軟件供應商用于預測模型開發,因此不需要識別特定客戶的信息,并且每個客戶部署可以從其他客戶的經驗中受益。首先,存儲供應商使用聚合數據來改進所謂的機器學習或深度學習培訓階段的預測模型。然后,他們將模型推送到系統管理軟件,該軟件在推理階段從各個系統中提取實時監控數據。其他模型用于系統配置、容量規劃和故障排除,以執行根本原因分析。
預測算法正在成為存儲平臺上的標準設備,與存儲管理的被動方法相比,它具有許多優勢。
預測性存儲分析軟件通常用于改進許多任務。在評估產品時,需要查看每個產品如何衡量這五個關鍵特性和功能:
(1)支持自動化預測并防止性能、容量、可用性和安全問題。容量管理是預測性存儲分析軟件最常見的應用程序。模型可以實時分析每個設備、數量和應用程序的使用情況,并在達到使用目標時主動發出警報。根據管理員的判斷,系統可以自動添加分配的空間或重新平衡現有容量,以防止其耗盡。
預測性存儲分析還可以通過關聯和識別與特定問題相關的事件來幫助解決問題和進行根本原因分析。使用匯總的客戶數據對于故障排除特別有用,因為它為管理系統提供了對所有客戶問題超集的可見性,并能夠檢測到以前未發現的細微的問題,這些問題與其他地方發生的類似問題共享取證簽名。
(2)管理和配置功能顯示在模型中,模型可以自動確定性能、資源消耗、容量基線和趨勢。其中包括不適合簡單統計模型的模型,如線性、多項式回歸或周期性時間波動(季節性、每月、每周)?;€和趨勢可用于自動化存儲系統的設置和管理,并通過優化配置設置和協助工作負載分配來提高資源利用率和效率。
(3)系統軟件更新和修補功能主動應用修補程序(需經管理員批準),包括解決以前發現的系統問題的修補程序。一些供應商使用分析使beta或alpha級別的代碼,僅對遇到特定問題并滿足硬件或其他系統要求的站點可用,希望該修復程序能夠解決緊急問題,而不會不必要地危及其他客戶的可靠性。
(4)資源規劃功能使用相同的趨勢發現預測算法來增強規劃模擬和假設分析,使存儲管理員能夠快速模擬各種場景,預測容量、IOPS和帶寬需求,并建議系統升級。
(5)虛擬機管理功能與各種虛擬化平臺(尤其是VMware的vSphere)集成,可提供特定于工作負載的性能和容量指標,現場使用趨勢并建議存儲配置設置。
好處和建議
預測算法通常與其他自動化和配置管理工具配合使用,正在成為存儲平臺上的標準設備,與存儲管理的被動方法相比,它具有許多優勢。這些包括:
•通過自動化與容量和性能管理相關的存儲任務來降低運營支出;
•通過主動解決問題來提高可用性,例如特定卷上的容量耗盡;
•通過推薦最佳配置來提高資源利用率和效率,并改善應用程序性能。
例如,除了在客戶意識到問題之前預測和解決問題之外,HPE公司聲稱InfoSight將管理和解決存儲相關問題所花費的時間減少了85%,并節省了79%的運營費用。
存儲供應商通常提供管理軟件。因此,建議將預測性存儲分析和其他人工智能衍生技術作為未來產品評估的關鍵點。對于使用設備無關的軟件定義存儲的組織也是如此,例如Cohesity、DataCore、Red Hat Ceph、Gluster以及VMware vSAN。使用上面的功能列表作為產品評估清單的一部分,以確定最適合企業的需求和更廣泛的基礎設施管理環境。