雖然技術不斷創新,并引入新的基礎設施管理工具,但許多工具仍然無法滿足業界所追求的實現自動化和降低維護成本的要求。因此,許多IT專業人員仍在投入大量精力人工處理需要調整和優化的問題。
運維人員面臨的主要問題是數據中心的維護周期仍然需要人為干預。此外,數據中心運營商將大部分預算用于保持其正常運行。
這就帶來一個問題,即為什么在不斷引入新的工具來解決這個問題的同時,仍然需要大量的維護。人們到底錯過了什么?
傳統基礎設施工具的不足之處
真正消除數據中心基礎設施的管理負擔需要具有預見性,以便在問題發生之前預測問題,同時能夠提供深入洞察力的基礎工作負載和資源情報,以實現更好的基礎設施優化。
組織需要考慮以下四個因素,以確定采用的工具在克服令人沮喪的維護問題方面的不足之處:
1. 沒有向他人學習
只是報告本地系統指標的分析往往提供有限的價值。相反,采用工具的目的是它能夠從數千個對等系統的行為中學習,以幫助檢測和診斷發展中的問題。從某種意義上說,兩種想法總比一種想法要好,需要集思廣益。
數據收集和分析的整體方法可以匯集來自各種各樣的工作負載的觀測結果。這允許在一個數據中心識別的罕見事件在另一個數據中心預先避免,并且更準確地檢測更常見的事件。
2. 不能看到整體情況
傳統工具通常只能以孤立的方式提供分析。每個設備僅提供系統狀態,這只是整個過程的一部分。由于存在破壞應用程序在基礎設施堆棧中任何位置突然出現的問題,因此能夠跨多個層進行跨堆棧分析以獲得更大的視野非常重要。這將需要關鍵組件,例如應用程序、計算,虛擬化、數據庫、網絡和存儲。
3. 不夠深入了解
預測建模需要深入的領域經驗,需要了解基礎設施堆棧中每個系統內的所有操作、環境和遙測參數。通用分析需要深入。但是,行業領域專家與人工智能相互配合可以使機器學習算法能夠識別歷史事件的因果關系,進而預測最復雜和最具顛覆性的問題。
4. 無法積極采取行動
也許采用傳統工具的最大缺點是無法積極采取行動。在理想的自主操作狀態下,數據中心將會自我管理、自我修復和自我優化。從本質上講,他們應該能夠避免問題或改善環境,而無需管理員的人為干預。要實現這種自動化水平,需要經過驗證的自動化建議歷史記錄,以提供必要的信任和信心。
數據中心維護的未來
為了克服傳統工具的局限性,并有效地降低維護需求,以及更好地讓數據中心實現自動化,人們需要采用新一代的人工智能解決方案。這意味著利用能夠觀察、學習、預測、推薦并最終實現自動化的工具。
通過觀察,人工智能將能夠針對各種工作負載和應用程序對理想操作環境的穩態理解。深度系統遙測與全球連接相結合,可實現快速的云計算機學習,從而使人工智能具能夠通過模式匹配算法快速預測問題。甚至可以根據過去的歷史配置和工作負載模式為新的基礎設施建模和調整優化應用程序性能。
基于這些預測分析,人工智能解決方案可以確定改善數據中心環境所需的適當響應。然后IT團隊消除壓力,這意味著他們不再需要通宵達旦地工作以在管理基礎設施時找到問題的根源。更重要的是,如果人工智能證明是有效的,那么可以自動應用建議而無需IT管理員的干預。那么這就是實現自動化的意義。
例如HPE公司的數據中心運維,采用人工智能工具在86%的時間內自動預測和解決問題。此外,他們在存儲問題上花費的時間減少了85%,甚至可以將IT存儲運營支出減少79%。因此,部署人工智能以協助數據中心基礎設施的優勢是不可否認的。
此外,隨著技術進步和經濟發展,預計到2030年,高度多樣化的地區將面臨200萬IT專業人才短缺的情況。而在不那么遙遠的未來,自動化將成為數據中心管理的下一個前沿技術。