IT運維管理是一門探討如何提高網絡應用性能的課題,怎樣利用網絡管理做到企業IT基礎設施建設的管理、合理分配網絡資源、保障生產業務、對網絡規劃和新業務上馬提供支撐。
調優難點:“線上系統”
調優工作有難易之分,最簡單的例子就是新、舊兩套業務系統,后者明顯需要更多的理解和數字變化上的感知。以大型企業為例,當新業務上線時,由于業務的數據特征、流量特征、訪問特征都存在不確定性因素,因此往往需要在上線前、上線后、運行過程階段,對關鍵的基礎設施和應用層進行持續的配置調優。而對于已運行的系統,也就是線上系統,我們不可能將其環境完整地復制出來“做試驗”,所以就必須依賴長期的監控,獲取到系統的運行數據,找到現階段的瓶頸,有針對性的提出優化方案。
不過有人認為,針對線上的系統調優,只能聘請專家級的人物來做。對此,專家表示:調優的效果取決于量化的數據和理性的目標,不論是在企業內任職的IT運維工程師還是外聘的專家,這都是必不可少的。另外,我們所做的基礎設備層面或是開發層面的優化,如果不熟悉企業自己的業務,不圍繞業務層面做優化,就會與決策層的期待值相差甚遠。所以說,針對線上系統,如果缺少數據支撐,就不可能在業務層面實現調優,也就失去了優化工作的真正意義。
有人將調優稱為“黑色藝術”,就因為它依靠著數據和感覺,在理性和感性間徘徊。但如果要讓別人欣賞你的“藝術作品“,業務層的調優則是見效最快、展現IT運維價值最好的窗口。但業務部門不會關心CPU占用了多少、內存夠不夠、鏈路參數是否需要調整……這種底層的問題,他們對于調優的看法是整個業務的流程會不會更快。
調優本質:“迭代優化”
要進行優化,先得找到性能瓶頸! 那些可以進行業務仿真、業務數據流圖、業務用戶監控的管理運維軟件會更加受用戶歡迎,它們從業務關鍵路徑的響應時間、業務的時間分布、業務在具體網絡中的負載路徑,分析業務支撐系統性能指標,幫助用戶及時調整網絡部署和運維安排,實現“更好用、更快捷“的業務系統服務。
一個業務系統是否健康,業務量是否飽滿,如何看待各類系統運行參數,這些都是和在線使用情況直接相關,業務性能分析不能脫離業務負荷這個前提。但傳統意義上的網絡拓撲圖只能提供出網絡之間的流量大小,但是這些流量的大小往往是物理上的流量。 對于業務系統來說,管理人員迫切需要通過對物理流量的分析,了解某項核心業務是否出現了異常,是否有調優的必要。
性能優化未必一次性就能滿足,可能此處瓶頸消失了,系統一旦運轉之后,業務層面的調整還會在其他地方又發現新的性能瓶頸。所以,性能優化是一個迭代的工作,循環往復,直至滿足系統需要的性能指標,而這也正是IT運維管理工作在企業中的一大價值所在。