來自數據中心的挑戰可能林林總總,不一而足,然而保持對系統和數據的密切關注,管理員能夠隨時準備好迎接問題。
作為一名數據中心管理員,很容易陷入解決具體問題的重復之中,因為他們沒有站在更加宏觀的視角看問題。然而,數據中心的挑戰,從操作障礙到宏觀經濟問題,都可能來自四面八方。與其等待不可避免的問題發生,管理員更應積極收集數據、分析趨勢并準備做出反應。
下文我們將關注管理員采用IT監控的最佳實踐預測和解決他們所面臨的三則常見的數據中心挑戰。
運營問題
如果你用于bug修復的周期時間需要12個月以上,這是一個好現象,因像COBOL這樣的遺留系統以及操作實踐共同造成這一周期的時間變長,需要更換。數據中心管理員需要考慮采用軟件作為一種服務或SQL和C重寫替換這些遺留系統,如果更換系統而不愿意改變業務流程,你投入大價錢的結果將是很大比例的軟件將不能正常運行。從特定部門發來的迅速增加的需求變更請求清單更像是個警告,一些員工抗拒改變業務流程。
操作上,管理員最重要的工作是要收集的數據中心正在發生的趨勢數據。如果一件工作要花上兩倍的時間處理,那就必須弄清原因。監控存儲、網絡和服務器的操作,使用結果來顯性化瓶頸和故障。良好的IT信息監測系統需要花費資金和工作人員的時間,但蠻力的方法收集來的更多是外部數據,很容易會導致信息過載,而無法尋找到根本原因。
升級存儲
似乎購買更多的硬盤當作存儲空間是進行存儲升級最簡單的解決辦法,但重要的是要選擇正確的存儲類型,如快速的固態硬盤(SSD),緩慢的串口(SATA)散裝硬盤或網絡存儲。你的監控需要覆蓋每一層級存儲的使用容量以及IOPS趨勢。當前最好的做法是把不常用的數據從主存儲層中遷出,真正需要購買更多存儲的重要依據是計算機所生成的趨勢數據。如果你有很多設備,趨勢分析將有助于把驅動器遷移到最需要它們的地方。
企業中的存儲將變得更加復雜。它已經從一個簡單的主/從硬盤驅動器(HDD)的存儲模型,演變為基于SSD和散裝串口硬盤的模式。未來兩年將非易失性DIMM(NVDIMM)存儲,3D XPoint的非易失性存儲器(NVMe)固態硬盤,高容量的SATA固態硬盤,同時具備更多的網絡和集群的應用選項,如虛擬存儲區域網絡(SAN),超融合系統和遠程直接內存訪問(Remote Direct Memory Access)連接。當這些技術成為主流,自動化IT監控將是調整和優化操作的唯一方法。
更高級別網絡
網絡同樣也帶來了一些數據中心的挑戰。用來控制虛擬局域網的安裝和拆卸的模板和規則會變得越來越流行,將授權他們使用云服務部門的用戶。然而,這些用戶如果不調整網絡,當部署新的云服務,它們將會出現松散的兩端。用可識別瓶頸的自動化工具改進用戶體驗不失為一種好辦法。
同樣至關重要的還有緊盯遺留系統相關的趨勢,以及鏈接中搬運容量的使用百分比。這可能釋放出一種需要重新構建某些工作負載的信號,進而能夠演示出這些變更是如何起到作用的。隨著云計算和集群業務流程技術的進步,智能負載平衡方法也將更加突出,重資源實例與輕負載相融合在一起。
服務器上有幾塊額外的顯示器,包括動態RAM(DRAM)和CPU的利用率。我們很快就會有云的業務流程工具,它能識別熱點,按照自動平衡工具工作。這仍然是一個不斷發展的領域,公司需要使用組織過程資產來引導每個單一應用程序上的決定。
任何好的IT監控軟件能力的一部分是,當某項數值超過閥值時能夠接收警報。尋找一個快速進入問題的軟件包。如eG Innovations Enterprise 6.1和Printerlogic的打印機安裝程序等工具,可以在很短時間將執行緩慢的工作放入應用程序進程的監控位(顯性化問題所在),而不需要通過圖形系統樹手動鉆取。
綜上所述,巧用IT監控軟件和趨勢分析能夠提高應對數據中心挑戰和現實威脅的能力。