無(wú)論企業(yè)是使用AWS,Azure,或其他的IaaS提供商,作為一個(gè)MSP(管理服務(wù)提供商)就是要確保客戶獲得最佳的實(shí)踐。每天你應(yīng)該監(jiān)控他們的用法,以找到問(wèn)題所在。通過(guò)監(jiān)控他們的工作量,可以根據(jù)客戶目前的需求提出縮放建議。
這些監(jiān)控就包括以下方面:
1.虛擬機(jī)
從基礎(chǔ)開始。你需要監(jiān)視CPU使用率(百分比,用戶時(shí)間,閑置時(shí)間等)。你需要監(jiān)視內(nèi)存以及(正在使用的百分比,可用的百分比)。
2.網(wǎng)絡(luò)
這指的是在進(jìn)出VM的網(wǎng)絡(luò)流量。監(jiān)視此通信(網(wǎng)絡(luò),TCP連接建立和失敗的),可以在達(dá)到飽和之前,提醒你的問(wèn)題。
3.磁盤I / O
監(jiān)視磁盤I / O(讀取字節(jié),寫入字節(jié)交換比例,和磁盤隊(duì)列長(zhǎng)度)可以讓你了解如何影響虛擬機(jī)客戶的應(yīng)用程序。例如,發(fā)現(xiàn)太多的讀取/磁盤可能表明需要緩存層。如果你發(fā)現(xiàn)磁盤I / O瓶頸,它可以表示需要升級(jí)到一個(gè)新的虛擬機(jī)。
4.存儲(chǔ)
如果成千上萬(wàn)的人同時(shí)使用系統(tǒng),云存儲(chǔ)的磁盤空間很快就會(huì)耗盡.。監(jiān)控存儲(chǔ)(隊(duì)列可用性,隊(duì)列總請(qǐng)求等)可以讓你的客戶知道之前發(fā)生的問(wèn)題,他們需要升級(jí)存儲(chǔ)。
5.數(shù)據(jù)庫(kù)
監(jiān)測(cè)數(shù)據(jù)庫(kù)(CPU利用率,成功連接等),可以讓你了解你的客戶是否需要放大或縮小他們的數(shù)據(jù)庫(kù)規(guī)模以達(dá)到最佳性能。當(dāng)客戶有能力調(diào)整性能,在MSP妥善的監(jiān)控之下,讓客戶知道什么時(shí)候可能有一個(gè)潛在問(wèn)題。
6.成本
看成本是非常重要的,因?yàn)榇蠖鄶?shù)云提供商或基于使用模型的基礎(chǔ)上建立服務(wù)收費(fèi)。重要的是如果知道成本超過(guò)預(yù)算,就要迅速采取行動(dòng)
7.平臺(tái)
同時(shí)監(jiān)控各個(gè)資源是非常重要的,每個(gè)人都應(yīng)該關(guān)注平臺(tái)范圍的警報(bào)。無(wú)論AWS和Azure的狀態(tài)頁(yè)沒(méi)有提供更新。
最佳實(shí)踐
告訴你的客戶需要高度重視監(jiān)測(cè)的重要性,因?yàn)樗苯佑绊慖aaS的性能和成本。監(jiān)測(cè)可以在問(wèn)題出現(xiàn)之前發(fā)現(xiàn)并解決,以避免性能問(wèn)題和停機(jī)時(shí)間。