盡管云供應商一般會提供強大的云環(huán)境管理工具組,但是第三方工具確實能夠起到很大作用。高度分散的云基礎架構時常需要細分到一定水平的工具,而源生的云監(jiān)控工具無法滿足這一需求。鑒于各環(huán)境情況不同,必須由IT管理員來決定哪種工具最為合適。
第三方工具旨在為云數(shù)據(jù)中心的監(jiān)控提供“單一管理平臺”,這些軟件試圖集成云管理工具,提供全局性查看整體基礎架構的方法。根據(jù)數(shù)據(jù)中心的位置,管理員可以進行探索,找到所有的必要組件,維護健康的環(huán)境。
在第三方工具中要找什么?
使用第三方云管理工具的想法是基于人們想要解決源生工具不能管理或者發(fā)現(xiàn)不了的內容。在運行任何新工具組之前,管理員必須檢查并了解當前環(huán)境中有什么,正在運行什么。在初步調查之后,IT管理員才能根據(jù)需要的功能作出正確的決定。下面是一些探索第三方工具時需要尋找的功能:
分布式環(huán)境管理:第三方工具最大的優(yōu)勢在于可以觀測分布式云環(huán)境。當一家公司有多個云端的時候,管理員必須得對所有位置上的數(shù)據(jù)中心的操作具有詳細認知,我們需要的工具必須能夠發(fā)現(xiàn)各個云位置發(fā)生的事情。這代表著監(jiān)控與管理一切:從資源到程序負載均衡、甚至用戶數(shù)量。
服務等級協(xié)議(SLA)管理:第三方云管理工具的一大功能在于其監(jiān)控SLA需求的能力,可能會包括服務質量(QoS)監(jiān)控,甚至具體服務器正常運行時間指標在內。通過確認滿足了SLA,管理員可以最大限度地讓環(huán)境運行。
災難恢復:使用第三方工具組的目標之一在于加強災難恢復功能。在有計劃的行動中,管理員必須了解根據(jù)災難恢復功能需要提供什么樣的工具組,尤其是考慮到高可用性與災難恢復故障轉移的前提下,在工具組的選擇方面作出正確的抉擇。
工作流自動化:一個不錯的功能是在云環(huán)境中使用一些自動化的功能。例如,如果在一個云數(shù)據(jù)中心上發(fā)現(xiàn)某個服務器上的用戶量激增,就會執(zhí)行措施以減輕額外用戶造成的負擔,后臺軟件工具會自動加速新的虛擬機運行,從而幫助分擔額外的用戶量。
全球資源控制:有多個云端時,云環(huán)境會難以管理。在全球范圍內對資源進行詳細的檢查可能會讓管理出現(xiàn)的問題進一步惡化,這時第三方工具就能起到作用了。設置警報、監(jiān)控協(xié)議、甚至自動恢復程序都包含在工具組功能中,還有某些管理員可能需要的強大功能:在分布式層面對資源進行詳細管理。
高級報警功能:除了向正確的管理員發(fā)送郵件之外,一些公司還在尋找更多的報警策略,像是安裝自動電話、發(fā)送短信甚至組建一個自動化的內部應答系統(tǒng)。一些第三方工具包含了這種先進的報警機制,確實能在尋求此類監(jiān)控的IT環(huán)境中幫上大忙。
安全審計:使用第三方工具時,一些公司可能會需要安全審計追蹤。有嚴格標準并遵守協(xié)議的公司可能需要一個可以記錄詳細安全日志并進行監(jiān)控的工具組,這時管理員就可以使用針對安全意識環(huán)境的工具組。
應用程序的可視性:一些第三方云管理工具組可以觀察到應用如何運行,而很多源生工具并不具有這項功能。這些工具還可以細致到包含錯誤記錄、安全訪問與性能監(jiān)控,根據(jù)開發(fā)交付的應用類型,一些管理員可能需要監(jiān)控某些特定的云應用。
拒付:各部門訪問云端負載不同,某些公司對不同部門設定具體花費的金額,他們會需要這種功能。通過該功能,管理員可以預測不同部門的增長情況,并得出最切合IT團隊需求的預算。
需要尋找的內容
盡管這些工具功能強大,使用者卻很容易被所有這一大堆功能中搞暈。就像源生工具那樣,這些軟件并不能包治百病,各有各的缺點。不過在對環(huán)境進行更充分的計劃和了解之后,管理員就能夠作出更好的決策,來避免購買的工具組有用不上的功能。下面是一些需要謹慎對待的情況:
訓練:與任何新工具一樣,第三方工具也需要額外訓練。要記得,即便有那些功能,也不意味著管理員就知道它的用法。花些時間學習一下新工具,這是充分利用它們的最好辦法。
安裝與配置:與打包安裝的源生工具不同,第三方工具需要額外的配置工作。有時候直接運行安裝向導就可以了,也有時候會比較復雜,需要將現(xiàn)有組件與第三方監(jiān)控工具相合并。跳過這些步驟或者錯誤地進行配置可能會造成金錢上的浪費,甚至對云環(huán)境產(chǎn)生負面影響。
測試與維護:需要由管理員確定第三方工具組是否運行良好。盡管第三方工具是安裝在現(xiàn)有的環(huán)境中,偶爾對工具所提供的結果還有指標進行驗證是非常重要的。也就是說需要確保工具發(fā)揮最優(yōu)性能,并對引入工具以完成各大核心元素進行測試。
持續(xù)的可視性:在分布式云環(huán)境中,維護持續(xù)的可視性可能會是一個挑戰(zhàn)。第三方工具可能起到作用,也有可能產(chǎn)生負面效果。通過設置管理角色,IT管理員可以將責任細分并列入監(jiān)控范圍,讓有時候顯得太過寬泛的第三方工具派上用場。如果一個團隊沒有準備好或者訓練完畢,他們發(fā)現(xiàn)或收集的所有信息可能都沒有用處。這樣一來,環(huán)境中的錯誤就會產(chǎn)生影響,因為數(shù)據(jù)并未正確關聯(lián)。
警報:即便在高級警報功能中,第一步就是進行正確的設置。第二步是持續(xù)維護該系統(tǒng)。這是由于一個工具有這項功能并不代表它就能夠開箱即用,確保所有警報正確設置并定期進行測試非常重要。工具就是幫助數(shù)據(jù)中心有效運作的機制。無論你是使用源生工具還是第三方工具,請確保與數(shù)據(jù)中心的生態(tài)系統(tǒng)保持一致。也就是說,需要了解公司需求增長方向,還有哪些工具能夠起到作用。