讓您企業(yè)的IT基礎(chǔ)設(shè)施上所提供的歷史數(shù)據(jù)隨時可用其實(shí)能夠帶來諸多方面的益處。其將有助于您企業(yè)的分析、預(yù)測、災(zāi)難恢復(fù)和故障排除。
當(dāng)Ross剛剛加入一家技術(shù)經(jīng)銷商擔(dān)任系統(tǒng)管理員時,他覺得自己簡直可以說是一片黑暗中制定關(guān)于IT基礎(chǔ)設(shè)施的相關(guān)決策。該公司在過往并沒有監(jiān)測他們的基礎(chǔ)設(shè)施,故而也就沒有他在工作過程中需要借助以制定決策的相關(guān)數(shù)據(jù)信息。
Ross當(dāng)然希望能夠解決導(dǎo)致系統(tǒng)運(yùn)行減速和停機(jī)的相關(guān)問題。但更為重要的是,他的目標(biāo)是能夠使得該公司的基礎(chǔ)設(shè)施更具彈性,從而盡量防止問題的發(fā)生。他求助于創(chuàng)建腳本和導(dǎo)出數(shù)據(jù),但他發(fā)現(xiàn),數(shù)據(jù)會迅速增加,填滿了他的存儲空間,并甚至導(dǎo)致了更多的問題。
Ross查看了各種的監(jiān)控解決方案,并發(fā)現(xiàn)這些監(jiān)控解決方案通常在保存企業(yè)數(shù)據(jù)的時長方面都有一定的限制。他發(fā)現(xiàn)其中一款解決方案,使他能夠盡可能長久的保存歷史數(shù)據(jù),只要他喜歡。更好的是,該款解決方案能夠?qū)?shù)據(jù)信息存儲在云中,所以他不必?fù)?dān)心其對該公司的基礎(chǔ)設(shè)施帶來任何影響。他通過向公司高層解釋掌握歷史信息的益處,說服了公司的高層領(lǐng)導(dǎo)們進(jìn)行了這方面的投資。而這些歷史數(shù)據(jù)信心包括能夠執(zhí)行以下方面的操作的功能:
1、在執(zhí)行前后進(jìn)行分析
在技 術(shù)領(lǐng)域,唯一保持不變的趨勢便是不斷的改變了。
如果您像其他IT領(lǐng)導(dǎo)者一樣,那么您會頻繁的在技術(shù)領(lǐng)域進(jìn)行投資。畢竟,您需要不斷的適應(yīng)企業(yè)需求的增長,并將更先進(jìn)的技術(shù)融入到您企業(yè)的環(huán)境,使之為您企業(yè)所用。但是,您是否準(zhǔn)確的知道您從這些技術(shù)投資中獲得了多少價(jià)值呢?您知道這些技術(shù)投資是如何影響您企業(yè)的基礎(chǔ)設(shè)施的其他領(lǐng)域的嗎?
例如,在不同的企業(yè)組織安裝了flash閃存存儲之后,我們會看到兩種完全不同的結(jié)果。其中一類公司可能會感到非常獲益,因?yàn)槠鋾娱L導(dǎo)致運(yùn)行放緩的高延遲期??赡艿那闆r是,他們的工作負(fù)載是具備高IOP的讀取密集型。另一類企業(yè)則可能認(rèn)為flash閃存對于他們而言根本不奏效。而通過查看后者的前后數(shù)據(jù),他們很可能會發(fā)現(xiàn),IOP的速度增加已經(jīng)使得他們的CPU或網(wǎng)絡(luò)飽和了,進(jìn)而形成了一個新的瓶頸。
當(dāng)您企業(yè)遷移到云托管時,在執(zhí)行之前和之后的分析也是相當(dāng)有用的。如果您在遷移之前,亟待遷移到云中的應(yīng)用程序上有相應(yīng)的數(shù)據(jù),那么在試用期和遷移完成之后,您可以確定性能是否正在提高,降低或仍然保持未變。如果在試用之后出現(xiàn)性能下降,您可以與云服務(wù)供應(yīng)商討論,并確保他們滿足您的服務(wù)水平協(xié)議(SLA)的要求。
2、預(yù)測技術(shù)需求
為了提高技術(shù)效率,您企業(yè)需要準(zhǔn)確地預(yù)測您的業(yè)務(wù)需求。而由于相關(guān)的數(shù)據(jù)通常無法提供,例如關(guān)于存儲和容量使用的清晰視圖數(shù)據(jù),使得企業(yè)的IT部門往往有過度配置供應(yīng)的趨勢。不幸的是,鑒于這樣會提高資本和運(yùn)營成本,故而可以說這是一種成本代價(jià)昂貴的用以確保性能的方式。
為了要預(yù)測企業(yè)未來的業(yè)務(wù)需求,您將需要立足于過去所收集的數(shù)據(jù)信息,這些數(shù)據(jù)將有助于您確定企業(yè)業(yè)務(wù)的發(fā)展趨勢。您應(yīng)該能夠使用任何相關(guān)的數(shù)據(jù),無論這些是過去三年所顯示的業(yè)務(wù)穩(wěn)定增長的數(shù)據(jù),還是過去三個月,在您企業(yè)簽訂了一家新的大客戶之后的數(shù)據(jù)。
3、災(zāi)難恢復(fù)
假設(shè)當(dāng)某處管道的破裂會導(dǎo)致您企業(yè)的數(shù)據(jù)中心被淹沒時,其對于您企業(yè)的生產(chǎn)所帶來的至關(guān)重要便是服務(wù)器運(yùn)行的下降。而您企業(yè)將需要通過將這些服務(wù)器上的應(yīng)用程序遷移到備份服務(wù)器來快速重新啟動并實(shí)現(xiàn)運(yùn)行。但您可能無法肯定的是:您企業(yè)是否有足夠的容量。如果您企業(yè)有一套保留了歷史數(shù)據(jù)信息(不在同一個數(shù)據(jù)中心!)的監(jiān)控解決方案,您就可以通過檢查歷史記錄以確定內(nèi)存和CPU的需求,以及應(yīng)用程序是否適合其他地理位置的非生產(chǎn)服務(wù)器。
4、故障排除和根本原因分析
如若缺乏您企業(yè)的IT環(huán)境的歷史數(shù)據(jù),就將很難確定發(fā)生運(yùn)行減速和停機(jī)的根本原因。這會使得相關(guān)的管理團(tuán)隊(duì)可能需要花費(fèi)幾個小時甚至幾天的時間來找到并解決問題的核心。但是,如果您企業(yè)有關(guān)于服務(wù)器、存儲、SAN和應(yīng)用程序的性能的歷史記錄數(shù)據(jù)信息,以及一目了然地顯示信息的儀表板,您就可以快速發(fā)現(xiàn)被更改的內(nèi)容,更改發(fā)生的時間,并在第一時間解決問題。
為了確保在您企業(yè)業(yè)務(wù)生產(chǎn)過程中持續(xù)的推進(jìn)卓越的性能,您需要了解過去發(fā)生了什么。這將幫助您在工作任務(wù)執(zhí)行之前和之后進(jìn)行分析,預(yù)測您企業(yè)的技術(shù)需求,從盡快從災(zāi)難中恢復(fù),并解決運(yùn)行放緩和停機(jī)的根本原因。在搜尋一款基礎(chǔ)設(shè)施性能管理工具時,請不要安排比所需的數(shù)據(jù)少的數(shù)據(jù)。而且,在理想情況下,盡量尋找一款能夠?qū)⒛髽I(yè)的數(shù)據(jù)存儲在云中的解決方案,因此這樣您就不必?fù)?dān)心其會對您企業(yè)的IT環(huán)境造成影響。
關(guān)于作者
本文作者Chris Churchey是ATS集團(tuán)和Galileo公司的聯(lián)合創(chuàng)始人兼主管,他在企業(yè)開放系統(tǒng)和存儲技術(shù)方面擁有超過35年的IT經(jīng)驗(yàn)。他的重點(diǎn)關(guān)注領(lǐng)域是操作系統(tǒng)、虛擬化、大規(guī)模系統(tǒng)/存儲架構(gòu)、設(shè)計(jì)和集成以及計(jì)算機(jī)資源的性能優(yōu)化。Chris擁有IBM公司所頒發(fā)的眾多認(rèn)證,同時是一名服務(wù)器/存儲整合、性能、AIX、Linux、電源、虛擬化和IBM存儲技術(shù)方面的主題專家(SME)。