“云智慧幫我們建立了一套監(jiān)測、響應(yīng)、分析、管理的監(jiān)管機(jī)制,有效的提高了業(yè)務(wù)系統(tǒng)的支撐能力。”
——同城旅游主管 徐美鳳
“云智慧實(shí)時(shí)性能監(jiān)控,在用戶訪問高峰期可及時(shí)發(fā)現(xiàn)問題,排除故障,保障后臺性能的穩(wěn)定性,為陌陌業(yè)務(wù)發(fā)展提供了有力支撐。”
——陌陌運(yùn)維總監(jiān) 陳湛翀
“原有上千臺服務(wù)器需要大量的人工任務(wù)干預(yù),現(xiàn)在實(shí)現(xiàn)全程自動(dòng)化,減少了對業(yè)務(wù)運(yùn)營的影響。”
——豌豆莢質(zhì)量總監(jiān) 高磊
上面這些評語是云智慧30萬用戶中的代表者的心聲,他們是云智慧監(jiān)控寶的忠實(shí)粉絲,也是我國應(yīng)用性能管理(APM)的早期嘗試者。
應(yīng)用性能管理在國外已經(jīng)是比較成熟的產(chǎn)品了,Gartner曾在2011年對應(yīng)用性能管理(Application Performance Management,APM)做了界定。簡而言之,APM是一種網(wǎng)絡(luò)及應(yīng)用性能管理方式,通過全網(wǎng)可視、應(yīng)用性能監(jiān)控、智能預(yù)警三大機(jī)制實(shí)現(xiàn)端到端的終端用戶體驗(yàn)監(jiān)控,幫助IT運(yùn)維人員預(yù)見和避免系統(tǒng)故障,保障網(wǎng)絡(luò)應(yīng)用的高可靠性。在我國,隨著互聯(lián)網(wǎng)產(chǎn)業(yè)的興起,應(yīng)用性能管理最初的應(yīng)用就在于實(shí)現(xiàn)網(wǎng)絡(luò)流量可視化,從網(wǎng)絡(luò)二層到網(wǎng)絡(luò)七層,通過L2至L7全方位的流量分析,管理員可以輕松了解網(wǎng)絡(luò)中的流量和應(yīng)用構(gòu)成,以及包大小分布,網(wǎng)絡(luò)層協(xié)議流量等信息。
云智慧是國內(nèi)涉獵應(yīng)用性能管理較早的廠商,其監(jiān)控寶產(chǎn)品在圈中“聞名遐邇”,概括監(jiān)控寶的特點(diǎn)離不開兩大關(guān)鍵詞,一是大數(shù)據(jù)平臺,二是SaaS模式。
根據(jù)云智慧客戶服務(wù)總監(jiān)劉志達(dá)的介紹,云智慧做網(wǎng)站監(jiān)控起家,當(dāng)前的監(jiān)控寶產(chǎn)品真正做到了端到端的應(yīng)用性能管理,監(jiān)測從用戶發(fā)起請求到任務(wù)完成的全過程。這個(gè)過程可能會涉及到數(shù)據(jù)傳輸?shù)木W(wǎng)絡(luò)、防火墻、Web和應(yīng)用服務(wù)器、代碼、存儲等其他物理設(shè)備的性能等等。
這其中每個(gè)環(huán)節(jié)的性能下降都會影響到用戶的訪問體驗(yàn),監(jiān)控寶會對這些環(huán)節(jié)的數(shù)據(jù)進(jìn)行采集、分析,快速發(fā)現(xiàn)故障,準(zhǔn)確定位問題,實(shí)現(xiàn)用戶體驗(yàn)的優(yōu)化。
數(shù)據(jù)采集之后的分析過程,就是充分利用大數(shù)據(jù)平臺的過程。云智慧在自己的數(shù)據(jù)中心和云數(shù)據(jù)中心中,創(chuàng)建了基于Hadoop架構(gòu)的大數(shù)據(jù)分析平臺,對用戶在公網(wǎng)的性能數(shù)據(jù)進(jìn)行分析、對比,將報(bào)告反饋給用戶。
由于法規(guī)和行業(yè)特點(diǎn),很多用戶選擇了在企業(yè)內(nèi)部的私有云中使用監(jiān)控寶產(chǎn)品,對內(nèi)網(wǎng)性能和私有云上應(yīng)用性能進(jìn)行監(jiān)控,此時(shí)的大數(shù)據(jù)分析就在企業(yè)內(nèi)部進(jìn)行,分析報(bào)告能夠幫助企業(yè)更好的定位問題,保障SLA等級。
也許有人會提出,數(shù)據(jù)中心整體解決方案廠商也往往會向用戶提供基于數(shù)據(jù)中心的監(jiān)控解決方案,云智慧客戶服務(wù)總監(jiān)劉志達(dá)解釋說,這些數(shù)據(jù)中心整體解決方案提供商的監(jiān)控方案重點(diǎn)多基于設(shè)備運(yùn)行本身,關(guān)注服務(wù)器、存儲、網(wǎng)絡(luò)等設(shè)備的健康情況。而監(jiān)控寶則關(guān)注應(yīng)用性能,及用戶的實(shí)際感受。很多時(shí)候,設(shè)備的健康運(yùn)行未必能帶來用戶感受的順暢。
無論是基于公有云的公網(wǎng)監(jiān)控,還是對企業(yè)內(nèi)部私有云的監(jiān)控,云智慧提供的功能和使用模式都是一樣的,收費(fèi)模式都是計(jì)時(shí)收費(fèi)。這也就是常說的SaaS模式——云計(jì)算的重要模式之一。SaaS模式,對于用戶而言,是最經(jīng)濟(jì)的服務(wù)獲取模式。
如果說監(jiān)控寶的職責(zé)是保障用戶最佳的性能體驗(yàn),那么云智慧已經(jīng)醞釀成型并即將發(fā)布的另外一款產(chǎn)品“透視寶”將為企業(yè)未來業(yè)務(wù)發(fā)展提供最有力的支持。通過大數(shù)據(jù)分析平臺提供的報(bào)告,透視寶能夠?yàn)槠髽I(yè)未來的IT規(guī)劃提出合理化的建議。如根據(jù)業(yè)務(wù)的增加,對服務(wù)器數(shù)量的增加或是網(wǎng)絡(luò)帶寬的增加提出建議。這種規(guī)劃建議對于企業(yè)CTO和CEO將有著非凡的價(jià)值。
目前監(jiān)控寶的30萬用戶分布在全國各地,從小型個(gè)人用戶到大型互聯(lián)網(wǎng)公司都在體驗(yàn)著這種應(yīng)用性能管理SaaS平臺帶來的便捷。為了保證對公網(wǎng)數(shù)據(jù)的實(shí)時(shí)傳輸,云智慧公司在全國部署了多個(gè)采集點(diǎn),并使用獨(dú)享帶寬,每個(gè)點(diǎn)的帶寬都會留有余量,并根據(jù)需要不斷增加帶寬。
就監(jiān)控寶本身而言,其行業(yè)特性并不明顯,但就產(chǎn)業(yè)發(fā)展來看,互聯(lián)網(wǎng)用戶對應(yīng)用性能管理的接受程度普遍超前,很多在線旅游、在線金融、在線教育都非常關(guān)注性能,是監(jiān)控寶的忠實(shí)用戶。隨著應(yīng)用性能管理APM理念的普及,傳統(tǒng)行業(yè),如傳統(tǒng)教育,政府行業(yè)都開始嘗試采用應(yīng)用性能管理解決方案提升企業(yè)內(nèi)部的應(yīng)用性能。
應(yīng)用性能管理(APM)是一個(gè)大課題,云智慧的監(jiān)控寶是第一步,排除性能障礙;透視寶是第二步,提升業(yè)務(wù)支持。未來,還有第三步,第四步……需要云智慧團(tuán)隊(duì)和它的合作伙伴們繼續(xù)攜手前行。