王璐,海爾集團PSI經(jīng)理,擁有多年的IT運維經(jīng)驗,負責(zé)過基礎(chǔ)運營、一體化平臺和架構(gòu)、開發(fā)運維等,擅長中間件以及一體化平臺的相關(guān)應(yīng)用,基礎(chǔ)網(wǎng)絡(luò)、DC、終端運維以及信息安全等領(lǐng)域。王璐認為:“移動應(yīng)用的監(jiān)控與運維管理,必須用產(chǎn)品結(jié)合實際應(yīng)用,打造出終端用戶較好用戶體驗的應(yīng)用才是成功的應(yīng)用。”
上圖為:海爾集團PSI經(jīng)理王璐
影響移動應(yīng)用的兩大關(guān)鍵:最終體驗及響應(yīng)時間
影響移動應(yīng)用使用的關(guān)鍵包括兩個部分,一是用戶的最終體驗,二是用戶的響應(yīng)時間,用戶最終體驗是感覺,很難描述,但開發(fā)過程中的三秒理論非常關(guān)鍵,比如對供應(yīng)商的考核,對開發(fā)人員的考核,都必須三秒內(nèi)響應(yīng)用戶的需求。但傳統(tǒng)IT應(yīng)用是被動式的,移動應(yīng)用做得好不好,體驗好不好,更取決于企業(yè)高管的需求及推進的力度。
移動業(yè)務(wù)的三點挑戰(zhàn)
移動應(yīng)用在帶來方便性的同時,也帶來了挑戰(zhàn)。移動業(yè)務(wù)有三點挑戰(zhàn),首先是由于在開發(fā)上引入了更多前端技術(shù),因此要做移動前端的應(yīng)用;其次是移動應(yīng)用帶來了快速迭代的過程,這讓開發(fā)節(jié)奏加快;最后是當(dāng)開發(fā)快了以后,自身開發(fā)人員速度跟不上。
因此,應(yīng)重點分析誰在用APP?什么時間被使用?用戶的行為是什么?用戶是如何使用的?用戶的最終體驗是什么?我們是否可為用戶提供更多的價值?上述問題是移動應(yīng)用如何管理的問題,包括四種解決方案,第一種是移動應(yīng)用分析,第二種是針對移動應(yīng)用的質(zhì)量跟蹤,第三是包括移動的一些網(wǎng)關(guān)等,第四是循環(huán)過程分析,即當(dāng)發(fā)現(xiàn)問題以后,我們?nèi)绾芜\維支持。
如何監(jiān)控用戶體驗?
移動應(yīng)用分為三大塊,第一種是前端的移動應(yīng)用監(jiān)控,其次是APM,包括業(yè)務(wù)監(jiān)控、后端方法監(jiān)控,第三塊是技術(shù)架構(gòu)層面的監(jiān)控。
當(dāng)企業(yè)的內(nèi)部應(yīng)用,操作系統(tǒng)沒有問題,數(shù)據(jù)庫沒有問題,開發(fā)也沒有問題,在整個指標(biāo)過程當(dāng)中,可能每一強指標(biāo)都是合規(guī)的,但是最終用戶還是覺得慢,這是為什么?如何去監(jiān)控用戶的體驗?
首先需要監(jiān)控用戶的真實業(yè)務(wù)操作,業(yè)務(wù)下單如何操作,用戶點哪一個按紐會出現(xiàn)什么情況等等,這個過程中用戶的真實體驗如何?
其次,需要實施端到端業(yè)務(wù)監(jiān)控,端到端業(yè)務(wù)監(jiān)控包括前端的響應(yīng)時間,后端的響應(yīng)時間、接口時間、方法的時間等等,再繼續(xù)細化到重構(gòu)時間,緩存PCP協(xié)議的時間,頁面往返的時間,網(wǎng)絡(luò)傳輸?shù)臅r間等。
移動應(yīng)用的價值
移動應(yīng)用管理、監(jiān)控能帶來哪些價值?
首先,通過監(jiān)控用戶的體驗和使用習(xí)慣,可以了解到用戶怎么和企業(yè)互動以及行為分析;其次,通過對APP性能的監(jiān)控,可以了解到用戶是不是體驗好、響應(yīng)快;第三是預(yù)防系統(tǒng)崩潰;第四是幫助企業(yè)實施遠程指導(dǎo);第五是可以提前預(yù)警基礎(chǔ)架構(gòu)的問題,包括風(fēng)險。
移動應(yīng)用的選擇及管理
從用戶的體驗、應(yīng)用的性能和應(yīng)用的瓶頸、基礎(chǔ)服務(wù)去建立企業(yè)移動應(yīng)用的管理能力。那么,如何選擇移動應(yīng)用相關(guān)產(chǎn)品及解決方案?首先,應(yīng)選非侵入式的,其次,選擇被動式監(jiān)控,不選擇主動式監(jiān)控。
在這個過程中,首先需要梳理指標(biāo),確定所有的監(jiān)控的指標(biāo)細則;
第二要從兩個方面監(jiān)控、展示,從領(lǐng)導(dǎo)層面和業(yè)務(wù)層面如何去看整個應(yīng)用的形式,將可用性以及客戶體驗的質(zhì)量以及服務(wù)資源的狀態(tài)做成統(tǒng)一的視圖,當(dāng)可用性不達標(biāo)時,系統(tǒng)付款會全部停掉。
第三是制定整個業(yè)務(wù)端到端的響應(yīng)時間規(guī)則,從前端瀏覽器時間到DNS的時間,整個網(wǎng)絡(luò)傳輸?shù)臅r間,前端服務(wù)器的響應(yīng)時間,外部服務(wù)器的調(diào)用時間、數(shù)據(jù)庫調(diào)用時間等等進行主動測試,并注意兩個指標(biāo),第一個指標(biāo)是成功率,包括一些報錯的信息,第二就是慢速的問題。
通過上述方式,從前端的指標(biāo)梳理到后端的業(yè)務(wù)模式的建立,從業(yè)務(wù)人員和運維人員的使用到開發(fā)的優(yōu)化,定期形成運維報告,包括業(yè)務(wù)指標(biāo)的報告以及針對資源、節(jié)點、服務(wù)的報告,以給開發(fā)人員提供相關(guān)的指導(dǎo)。