運維是一個古老的話題,可是今天的運維比以前已經大不一樣了,智能化、可視化這些新技術給運維帶來了更多新的手段,在7月14日企業網D1Net舉辦的2018汽車行業CIO現場,博睿數據技術總監劉毅先生在《智能運維驅動車企數字化轉型》中講述了車企轉型中關于智能運維的那些事。
以下是現場速記:
【博睿數據技術總監 劉毅】
劉毅:感謝各位專家,我是代表北京博睿來參加會議的,因為汽車行業的會議是第一次參加,原來很多都是參加金融或者互聯網的會議。實際上剛才陸總提到了幾個關鍵詞即用戶體驗,今天所有的IT系統支撐業務很多時候是為用戶提供這樣的保障服務,其實大家可能關注更多的是用戶在使用自家IT系統的時候的滿意度和保障程度,這對我們運維整個的體系提的要求而言是一項飛躍。該領域大家都知道,因為以前的十年基本上互聯網高速發展,其實互聯網行業大部分的用戶對運維的體系理解已經超越了可能一些傳統行業,今天也借此機會,我們把其中的一些與公司相關的理解給大家做一次分享。
此次演講的目錄是“取勢、明道、優術”,長江商學院的這句話被引用了無數次。汽車行業數字轉型,第一個是我會給大家說一些大背景。第二個是具體在ATM上面,我們助力車企實現智能制造,其實智能制造說起來有點大,可能在IT支撐方面給大家貢獻一些新的思路。第三個是簡單介紹一下博睿全數據鏈、業務鏈的應用性能管理上面的一些經驗。數字轉型其實是整個行業的趨勢,據調查行業第三方的數據,一千強企業有67%已經提到數字化轉型的核心戰略,剛才陸總提到很核心的一點是數字化轉型,實際上數字化轉型可以非常虛,但也可以非常具體,包括現在汽車行業里面很多用戶都在嘗試著做數字化轉型。全球整個在數字化相關作坊會有1.7萬億美金,相比2017年整個會有42%的提升,當然數字化轉型概念很多,包括現在其實提到自動化駕駛,這些問題都可以囊括在數字化轉型當中,把數字化的應用到新產品開發、新的技術開發當中去,然后其中落地在中國,可能未來有20%的GDP來自于數字化轉型,這是當時整個的行業。
我們來看一下這張表,它是2017年10月份全球非常有名的,因為做IT我們都知道這個,其實是全球非常頂尖的咨詢機構,它在2017年做了一個調查,做了什么調查?大概選擇了有3000多個企業的CIO做調研,當然調研有很多的維度,其中我大概選了幾項,這是關于整個大概行業的CIO對未來在整個投入上面關注的重點上面有一些排序,可能列了很多項,其中數字化轉型、數字業務排得非常高,整個行業的CIO對這個將近排到第二位,第一位是市場增長、利潤,這永遠是企業的話題,包括現在該概念已經不難講,因為我接觸互聯網企業比較多,直接是IT部門要利潤,IT部門生產利潤,沒有什么再制造,因為沒有制造,因此IT部門都是這樣。其實他們很多的CIO考慮的是怎么樣設計產品、爭取更多的流量、更多的用戶,是這樣的概念。
但是我比較驚訝的是,在汽車行業里面,第一次數字轉化的這一項任務也被排進了前十,而且排在第四位。后來我去思考,實際上這兩年隨著互聯網+和傳統行業的疊加,再加上其實我拜訪的客戶里面,有一些是新型的汽車制造企業,在上海有好幾家,他們很多CIO直接從互聯網挖過來,他和我談的概念可能重點不是ERP、制造業,而是營銷、客戶服務、前市場與后市場的延伸,整個生態。因此其實來說,他們可能對數字的敏感、數字轉化生產的敏感度比較高,我認為這將來會成為一種趨勢。
回到現實當中,我應該是做IT有二十多年,以前是做集成出身,其實在這過程當中,也服務過很多的汽車行業服務,當然那時候還在做傳統,也做集成、ERP、咨詢,至少在近十年里面,我看到沒有什么太大變化,當然每年都在投入、建設,但是建設的核心依然是一些傳統的東西,前幾年可能數據中心,ERP在升級,或者很多新的一些再造系統,這些投入很多。但是近兩三年,我看到完全不一樣,因為實際上我剛才講到了,新的技術包括剛才早上其實陸總也提到,新的這種新能源汽車的制造,其實它會帶來汽車用途的革新非常大,實際上我們也截取了,同樣在這份報告里面,這份報告的表實際上你在未來的一到兩年里面,會最關注的新技術,在你企業里面比較關注是哪些新技術。
當然一開始我們看到都是正常的,與剛剛幾位的演講都是呼應,第一位是BI,汽車行業做BI做得很早,做金融分析數據做得很早。第二位是安全性,安全很重要。第三位是ERP,依然老三樣排在了前三位。但是我們發現幾個,因為我們同時去看了其他的調研,有些項目不在里面,但是在2017年調研上面出現了,比如說數字化市場,說到這個,我在這一年當中去拜訪過大概七八家汽車制造業,有的在上海,有的在武漢、南方廣州都有,我去的時候,帶著傳統思維,去推監測的方案,負責運維的保障。以前我認為我們汽車行業IT部門主要是在現有的系統上面應用上的問題,造成生產終端,經常會遇到投訴,需要有利的工具去保障它。但是實際上我遇到所有的用戶,大概有80%他們的IT負責人都會很關注電商、APP、服務的這種,我很奇怪,其中有一位用戶告訴我,他說很簡單,現在遇到的問題是把電商渠道當成很重要的渠道。我說車放在網頁上怎么樣賣得掉,還是要4S店傳統的營銷,但是他告訴我,他們不是,有一些特殊車主是嘗試做互聯網營銷模式,收效還不錯,他們上一次遇到問題是,他們在做沖銷,其實是一個活動,也不是直接銷售,可能預約一個什么樣的活動,非常針對年輕人的時候,沒想到用戶訪問量瞬間非常大。
因此剛才其實嘉賓有提到汽車行業不會輕易遇到電商這樣的問題,實際上不是,我的用戶里面就有經歷電商的白馬,以前雙十一只是阿里的問題,618只是京東的問題或者蘇寧的問題,但是現在實際上只要你走電商的路,互聯網的問題都會出現。實際上他當時做了很多營銷設計,但是你可能投入了大量的資金,而且你的用戶反應不錯,上你這個活動的時候居然擁塞了,而且該活動只是進行了半小時就有人投訴,你們有幾個鍵點下去沒有反應,這對銷售來說是很糟糕的問題,如果我負責銷售的活動,可能忙了一個月,終于推出去了,居然是因為我們不可預測的問題而導致了這些。數字化的市場我看到了這一點,和我實際的感受相吻合。
還有一個很重要的是,雖然不相關,即IT和人工智能,因為這不是比如說自動駕駛、什么技術,也確實是重中之重,有很多企業在研究。但是有一個地方我沒有想到的是移動的應用,我沒有想到移動應用,因為之前我去汽車行業,當然我都知道汽車行業都有做自己的APP,做了很多APP,甚至一個車廠會做很多的APP,但是我打開APP,以前我的概念是介紹一下公司、車型,然后沒有了,連一個銷售的通道都沒有,好像是一個廣告宣傳的作用。但是今天我看到的APP有一些,我想說明一些新智造的企業有很多APP的應用在汽車行業里面、汽車制造業的公司里面,其實有很多的用途,我都受到了很多教育。
比如說一家上海蠻有名的汽車制造企業,他和我說要對你們APP性能和體驗監測,我說你有多少用戶?因為我們以前都不講這個,互聯網領域叫日活有多少。他說注冊用戶有六萬,我說六萬太少了,好像項目不會做得很大。但是他告訴我們項目很重視,為什么?因為他把4S店所有大概六萬的專職銷售全部注冊,而且他要通過我們的APP上面體驗和行為數據采集去分析、管控他4S店人員的規范化,即他對4S店的人員有要求,但其實一旦發下去以后,他們并沒有完全按照要求去做。因此他們市場部做了該APP,發現其實還沒有去管控到銷售端,希望通過行為分析去分析他們是否按照規范的流程去向客戶介紹我們服務。其實這東西只要正常在APP里面走一遍,我們都可以記錄下來,包括停車時間、停留時長,或者你的到店什么的,這是互聯網里面有很多指標。
其實有很多的應用場景,但是它的用法不一定和互聯網一樣。包括剛才陸總說到每天有可能流水線上的人都用手機,給我們腦洞大開,當然我在汽車行業里面沒有想到,但是我本人做4D行業,基本上幾大4D公司都是我的客戶,他以前的應用很簡單,我只要把他需要的應用設置到運行就好,但是現在在做有兩家公司也很大,已經實現了手機替代了他們前端所有以前看到的用掃描槍在掃描包裹,以前沒有掃描槍,全部是手機,因為掃描槍只能兼容掃條碼、數據簡單錄入,如果你的業務多種經營化,實際上你的掃描槍不能用,因此手機是一個很好的替代品,主要解決手機掃描條碼的速度和掃描槍的速度一致即可,所以現在你去看快遞公司,已經讓下面他們下面所有的快遞員全部用手機替代掃描槍,這個業務量變得很大,一個快遞公司有十幾萬的快遞員。如果汽車行業的用戶用手機,員工也不少,而且會產生很多的問題,因為手機端的應用,大家都是做IT,手機端的應用比傳統的應用要復雜得多,因為操作系統、手機操作不一致,用戶使用不一致,因此實際上帶來了很大的運維困難。我發現了幾個技術,這是我剛才講到的,有很多,我也上網搜了一下,確實不少。
回到今天的挑戰,新的思維方式、新的數字化的業務模型轉變,使得我們比較關注用戶體驗,因為我們有很多的類互聯網的業務方面。剛才我在下面,其實坐我旁邊的是做汽車物流,我和他分享,因為他做技術,他說現在沒辦法支撐,希望去轉微服務架構,當然微服務架構很靈活、方便架構,而且非常容易擴充,但是微服務架構的運維很難,因為互聯網公司都是微服務架構,也不用拿手機,都是PC,性能不夠了就擴,甚至用容積方式去擴,很靈活,成本很低,但是會帶來運維上很討厭的地方,為什么?因為你都不知道這筆交易是哪個微服務接口,因此像蜘蛛王一樣,會帶來新的給用戶體驗、運維帶來更大的壓力。
第二,車與人、車與車、車與度,當然這很好理解,反正是未來汽車行業會手機的數據可能會增加十倍到二十倍,你的很多互聯網數據都要收集,自動駕駛、傳感器隨時都在采集數據,這些數據有商業價值嗎?我不知道,反正當我不知道它有什么價值的時候,我就要采集、保存,因為未來什么時候也許我發現它有商業價值。車里面,比如說以前的車聯網之類的東西。大量的這種數據使得我們未來有可能車會變成一個互聯網的流量入口,當然現在其實該概念最早不是我說的,而是新的那些造車CIO談的,完全變成互聯網的入口,只是和我們手機沒什么區別,功效不一樣,是一個開的東西,但是會有大量的數據在中間產生,其中有一部分有很大的幫助,去把它采集起來。
第三,可能比較聚焦,業務模式優勢改變,數據量幾十倍的增長,業務復雜度本來就不低,我記得汽車行業本來ERP里面有非常復雜的業務流程,現在可能生產和重心轉移到銷售、服務,怎么辦?說句實話,我喜歡實話實說,我看到的汽車行業用戶里面有非常好的,很多年前的IT客戶每天都非常忙,他們概念非常領先,已經做成與互聯網公司沒什么區別,但是有一部分還比較傳統,主要是圍繞ERP每天生產保障,不能斷,不能出問題,這樣的企業也比較多。所以一旦我的業務要發展,像這樣的運維會受到非常大的影響。
我們聚焦到運維,然后談一下全球的發展趨勢,我們現在在這兒,OPS即現在的運維方式,互聯網行業怎么樣?當然這是口號,因為互聯網行業的特點是研發即運維,產品即銷售,這是它的特點。一個軟件規劃師、應用規劃師設計出一款產品設計出來之后,需要對營收負責,如果該東西營收不好,就被拿下,或者換一個新的項目。研發是做該產品,你要為該產品的運行完全負責,現在大家覺得這有很大的問題,我們運維就是運維,研發就是研發,其實兩者之間沒有什么關聯,出了問題,運維解決運維的問題,研發解決研發的問題。我告訴大家,用我的體會來說,很多時候不能夠非常快速的去保障業務系統高質量的健康運行,該架構有很大的問題,因為研發解決研發的問題即可,大家有偏差。但實際情況是,你要排除一個業務上的問題時候,除非比如說機器已經著火,很明顯,這就是服務器問題,因為很多情況下我們說不清楚,看看服務器、網絡都正常。但是那邊用戶端有投訴,然后軟件部門也看不到程序運行的狀態,所以說我們測試都測試完,都是好的,所以上生產,運行了一個多月、一年,都沒有出問題,所以你們不能說我們有問題,這里面有很多的隔閡。但是在互聯網公司都存在這樣的爭論,因為研發也為應用順暢運行提供保障。
因此這樣一個行業的發展有些不同,但是一旦我們可能會涉及到互聯網業務轉型,或者說有多種業務經營方式,也許可能未來正是這個標準需求很大。我現在發現汽車行業里面大量的在招研發,以前我不知道,但是我每去一個公司,發現隔半年去,研發的人又多一倍,我說你們在做什么系統?他們說好多系統。反正這也是一個趨勢,因此自己很多應用上面會做很多。當然最終極限是走VIOS,我的預估是到2025年有真正成熟的VIOS的平臺會在汽車里面推動,那時候真的能夠實現只要有一個業務上的問題,系統會直接告訴你是什么原因,然后我們不需要那么多運維,這是VIOS的終極目標,但是現在需要數據通過人為的分析去解決問題。時間問題,我不展開,以后有專門針對VIOS的話題來講。
我剛剛講過,因此我們可以幫用戶聚焦解決三個問題,這是活躍的角色在這兒。第一,我們可以實現可用性和性能的體系化管理,只要你的業務系統是符合我們的要求,當然絕大部分業務系統都符合我們的要求,因為做的人太多了。我們可以幫你對應的業務運行精確到,也就是說,其實沒有什么我們看不到,你的用戶使用過程當中,可能按個按鈕發送,一直在轉圈,我們知道到底問題出在PC端、手機端,還是網絡端、服務器的某一個進程里面,實際上是我們所說的這個,把它捅出來,如果是軟件的問題讓研發解決,如何是運維的問題讓運維解決,要精準,這是對今天運維提出一個非常高的要求,我剛剛說當時的APP要用這樣的方案去解決。
第二個,我通過追蹤機制重新定義追蹤的數據分析,實現可視化。待會兒我會給大家看幾張圖,剛才其實包括陸總提到幾個好的叫軟件架構和基礎架構,我們可以把它直接在上面顯示出來,這完全不一樣。然后VIOS是現在準備在研究、試錯,但是未來不久的時間會有成型的產品,實際上需要把大量的看似沒有用的IT數據放在一起,然后經過計算,會產生一些對你有用、有價值的數據。
分工明確,我們希望未來的運維其實有這樣的圖,什么意思?管理層實際上都不是具體做研發、運維,但管理層對業務負責,比如說你的CIO或者你的CTO,或者運維總監,對業務運行負責,其實很簡單。我記得我去東唐的時候,他們的負責人移動部門的人和我說,一是我的這套業務系統好不好,能讓我可視看得見;二是我的業務系統有用戶投訴,可能有問題,你要讓我看得到在業務系統的整個過程當中哪個模塊有問題;三是你告訴我流程出來,那塊模塊的負責人是誰即可,就三個問題。實際上IT老大不用在下面做事,只要負責,但具體的問題具體的人去解決,分工明確。但我現在經常遇到一個問題是,我經常看不到,只知道等到問題爆炸,影響到生產、服務,下面的人再開始急,開始有投訴投過來,這是很被動的做法,而且就算投訴投過來,那是很局部的問題,其實我都不知道這個原因在哪里,應該去找誰,因此蠻簡單。
運營部門可能對用戶的行為感興趣,因為他對我經營分析會有所幫助。當然這里面提到運營部門,我不知道汽車行業怎么樣,我給大家分享一下券商,因為券商做得比較多,證券公司現在已經有一個部門非常強的是網金部,該部門的領導都是不懂IT,但他對我們現在APP都用,他對金融全權負責,包括零售都要負責。如果該APP出現任何問題影響使用,他可以把運維的負責人叫到面前,劈頭蓋臉的一頓說,因此它是一個業務導向的部門,有非常大的權利看住研發和運維,甚至有的網金部直接招聘研發,比如說APP業務上面一些自己做,完全自己做,其實這樣的部門蠻在乎這東西用得好不好。
第三,IT部門,網絡性能、應用性能、系統性能,說簡單也就是實際上我只要前端有人用了多少,后端就能制造什么問題。還有是前端,因為有很多前端開發部門,前端部門是要知道用戶的體驗怎么樣,因為運營部門如果有人投訴,會來找我們部門,所以我要是收到投訴怎么樣做。
簡單得介紹一下,這是公司業務,因為我們是傳統行業,可能不知道,當然有很多人知道,因為是我們的客戶。我們其實2007年成立,在中國有11年,一般IT公司從小到大生存11年不太容易,如果到互聯網行業、金融行業應該知道我們比較多,實際上我們公司隨著移動互聯網爆發成長起來,今天整個互聯網行業,大家平時都可以用到我們公司的服務,比如說你們看電影、看新聞、買東西嗎?每天都會用到,因為我也用到,有些特別是大的,它的性能條目做得非常好,很少出現很嚴重的故障,為什么?難道是它架構設計得好,就不會出問題?不是,因為他們對很多服務都進行監測,如果說這些服務有一些些甚至,比如說我告訴你們,今日頭條有很多小視頻,它的競爭對手是騰訊,大家都是在線的新聞推送,這兩個競爭到什么地步?你的小視頻我從第一個視頻推上去推到第二個視頻,因為推過去你當中會有一個間隙,然后才會放,會有緩沖,他們在算首字節回饋時間,如果說今天騰訊做得多好,然后今日頭條會去改進,因為他們有我們比較數據,他們改進,使得新聞推送要超過騰訊。競爭幾乎是每個操作都有,后面其實使用了我們非常多的用戶體驗的應用性能監測。
因此很多時候是真實的數據,一個只有300多人的公司居然有30項,而且是實實在在的30項的專用,這是已經申請獲批下來。在數據采集領域,我們其實有非常深的這種應該說造就,我們CTO也很厲害。客戶早就超過三千家,傳統行業有很多,幾乎是涵蓋了現在看到所有的互聯網業務模式,這是我們以前說的ES架構,只要你的業務是這樣,用新技術做,我們基本上都可以做到該架構。
再看十張圖,這是我們APP的監測頁面,某一個用戶或者某一個APP的監測頁面。我大概給大家描述一下,在它的左上方有網絡、CTM、第三方資源、手機端軟件、后臺五個指標,還有客戶滿意度,這六個指標都是有評分,因為我們最早這種頁面都是根據用戶設計出來,他要求一個APP的服務,對下面所有的IT運維部門有評分制,你給我支撐網絡環境,如果低于六百分,這一季度考核,比如說出現過多少次這樣的情況,我可能考核會低一個檔次,已經到了自己內部的數字化,當然這也是非常嚴格。
在這兒我們可以手機端,這是你的用戶,用你的APP發送了多少次崩潰,崩潰的原因是什么;哪些頻道用戶比較擁擠,然后出現了卡頓;哪些請求失敗,送到后端去,與你的后臺服務器的服務可能也有關系,因為今天其實云非常好,但是用了多之后,勢必也會出現很多問題,我們說云上出問題也不是一天兩天,經常會出現。其實云服務上的資源都是動態切割,根據客戶的優質程度去動態切割資源,因此你去看很多,其實要實時的能夠知道提供的服務狀態怎么樣,這些東西都很重要,我們全部OK。這是針對APP的一個界定。
這是剛剛講的管理層要知道什么?我不需要知道得太多,我只需要知道我的業務架構上面好不好,剛剛有評分、值,這其實是互聯網行業標準的通用值,你這個值到90分以上,說明你用戶打開你的頁面APP、網頁非常快、好,你的出錯率低于千分之三,一般千分之三是互聯網行業里面的指標,你的出錯率如果高于千分之三,用戶基本上滿意度就不會很高,當然你要分析他會不會在這上面,如果經常登錄在IT上面,我本人可以打賭,他是一個潛在的優質用戶,其實有很多分析。
老板做什么?天天看到這張圖,上面如果都是綠色,就沒有問題;如果發現有一塊紅的很深,這又是什么?不用埋頭查看,一定可以找到他的負責人。這是我們剛剛講到的應用架構,表面上看是一個大的一張圖,但實際上大家有機會可以去嘗試一下,每一個點都有數據,可以做大分析,因此不是一個表皮,只是把數據抽取下來。該東西背后是什么?是一個非常復雜的應用調用,我們都知道其實比如說你的機器硬件也好,可能是一百臺機器,在上海可能五百個應用,但是這些應用到底怎么樣流轉,實際上時間長了之后并不知道,其實我相比較硬件比較容易發現問題,但是相比較軟件很難發現問題,好的方式是什么?把你的軟件怎么樣跑的抓出來,形成你的架構,而且軟件無論在哪個節點出現了問題,實際上我們都可以關聯地分析到你該軟件所部署的軟件,以及容器的優化環境到底怎么樣,是不是因為硬件和容器的優化環境導致軟件跑得不好,都有多種分析。因此這個是給工程師用的,你要判斷問題、解決問題,但是可能我是負責一條產線,或者某一個SI功能系統的運維人員,只需要去看著它就好,其他與我沒有關系,只要它運作是正常,我就會有問題。
我們看到的是完整的業務調用,每個業務入口、業務出口,往后,我們在很多公司,其實他們已經遇到很大的問題是,比如說剛才講到的中臺、后臺,在金融里面也叫中臺、后臺,中臺是第三方公司開發的,后臺、前臺是自己做的,當他發現他的調用是因為中臺出問題,當然現在簡單了,因為我知道該模塊在中臺里面爆出問題,我去找第三方公司就好,甚至知道他們這塊部分是誰寫的,馬上找到這個人,我們有數據給他,直接用好。以前做不到,為什么?因為監控都是局部,比如說手機端、PC端、前端有監控,網絡有監控,但是一旦監控到,往那邊一調用,調用到某一個監控里面,大家就知道解決,那邊發生了什么問題?不知道,不知道就沒辦法指責別人,因為還沒有辦法精確的定位。因此實際上這樣的一個架構服務首先要抽取出來,而且能夠精確的定位,責任分清。這是業務采用的東西。
后端,這是我剛剛講的,工程師要做的是,老板發現你容易發現的東西,所以不要和老板在狡辯,其實針對你要負責的問題直接去分析,所有的業務調用、結構都在這里面,數據調用,包括遠程監視等很多,無所謂,這不細講了,都是一些技術細節。我們在用戶使用環境里面,幾乎經常幫用戶抓到這些問題,EMS營銷系統上面,經常營銷系統一張報表拿不出來,時間很長;一張訂單批量數不行,等待了很久,沒有反饋,后面只要你操作,我們就可以立馬把你操作引起的問題在哪里,全部抓住。然后這是供應鏈上的一個,剛才抓到的其中有一個數據庫調用的時間,平均處理調時是多少,我看到,大概是16013秒,要轉化成小時。
這是所有的遠程調用,如果你以后做微服務就靠這遠程調用,所有的微服務接頭的這種效能全部在這里,一個應用跑下去,有可能就是一個微服務接口導致的服務場景在內,因為微服務管理起來太難。下面這些案例,我就不多說,其實我在剛剛過程當中講了很多我見到的用戶以及反饋的案例,實際上用途在其他行業里面已經有非常多,因此如果大家有興趣,會后可以找我們來做深度交流。這是我們客戶的名單,其實寫不下來,而且最近在制造業,當然像格力也是我們的服務,他們整個后臺服務器的應用、監控、全自動化的提取都是我們做的。大家有興趣可以使用,這是針對電商,如果有電商的一些東西,因為比較簡單,掃一掃,注冊用戶就可以。
我拋磚引玉講到這兒,謝謝大家!