由企業網D1Net、中國企業數字化聯盟和信眾智(CIO智力輸出及社交平臺)共同主辦的2024北京部委央國企及大型企業CIO大會于1月20日在京圓滿召開。本次大會匯聚了百余位央國企部委及大中型企業CIO、信息主管以及數字化一線廠商,以“數智賦能可持續發展”為主題,圍繞數據治理、BI、數據合規、數據入表、人工智能大模型、分布式云、安全等數字化技術應用,數據戰略規劃與實踐、大模型在行業中的落地實踐、數字化轉型實踐等熱門議題展開深入探討。
某世界500強德國車企原大數據部負責人歷娜博士在演講中基于國際化的經驗分享了數據治理和信息安全的重要性,以及如何在企業中成功實施這些措施。
歷娜博士強調,在大的公司中,技術只是數據治理和信息安全的一部分,雖然重要,但成功的關鍵在于建立系統化的思維方式和決策網絡。她提到,數據治理和信息安全考慮多個方面,包括合作伙伴、法律法規、技術、利益相關人、決策與審批、預算與成本、團隊資質、流程與制度等。歷娜博士詳細介紹了數據的全生命周期,從數據的產生、采集、分類、脫敏、清洗、轉化、存儲、監控、集成、處理、建模、云計算、展示、創新應用到最終的數據銷毀。通過多個案例分享,歷娜博士展示了在不同階段如何處理數據治理和安全問題,包括工業4.0、車聯網、電動車監控、企業數據湖建設、數據信息安全等。
最后,歷娜博士以汽車產業為例,區分了信息化產品(如ERP系統)、數字/智能化產品(如車聯網、無人駕駛)和大數據創新(如電動車電池報警分析),還討論了數字化產品和大數據創新的區別及對企業的意義。
以下是現場速記。
某世界500強德國車企原大數據部負責人 歷娜博士
歷娜:各位領導、各位來賓,各位朋友,大家下午好!我是歷娜,感謝范總和企業網的邀請,今天有機會跟大家分享數據治理與數據安全。我出身外企,今天聽了各位央國企領導激情澎湃的演講,以及供應商對數字化現狀以及數字化大模型未來的介紹,我聽了非常激動。接下來我跟大家分享下在這個領域,我做了哪些事情。
可能大家對我還不是很熟悉,我先做一下自我介紹。我在世界500強德國頭部車企工作了十幾年,任職大數據中心的負責人。我和我先生都從事IT領域的工作,非常繁忙,因為家里有兩個小朋友,疫情期間需要投入一定的精力,為了兼顧家庭,我轉身做了顧問的工作。我的工作領域主要涉及到這么幾個方向:1.全球ERP系統的實施;2.集團總部信息化;3. 集團車聯網中國本地化;4. 大數據中心建設和大數據創新。在2011年有一個非常好的機會,德國總部計劃將車聯網系統實施到中國本地,我非常有幸作為車聯網IT中國區參與到這個項目。我的主要工作是負責集團進口汽車車聯網IT后臺本地化,以及與合資企業的IT后臺技術談判。在談判的過程中我發現合資廠除了技術以外,對數據非常感興趣,從那時候開始,我對車聯網數據的采集和后臺存儲結構格外重視。
我給大家做個車聯網的普及。車主現在買的汽車駕駛艙前面有一個大屏幕,這個大屏幕以前專門看導航,現在可以跟它進行對話,可以看新聞、天氣、查找停車場等,還可以用手機來遙控汽車,比如進行遠程的閃光鳴笛、解鎖車門、開啟空調等,甚至當車發生故障時可以呼叫道路救援。這是2011年開始我參與的非常大的集團的項目,涉及到很多、很多的部門,包括質保、技術、研發、售后、銷售、市場、法務以及采購等各個部門。IT負責將整個技術后臺落地到中國,我是當時IT中國中三個人中的一個。
當時發現數據的吸引力,我并沒有把它放到日程上。因為整個集團正在實施車聯網本地化,數字化的創新至少在集團的層面還沒有太多的關注,尤其是德國總部,包括美國他們對個人信息的保護都是非常的重視的,所以很難把這個事情做大。所以我將這個事情慢慢的壓下來,到2017年有一個非常好的機會,我們生產部的EVP想做智能工廠工業4.0的試點,這個試點就要用生產線上的大數據,機會終于來了。我當時將大數據中心的想法包括車聯網數據進行數據創新的想法跟我的CIO和負責車聯網的EVP溝通,非常榮幸整個大數據中心和組織架構被批了。而智能工廠生產線設備的可預防性運維大數據創新和進口汽車車聯網大數據創新成了我團隊的前兩個試點項目。這兩個項目的成功,讓我有了更大的信心把大數據中心做大做強。
我等同于從0做到1,從0預算兩三年內做到幾千萬的預算,規模很大的,當時在集團也贏得了很多的反響,包括德國專家到中國跟我們去了解這個事情是怎么做的。今天借助數據治理和信息安全焦點的問題,我給大家分享一下這個過程,我們遇到了哪些困難,這些困難我們是怎么解決的。
首先談到數據治理,我相信各位的專家、領導都非常清楚,一定是從數據源的采集到清洗轉化到計算應用、最后到數據銷毀的過程中整個數據鏈路的控制和管理。對于我們甲方來說,技術僅僅是我們要管控的一個方面,還要想到很多其他方面的問題。比如你做數據治理,做大數據的項目,是不是得有錢,得有預算,如果自己的研發人員不夠,研發力量不強,是不是還要跟合作伙伴進行合作?比如說SAP、埃森哲、IBM,oracle等這都是我過去的合作伙伴。可能我們要借助他們的一部分力量,來幫助我們搭建技術平臺。
整個大數據的治理過程中涉及到方方面面,涉及到不同的階段,有不同的利益相關人,可能有我們的智能工廠、有我們的車主,車主也是我們鏈條當中的一部分,因為車主擁有數據,是車聯網數據的所有者,還有我們各個不同的職能部門如采購部門、生產部門、物流部門等等,包括我們的品牌和我們的合資企業,它都是我們的利益相關人。作為一個甲方的大數據負責人,這個是你非常重要的工作,你要把利益相關人管理好。
我們的項目要有進度,這個不多說了。我們要有團隊,有自己內部研發團隊,有外部合作的供應商,我們還要對整個數據治理的過程進行控制。同時可能還會受國際政治關系的影響,比如中美關系,它可能會影響我們大數據平臺的選型,這個云廠商,我選擇誰?在美國制裁的實體名單當中也有一些廠商,我們能不能選?如果我們選了,將來如果有一天需要切換,平臺怎么進行安全低成本的遷移?我是選擇IaaS還是PaaS還是SaaS?在這個過程中作為大數據中心的負責人必須得考慮將來可能帶來成本的變化,可能帶來技術遷移的困難,選擇哪個廠商對我們來說也是非常重要的。在這個過程中還要受到不同各級領導的審批,還涉及到法律法規。
做大數據的大家都知道有三部非常重要的法律:《網絡安全法》、《個人信息保護法》、《數據安全法》,這三部法律決定項目進展是否順利,能不能進行?比如分析車聯網的數據,剛才穆總講數據資產的時候我印象非常深刻,沒有車主的同意,沒有車主簽的合同,我們沒有權利進行分析,因為汽車廠家只擁有數據的使用權。只有我們在賣車的過程中跟我們的車主簽訂了數據協議,能夠對這些數據進行分析、使用并提供增值價值,我們的大數據中心才能夠合理合法地使用這些數據。
《個人信息保護法》實施之后對車聯網系統或者大數據來說影響最大的是什么?就是車主的這些關鍵信息如GPS數據,報警數據,包括這些零部件發生故障的這些數據,能不能進行分析?這個都得需要我們法律部門給一個標準出來。除了這個以外,我相信各位大數據中心負責人都會遇到一個問題就是匯報,你得做好匯報。為什么?大數據項目是未來增值潛力很大的創新工程,但是錢花得多,而且太復雜,經過模型預測后可能看不見預期效果,公司的高層需要了解它的復雜度、風險性和可能創造的價值的能力。投資大數據,做人工智能分析,是集團的創新,集團需要在風險中進行控制,作為大數據中心的負責人,我必須和我的領導及集團的高層保持緊密的匯報,以便及時發現問題,進行戰略性的調整。
接下來還有內部流程以及合作伙伴的資質。舉例來說像車聯網系統在全球的推行可能要借助合作伙伴幫你做后臺,但是這個后臺它是需要擁有TSP資質的,它是需要所在國家授予資質的,審核供應商的時候必須得審核它的資質。所以說呢,對于大數據負責人,你得有這些東西,在你的大腦中形成一張網,而不僅僅是技術。雖然我們出自IT,但是在企業任職,上面有高層決策者,下面有不同合作伙伴和利益相關者,要想到方方面面的關系在腦海中形成一個關系網。
既然談大數據的創新,那么得分清楚是大數據的創新還是數字化產品?我也是做信息化的,所以我們都是從ERP走出來的,從信息系統走出來的。在國家實現數字化的概念的時候,我覺得有必要澄清兩個方向:數字智能化產品、數據創新。對于數字智能化產品,我以汽車產業為例,包括車聯網,包括無人駕駛,包括智能生產線上工業4.0上那些智能的設備,這個叫數字化產品,它有什么特點?它是企業必定的發展的戰略,一定要做的。投資大而明確產品價值,所見所得,做什么就能看見什么。
比如車聯網,采集的數據都是事先約定好的。通過車身部件,從總線上采集的數據轉化為車聯網服務,提供車主來使用,這些服務是固定的,它背后的數據是為了支撐服務的,還沒有進行分析使用。所以理論來說,除非你這個產品在技術方面遇到了重大問題,否則它一定會上線。你的投資可以看到預期的結果,可以通過銷售的KPI看到。
數據創新是什么?我的數據有固定數據,如來自ERP信息化系統,也有不確定性數據,如車聯網、無人駕駛系統和機器設備中采集的數據,要把它們放到一個大池子里去分析它、挖掘它,做人工智能、做神經網絡,我有可能看不見,有可能得不到預期的結果。當然有些是可以的,比如BI,可以在上面做報表,可以拽模塊讓業務部門在上面分析,這都可預可得的,但是你做AI模型就不一定得到你所期待的結果,因為要做預測。遇到這種情況的時候,怎么匯報,怎么跟領導解釋投入這么大筆錢,可能有一部分創新如模型預測部分,也有可能得不到預期結果,這是我們作為數字化的領導人需要考慮的這個問題,要和公司決策層共擔風險,共同努力,去最大化公司的利益價值。
大數據創新,很多人不敢做。為什么不敢做?說大的方向,可能會對公司造成風險。小的方向,可能對你的職業生涯都會造成影響,因為你可能就是投進去看不見結果。所以我們把它稱之為創新型的戰略。
為什么說我能夠抓住這次機會呢,因為我負責車聯網的后臺建設和談判多年,我又熟悉制造業的ERP實施和生產線,我知道我們企業有哪些數據,哪些是實時數據,哪些是事務數據,哪些能夠提取出來,哪些不能,因此在選擇大數據戰略和策略時,能夠為企業最大限度的規避風險,實現價值最大化。還有一條,就是我是一個喜歡創新的人,我從工作起做的IT領域的所有工作,都是同時代最有挑戰性和最具創新性的事情,如ERP和車聯網。一個傳統的車企在數字化轉型的過程中,要抓住機會和關鍵的轉型節點。
今天央國企的領導都給大家分享了宏觀大的激動人心的實例,我給大家分享我在整個數據治理過程中遇到的問題,這些問題我是怎么解決的?
首先先談數據源的采集和數據分類部分。我給它起了個名字叫做“你要學會搞“政治””,這是什么意思?我們是搞技術的,我是處在集團的位置,集團的下面有不同的品牌,有我們的合資企業,有我們的零部件廠,也會有我們的合作伙伴。你既然在集團的位置,那么怎么聯合大家一起來搞創新呢?數據在車主的手中,在合資廠、在我們的品牌、在我們的生產線上。但是你從集團的角度想進行創新,必須解決數據得跑到你這兒來,否則你沒有說話的底氣,做大數據沒有數據做什么?第一件事情就是要解決這個事兒。
我跟我的領導進行溝通,首先要站在集團的立場上去跟各方溝通,如果各個品牌,各個合資廠大家自己各搞一攤兒,技術不同步,標準不統一,不僅僅造成技術方面將來沒有統一的主導,也會造成資金的浪費。先從大的觀念上,得到大家的思想同步。
第二個要做幾個成功的試點,讓大家知道你的實力。生產部高層推動的智能工廠生產線數據創新,車聯網駕駛行為分析,電動車實時數據報警等挖掘,這些都是我的部門搞試點的好機會,我先把這三個做成功,做給大家看,我能不能有本事把大數據建起來。我當時選擇的是生產線上機器設備的可預防性運維,就是分析這個生產線設備發生故障的概率,另外研究車聯網當中的駕駛行為,研究消費者經常去哪,他平時跑醫院還是跑學校還是跑企業?跑醫院是不是家里有老人,跑學校是不是家里有孩子,小學還是初中還是去哪個4S店,去哪個運動中心去運動,這些亮點都出來了,你把這塊慢慢鋪墊好,做出名了,你再跟品牌去談,你看結果,給你把這個事兒給辦成了,咱們這個事兒還可以繼續做下去。怎么做?大家一起做。不是說我把大數據中心在集團建立起來了,數據在我這兒分析了,我們這個集團就得了主要的功勞,不,大家一起做。
我當時建立了企業各個相關部門的高層領導戰略委員會,邀請我們的研發部門、質保部、售后部、財務部等,大家在高層方面建立這樣的匯報會議,兩三個月開一次會,我及其各個部門的數據負責人一起匯報項目的進度、成本、有價值的數據用例、開發優先級、共有服務還是私有服務,以及目前的風險等。讓大家在戰略上,在我們投資的方向上,在我們可能出結果上面都能得到同步。在底層我的下屬他們打交道的不是高層領導,是下面的工作人員,為了平衡這些工作人員之間的部門利益,以及他們在這個領域所做出的突破,我們從底層建立數據社區,大家一起來討論數據用例,一起來定優先級,這個就從上到下把關系就搞清楚了,把大家的利益就綁到了一塊,跟集團整體戰略方向是一致的。這些都是非常、非常的重要。
第二,工業4.0:智能生產線機器設備的數據采集問題及解決。我們工廠有智能設備,數據可以采集。但是遇到了什么問題呢?工廠當時買設備時從來沒有想到我們要用數據,他們跟機器廠商簽訂的都是維保合同,在現場會有大屏幕,有幾臺電腦,你可以在上面看哪些設備運行狀態,現在出了什么問題?出了問題,他們簽的合同的供應商馬上要過來解決,這是要花錢的。我們做工業4.0試點,怎么辦?你幫我提取數據,最后發現數據不全,遇到最大的問題是我想要的數據沒那么多,還不是每秒采集一次,每次10分鐘甚至更久采集一次。在這樣的壓力下,你還想做數據采集,怎么辦?這個時候你不能自己頂壓力,立馬向領導匯報,得到合資廠高層領導的支持和重視,跟我們的合作伙伴也進行了數輪溝通,最后他們已經盡他們最大的努力把數據提給我們進行分析。
對于機器設備合作伙伴來說,它可能會有一種擔心,我把數據給你,你自己分析,那我還怎么收設備維修保養費?你做分析,將來你能夠預測這個故障,你還跟我簽什么合同,對于供應商來說其實是一種挑戰和威脅。所以這個事情,也要把利益關系梳理通、梳理好,大家要談判,你做什么,我做什么。如果將來咱們把這個事情做大的時候,數據肯定要花錢,這個數據不是你幫我拿過來的呢,大家要有利益方面的討論。
解決完上面問題之后,在預測模型的時候也出現了問題。我們用的是神經網絡,最后發現預測的概率遠遠不如想象的高,比如要能夠預測設備,在明天5點鐘80%發生機器故障,維保人員就可以提前去排查。但是我得到的不是80%,而是35%,這種問題出現了,簡直就是一大災難,我做了這個模型最后我預測得不準。怎么辦?對于我當時的大數據團隊來說也是非常大的挑戰。但是好在你是一個甲方,你自己的這個團隊能力不夠的時候,你可以有外援。我當時跟供應商簽合同的時候,我不是簽一家供應商,我簽三家或五家供應商,為什么?因為大數據是有風險的。一個供應商提供的數據科學家,他用的模型,他采用的方法有可能不一定正確,不夠準確。好,我邀請五家,我跟你都有合同,我跟你簽的合同不是按照不同階段付款的合同,我是按人天付錢,數據科學家簽30天,數據分析師簽20天,當發生問題時讓大家一起開會討論數據預測不準了,找原因,解決問題。這個會跟工廠人員一起討論找原因,最后決定改變預測的方法,同時要把我們的數據重新進行優化,最后終于得到了想要的結果。
當時你做這個方案的時候,還不能只做預測還得干點別的,萬一這條真的過不了,這個錢不能白花。所以我們做了一些報表,還做了設備相關度的分析,如果一個設備發生故障,可能也會導致另外一個設備發生故障。所以當你做這樣的大數據項目的時候,你作為大數據的負責人,你不能只抓這一條,你還要遍地開花,每個方面都要有結果,綜合展示才能是完整的結果,而且還可以在某種程度上規避風險。
燃油車車聯網的數據采集問題及其解決,德國總部在設計車聯網后臺的時候并沒有想到將來會分析它的數據,因為目標是提供車聯網的服務,遠程解鎖車門等。我要做呼叫中心,我并沒有想到我將來會研究消費者經常去超市還是去商場,這個是當時沒有想到的。所以當你做大數據的時候你會發現我這個后臺系統當中有些數據我根本不知道有什么,它分布到哪些表里,這些數據和數據之間是什么關系?完全不知道。但是好在我負責這項后臺的談判,而且在當時談判的過程中,我敏銳地察覺到我們的伙伴對這個項目非常感興趣,所以當時把這個數據結構搞得非常的清楚,整個集團只有我的IT團隊搞清楚了。所以我才有這么大的支持力度,大家來支持我去干這樣的事情。因為這一個庫里可能有成千上萬張表,表和表之間的關系一定最清楚的是系統架構師,當你知道這么一個事兒的時候,你作為一個甲方第一件事兒要做的事情找到他研究明白表,有哪些數據,數據之間的關系,哪些數據能用?GPS數據有沒有,車輛報警信息、故障代碼信息有沒有?最后我們把它做出來了,做得非常成功,得到了支持。有的時候人要有預見性,要善于抓住機會,因為機會決定著你這個事兒能不能做下來。
電動車不同品牌的實時監控信息。這個大數據最后我們能做出名,取決于電動車。為什么?國家對電動車有一項法律規定,必須把關鍵數據提交國家,包括報警的、電池的狀態、健康度、GPS等等,每個車廠都要把這些數據以每15秒到30秒的頻率上交國家,你就要提取這樣的數據。好了,機會來了。這個可比智能工廠、比燃油車車聯網系統要更好,更實時。
當時我遇到了這樣的案例,這個最后也是得到了業務部門的支持。是我們的質保部門,他們接到了一個客戶的投訴,這個投訴是什么?就是一個電動車賣了3個月之后,一個客戶說剎車太硬,踩不動。這可難壞了質保部門,從技術、從售后的角度到處找原因,找不到。最后找到我們的CIO,說“IT,你們幫我們看看吧,你們有后臺的數據,看看到底是怎么回事兒,試試能不能從數據方面發現原因”?真就找著了,找到的是什么?就是這個車主每次踩剎車的時候都要踩一下“油門”的踏板,它這個剎車和“油門”同時踩,如果沒有數據分析,任何人是發現不到的。讓我們發現了這個核心的問題之后,跟我們的車主去確認,真就是這樣的問題,最后還發現不是一個消費者,真的有其他車主也有這種駕駛習慣,這對整個質保部門是顛覆式的影響,因為不僅挽回了品牌形象,還節約了大量修車成本,而這個是通過電動車實時大數據分析出來的,是實實在在的創新。數據可以創造新的價值,可以發現不了我們之前發現不到的原因。一下就把我們做出名了,接下來研發的人也來找我,售后的人包括銷售的人也來找我們,為什么?因為這個案例以前沒見過。在我們傳統的車廠是看不到數據能創造這么大的價值,接下來又有一個例子發生了。
也是一個消費者駕駛的車去山區游玩,發現充不上電,怎么充也充不上電,就開始投訴了。也是我們用大數據分析,幫他找到了原因。最后的原因是這個充電樁的絕緣電阻出了問題,這不是我們品牌的問題,這是充電樁的問題。這樣就保護了這個品牌的形象,也為我們節約了售后的成本。所以你通過這樣一個一個實例基本上就讓公司各個高層看到了數據價值。
企業數據湖建立,不同數據源、數據類型的整合,上云與不上云。這個很遺憾,沒做成。為什么?最主要的問題是太多的數據不在我們這里了,因為合資廠他們ERP的數據,包括他們重要的財務數據是不在集團這一塊的。我們就放手,由他們自己來做。但是對于集團總部這兒,我們可以做。我們把各個職能部門的信息化系統整合起來,做了企業數據湖大數據平臺。這個時候你就要考慮了,是不是所有的數據都能上云?答案當然是no,像財務、生產這些重要的數據是不能上云的,對于剛才我說的車聯網、電動車,這批肯定要在云上進行處理。企業建大數據中心的時候就要考慮到公有云、私有云、還是混合云的問題,這個很多都是技術問題,我不說了,大家肯定都會遇到這個問題。
接下來是數據信息安。我曾經在的公司對于數據安全非常重視,它有不同的分級,有不同的等級,我相信做信息安全的都比較知道。重要的是什么?它在我這個階段就介入了,它不是在我開發的過程中介入,是在你立項的這一刻它就已經介入了,對你的信息進行分級整合。比如像GPS這種核心的信息,它就會審核消費者有沒有簽訂合同?車廠有沒有同意?你要做哪些分析?它會有一張完全的信息安全的表讓你來簽,這樣就會讓我們在后邊相對來說比較順利。
接下來我要介紹關于存儲和監控,做大數據的人都知道存儲太貴了,數據每15-30秒采集,一年賣那么多輛車得多少錢?向領導匯報的時候怎么匯報?我們以前在企業機房的時候,之前它屬于資產折舊,但是現在大數據中心不是資產了,它是費用,是成本,每個月要按流量計費,那就到我的團隊這里來了,我要匯報大數據的成本。比如之前一個月15萬,再過三個月花25萬,領導就急了,花什么了,得到什么利潤花了這么多錢,需要解釋。這個時候你就要去看一下大數據的云平臺怎么用的,為什么有的時候它會出現那么貴?因為我們的用戶在提需求時,它不關心成本,它只關心我現在點這個按鈕3秒內立馬響應,每個用戶都這么提,有的時候如果一個IT人員沒有經驗的時候真就同意了,同意之后造成成本蹭蹭往上長,為了達到3秒、2秒一點就出來,它必須得放到熱存里,這個存儲成本非常高。
當我們得到這個原因之后就要跟業務部門去談,真的是每秒鐘都點嗎?還是上班喝個咖啡之后慢慢地點,一天點的頻率有幾次?有必要做到3秒鐘、2秒鐘就出結果嗎?你還得跟他說不是我不答應你,是公司要攤這部分錢。道理講通了,業務部門立馬就知道要求太高了,不知道越快意味著越貴,這時企業IT部門和業務部門達成共識之后,大家就來想優化一下成本。我知道今天有云的領導在這,但是作為乙方其實你要適當的去替甲方想一想,大數據這個事情跟別的項目不一樣,有可能所見不所得,對于我們內部人進行匯報的時候,真的是很難的。也請云廠商的這些人幫甲方站在我們的角度去想一想,能幫大家能優化一下就優化一下,冷存和熱存的成本真的是很高的。
因為我們這個云平臺是供很多的品牌來使用的,包括合資廠,大家要平攤這個費用。平攤費用的時候,我們就要借助云廠商它的一些監控工具,你這個用了多少流量,它用了多少流量,每個月給大家報數。為什么單提這個?因為作為項目組以前不管這塊,我只管項目,但是現在我管云了,它已經到了我這個部門了,我必須得肩負起這個責任,為公司省錢,而且得達到業務部門的滿意度,所以這一點是非常、非常重要的。
接下來是數據建模,關于模型預測不準的事兒,剛才已經說過了。實時數據不夠,也說過了。
接下來重要的是如何給企業高管做大數據模型的匯報?我可以不夸張地說,這張片子我改了7遍,為什么?作為生產部門的EVP,它根本不懂IT,你弄了表,怎么給它講?他都聽亂了,但是你又不能介紹得太宏觀,因為你也得要考慮到這對他來說是新的技術,他可能也要給他的領導去解釋,這是集團創新的一部分,高層都很關注。他想去搞清楚這個模型到底是怎么回事兒,神經網絡怎么解釋清楚了。在設計PPT的時候一定要想,我既可以讓領導看明白,我又得把技術給它講清楚,你還得在謝謝之后做附加文檔,萬一他要知道更多技術細節呢?你不能只做PPT,既用他能夠聽懂的語言去講清楚,又讓他真正明白更多的技術內容。我說的是什么問題?有的時候為了講清楚一個技術模型,要想盡各種辦法,目的就是讓老板知道這個圖到底是什么意思,復雜的IT系統,不能上去就展示IT系統,他需要看到價值。這個價值怎么體現,模型如此之復雜,怎么用最簡單的語言把它講清楚,用小孩子聽得懂的語言講清楚就行了。
最后一條各個業務部門都招聘大數據科學家,IT部門怎么控制?我是在集團做的大數據的創新,調動了我們不同的品牌、不同的業務部門大家一起來參與完成了這個事兒,大家一起匯報,一起來找use cases,最后你會發現每個業務部門都看到了好處,開始設置一定崗位,招聘大數據科學家,最后都跑你這兒來了,給我點數據我也來分析、分析。可是不行,我們的生產系統不允許任何非IT人進行介入,但是你又不能拒絕它,他把人都請了,能不讓他用數據嗎?這個難住了,最后我們想到了一個辦法,在數據授權方面做了控制。業務部門大數據科學家,我給它開辟一片區域,這個區域就是我當時在收集存儲數據的時候專門給它留的一部分比如3到5個月的數據,得到他們部門大領導的授權,他可以用它做模型,因為模型必須用生產數據,否則如何預測。所以給每個品牌,每個業務部門他們分別設置了數據研究中心,這個業務部門的科學家他們就在這可以玩數據了。
對于除了數據科學家以外,業務部門有懂得BI的人,我就設置從左側拖模塊,看到車聯網的數據,在里面拖拽在里面做應用案例,行了之后再找IT部門進行研發。我之所以介紹這一條,是想跟大家說技術根本不是個事兒,事兒是人。當各個業務部門不跟你溝通的情況下,都設置了大數據科學家的時候,你得擺平這件事兒,你不能讓他們為難,你還得幫著他們,你自己又得知道我們是有信息安全限制的。所以你就得找到折中辦法,把這個事兒解決了。
下面是數據展示和數據創新,這個問題我剛才也大致介紹了。我建了數據社區,每一個月的時候甚至比如說集中度比較高的時候每兩周大家坐在一起,來自各個部門的人,因為這些人都已經參加過好幾輪數據會了,他們對數據非常熟悉。我當時給每個部門都發了數據列表,大家一起來討論,我們能做出什么有價值的應用?而且這些討論,每個人都坐在一起進行交流,所以不會有重疊。比如今天你想出三個,明天他想出兩個,兩周之后定優先級,哪個作為公共模塊?哪個是你部門獨有的?這個機制非常好,所以就協調了各個部門之間互相競爭或者是大家都想先做的這樣的矛盾。
接下來是如何讓大數據團隊成為公司最閃亮的部門?剛才已經做過介紹了。本來你在集團是一個沒有數據的部門,但是最后所有的人都支持你,為什么會出現這個事情?這是我最開始講的,因為我做車聯網的,我做ERP的,我比別人更了解數據,我知道如何幫助大家一起成功。我經常跟我的下屬說,幫助業務部門成功就是幫助我們自己成功。
我們必須得幫助我們的業務部門,因為數據創新,人家給了你巨大的支持。你一定要讓他從創新當中看到成功的可能,讓他從這個過程中得到自身的成長。所以在這個過程中,當他遇到一些匯報的問題或者當他遇到use cases的問題,想辦法去幫助他,直到他把這一塊在他們部門做成了,讓他的老板及其老板的老板看到了數據的價值,我們集團的大數據創新就實現了。
怎么搞數據創新?我最開始做大數據的時候,我們的業務部門問我一句話,你有什么數據?我當時回了一句,你想要干什么?你要干什么我就給你提供什么數據。他說我不看到數據,我怎么知道我能干什么?這就是矛盾。你最開始做大數據的時候,你一定要盡量地提供非常全面的,至少在這一塊的數據列表,讓每個人都看到,原來這些數據是我可以利用的,這就是數據資產了。
得到了這個表之后,大家要從工作當中,從你實際的業務當中去找use cases,比如質保部門遇到的就是實際發生解決不了最后想到數據這一塊。結合穆總做的數據資產,舉一個例子,在車聯網的領域可以通過用戶駕駛行為與保險進行合作,這一塊等同于出售。當時為什么沒有做成?當時國家有管控,只在個別城市進行試點,但是我們的車在那幾個省市賣得沒有那么多,所以數據采集有限。這個就是完全的數據創新,再比如二手車,你賣一個二手車你只能讓第三方的評估機構給你評估,但是我有了車輛的數據,我就知道他的駕駛行為,我對三年之后這個車它的情況,我就會非常了解,我就可以跟4S店進行合作,從真正用戶使用數據的情況下來評估車的價值,這真是非常有價值的一件事情。
回到數據治理,各位都是做大數據的,所以大家也都比較清楚,我在這個過程中要進行哪些的控制?對于一個公司如果它的流程、制度、標準或者是法律,這個方面都管的比較嚴的話,你的數據治理不存在太多的問題。因為每個過程都會有審批流程,都會有人看著你,一起幫你把這個事兒做好。這個過程中,除了技術以外,可能就會有很多非常重要的非技術的因素,包括剛才我說的三步法:數據安全、合規、合同、供應商、質量等等,這些事情都要考慮到。
接下來的信息安全,我給大家講一下在我過往的項目當中我在哪個地方受到了安全信息挑戰,設置關卡來卡項目組。首先做試點時候就會有三條法律來卡你,因為你還要用生產數據,你得跟你的合作伙伴簽NDA。接下來立項時除了數據安全立項外還有這個方面的方案,項目立項了,大家一起開會討論項目怎么干的時候,定計劃、定安排時,這個時候又讓你填一堆的表,包括網絡安全的、數據安全的、個人信息保護的,包括系統登錄的,加密、傳輸,完全在這個地方做了全方位的控制。
將來在你設計的時候會有專門的部門來審核你這部分的信息安全方案實施得如何,有沒有考慮到設計當中。開發過程中也會有信息安全相關開發,測試的時候最著名的就是防攻擊設計,第一花錢第二很麻煩,會對你的成本和進度都會造成影響。但是當你做了一個項目以后,你就知道每個項目都要跑這一輪,所以最開始時你實際都準備好了。最后在交接運維時要有相關的文檔,而且在運維的過程中跟供應商簽的NDA合同,因為他們要運維生產數據等等這個都非常重要。
我今天的分享就這么多,今天主要是央國企的領導們都從大的方向高屋建瓴,我給大家講一點工作當中的具體小問題,大家如果以后有問題還可以隨時找我溝通,謝謝大家!