2019年12月7日,由企業網D1Net、信眾智CIO智力共享平臺和中國企業數字化聯盟聯合主辦的2019能源行業CIO沙龍于北京成功召開。工信部產業發展中心、中石油、中石化、中海油、國家電網、國家能源、中燃集團等單位的信息化領導及騰訊云、博云、MAXHUB、時速云等優秀的解決方案提供商出席了本次沙龍。
以下是現場速記。
中石化石化盈科數據部總經理蔡春久
蔡春久:各位專家、各位領導大家好,我用一個小時時間分享五個案例,我演講題目是基于云物移大智鏈數據資產五個案例的分享。
我們做信息化有十多年了,數據是一門科學,數據是生產要素。過去十多年當中,我們在數據治理和數據資產領域關注程度是不夠的,以工匠精神做數據,需要用工匠精神做好,所以要精于工、匠于心、品于行,用工匠精神才能把工作做好。
講之前我簡要介紹自己我是石化盈科對外服務的數據負責人,我前10年在ERP領域做,近十年一直在數據治理、數據倉庫領域做服務。我主要介紹一下我在三個協會的情況,跟大家介紹一下。
第一個,國際數據協會,DAMA全球有10000多人非盈利機構,主要在數據管理領域。
第二,在中國信通院大數據協會里寫了白皮書、國標。
第三,中電標協里做了一些工作。
在過去的十年當中,我是08年加入到石化盈科的,在中石化負責大概幾年的數據治理的大的項目。從14年到現在大概做了80多家能源行業的企業,有三分之一的央企我參與項目建設,這里和我們相關的有南方電網、中國核工業等類似這樣電力能源相關的企業。
這里80多個案例當中,其中有70%做過數據治理,做得不太好,我去接盤。其中有50%以上做過兩次做得不太好,我過去接盤的,這里可見數據治理不好做,真的需要工匠精神才能做好。這是我做的客戶情況。
因為我在國家層面也做了一些白皮書、國標相關。
《工業大數據白皮書》今年4月份發布出來的,是國內頂級數據專家共同寫的白皮書。去年4月發布的《主數據管理實踐白皮書》從1.0發布到4.0,下周發布《數據標準管理白皮書》,這是國內很多專家花一兩年時間形成的,可以做參考。2012年和北京燃氣合作,我們形成行業標準。這里有新奧燃氣等,在物資編碼做得蠻好的。
我們組織國內大概有30多個專家正在編寫《工業企業大數據治理實踐指南》,這本書明年4月份會發布出來,這是我本人在這個領域做的工作。
今天下午主要講三方面內容:
第一,對數據資產管理的理解。這里主要是我們現在遇到的挑戰,大型央企遇到的挑戰和現狀。
第二,標桿企業數據中臺與數據資產實踐案例分享。
某石化集團數據資產管理實踐案例分享
某能源集團數據標準框架體系設計案例
某新電力集團數據資產繪畫項目案例
某燃氣集團數據中臺平臺建設案例
某電網平臺的案例
第三,數據資產規劃相關建議。
我們企業在數字運用、在平臺、用應用方面遇到很多挑戰,最大問題是多頭填報、數據共享、數據服務、數據資產評估等方面都存在挑戰。
第一方面,應用層面。用戶無法想象大數據能帶來什么,無法提出準確的需求,錯失很作良機。報表比較死板,不能很好的即興、即時展現。
第二方面,數據層面。表現嚴重是數據孤島比較多,看不見拿不到,無法在線應用。
第三方面,平臺層面。老平臺無法支持新應用,工具困乏。我們處理海量數據,需要進一步去加強。我們數據安全和隱私方面需要進一步提升。
在數據管理領域面臨四個困難:
第一,數據孤島比較多,有數不能用。這里面主要體現三個方面,不愿意共享、不敢共享、不能共享。
第二,數據質量不高,有數不好用。缺乏統一的數據治理體系,數據采集、存儲、處理等環節可能不科學、不規范,老四數據錯誤、異常、確實等。
第三,融合應用困難,有數不會用。
第四,治理體系缺失,有數不善用。
這是我們總結目前國內很多大的企業在數據管理領域面臨的一些難點。
我們前兩周十九屆四中全會這里面提了非常重要的字,數據是我們重要的生產要素,跟我們的資本、土地、知識、技術一樣,這個報告里就幾千字,這里加兩個字加了數據,這是非常明顯的風向標。
第二,數據必須要保護和開放共享的原則。我們現在數據對收集、采集、濫用方面存在很大問題。
第三,數據是作為無形資產列入會計目錄,評估資產價值,投資轉讓、融資貸款等,這個已經是無形資產。
第四,數據作為生產要素在市場上流通,如何評估數據價值,如何評估數據成本,尤其我們個人數據和隱私方面也要不受到侵害,這是十九屆四中全會這里談到的數據,這里四次談到數據,81次談到治理,有國家治理、城市治理、企業治理。
另外再看看今年3月12日國資委發布的文,明確提到要推進數據資產的管理。這里有條件的企業成立獨立的部門來管我們的數據。另外我們去年18年數據管理領域各個部委、各個協會,尤其像去年發布了國標DCMM數據管理深度評估模型,現在各個行業都在做。去年在金融行業,這里面發布了銀行金融行業數據治理指引,在保險銀行、證券引起軒然大波,金融行業是充分利用、高中季度行業,但是與指引有非常大的差距要走,包括衛健委、工業互聯網。
去年我們成立了數據管理應用協會,這里面有華為、阿里包括石化盈科,在里面做四個峰會,在信通院發布了白皮書。
剛才從習主席到整個國資委到行業協會都紛紛的對數據資產、數據治理非常重視。
這里我們介紹什么是數據治理,什么是數據管理?前20年數據治理這個名詞還在,主要做內部風控,防止一些財務做假帳,防止一些數據泄密等。第二個滿足外部監管的要求像一些上市公司必須要符合法規,這是前20年狹義的數據治理。
現在的數據治理是廣義的包含數據管理。這里又談一個新的名詞數據資產,我們在數據資產白皮書里是這樣定義的,企業擁有由企業控制的,數據資產是能夠給企業帶來價值利益的。我們可以這樣來理解,廣義的數據治理可以約等于數據資產,因為數據治理有狹義和廣義的,不同場合說治理有點混淆,所以說我們現在很多企業把數據資產進行管理。
數據資產在百度百科包括有數據資產、財務資產、房地產、實物資產。
數據資產的特征無形、數據資產不可替代、數據資產不可消耗(可復制、共享)、數據資產不會貶值。
我們有數據管理、數據資源管理、數據資產管理,在過去20年中有非常深刻的變化。數據管理從IT角度來看,主要充分有效的發揮數據作用的。
第二,數據資源管理,去尋找手段,以有效的控制數據資源及并提升數據資源的利用率。
數據資產管理是全新的資產形態,并能夠以資產管理的標準和要求來加強相關體制和手段,從經濟角度、滿足對資產運營的各類管理要求。
關鍵變革包括基本認知的升級、管理領域的拓展、主體層次的提升。
我們看看數據資產里面發展有三個脈絡,這里在通用框架里,我們在幾十年都有ISO9000,包括全面的質量管理,這里都有數據管理。我們在單一領域體系像ISO8000有數據質量管理體系,我們在數據管理本身領域內,我們也有完整的理論,第一個是我們剛才建設的DMBOK數據知識管理體系,這是數據管理領域從業者的圣經,大家一定要仔細研究DMBOK2.0,另外是我們去年發布的國標。
我們在行業里有非常強的指導性,第一個是數據資產白皮書4.0,第二個是工業企業數據治理實踐指南,第三個是金融行業實踐框架,第四個是互聯網行業實踐框架。
首先介紹一下DMBOK2.0數據管理知識框架體系解讀。這里是非常完整的,全球1萬多個數據管理人員貢獻了這本知識體系,這里面在DMBOK2.0里面,我們最近正在翻譯,應該是在明年2月份DMBOK會正式發布中文版,這個有個DMBOK1.0在08年已經出版的。
這本書里增加了集成共享、數據陳述評估等,它缺乏實際案例,它作為案例可以參考但是不能照搬。
第二個介紹無的是DCMM數據管理評估模型。我們數據治理定義主要是治理架構流程,包括數據架構、數據標準、數據質量等各個行業在慣標。
第三個是《數據資產管理實踐白皮書4.0》,包括數據資產管理是什么、制約數據價值釋放的原因是什么數據資產管理等。
這里是8+5,這個指示體系有數據標準、數據模型、主數據、數據質量、數據安全、數據共享,數據資產管理保障措施里包括戰略規劃、組織架構、制度體系、審計機制、培訓宣貫。這里最有價值的是數據價值,另外數據開放共享。
在這三個理論框架體系總結一下,這里面一致的是把數據作為智能活動有標準、質量,源數據、主數據這是一項活動智能,需要有人去管的。
第二個,這兩個DMBOK2.0和DCMM都有數據戰略,所以我們對應企業有沒有數據戰略。
第三個,白皮書里有工具做支撐,對應某數據資產里大概有10多個工具怎么管我們數據資產。
另外這三個框架體系里都有組織架構,我們很多工業企業里都沒有實體組織。不同點這里談到數據資產目錄,因為我們企業數據很多,怎么快速找到這些數據?
第二個,除了數據管理以外,我們還有數據運營,包括數據需求、數據服務水平、數據交換共享等等,這是針對三個理論框架體系最后的總結結論給大家分享了。剛才簡要說了數據資產相關的政策解讀包括相關框架的介紹。
下面這個是我五個案例,是我親自參與的,我把每個項目做一個簡單的點評。中國石化在數字管理領域做20年了,從2000年實施ERP的時候剛開始做主數據項目建設,現在我們做大數據服務平臺。
這里面首先標準先行,另外是標準大概有內部做數據治理70個團隊在石化盈科。業務有四大平臺:經營管理層、生產層面、客戶層面、生產層面,我們把數據做成共享服務、數據智能。
數據治理從2000年開始最注重主數據和數據指標,我們大概有550多項主數據梳理出來,有1000多萬代碼庫,1萬多個指標項目,常年有70人左右做內部的工作。這個主數據包括數據指標,保證我們幾百個業務數據系統一致性、唯一性、準確性。
數據倉庫建立比較早,05年開始做,我們一直堅持在ICP BW以及BO上面在做著,負責經營管理層面數倉建設。
另外我們在客戶層面主要跟阿里在合作,做電商。
我們在生產營運平臺,這里是生產層面總部有大的展示平臺,下面油田都有自己的ODPS,這是我們做的不錯的,幫助中石化體制增效方面發揮了非常重要的作用。
我們再有幾個比較重要的項目點評,第一個從16年開始大概幾十個人,在中石化內部做中石化大數據戰略規劃,改了幾十版,這里主要是做大數據戰略發展規劃,包括平臺、數據治理、應用做了兩個三年,一個十年規劃。這里做七橫七縱兩統一,七個縱向、三鏈四域。每三年我們到底做哪些事情,一定是業務部門深度參與進來來做大數據,我們這兩年正在做大數據服務平臺,大數據服務平臺是以前基礎上在我們傳統的結構化數據再加上自己開發的很多開源非結構化大數據管理起來。
發展原則是:需求導向、創新驅動、吸收借鑒、專業主導。
我們總的目標主要是構建中石化大數據平臺,包括清管理、生產層面是我們的全面感知,包括優化、協同、科學決策。客戶服務層面、資產層面運營。把中石化企業系統數據包括政府相關數據、合作伙伴數據、國內公用數據、國外數據匯聚大數據平臺。我們有4萬人用這個公用系統。后面按照采、聚統一將大數據采到統一數據平臺里,治理數據在整個過程中從源頭治理,后面在大的數據平臺里做治理,我們各個用戶用數據,后面是保證業務安全。
這是我們做的數倉大屏,可以全面直觀集成企業各個層面的數據,為領導支撐服務保駕護航。
利用科大訊飛我們做了很多平臺,我們各級管理人員在手機上能夠看到數據,能夠聽懂人話理解人意,實現傻瓜式的平臺。這是一個應用場景,我們把數據跟語音結合起來,把這個指標全部固化在系統里,說一句話,外面的業務人員、領導都能看到相關的情況。把數據真正變成產品、服務,為各級管理人員來用。大家愿意去用這個信息,這是簡單給的例子。
這里把數據做成6種服務:包括數據訂閱/分發服務、數據查詢/申請服務,數據調用API服務、主數據公共數據資源池、數據資源服務、主數據即時服務。
最后我們看看數據治理的方案和目標,第一個我們要一套技術平臺,我們一個數據治理平臺,一套數據標準,統一數據研發、規范包括標準、資產管理,另外一套組織架構,我們總部一套人馬來做。從業務方好用、敢用,從數據研發、治理與運維是過程管控,數據獲取,源頭數據非常標準,這樣我們在大數據平臺里沒有那么費勁,我們本身就是一體化來做的。另外我們也構建了一整套數據管控制度流程體系。
另外我們打造綠樹工程,培養1000個數據工程師,我們有大量的培訓來做。前面比較快速的介紹了中石化在過去20年當中我們做的一些工作。
下面我們介紹能源集團數據標準框架體系設計案例。坦率來講,國家能源是神華和國電合并來的,他們是兩套體系。以前遇到很大的問題,最后尤其是在十二五期間做了很多成果,在十三五一直動不了,一直想做大數據,后面發現這個必須要從標準入手開始做,這里項目目標主要是通過做整個標準的融合,目標主要為了集團管控、產業協同、專業化運營、節約共享方面來做。
這里面必須要站集團層面,這里是組織范圍涉及到總部,包括數據全口徑、戰略層項目管理層,標準范圍除了指標范圍以外,交易數據、主數據、實時數據標準,它是兩個大集團很難去弄。
后面通過項目已經持續一年多,但我們石化盈科派了四個專家顧問帶著他們神華信息40、50個人來做。
后面我分享我們的成果,這是我們項目做的總體設計思路。
首先做了數據架構的梳理,這里面也做了領先實現研究,主要對標中國石化,后面主要是根據數據對象做了一些研究,規劃設計了四面墻,后面實現了標準清單也做了具體的在電力、北大做了具體的非常細的標準。
它把這個數據分為五類:指標數據、交易數據、主數據、通用基礎數據、生產數據,這面是數據周期傳輸,上面是智能架構,后面是這里面因為它后面下來這里面數據標準管控有組織、流程、評估、考核,相當于四面墻。
數據全生命周期包括交易數據標準技術數據標準從采集、傳輸、存儲、應用、共享和交換做了很多數據標準。
我們看一看主數據,主數據他們做了很多年了,做的力度不夠,只滿足ERP、MEMS其他方面都不夠,規劃總部通用主數據標準,另外按照產業板塊八個產業里,板塊專有主數據源,這里還有指標:產業、經營管理、分公司、央企、國資委考核指標體系做了完整梳理,這是經營層面的指標。另外按照行業也進行了梳理,最后我們構建兩個體系、兩個平臺、一個服務。我們規劃了數據治理平臺,以前主數據、源數據、數據資產目錄干很多年,發現沒有用起來。數據治理平臺目的主要保證數據質量和安全,我們規劃了大概有12個工具,里面最核心的就是有數據加工與服務、主數據、數據模型之數據標準等。
這是它的中臺,現在正在做,我們打造中臺。后面也是采用傳統工具、大數據工具把數據做成資產對外提供服務,這是我們幫著做的兩體系、兩平臺、一服務架構。這過程中最核心的回到源頭來看數據治理最為重要,數據中臺的工具好搭建,花錢買過來,這里最核心還是數據治理,數據治理在信息化整個過程中處在牛鼻子的位置,一方面保證業務系統源頭的一致性、唯一性、準確性,同時數據中臺指標、安全,所以在信息化架構中處在非常重要、核心的位置。
這里面我們規劃了一體化數據治理平臺,除主數據、指標、質量、安全包括模型。這里數據資產比較新,我們都在摸索著,包括其對應的源數據是支持指標數據交換服務,后面是一體化數據治理和服務平臺。前面介紹了國家能源,這兩年我們一直幫它做項目主要的成果。
下面是中廣核,我們剛啟動一個多月的項目。基本上是有四五個系統,后面系統孤島也蠻多,以前也做了相應工作,發現做得不夠,這里孤島也特別多,缺乏統一的管理體系,數據的機制不夠健全,沒有抓住制度流程,也沒有統一數據資產管理,數據資產沒有開發利用,沒有利用起來,散落各個部門,本來今年有大的項目想一起做,領導非常想做這件事情,但發現信息部門做這個事情沒底,先做對標咨詢做這個事兒。
目標主要是全面盤點數據資產、建立數據體系標準和隊伍、保障數據安全合規、不斷提升數據質量、提高數據獲取效率、持續挖掘數據價值。這里面新能源板塊,后面數據是全數據,另外它的系統是所有系統來做全面的梳理。
這個項目我們剛開始做的時候發現,剛開始要做12大報告,發現報告寫完沒用,最后我們總結出來第一個最重要的數據是要做做數據管理培訓,做洗腦工作,做對標工作,這個是第一步做數據文化普及,不急著做這個事兒,意識不夠。后面是明年計劃做數據中臺、數據平臺。
前面是里依據包括DAMA,后面找對標主要對標中石化,后面到十三五規劃,后面頂層架構設計它的戰略、組織構建包括架構設計,另外資產核心域包括主數據、數據模型標準包括主措施,后面包括報告,后面做了驗證,這是整個項目的實施論。
在這個咨詢項目中80%時間第一步做培訓,培養數據土壤,大家對這個真的很陌生,提高員工對數據資產管理基礎知識認知,加強員工的數據管理價值,培養數據資產管理核心人才。我們在三個月內組織6方面課程,19次62課時。這是中廣核項目的大概情況。
后面是北京燃氣,我們做得比較早,這里面做到整個數據資產中臺頂層規劃,我們從12年、13年每年大概有很多項目在這里面做著,發現做得不夠,以往只關注信息系統,為了物資系統,為了某個系統來做系統,發現沒有站到數據角度去做,它主要打造北京燃氣智能、運營、分析平臺。
這里同樣的第一個以前的系統欠深度融合,也是搭建幾十個系統,缺乏深度融合,所以它要將生產和安全各個系統相關的數據集中抽取,建立數據標準管理體系,實現數據統一管理,這是第一個要做的。
第二要打造數據共享服務平臺,以前存在盡管獨立系統是用得非常好,而且也非常漂亮,要打造數據共享服務平臺。
第三,開發智慧應用模型。
第四,建立數據治理體系。
通過數據治理體系,培養企業員工數字資產意識,建立共享應用機制,包括管控體制等等,這是項目主要要解決的問題。
總體目標一個平臺兩套體系三項能力、四類模型五大特征。這里是例子,北京燃氣在北京市實現燃氣行業數據集中采集、分布、協同,這是我們預期的效果。
另外數據要完全的采集,全面的共享,把數據做全程、全局,完成數據采集,實現構建化轉型,按需進行數據共享。
我們實現數據深度分析、透視,動態各個行業分析情況,后面是基層人員,通過日常維護、統一查詢查到日常的情況。這是北京燃氣做的數據中臺規劃報告,我們幫它做了落地。
后面介紹一下南方電網,南方電網在數據治理體系做了很多年了,這是他們最近分享的材料,我剛好是他們大數據中心外部專家。它是這樣評價的,前期數據資產管理工作開展存在挑戰,建設有余、見效不足。
第一數據資產管理驅動力識別不夠,業務價值有待顯性化,怎么評估價值。
第二個是規劃設計點狀開展,這里面非常重視規劃,協同銜接不夠,體系化程度有待提升。
第三,落地實踐深度不一,對實際業務和信息化工作支撐有限。
第四,數據管控模式制約著數據資產管理工作在省地兩級的實踐。
數據資產管理框架分兩部分,包括組織管理、技術支撐,這是它的業務數字化戰略,這是它公司轉型升級的,所以數據資產充分在它的整個轉型升級處的核心的位置。
這里面做得比較好的,它做到了數據的全生命周期管理,全生命周期的管理與監控,全流程記錄的追本溯源,全景模式的資產可視化。
它也做了一些數據工具,以前叫數據資產中心,這里叫數據管理平臺,支持后面的業務。
它去年做了整個數據資產的規劃,在未來四年當中大概要投6個多億做數據資產,它投資領域也比較多。這是簡要的把南方電網的數據資產做了案例跟大家分享。
后面的建議,數據治理比較難做,這里有四個方面:
第一,我們要做好頂層規劃設計工作,把數據資產規劃好。包括組織架構、應用機制、標準相關。
第二,要健全治理體系把數據資產管理好。包括做好數據資產管理、做好數據分級、分類、數據共享管理。
第三,加強安全管控,把數據資產保護好。我們現在要用戶授權,最小夠用原則,全程防護,這里在采集、存儲、實用環節要做。
第四,要強化科技賦能,把數據資產應用好,在算力、算法、存儲、網絡方面,要應用好。
這里面我們現在談中臺非常多,我們面臨著雙模式。傳統的像財務、物資管理等等這些東西用的ICP軟件,這部分很難用中臺馬上把它替換下來,中臺主要是在一些探索創新業務模式里,像一些新的快速響應業務,變化比較快的可以做試點,所以未來三到五年當中我感覺到這兩種是并存、雙模式存在的。老業務、老系統以我們為主,新業務、新系統采用新的技術、架構和建設模式。
另外我們看看大數據治理,我們有很多坑,并不是我們想象當中一帆風順,有很多坑需要我們填,包括數據標準、數據質量、數據整合,我們在這個過程中是非常艱難的,要有足夠的信心、足夠的時間、足夠的費用去做這個工作。
這個工作不能說太多時間,一年兩年看不到效果,大處規劃、重點實施,分布提升,我們想目標優勢,迭代要快,每個項目六個月要做完,起步要小,讓高管領導看到數據治理效果。
首先要有數據資產戰略、目標、規劃(三到五年),機制包括組織、制度、流程,另外本身數據治理、數據資產管理領域有些數據域管理。
這里面需要六個導向,包括需求導向、價值導向、問題導向、能力導向、創新導向、結果導向。從最終結果導向我們的數據治理情況。
我們數據管理目標三個結合:大數據治理技術跟傳統業務深度融合、長遠目標與短期目標相結合原則,我們要全局著眼、局部入手、重點突出、痛點著眼,癢點入手、標準、工具與運維保障相結合。
我們要堅持四個堅持、五個避免:
第一堅持統籌規劃、分布演進、局部執行,一定要頂層規劃、避免貪大求全、要做小而精,實現速贏。
第二堅持業務部門牽頭、信息部門統籌管理,咨詢公司作技術支撐。做這個東西滿足合規、審計要求。
第三堅持標準先行、急用先建、滾動發展。業務創新方面有所建樹,這樣高管領導會非常重視,不斷加大資金投入。
第四堅持標準貫標和內部數據人才培養。
五個避免:
第一避免貪大求全,要做小而精、實現速贏。避免數據部門、信息部門唱獨角戲,避免數據流程管理過長避免為了做標準而標準,避免單一工具,按照業務場景去做。
面向大數據平臺要機制落實、標準建設、數據系統建設。所以數據治理是項長期而復雜的工作,需要有專業和專職的團隊進行管理和服務,才能保障數據治理能夠取得比較長效的效果。
后面我們看從愿景來看,我們在數據管理是兩大平臺,第一是中臺或者大數據服務平臺,下面是我們的各種數據(內部、外部),這里主要是數據中臺,再加上數據資產平臺定義兩方面,將來未來一個帳號、密碼能看到跟我們所有相關的數據。
今天時間也快到了,這里面跟大家推薦一個公眾號,這是我團隊做的公眾號。
五句話結論:
數據是企業的核心生產要素、數據是溝通協作的基礎、數據是驅動優化創新動力源泉、數據助推業務增長,占領市場、數據是核心資產,發揮價值。
今天時間原因,我就講這么多,謝謝大家!