1、工業大數據的三大來源
2、工業大數據實施的三大關鍵問題
3、工業大數據兩個具體的實施案例
探索走出符合國情的工業大數據自主之路
——工業大數據的范疇、關鍵問題與實踐
文/王建民,清華大學教授、博導、軟件學院副院長
2011年麥肯錫全球研究院大數據報告表明,2009年美國以裝備制造為代表的離散工業領域擁有的數據規模為各領域之首,比美國政府擁有的數據還要多。近年來,隨著德國工業4.0和美國工業互聯網為代表的新工業革命深入發展,以及“中國制造2025”、“互聯網+”行動計劃與“促進大數據發展行動綱要”的頒布實施,工業大數據得到了越來越多的關注。這里分享一下我們的思考與實踐。
1、工業大數據三大來源
企業信息系統、裝備物聯網和企業外部互聯網是工業大數據的三大來源:
企業信息系統存儲了高價值密度的核心業務數據。上世紀60年代以來信息技術加速應用于工業領域,形成了產品生命周期管理(PLM)、企業資源規劃(ERP)、供應鏈管理(SCM)和客戶關系管理(CRM)等企業信息系統。這些系統中積累的產品研發數據、生產制造數據、物流供應數據以及客戶服務數據,存在于企業或產業鏈內部,是工業領域傳統數據資產。
近年來物聯網技術快速發展,裝備物聯網成為工業大數據新的、增長最快的來源,它實時自動采集了生產設備和交付產品的狀態與工況數據。一方面,機床等生產設備物聯網數據為智能工廠生產調度、質量控制和績效管理提供了實時數據基礎;另一方面,2012年美國通用電氣公司提出的工業大數據(狹義的),專指裝備使用過程中由傳感器采集的大規模時間序列數據,包括裝備狀態參數、工況負載和作業環境等信息,可以幫助用戶提高裝備運行效率,拓展制造服務。
當前互聯網與工業深度融合,企業外部互聯網已成為工業大數據不可忽視的來源。本世紀初,日本企業就開始利用互聯網數據分析獲取用戶的產品評價,時至今日,小米手機利用社交媒體數據成功實現產品創新研發。此外,外部互聯網還存在著海量的“跨界”數據,比如影響裝備作業的氣象數據、影響產品市場預測的宏觀經濟數據、影響企業生產成本的環境法規數據……
2、工業大數據實施的關鍵問題
數據質量、多源關聯和系統集成是工業大數據實施的關鍵問題:
擁有大數據不是目的,發掘其價值才是關鍵。由企業信息化數據、裝備物聯網數據和外部互聯網數據匯聚而成的工業大數據,蘊藏著巨大價值。例如,通過分析用戶使用數據改進產品,通過分析現場測量數據提高工件加工水平,通過工況數據進行產品健康管理等。
▋筆者認為實施工業大數據項目需要關注以下3個關鍵問題:
1、數據質量控制問題
原始數據(生數據)質量決定分析結果的質量。企業信息系統數據質量仍然存在問題,例如2014年某大型機車企業ERP系統中近20%物料存在“一物多碼”問題。裝備物聯網數據質量堪憂,某大型制造企業1個月的狀態工況數據中,無效工況(如盾構機傳回了工程車工況)、重名工況(同一狀態工況使用不同名字)、時標混亂(當前時間錯誤或時標對不齊)等數據質量問題約30%。
2、多源數據關聯問題
層次化的物料表(Bill Of Material, BOM)定義了企業信息系統數據的核心語義結構。針對跨生命周期的研制BOM和實例BOM間結構失配問題,我們提出了中性BOM模型,并以此為核心,向前關聯設計制造BOM,向后關聯服務保障BOM,形成星型結構,極大地降低了數據關聯的復雜度。同時,針對裝備物聯網數據和外部互聯網數據,可以根據其綁定的物理對象(零部件或產品)與相應的BOM節點相關聯。從而以BOM為橋梁,關聯3個不同來源的工業大數據。
3、大數據系統集成問題
工業大數據其來源更加廣泛,并且裝備物聯網數據(半結構化數據)和外部互聯網數據(非結構化數據)都要與企業信息系統(結構化數據)進行集成,因此要重構數據支撐平臺,甚至替換“舊”系統。
3、工業大數據實施工程案例
工業大數據分析提升工程裝備服務保障水平,這里分享兩個工程案例:
案例1、工業大數據提供故障分析新手段
液壓系統是工程機械的關鍵部件。2013年我們發現液壓系統的油缸密封套腐蝕故障數量異常。于是依據企業信息系統記錄的液壓系統維修歷史數據,通過比對相關狀態工況數據(裝備物聯網數據),搜索推薦與故障車輛關系密切的工況,發現車輛油缸換向頻率的波動幅度與這些故障高度相關。
進一步,引入互聯網上的行政區劃數據和歷年工程建設數據(外部互聯網數據)后,發現2012~2013年期間這些典型故障均發生在沿海省份,從而推斷出鹽霧環境是導致密封套腐蝕故障的主要誘因。
案例2、工業大數據提升備件需求預測精度
隨著工程裝備增量市場增長乏力,以維修保障為主的存量市場成為企業盈利新的增長點。我們利用了企業信息系統中的備件銷售訂單、采購訂單和備件庫存狀態數據,以及工程物聯網采集到的工況數據和外部互聯網數據(如每個省的GDP,建筑、交通等規劃數據)。
針對30個省市區進行了備件需要預測,平均預測精度為82%,每旬備件需求預測誤差在5件或真實值的20%以內。庫存水平控制在一個較低的穩定水平,僅為原來庫存水平的48%。同時,因為考慮到了20天的配貨周期,基于預測的補貨策略可以保證現貨滿足率,消除緊急臨時訂單。如果按備件庫存占有資金1億元計算,可節約庫存資金占用5000萬元。
工業大數據是實現智能制造的基礎原料,是提升工業生產力、競爭力、創新力的關鍵要素。然而必須看到,工業大數據是一個正在發展的學科領域,其內涵外延、模型理論、技術方法及其實施策略等還有待發展與創新。唯有結合中國國情認真實踐,才能走出中國工業大數據自主之路,實現制造強國的戰略目標。
作者簡介:
王建民,清華大學教授、博導、軟件學院副院長。國家政府特殊津貼獲得者、國家杰出青年科學基金獲得者。國家863 計劃先進制造技術領域“面向制造業的核心軟件開發”重大項目總體專家組組長(2012 年起), “十二五”國家863計劃先進制造領域制造服務技術主題專家組成員,國家衛計委人口健康信息化專家咨詢委員會委員(2014年起),國家“核高基”科技重大專項總體組成員(2008-2013)。2006年入選國家教育部新世紀優秀人才支持計劃,同年獲得北京市師德先進個人;1998年獲國家科技進步二等獎(排名4);2012年獲得國家教育部科技進步獎一等獎(排名1);2013年獲得中國電子學會科技進步一等獎(排名1),同年入選國家科技部中青年科技領軍人才計劃;2014年入選國家“萬人計劃”,同年獲得國家科技進步二等獎(排名1)。
注:版權著作權屬原創者所有,編輯:Fynlch。