自德國2013年4月正式提出“工業4.0”戰略迄今已兩年有余,“工業4.0”在國內已得到了非常廣泛的關注和討論,很多優秀企業開始摩拳擦掌,開始制定和實施自己的“工業4.0戰略”,這些如火如荼的景象凸顯出未來創新產品智能制造領域的誘人前景。無獨有偶,GE公司不久前宣布出售旗下包括GE Capital在內的非工業資產,將主要精力回歸于高精尖的創新制造領域。這一切似乎都在佐證著一場以創新和數字化驅動的智能制造為核心的新工業革命正在向我們頻頻招手。
工業4.0離不開數據分析和應用
工業4.0的一個目標,是要實現從智慧工廠到智能生產的的建設和升級,前者重點研究智能化生產系統及過程以及網絡化分布式的生產設施的實現,而后者涉及整個企業的生產物流管理、人機互動,3D打印以及先進制造技術在工業生產過程中的應用。一個普遍的共識是,要實現這一新的“工業革命”,基于“大數據”技術的數據挖掘和知識發現能力,將是其中最為重要的能力之一。而總體而言,制造業存儲了遠超過其他工業部門的數據,據不完全統計,從2010年以來的新產品數據就達到了接近2EB,這其中就包括大量的儀器儀表測量數據,供應鏈數據乃至產品全生命周期數據。對這些數據的分析和價值挖掘,是為創新和生產實踐提供智能指導必須要完成的工作,將直接影響智能生產能夠實現的程度。而幾乎在所有剖析工業4.0的文獻匯總,都著重強調了數據分析和知識發現的重要性。
制造業數據采集和分析領域的共性問題
工業4.0是多品種小批量創新產品高精度卓越質量的生產,而要實現這種“高精度卓越質量的生產”而言,對生產數據準確、及時的采集和分析無疑是不可或缺的。為了實現產品創新和高精度的質量控制,蘋果和Intel這樣的頂尖公司每年花費在數據分析軟件上的費用是非常驚人的,而且在其員工的培訓和考核體系上,數據分析能力也被作為一個重要的考量維度。在世界范圍內,各個工業巨頭在數據采集和分析領域的投資還在不斷加碼,而國內的絕大多數企業也正在掀起一場數據采集和分析利用的熱潮。作為業內專業的質量大數據和智能制造解決方案供應商,QuAInS在2014年深入調研了數十家企業,發現不少企業已經開始增加在數據采集和分析領域的投資,但由于起步較晚,在這個領域還普遍存在著一些具有共性的重要問題。
目標不明確導致貪大求全
曾有專家呼吁“大數據”應該從“小應用”著手,即選取一到兩個具體的領域開始數據采集和分析技術的應用,并隨著時間和經驗的積累逐步向相關的領域拓展。而有些企業一開始并沒有選定這樣的“小應用”,而是從盡量多的領域全面鋪開,結果各部門疲于奔命,搜集了供應鏈、生產、質量、財務成本、ERP,售后服務等各個方面的數據組成了一個龐大的數據群,但卻對如何應用這些數據來解決何種具體的問題并不明確,只是形成了一個價值相當有限的“數據堆”。比如江蘇有一家企業,在這種情況下花近兩年的時間集中了5個數據庫的數據,各個團隊為此耗費了巨大的精力和成本,但最終卻因為應用目標不明確,項目遲遲不見收益而不了了之。QuAInS質量大數據研究院資深專家Roger介紹說:由于國內大多數制造型企業本身并沒有太多的數據分析和應用經驗,有時候在對“小應用”還不明確的情況下為了趕“大數據”的“時髦”而匆匆上馬一些項目,這樣失敗的風險就很大。其實,對制造業來說,精細化和質量是永恒不變的最重要的課題,企業完全可以從提高生產質量和流程能力、降低單位質量成本入手,收集和整合產品的質量數據以及‘生產這些質量’的過程數據并加以分析利用,這往往是一種能夠比較快地見效和獲得客戶認可的路徑。
手動采集數據,效率低下
QuAInS在調研中發現,不少企業雖然已經有了一定的數據積累的意識,但數據采集過程的過程仍然是半自動甚至依靠手工進行。在浙江一家精密零件生產企業的測量車間,工作人員在完成測量后,需要將測量結果用筆手動記錄在一張事先打印好的表格中,然后由另外一位工作人員集中輸入電腦;而對于一些比較智能的測量儀器如CMM,測量儀器自動輸出的數據文件仍然以單獨文件的形式分散存儲在各臺測量電腦中,需要手動拷貝轉換才能實現數據規整,做一份簡單的質量檢驗報告也需要大半天的時間。這種方式不僅效率低下,造成很大的人力成本損失,而且,數據的記錄非常容易出錯。Tommy作為測量車間的主管對此深有體會:有時花了好幾個小時尋找異常測量值出現的原因,最后發現是因為在手動記錄是寫錯了小數點位置所致。“一般而言,如果借助一些自動化的數據采集方式,企業花在數據采集方面的時間至少能節省80%以上,而且還能大幅降低出錯的概率”。QuAInS數據采集方案高級經理Tommy解釋說。
只有結果數據,沒有過程數據
為了進行質量監控或制作質量報告,很多企業都對客戶直接關心的各個質量指標的數據進行了收集整理,比如某個具體產品的同心度、尺寸、角度等等。從質量大數據應用的角度,如果企業僅僅是為了制作質量報告或實現實時的質量監控(比如實施SPC,需以數據的實時采集為前提),這種做法是可行的。但是質量大數據的更多價值在于從數據中發現質量改進的空間和線索,并以此制定切實可行的持續改進方案,甚至是對將來一段時間的質量狀況進行預測,這點和提倡“用數據說話”以減少流程波動的六西格瑪質量管理在某種程度上有一定的異曲同工之處。如果沒有PCB生產工程中的噴淋角度、壓力、藥水PH值等方面的數據,我們就很難得到到底是哪個因素主要造成了某個批次線寬的不良。
未以應用為導向進行數據規整
在對數據進行探索和分析之前,對數據的規整是必不可少的。數據規整不同于簡單的數據數據獲取和整合,比如我們從不同的數據庫中得到了所需的數據(其中包括加工的溫度數據),但很可能我們還不能對之進行分析,原因是,在不同的問題研究場合,有時候我們可能需要將溫度當做連續變量來處理,有時候卻需要當成離散變量來使用,這個需要根據行業和工藝特點和具體需要分析和解決的問題來確定,但在相同的行業或同一個企業,這種處理又是相對固定的。因此,最好能夠在數據獲取的過程中就能夠自動完成類似的數據規整,這樣獲得的數據才能夠直接進行分析。
進行數據分析時無所適從
可喜的是,目前的確已經有一些企業能夠圍繞質量控制、改進和預測的主題進行一定的分析工作,特別是在一些高科技半導體行業這種情況已經比較常見。但工程師在進行這些分析工作時,除了前文中提及的數據規整的問題之外,往往還有更多的困惑:對于同一個數據分析問題而言,從初級的基本方法到高級的方法往往不止一種,工程師常常需要花很長時間才能摸索出一套對具體某個問題比較有效的分析方法和思路。這一方面是因為工業統計方法的應用具有相當的專業性,不僅需要具備一定的統計學基礎知識,還需要有相當的工程背景和數據分析經驗;另一方面,目前常用的數據分析軟件普遍只是提供各種數據分析方法,且使用起來也非常靈活,但在對具體問題應該采取何種方法的問題上,卻并未能給出足夠的建議,使得絕大多數并不具備足夠工業統計背景的工程師感到無所適從。就像一個屋子有很多扇門,我們很難知道到底哪一扇門才是通往我們想去的房間的最佳通道一樣。不過,從客觀的角度,這些工具軟件的靈活性本身是非常值得推崇的,只是目前國內大多數企業的在數據分析應用方面的實際水平與這種靈活性之間還有一定的差距。“我們著力研究的行業化解決方案,正式為了幫助國內的企業縮短學習時間”,Roger說。
誠然,上述種種問題,需要我們從知識積累,系統建設,人才培養等多個方面進行長期的改善。在中國經濟“新常態”背景和工業4.0的美好愿景下,我們有更多的理由去邁開堅實的步伐,畢竟“世界這么大”,我們能抓住的機會卻不多。