1 大數據的作用越來越重要
宗福季說,在高容量、高速度、多種類的大數據中,做到實時捕捉信號,及時過濾噪聲,掌握辨別信號和噪聲能力的是分析大數據、應用大數據,是大數據環境下質量創新的關鍵。
隨著質量和大數據的融合,大數據在質量管理尤其是宏觀質量管理中將發揮著越來越重要的作用,當前質量管理已全面進入宏觀管理,實行質量行政監督正在向聚焦系統性安全管控和防范的方面轉變。抽查監測、風險預警、誠信管理等新老監管手段的有效性都越來越依賴于對質量大數據的收集、整理、分析的科學性,憑借質量大數據來實現科學管理將是未來的趨勢,這需要通過大數據在消費者、企業、市場、政府之間建立連接的橋梁,采集大數據、分析大數據、應用大數據,進而提升質量管理水平。
2 工業生產面臨不少數據難題
生產工序復雜,生產過程參數過多,數據量龐大,模型維度高,不同數據源的信息需要整合……這些都是工業生產中采集、分析數據所面臨的挑戰。
宗福季舉例說明目前存在的業界問題:國內某航空企業制造的飛機慣性導航系統產品,由于制造和裝配過程參數與產品質量水平的映射關系不明,無法精準預測產品最終裝配后質量,導致最終裝配的良品率無法提高,出現質量事故時無法立即追蹤環節,也無法立即界定影響范圍。
某半導體工業中數據驅動的制造過程監控,監控對象是玻璃面板的物理氣相沉積成膜過程,由于數據過于繁多,雖然有海量實時數據,依然無法識別重要過程參數,難以對過程進行調控或提升,只能依賴最終檢測,出現質量事故時也無法立即追蹤哪個環節出了問題。
制衣工業也面臨著分析數據的難題,某制衣工廠雖有完整的ERP系統和RFID系統,但是工序復雜、不同數據源需要整合導致建模難度高,制造前線供需、工時、報價的計劃及管理,依然無法僅用系統數據預測建模,主要依賴人為判斷。
3 要擁有提升質量的創新工具
宗福季認為,其實,采集數據、分析數據并不意味著問題的完全解決,幫助客戶完成決策才是最終目的,為了實現數據的實際應用需要擁有提升質量的創新工具。
一為突破式創新,運用創意解決問題,首先要求要有同理心,需要以人為本的設計,通過觀察、采訪,發現用戶深層次的需求,對問題重新做深入的定義,需要發散思維,提出眾多解決方案,將一個好的創意點子用具體的原型來呈現,將原型通過情景模擬來測試可用性。
二為漸進式創新,運用統計思維解決問題不是從無到有,而是從好到更好,它不是從零開始,而是有數據作基礎來創新,它是根據定義、測量、分析、改善、控制這個流程來做,它以嚴謹的數據驅動和以客戶為中心的方法,采用系統方法提高績效和減少對客戶至關重要的缺陷。
4 工業大數據分析有層級之分
工業大數據分析實際上有層級之分。宗福季介紹說,在層級一中,只使用經驗,不考慮數據。以京都的百年老店為例,他們代代相傳,運用自己的經驗,發揚工匠精神,將一個東西做到極致,也做得很好;層級二中,收集數據,只用純數字呈現數據;層級三中,收集并整理數據,使用圖表來展示數據,因為人們對于數字不太敏感,而將數據可視化能清晰明了地展示數據,更易被人接受;層級四中,收集調查數據并使用描述性統計量,描述性統計即是計算數據的均值、方差但沒有對數據進行分析;層級五中,收集采樣數據并使用描述性統計量;層級六中,收集采樣數據并使用統計推斷、預測。
“真正的分析,必須要做到統計推論和統計預測,要建立模型,要能夠預測未來的事情,或者是描述推論,它里面的確定性、不確定性,都要進行分析,所以,描述性統計跟統計推論還是不同級別的事情。”宗福季強調。
隨著大數據時代到來,采集數據的傳感器價格越來越便宜,快速采集數據不成難事,如何使用實時的傳感器數據并描述性地總結、可視化是工業大數據的第七層級,目前大部分的公司還停留在第七層級。
“第八層級是使用實時的傳感器數據并建立統計模型,進行推斷、預測并用于決策,這是大家都希望實現的。”
5 分析數據才能更好地決策
宗福季認為,大數據是信息量豐富的資源,同時,分析數據才能指導人們更好地決策。
他指出,傳統工具存在不足之處,比如基于采樣,得到的是部分產品的信息,只能反映局部生產過程;缺少統一的數據與信息平臺,質量數據難以共享與追蹤;工具自動化程度低,依賴質量人員的大量參與與主觀判斷。所以,運用數據分析技術統計學習與機器學習很有必要,采集數據并建模,分析哪些特定的預測因子(X)實際影響了回應(Y),屬于正相關還是負相關關系,簡單的線性關系還是復雜關系。
如今,大數據發展迅猛,傳感器數據到位,系統整合成為可能,系統整合之后才能進行分析,而這些分析又可以借助機器學習。
“以前做不到數據實時的收集,現在可以做得到。在數據分析、質量提升、質量控制等方面現在都有提升,以前可能只是停留在學術論文層面,現在技術到位了,以前的學術研究到實踐應用時間周期比較長,而現在這個時間變得比較短了,一些學術研究可以很快得到應用。”
宗福季介紹,香港科技大學通過質量與數據分析實驗提供技術支持,比如說數據融合、遷移學習、過程監控。數據融合指的是不同精度檢測數據的融合,方針數據與實驗數據的融合。遷移學習是指不同形狀的三維打印產品誤差的遷移建模,比如香港各個地鐵站客流量的遷移預測。過程監控是指大規模復雜數據的統計監控與診斷,基于變量選擇技術的高維數據統計監控、多元類別數據的統計過程控制。
“我今天講的大數據是放在工業大數據的框架下,醫療大數據跟工業大數據非常不一樣,工業大數據一定大有可為,但其實現在應用得不是很深。”宗福季認為。
其實收集數據前需要進行某種分析,雖然存儲數據很便宜,可是不是因為便宜就把它存起來,尤其是工業大數據,你要有某種目的性,什么東西有用,什么東西有關,你才用,因為這涉及投資,所以你必須要在前期做一些分析才做,有目的性,還要做一些規劃。宗福季建議,對于相對復雜的建模操作,企業主管應該學習掌握相關的專業知識或者找專門的技術人才負責。