鎂光公司(Micron)改變了其數據管理戰略,在一系列業務部門內嵌入了數據科學家。以下便是這個集中化戰略所帶來的驚人成果。
如果說數據是新開采的石油,很多公司正在忙于盡力不被其淹沒,但這不包括鎂光科技。總部位于Boise的這家芯片制造公司開創了一個被專家稱為未來工廠的藍圖,幾乎全自動化地利用軟件來對產品和制造產品工具的相關數據進行分析。將機器學習軟件嵌入其集中化數據管理戰略,鎂光正在減少低效流程的相關浪費,同時提高了累積收益并且加速了產品上市時間。
“從供應鏈網絡到其他領域,我們工廠里的機器每天有大量數據涌出,因此具預測性且有實效的分析成為了競爭優勢。”鎂光CIO Trevor Schulze這樣說道,其帶領團隊利用數據和分析來追求極致增長。
據麥肯錫全球研究院上個月發布的一份報告顯示,當近些年海量數據呈指數級增長時,絕大多數公司僅僅攥住了以營收和利潤為表現的部分潛在價值。在麥肯錫調研的500位高管中,85%表示他們僅僅“某種程度上有效地”達成了既定數據和分析項目目標。而鎂光因為其組織化變革分析戰略大有成就。
開創正確的“數據文化”
Schulze在2015年加入鎂光時,他看到了很多大數據分析項目,但并沒有一種架構幫助公司挖掘出其非結構化數據的價值,而數據科學和機器學習僅僅用于資本資產利用——制造商的關鍵標準之一。另外,由于數據利用不能重復處理,工程師們一次又一次地面對同樣的問題,他們不得不手動操作來提取和對比來自分散在全球各數據容器的數據。對于這種做法,技術人員不得不說:批處理吧。
認識到這點,Schulze創建了企業級的分析和數據IT團隊,其和業務團隊合作,將來自于制造業、供應鏈和人力資本管理的數據進行清洗和收集。“其加速了數據文化,我認為每個公司都將會這樣。一個集中化的團隊可以一種介入的方式來解決主要業務問題。我們在非常短的時間內就看到了巨量的業務價值。”Schulze認為將數據科學家嵌入到業務中,將獲得數據和數據準備的所需要的時間減少了一半。
就像一個搖滾樂隊如果沒有樂器就玩不轉音樂,沒有好的工具,許多分析團隊也玩不轉數據。鎂光的IT團隊利用許多開源分析軟件例如Apache Hadoop, Spark 和 NiFi構建了一個全球化數據倉庫,同時利用適宜的機器學習算法來分析數據。
理解機器學習帶給鎂光的收益,其可以幫助理解它如何協助分析數據。多年來工程師們單次只能針對儀表盤上的大量數據對比兩個變量,如今,相應的算法可以從鎂光的企業數據里探索出所有的信號,識別出哪些可能是某問題的初始原因,標識出可以進行庫存優化的區域,以及計算出設計新產品需要多長時間。
“如果每次只能對比兩個變量基本上不能解決任何問題。”鎂光企業數據科學總監Tim Long說道:“并非規模化就可以讓你解決問題,機器學習賦予我們同時測試數據之間數百數千種關系的能力。”
舉例而言,在鎂光的制造工廠中,全球數據倉庫偵測到安裝線上出現問題,就會立刻發出警報讓工程師去檢查工具,而在以前,鎂光只能等到晶片到達制造流程中的檢測步驟時才能偵測出問題。
以機器學習共贏
鎂光企業級分析和數據IT總監David Leach認為系統可以幫助工程師收獲2700種 “贏”,包括在數據科學技術或解決方案的幫助下,一位工程師可以直接指出一種關鍵制造規范的改善方式,這種類似的案例很多。“這些信號就在那兒,但是你能及時看到這些信號,并且及時有所作為么?這就是挑戰。”
好的工具并不代表其可以獲得卓越了,除非它們可以實施在質量流程中的場景中。鎂光利用Data Vault方法論,尤其是其框架來應用數據倉庫的敏捷開發流程,可以迅捷、不斷地改變全球數據倉庫。這代表傳統數據倉庫方法論的另一種開拓,以前工程師們手動將數據錄入系統,一項大數據設計匹配大約需要18個月才能夠交付。如此多的“瀑布”項目中,交付并不和任何人的需求相吻合,Leach說道。Data Vault允許鎂光迅速做出改變,并且在事后增加事項而不需重構軟件。
“最關鍵的是其可以讓我們數據科學團隊在制造業加速前行,并且能夠迅速地回到他們的解決方案中去。”Leach說道。
鎂光成功地利用機器學習來做需求預報,將客戶需求與數千計芯片產品的生產緊密相連。Long表示機器學習改善了15%的預測精確性,這是一個以前未曾料到的驚人壯舉。
“機器學習讓我們可以產生數百不同時間序列的預報,并且利用技術來識別哪一些和哪一些的結合可以提供最厲害的預測。”他補充道。