單純地雇用數據科學家并不意味著企業能夠充分利用數據科學帶來的優勢。來看看以下幾家企業如何通過數據科學團隊讓數據價值最大化。
數據科學看上去是一項很“高大上”的工作,企業正在利用數據科學提取巨大的運營價值。
福特汽車公司全球分析總監Alan Jacobson在Gartner數據分析峰會上表示,數據科學的重點為公司帶來了巨大的收益。
從2015年開始,該公司聘請了一位首席數據科學官,并從業務部門中抽取了大約200位數據分析師,形成了一個集中的數據科學團隊。如今,該團隊在每一個業務領域都發揮著咨詢、協商的作用。這意味著分析師正在從汽車生產問題到支持使用福特汽車的NASCAR賽車隊開展工作。
數據科學提升運營效率數據科學的最大價值是提高制造效率。 Jacobson分享了負責制造的總監如何獲得車輛生產信息清單。確定生產順序是一個手動的過程,管理人員憑借經驗整理生產計劃。但沒有人可以跟蹤所有涉及的變量,例如某些車輛可能需要的專用工具,以及生產某些汽車所需的時間差異。這延遲了新車的交付時間,也給公司帶來了損失。
Jacobson和他的團隊了解到這些問題后,為加拿大的生產流程制定了一個算法。該算法不僅考慮了生產每個車輛的所有變量,該算法提供了一個進行了優化,保持車輛沿最小重組生產線移動的生產計劃。Jacobson說,構建算法需要七天時間,另外還需要七天將算法部署到生產環境中進行測試。如今,生產設備每天都可以達到目標,節省了公司的資金。
數據科學助力產品開發對于亞特蘭大征信局Equifax來說,數據科學的價值來自于改進其主要產品之一:信用評分。
Equifax數據和分析高級副總裁Peter Maynard在接受采訪時表示,信用評分在傳統意義上是消費者信用狀況的一個快照。使用更多的趨勢和歷史數據可以讓分數更有說服力,讓貸款人看到消費者隨著時間的推移如何使用信貸。但Maynard認為,信用報告機構傳統上并沒有使用趨勢數據,因為這樣做會增加一些復雜度。
像神經網絡這樣的機器學習模型可以理解這種復雜性,但是由于監管的原因,報告機構需要能夠為他們提供的分數提供簡單的理由。通常征信局無法為機器學習模型給出的答案做出更好的解釋,所以像Equifax這樣的征信局一般不會選擇機器學習模型。
Maynard要求團隊成員不僅僅是開發一個評估歷史信用數據的神經網絡,而且還為決策提供了原因代碼,這些事機器學習做不到的。Maynard表示,這一變化以數據科學為主導,大大改進了公司的主要產品。
“通過分析實現更好的決策,這是金融業十年來一直在等待的事情。”他說,“這也是快照和數字視頻之間的區別。”
重視數據質量當然,要想充分挖掘數據價值,并不是簡單地要求數據科學家解決某些問題擺在面前,要求他解決這些問題。FICO首席分析官Scott Zoldi表示,實現數據科學的價值,數據質量也是非常關鍵的一環。
Zoldi說,軟件供應商使用人工智能和機器學習來開發信用評分模型及其銷售的軟件。但他表示,這些模型中使用的數據往往與模型本身的成功有關。
例如,他指出機器學習模型可以很好地發現變量和發現趨勢之間的相關性。但是,相關性并不等于因果關系。過時的數據或從不同來源組合的數據可以呈現任何數量的關系,這并不意味著可以帶來任何商業價值。
Zoldi說,這不是所有新的數據科學家都能理解的,他們中的許多人將針對任何可用的數據進行復雜的分析,相信該模型將彌補數據中的任何缺陷。但Zoldi表示,公司應該花費更多的精力來獲取高質量的數據,而不是擴大他們的數據科學團隊才能做到這一點。
“在我的職業生涯中,我已經學會了尊重這一點,”他說,“如果你不能得出因果關系,至少要理解并確保模型的建議是可信的。”