以下是首席信息官如何成功利用數據分析和機器學習來實現業務目標的成功案例。
如果把數據看成是一種新的石油,那么知道如何將其提煉成可操作的情報則是釋放其潛力的關鍵。為此,首席信息官們正在利用預測分析、精心設計的機器學習算法和久經考驗的分析解決方案來追求提升業務效率和服務客戶的新方法。
首席信息官們意識到,降低成本或增加收入可以幫助他們在高管層和董事會眼中熠熠生輝,因此他們在支持數據科學的技術上投入的資金比以往任何時候都多。
根據市場研究公司IDC的數據,今年全球大數據和商業分析軟件的收入將超過1660億美元,比2017年增長11.7%。此外,能夠與新興分析技術合作的人才爭奪戰也正處于白熱化的狀態。
一些首席信息官已經找到了提振上下游增長的方法,他們研究了最近分享的數據,從中吸取了教訓,并為從事類似工作的同行提供了建議。
石油公司殼牌通過分析數據以預測機器故障
很少有行業能比能源行業產生更多的數據了。但多年來,石油巨頭殼牌甚至不知道其在世界各地的各種設施中的零件都位于哪里;它不知道什么時候需要再進貨;直到部件開始出現故障,它才知道什么時候出現了維護問題。由于機器停機每天給公司造成了數百萬美元的損失,于是殼牌決定收集數據以避免這些問題。
殼牌卓越數據科學中心的總經理Daniel Jeavons表示,殼牌基于多家供應商的軟件建立了一個分析平臺,運行預測模型,以預測3000多種不同的石油鉆井機的部件何時會出現故障。
其中一個名為Databricks的工具通過Apache Spark來捕獲流數據。殼牌使用這個工具來更好地計劃什么時候購買機器部件,保存多長時間,以及在哪里存放庫存物品。
該工具托管在微軟Azure的云中,幫助殼牌將庫存分析從超過48小時減少到不到45分鐘,每年減少數百萬美元的庫存轉移和重新分配成本。
經驗總結:避免機器故障需要很多工具。Jeavons表示,殼牌的平臺包括了來自Databricks、Alteryx、C3、SAP和其他供應商的軟件,所有的這些軟件共同幫助了他的數據科學家來產生商業見解。最終,首席信息官必須正確評估這些工具,并在進行大額購買之前了解哪些才是有效的。
ARC啟用了新的數據管理工具
數據是航空報告公司( ARC )的生命線,該公司每年結算航空公司之間價值超過880億美元的機票交易,包括德爾塔航空公司、美國航空公司、英國航空公司、阿拉斯加航空公司以及Expedia等旅行社。航空公司付費獲取ARC在這些交易中收集的數據,以了解更多的關于旅行者的目的地、旅行時間以及在此過程中每年為超過22億次航班支付的費用的信息。
ARC捕獲數據,將其輸入分析引擎,對其進行細化,并為其客戶構建定制的報告。ARC 的CIO Dickie Oliver表示,該公司正從Teradata的數據倉庫遷移到Snowflake的云軟件中,這將幫助ARC更快地將數據產品推向市場,并提供更大的可伸縮性和性能,這得益于其在AWS上的業務。Oliver表示,Snowflake是為了將計算資源與數據存儲分開而設計的,它使ARC能夠為客戶快速構建新的定制報告。Oliver補充說,多虧了這個項目,ARC將能夠為考慮新數據形式的客戶量身定制新的產品。
經驗總結:遷移到一個新的數據平臺通常是令人畏懼的,不僅僅是因為技術的轉變;變更管理是其中真正的麻煩所在。Oliver說,讓人們“從一開始就專注于改變,并讓他們經歷改變過程是這個過程中最具挑戰性的部分”,他補充說,他正全力培訓員工,包括讓他們通過認證,并引進顧問,如讓Slalom來幫助我們進行變更管理。
TD銀行在數據湖方面的天賦
TD銀行的數據分析團隊花了幾年時間來更新數據基礎設施,以滿足當前和未來的需求,并創建了一個企業Hadoop數據湖。
TD銀行企業信息高級副總裁Joe DosSantos表示,我們使用了基于Cloudera的數據湖用來培養對客戶的洞察力,包括從跟蹤員工的流失率,到為客戶提供合適的產品。
TD 銀行的一個核心關注點包括讓業務分析師能夠從數據湖中提取數據,可用且可操作的能力,而無需數據科學家來親自操控。 DosSantos表示:“我們正在讓人們廣泛使用這些數據集。”他補充道,TD Bank還嘗試使用其分析平臺來檢測欺詐和其他瀆職行為。
經驗總結:過去幾年來,TD Bank一直在重新構想其企業數據平臺,篩選數十年來的客戶交易和其他數據。TD銀行沒有過度依賴Hadoop,而是使用了Talend的軟件來提取、轉換原始數據并將其加載到可用于可操作商業智能的信息中。
DosSantos解釋道:“Hadoop對于理解如何從A點到B點獲取數據方面并不是很好。而Talend有一個元數據管理器和一個中央存儲庫來跟蹤數據湖中的數據移動和轉換。”
嘉吉公司正為蝦農提供數據分析
嘉吉公司(Cargill)的動物營養部門開發了一款名為iQuatic的移動數據跟蹤應用,幫助養蝦人降低產量的死亡率。
嘉吉動物營養公司的CIO Tiffany說,該應用程序能夠基于環境因素(如溫度、pH值和營養)來預測蝦池中的生物量,并與嘉吉公司的iQuatic自動喂蝦系統協同工作。Snyder在8月的CIO 100研討會上介紹了iQuatic系統。
只要農民將應用程序中的數據保存到云中,然后訪問實時的操作儀表盤,便能夠直觀顯示池塘的性能,提供關鍵的測量和預測分析,幫助他們更好地管理蝦健康并提高產量。以前,農民是用傳統的方式——用筆和紙來收集的這些數據。
經驗總結:為了構建這個應用程序,嘉吉公司派遣了工程師和企業高管去厄瓜多爾的一個養蝦場,了解農民是如何從池塘中獲取數據的。“我們讓農民成為了我們團隊的一部分,”Snyder說。通過在敏捷、two-pizza的團隊中快速工作,為在5個月內成功進行試點鋪平了道路,并最終實現了產品發布。
讓數據分析在默克公司發揮作用
全球醫療保健公司默克希望利用在ERP和核心系統中收集到的數據來進行生產執行和庫存控制,以獲得更多的商業見解。但是,由于它的工程師花費了60%到80%的精力去尋找、訪問和獲取每個項目的數據,以至于許多商業目標沒有得到實現。默克公司的IT制造首席信息官Michelle D’alessandro表示:“我們沒有把數據視為一種可行的、永久的、有價值的資產。我們希望建立一種文化,在這種文化中,我們可以盡量在移動和報告數據上少花時間,從而將更多的時間花在使用數據來實現有意義的業務成果上。”
默克公司創建了MANTIS(制造和分析智能)系統,這是一個über數據倉庫系統,包括了內存數據庫和開源工具,可以處理在結構化和非結構化系統中的數據,包括文本、視頻和社交媒體。重要的是,該系統能夠允許非技術業務分析師在可視化的軟件中輕松的查看數據。而數據科學家可以通過復雜的模擬和建模工具訪問信息。MANTIS系統已經使公司整體IT分析項目總業務量的時間和成本降低了45%。有形的業務成果包括平均提前期減少了30%,平均庫存持有成本減少了50%。
經驗總結:D'Alessandro表示,她成功的關鍵是在亞太地區的一家工廠中設立了一個“標桿”分析項目,默克將在那里獲得最大的回報。而在那里展示了MANTIS的成功之后,它就為其他網站樹立了榜樣。她還學會了如何步步為營。D 'Alessandro說,她在一個早期的實驗中使用了人工智能和機器學習來分析默克制造過程的成本,但她“做得過頭了”。她說:“這并不是因為缺乏贊助或缺乏遠見,我們只是無法讓它發揮作用。”
胡椒博士集團通過機器學習來進行語境相關性研究
多年來,胡椒博士集團(Dr. Pepper Snapple Group)的銷售員工通常會拿著一個裝滿客戶數據、銷售記錄和促銷信息的大活頁夾,然后開始著手爭取沃爾瑪(Wal-Mart)和塔吉特(Target)等客戶。如今,銷售人員都配備了ipad,它會告訴他們需要訪問哪些商店,能夠提供什么,以及其他的關鍵指標。胡椒博士集團的首席信息官Tom Farrah表示:“他們是光榮的接單員。現在,他們正在成為智能銷售人員,手中掌握著幫助其實現目標的信息。”
該平臺名為MyDPS,配備了機器學習和其他分析工具,當員工加載應用程序時,這些工具就可以提供推薦,并向他們提供每日的運營記分卡。算法將向員工展示他們將如何執行預期的計劃,包括他們是否按計劃完成計劃,以及如果沒有按計劃完成,該如何糾正。“如果我想讓一個人成功,我就必須確保他們所擁有得信息是與工作內容相關的,”Farrah說。
經驗總結:為了測試MyDPS的概念證明,Farra將軟件交給了一家分公司的四個人,并讓業務總裁去拜訪他們。他們透露,在使用了MyDPS之后,執行銷售自上個月以來已經提高了50%,這一結果讓總裁批準了該項目。“他看到了結果,這就是銷售所需要的,這不僅僅是為了項目的商業贊助,也是為了得到預期的結果,這一點非常重要。”Farrah說。
柏克德通過卓越的大數據中心顛覆了自己
柏克德(Bechtel)公司的首席信息官Carol Zierhoffer說,與建筑相關的支出占到了GDP的13%,但在過去20年里,該行業的生產率只增長了1%。但專家表示,通過重新安排合同、提高工人技能、改善現場執行以及其他的一些調整措施,該行業可以將生產率提高50%至60%。于是,建造了胡佛水壩、英吉利海峽隧道和其他奇跡工程的柏克德爾公司,開始從埋藏在商業各個領域的數據中挖掘靈感。
Zierhoffer建立了一個卓越的大數據中心,其中有一個包含5 P數據的數據湖,并開始了概念驗證。該公司使用了照片識別技術來代表客戶檢查和標注網站照片,以此節省了200萬美元。還使用了自然語言處理(NLP)工具來解析索賠、提案請求和合同。在過去需要幾天或幾周的估計和計劃現在只需要幾個小時。柏克德還擴展了分析工作,以考察員工的留任情況,包括試圖預測員工可能的離職時間。Zierhoffer說:“我們相信我們正在敲開生產力挑戰的大門。”。
經驗總結:數據倉庫和質量是關鍵。雖然柏克德可以分析大量數據,但必須提高整個企業的數據質量。“我們不得不顛覆自己,了解自己是如何工作的,并將所以數據都連接起來。”
借助機器學習,RRD走向了新的業務之路
幾年前,營銷傳播公司RRD成立了一個物流部門,向消費者和企業運送印刷材料。為了支持這項業務,RRD自己管理貨物,并代表其合作伙伴運送從洗衣機到狗食的任何東西,最終發展成為了一個價值10億美元的企業。需要面臨的挑戰?那就是在這個聯邦快遞和UPS是無可爭議的王者的世界里,找到一個最優的運費。
天氣、地理、司機和政治氣候等變量都可能使其業務損失慘重。RRD的CIO Ken O 'Brien說,由于迫切需要對費率變量進行預測,RRD轉向了機器學習和分析。它雇傭員工和大學來幫助編寫算法,測試700條路線上的數千個場景,直到能夠實時預測運費——甚至提前七天以99%的準確率來預測運費。 O’Brien表示:“這個項目在不到一年的時間里就收回了成本,而且我們仍然看到與貨運相關的業務在持續增長。”
經驗總結:新企業需要高水平的投入,盡管O 'Brien承認他的一些商業伙伴已經準備好了在不同的階段放棄。他們不信任這項技術,因為這一過程通常是憑感覺和猜測完成的。但RRD建立了一個協作環境,在這個環境中,業務部門和IT部門能夠共同努力來影響結果。“你可能會絆倒,也會有挑戰,但你要有耐心,”O’Brien說。
孟山都利用機器學習來優化種植
農民們總是在苦苦思索該種哪種種子,種多少,以及在哪里和在什么時候。種子巨頭孟山都(Monsanto)也是如此,它利用數據科學,通過利用數學和統計模型,繪制出最佳的時間線來種植雄性和雌性植物,以及在哪里種植,從而為種植者提供指導性的建議。孟山都全球IT分析主管Adrian Cartier表示,該公司的機器學習算法能夠在幾天內,而不是幾周或幾個月的時間,就能處理超過900億個數據點。這能帶來多少商業利益?2016年,孟山都節省了600萬美元,減少了4%的供應鏈足跡。Cartier說:“在北美,4%的土地利用率的下降就意味著很多土地沒有被使用,這將節省大量資金。”
經驗總結:孟山都成功的關鍵是在它和供應鏈業務之間建立了一種“從搖籃到墳墓”的合作方式。他們具有農業和供應鏈角度的專業知識,而我們具有數學和統計領域的專業知識,兩者結合起來,就創造了我們能夠提供的價值,Cartier說他還找到了“改變領導人和支持者”在供應鏈中角色的方法來抵消反對者的數量,以此形成一種健康的平衡。
對于Pitt Ohio來說,預測分析帶來了成功
Pitt Ohio的首席信息官Scott Sullivan表示,貨運行業正受到“亞馬遜效應”的猛烈沖擊。價值7億美元的貨運公司Pitt Ohio已經習慣了在第二天提貨并將貨物交付給客戶。但是多虧了亞馬遜,顧客越來越期待能夠當天交貨。他們期待著更多關于他們包裹的信息。
Sullivan說:“客戶現在不僅想知道什么時候可以拿到,還想知道將如何拿到,這樣他們就可以規劃自己的工作。”。通過使用歷史數據、預測分析和算法實時計算各種貨物的重量、行駛距離和其他因素,Pitt Ohio可以以99%的準確率估算出司機到達目的地的時間。該公司估計,他們由此可以通過老客戶的訂單增加收入(估計每年5萬美元),并減少客戶流失的風險(估計每年6萬美元)。
經驗總結:Sullivan說,這是一個涉及市場研究、銷售運營和IT的跨部門事務,所有人都必須反復檢查結果,以確保自己實現了目標。Sullivan說:“在你的企業內部中其實有很多的數據——你需要創新,并尋找具有挑戰性的方法來使用它們。”