能夠準確而自信地預測未來的重要性不言而喻。以下是將數據轉化為對未來的洞察所需要的工具和策略。
預測未來一直是一個冒險的命題。幸運的是,預測分析技術的出現使得用戶能夠基于歷史數據和分析技術(如統計建模和機器學習)預測未來的結果,這使得預測結果和趨勢變得比過去幾年更加可靠。
盡管如此,與任何新興技術一樣,想要充分發揮預測分析的潛力也是很難的。而可能使挑戰變得更加復雜的是,由不完善的策略或預測分析工具的誤用導致的不準確或誤導性的結果可能在幾周、幾個月甚至幾年內才會顯現出來。
預測分析有可能徹底改變許多的行業和業務,包括零售、制造、供應鏈、網絡管理、金融服務和醫療保健。AI網絡技術公司Mist Systems的聯合創始人、首席技術官Bob fridy預測:“深度學習和預測性AI分析技術將會改變我們社會的所有部分,就像十年來互聯網和蜂窩技術所帶來的轉變一樣。”。
這里有七個建議,旨在幫助您的組織充分利用其預測分析計劃。
1.能夠訪問高質量、易于理解的數據
預測分析應用程序需要大量數據,并依賴于通過反饋循環提供的信息來不斷改進。 全球IT解決方案和服務提供商Infotech的首席數據和分析官Soumendra Mohanty評論道:“數據和預測分析之間是相互促進的關系。”
了解流入預測分析模型的數據類型非常重要。“一個人身上會有什么樣的數據?” Eric Feigl - Ding問道,他是流行病學家、營養學家和健康經濟學家,目前是哈佛陳氏公共衛生學院的訪問科學家。“是每天都在Facebook和谷歌上收集的實時數據,還是難以訪問的醫療記錄所需的醫療數據?”為了做出準確的預測,模型需要被設計成能夠處理它所吸收的特定類型的數據。
簡單地將大量數據扔向計算資源的預測建模工作注定會失敗。“由于存在大量數據,而其中大部分數據可能與特定問題無關,只是在給定樣本中可能存在相關關系,”FactSet投資組合管理和交易解決方案副總裁兼研究主管Henri Waelbroeck解釋道,FactSet是一家金融數據和軟件公司。“如果不了解產生數據的過程,一個在有偏見的數據上訓練的模型可能是完全錯誤的。”
2.找到合適的模式
SAP高級分析產品經理Richard Mooney指出,每個人都癡迷于算法,但是算法必須和輸入到算法中的數據一樣好。“如果找不到適合的模式,那么他們就毫無用處,”他寫道。“大多數數據集都有其隱藏的模式。”
模式通常以兩種方式隱藏:
•模式位于兩列之間的關系中。例如,可以通過即將進行的交易的截止日期信息與相關的電子郵件開盤價數據進行比較來發現一種模式。Mooney說:“如果交易即將結束,電子郵件的公開率應該會大幅提高,因為買方會有很多人需要閱讀并審查合同。”
•模式顯示了變量隨時間變化的關系。 “以上面的例子為例,了解客戶打開了200次電子郵件并不像知道他們在上周打開了175次那樣有用,”Mooney說。
3 .專注于可管理的任務,這些任務可能會帶來積極的投資回報
紐約理工學院的分析和商業智能主任Michael Urmeneta稱:“如今,人們很想把機器學習算法應用到海量數據上,以期獲得更深刻的見解。”他說,這種方法的問題在于,它就像試圖一次治愈所有形式的癌癥一樣。Urmeneta解釋說:“這會導致問題太大,數據太亂——沒有足夠的資金和足夠的支持。這樣是不可能獲得成功的。”
而當任務相對集中時,成功的可能性就會大得多。Urmeneta指出:“如果有問題的話,我們很可能會接觸到那些能夠理解復雜關系的專家” 。“這樣,我們就很可能會有更清晰或更好理解的數據來進行處理。”
4.使用正確的方法來完成工作
好消息是,幾乎有無數的方法可以用來生成精確的預測分析。然而,這也是個壞消息。芝加哥大學NORC (前國家意見研究中心)的行為、經濟分析和決策實踐主任Angela Fontes說:“每天都有新的、熱門的分析方法出現,使用新方法很容易讓人興奮”。“然而,根據我的經驗,最成功的項目是那些真正深入思考分析結果并讓其指導他們選擇方法的項目——即使最合適的方法并不是最性感、最新的方法。”
羅切斯特理工學院計算機工程系主任、副教授shanchie Jay Yang建議說:“用戶必須謹慎選擇適合他們需求的方法”。“必須擁有一種高效且可解釋的技術,一種可以利用序列數據、時間數據的統計特性,然后將其外推到最有可能的未來,”Yang說。
5.用精確定義的目標構建模型
這似乎是顯而易見的,但許多預測分析項目開始時的目標是構建一個宏偉的模型,卻沒有一個明確的最終使用計劃。“有很多很棒的模型從來沒有被人使用過,因為沒有人知道如何使用這些模型來實現或提供價值,”汽車、保險和碰撞修復行業的SaaS提供商CCC信息服務公司的產品管理高級副總裁Jason Verlen評論道。
對此,Fontes也表示同意。“使用正確的工具肯定會確保我們從分析中得到想要的結果……”因為這迫使我們必須對自己的目標非常清楚,”她解釋道。“如果我們不清楚分析的目標,就永遠也不可能真正得到我們想要的東西。”
6.在IT和相關業務部門之間建立密切的合作關系
在業務和技術組織之間建立牢固的合作伙伴關系是至關重要的。 客戶體驗技術提供商Genesys的人工智能產品管理副總裁Paul lasserr說:“你應該能夠理解新技術如何應對業務挑戰或改善現有的業務環境。”然后,一旦設置了目標,就可以在一個限定范圍的應用程序中測試模型,以確定解決方案是否真正提供了所需的價值。
7.不要被設計不良的模型誤導
模型是由人設計的,所以它們經常包含著潛在的缺陷。錯誤的模型或使用不正確或不當的數據構建的模型很容易產生誤導,在極端情況下,甚至會產生完全錯誤的預測。
沒有實現適當隨機化的選擇偏差會混淆預測。例如,在一項假設的減肥研究中,可能有50%的參與者選擇退出后續的體重測量。然而,那些中途退出的人與留下來的人有著不同的體重軌跡。這使得分析變得復雜,因為在這樣的研究中,那些堅持參加這個項目的人通常是那些真正減肥的人。另一方面,戒煙者通常是那些很少或根本沒有減肥經歷的人。因此,雖然減肥在整個世界都是具有因果性和可預測性的,但在一個有50%退出率的有限數據庫中,實際的減肥結果可能會被隱藏起來。
總結
商業智能和分析軟件開發公司GoodData的數據科學高級總監Arvin Hsu表示:“企業正在經歷成長的痛苦,并認識到預測分析可能不是自己可以涉足的領域。”然而,強大的預測分析對于業務效率、收入和產品性能的影響是非常巨大的,而為此投入的時間、精力和資源最終將被證明是非常值得的。