時間序列是一種標準的分析方法,但是較為先進的機器學習工具引入了統計技術,來建立更精確的預測模型。時間是無法倒流的,但是使用現有的工具,您有更多的機會預測時間,更準確地說,是可以預測時間序列樣本中的事件是否會繼續影響決策趨勢。
Google發行的Facebook Prophet和TensorFlow是兩種旨在吸引開發人員創建數據科學應用程序的機器學習協議。技術和分析經理應將這些工具視為擴展其DataOps功能并將其初始步驟擴展到機器學習的方法。
由Facebook核心數據科學團隊創建的Facebook Prophet提供了可靠的時間序列預測,其中處理能力是一個問題。先知基于加性模型,以解決非線性趨勢如何與每年、每周和每天的季節性相適應。當數據包含周期性趨勢(例如發現突發事件影響趨勢)時,該框架將為企業提供幫助。 R編程和Python版本是在一年前發布的,因此企業可以利用開源資源來創建模型。 源代碼和示例可在GitHub上獲得。
神經網絡框架還提供了一套附加的概率模型,在R中,模型被稱為一個單獨的庫。這使得更高級的統計模型可以更容易地構建到模型中。在時間序列的情況下,用戶可以應用貝葉斯結構的時間序列。貝葉斯結構時間序列是一組概率模型,它包含并延展了許多標準的時間序列建模概念。其目的是突出統計細節,以便更準確地比較當前和以往各時期的時間序列數據。TensorFlow概率庫允許模型包含貝葉斯結構時間序列。
為什么要對時間序列如此重視呢?時間序列報告和Excel電子表格一樣常見,許多工具都顯示時間序列數據,而你只需看一下web分析解決方案或社交媒體分析報告就可以得到。但是,這些解決方案中時間序列數據的可視化并沒有真正考慮到統計分析。
例如Google Analytics(分析)之類的網絡分析解決方案,可以提供引薦流量的時間序列結果,這些結果可以決定哪些源始終向網站發送流量。但是,假設您需要預測給定轉診源的趨勢可以持續多久,如果時間足夠長,趨勢線的斜率可能無法立即從平面線中分辨出來。通常確定第一個客戶的搜索流量的最高轉換來源時會耗費較長時間,因為訪問量增長緩慢。
根據目前的數據源情況,給定時間序列的頻率模式也可能不是線性的。這意味著觀測結果將以對數或曲線的形式顯示出連續的增減。具有統計能力的工具能夠比標準解決方案更好地檢測這些細微差別的趨勢。進行股票市場預測的金融專業人士非常了解更好的統計能力的價值。他們使用先進的工具來創建精確的時間序列預測,但因為數據中的噪音和波動掩蓋了這一趨勢。
最新的工具使很多統計功能成為可能,加快了創建有意義的決策分析。數據中的隨機噪聲也可以過濾掉。但高級分析也可以在其他儀表板(如Tableau)中完成,或者像Prophet提供的用Python或R編程創建可視化模型。
雖然時間序列是一個簡單的分析,但有時也會包含復雜的統計細微差別。檢查這些細微差別可以快速顯示正確的細節,幫助團隊更快更好地做出數據驅動下的正確決策。