話務預測是客服中心現場運營管理中的第一個環節,也是最重要的一個環節。精準的話務預測能夠提高人工座席利用率,能夠降低人力成本,能夠提前對未來運營做出預警,為提高服務水平奠定基礎。目前,中心話務預測停留在基本的趨勢分析,存在主觀預測成分大、缺乏統一預測規則、預測周期短、不能與排班進行完全吻合等問題,無法達到人員利用最大化的目的。本文以建立穩定統一的預測模型為目的,在提高話務量預測準確度的同時延長預測周期,為合理排班打好基礎。
呼叫中心的話務預測一般分為中長期預測、短期預測、時刻預測三個方面,文章根據不同周期的話務量特點,分別選取X12-ARIMA、ARIMA、BP神經網絡模型,實現話務量的中長期、短期、時刻預測。
一、中長期預測
中長期預測主要進行月度、年度預測,為整體人員安排、培訓計劃、活動制定等提供參考,對月度、年度工作計劃有重要價值。
(一)X12-ARIMA模型介紹
X12-ARIMA方法是由X12和時間序列模型ARIMA組合而成的季節調整方法。季節調整(Seasonal adjustment)就是從時間序列中去除季節變動要素,從而顯示出序列潛在的趨勢循環分量。趨勢循環分量能夠真實地反映經濟時間序列運動的客觀規律,該模型僅限于季度、月度數據使用。目前有三種比較常用的季節調整方法: X12、X11方法、移動平均方法,其中最常用的就是X12方法。X12有以下四種模型選擇:加法模型:Y_t=TC_t+S_t+I_t;乘法模型:Y_t=TC_t⋅S_t⋅I_t;對數加法模型:LnY_t=LnTC_t+LnS_t+LnI_t;偽加法模型:Y_t=TC_t (S_t+I_t-1);其中Y_t表示時間序列;TC_t表示趨勢循環要素;S_t表示季節要素;I_t表示不規則要素。X12的主要缺點就是在原序列基礎上補充末端欠值,如果補欠項方法不當就會造成信息損失,而通過ARIMA模型延長原序列則彌補了移動平均法末端項補欠值的問題,ARIMA(p,d,q)模型表達式為:y_t=c+α_1 y_(t-1)+α_2 y_(t-2)+…α_p y_(t-p)+ε_t+θ_1 ε_(t-1)+θ_2 ε_(t-2)+…θ_q ε_(t-q),(公式1)其中y_t表示時間序列,α_i、θ_i為回歸系數,ε_i為殘差。X12-ARIMA模型已經被廣泛應用于月度或季度時間序列數據,能夠對數據系列中的月度或季節因素、趨勢因素以及除此之外的其他因素進行同步分析,預測的精準度較高。
(二)月度話務量的描述分析
從近幾年的月度話務數據可以看出每年3、7、8為話務高峰月份,2、6、11、12月為低谷月份,話務量顯示出明顯的月度循環效應,同時呈現逐年下降趨勢,月度及趨勢規律性較明顯,比較符合X12-ARIMA的模型特點(如圖1)。
(三)X12-ARIMA模型建立及預測
PBC版的X-12-ARIMA季節調整軟件能夠對數據系列的季節因素、中國式節假日因素、趨勢因素以及除此之外的其他因素進行同步分析。利用該軟件,以我中心2011年1月至2015年5月的月度話務量為實驗樣本,經多次測試最終確定選擇X12加法模型、ARIMA(1,1.1)最符合我中心月度話務量特點,預測效果最佳。圖2是利用X-12-ARIMA季節調整軟件通過相關參數設置后對2015年6月至2016年5月的話務量預測情況,我中心6月實際話務量為5422409,預測準確率為99.8%。由于X-12-ARIMA預測精準度會隨著時間拖延而降低,所以需要及時更新數據(如表1)。
二、短期預測
短期預測主要進行單天話務預測,該預測提前預警總體人員需求情況,可以滿足服務水平的需求,同時為員工的休假時間提供參考。
(一) ARIMA模型及實現軟件介紹
ARIMA模型被廣泛應用于時間序列的分析和預測,是一種精度比較高的短期線性預測方法,它適用于各種類型的時間序列。ARIMA又稱ARIMA(p,d,q),其中d是指對時間序列進行d階差分,p是自回歸項,q為滑動平均項,它是自回歸模型(AR模型)和滑動平均模型(MA模型)的一般形式,模型表達式見上文公式1。
Eviews全稱Econometrics Views,是美國QMS公司推出的基于Windows平臺的專門從事數據分析、回歸分析和預測的計算機軟件。Eviews是當今世界上最優秀的計量經濟工具軟件之一,具有操作簡便、界面友好、功能強大等特點,在科學數據分析與評價、金融分析、經濟預測、銷售預測和成本分析等領域具有廣泛影響。本文利用Eviews7.2(最新版本)進行模型建立及預測,其結果更具信服力。
(二)ARIMA模型建立及預測
本文利用某分中心2014年1月1日至2015年6月15日單天數據為訓練樣本,以6月16—22日一周數據為測試樣本,對訓練樣本時間序列進行一階差分后得到平穩序列,通過對一階差分后的平穩序列進行自相關檢驗,結果顯示自相關函數和偏自相關函數都是2階“截尾”(如表2),由此,分別建立ARIMA(2,1,2)、ARIMA(1,1,2)、ARIMA(2,1,1)、ARIMA(1,1,1)模型,通過比較SIC、SC及調整R^2(如表3),最終確定ARIMA(1,1,1)模型擬合效果最優。模型結果為:
〖hwl2〗_t=-27.23+0.7792〖hwl2〗_(t-1)+ε_t+ε_(t-1) (公式2)
其中〖hwl2〗_t指話務量的一階差分序列;ε_t為殘差。
表2一階差分序列的自相關檢驗
三、時刻預測
目前,我中心正常班次時間集中在8:30-21:30,熱線班長根據期間26個半個小時的話務量提前進行排班,從而時刻預測成為班次排布的前提,對熱線30
S接通率有直接影響。
(一)神經網絡模型及相關軟件介紹
由于時間序列模型對長期預測精準度不高且預測非常慢,在時刻預測方面難以應用,本文大膽嘗試神經網絡模型,力圖提升時刻預測的精度和速度。
在眾多的神經網絡模型中應用最廣泛的是BP(Back Propagation)模型,即利用誤差反向傳播算法求解的多層前向神經網絡模型。BP網絡在故障診斷、模式識別、圖像識別、管理系統等方面都得到了廣泛應用,本文討論通過BP模型來實現時刻話務量預測。
圖3是BP算法學習框圖,其基本思想是通過調整隱含層中的恰當的網絡結構來探索輸入和輸出變量之間復雜關系的過程。輸入信號在輸入層經隱含層神經元、輸出層的向前傳遞過程中網絡權值固定不變,如果輸出端產生的輸出信號不是期望的輸出,則進入誤差信號反向傳播階段,通過誤差反饋不斷修正網絡的權值,使網絡的實際輸出更接近期望輸出。這種過程不斷迭代,最后使得誤差信號達到允許的誤差范圍之內。
在各種數據挖掘軟件中,SPSS Modeler已經連續多年雄踞各種應用軟件之首。它不但集成了諸多計算機科學中機器學習的優秀算法,同時也綜合了一些行之有效的統計分析方法,成為內容最為全面、功能最為強大、使用最為方面的數據挖掘軟件產品。本文利用最新版本SPSS Modeler14.2軟件進行時刻預測,結果具有一定信服力。
(二)時刻話務量的描述統計及影響因素分析
1、時刻話務量的描述統計
圖4、圖5、圖6分別為某分中心2015年4、5、6全月、第三周以及6月14、15、16日每半小時的話務量,可以看出時刻話務量呈現明顯的月、周、日周期性。
2、時刻話務量影響因素
為建立BP神經網絡,需對影響時刻話務量的因素進行匯總分析。根據因素的重要性,文章對可能存在的影響因素進行了等級劃分,其中1級為最重要的。前4個因素Month,Week,Day,Constant對其它因素的選取起著時間參考系的作用,后7個因素的準確時間定位都將依賴于此4個因素,因此將其設置為1級影響因素;根據時刻話務量數據特有的周期效應,上個月與上周同時刻基本一致,具有很高的相似性,所以將前一個月同時刻、前一周同時刻設置為2級影響因素;再考慮到呼叫中心業務特點,公司會根據客戶的需要在不同時期開展持續時間不同的活動,所以在時間點越接近的幾天的數據對于預測具有越大的影響力度,因此將前五天同時刻話務量的權重設置為3級,具體因素見表5。
3、神經網絡模型的建立及預測
由于BP神經網絡算法的結構很敏感,輸入層參數數目的確定對整個算法起著至關重要的作用。到底選擇多少個輸入參數才能使結果最優,盡管很多學者對此做了大量的實驗和研究,迄今為止還是沒有一個成熟的理論來解決這個問題,所在實際的應用中還是采用了實驗驗證法。
本文選取某分中心2014年1月1日—2015年5月28日時刻話務量作為訓練集,分別選取因素表中的前4個、前6個、前7個、前8個、前9個、前10個、所有11個因素作為BP神經網絡輸入參數,設置最大訓練時間15分鐘,最低準確率為90%進行擬合,擬合結果見表6,從結果可以看出選取所有11個因素時擬合準確率最高。
注:擬合準確率=1-((預測值-實際值)/實際值)
利用最優的BP神經網絡模型對未來7天時刻話務量進行仿真預測,預測結果如圖7。由圖可知前三天的預測效果較好(準確率92.34%),后四天預測效果欠佳(準確率86.68%),且預測話務量偏高,這種情況可能是由于今年短信群發量低,6月份較去年同期話務量下降幅度過大造成的,后期將繼續增加歷史數據進行再次驗證。同時更新歷史數據至7月5日,對7月6日至12日時刻話務量進行預測,預測結果見圖8,整體接通率為92.47%,預測結果較好。
本文分別利用X12-ARIMA、ARIMA、BP神經網絡模型實現了客服中心的話務量中長期、短期、時刻的預測,其中中長期預測準確度最高,已經推廣全中心充分利用PBC版的X-12-ARIMA季節調整軟件進行中長期預測;短期預測和時刻預測方面,較長期預測還需進一步提升。如何更進一步對話務量進行精確的分解和分析,如何結合其他的預測方法和理論進一步提高預測精度,保證預測對各種影響因素的反應準確度,特別是減少大跨度時間的預測誤差等,都值得進一步探討和研究。