對于移動運營商來說,經過多年的IT系統建設,大量的網絡數據被積累下來。但是現有的IT系統和數據對于支撐網絡運營工作還存在一些障礙,主要表現在:面對多樣化需求,重復從底層進行大數據處理,處理環節多、難度大;留存數據主要以網絡設備為中心進行存儲和組織,無法反映用戶真正的感知情況,無法支撐以用戶為中心的網絡運維;現有數據可視性和可用性較差,不能提供多樣的數據開放手段,支撐一線業務人員的數據使用要求。這些障礙也是國內運營商網絡部等業務部門普遍面對的問題。
為解決上述問題,同時響應中國移動集團全面轉型到“以用戶為中心”的戰略要求,山東移動網絡部與IBM全面合作,通過對既有系統所產生數據的詳細研究,以創新思維設計了區別于傳統3層系統應用架構的基于用戶網絡畫像的大數據開放引擎,并基于此大數據開發引擎利用多種大數據開發手段設計多種數據處理算法,以用戶為中心對海量復雜的基礎網絡數據進行多層次的處理,使得網絡數據能夠圍繞用戶進行全方位的使用,有效支撐網絡部支撐工作向以用戶體驗為中心的工作流程的變革,同時有效降低了大數據使用的門檻,實現了加工后數據資產的有效利用,支撐應用系統能夠快速利用數據上線滿足一線業務的需求,實現了大數據的可視、可用、易用,為網絡規劃、網絡優化、用戶體驗管理、業務營銷等提供了有力支撐,實現了網絡部對于省公司業務精細化運營的有力支撐。
山東移動基于用戶網絡畫像的大數據開放引擎總體架構主要包括采集層、共享層、大數據開放引擎層、業務應用層4個邏輯層。采集層的主要功能是基于FTP批處理或者異步同步模式實現4G/VoLTE軟采與硬采信令、家客信令等多個系統的海量數據的采集和預處理工作;共享層基于流計算和Spark等技術,對海量網絡數據進行二次加工處理以保留有效數據,控制數據規模;大數據開放引擎層以HADOOP和關系型數據庫作為存儲數據的平臺,同時結合網絡業務支撐需求,基于IBM SPSS平臺設計實現多種大數據挖掘算法對數據深度加工處理,形成“三階”用戶網絡畫像,并通過各種形式的API接口(SQL/REST API)為應用開發和數據探索提供開放的數據服務;業務應用層則再次基于業務需求,借助SPSS對生成的“三階”用戶網絡畫像進行業務對標處理,同時基于IBM COGNOS和其他JAVA平臺實現多種業務應用。
基于用戶網絡畫像的大數據開放引擎方案的創新特色主要包括以下幾個方面:
——“三道工序”構建“三階”用戶網絡畫像。方案從網絡感知、位置等六個維度通過“粗加工”“細加工”和“精研磨”三道工序生成一階、二階和三階標簽,三類標簽共同構建了“三階”用戶網絡畫像,從而建立了跨部門、跨專業都可理解的統一的數據語言。
——“API 數據可視化”實現能力開放。三階用戶畫像標簽以API方式實現數據共享,并對實現此標簽的常用算法進行封裝供上層應用調用。業務人員可通過API或者數據可視化工具重復使用加工后的數據,對不同標簽組合以對標業務實現靈活建模,從而快速支撐個性化應用的實現。
——實現自主研發流程的可視化。通過統一的、易理解的可視化視圖呈現“三階”用戶網絡畫像,業務人員可結合自身需求,靈活組合各種標簽,借助SPSS流程化建模工具自主建模,實現應用快速落地,極大地激發了一線業務人員的創新熱情。
——多層次數據組織和多形式的數據處理。運用多層次數據組織方式,按照數據用途、數據細分粒度、時間周期等維度對數據進行分層歸類處理,定義出元數據域、數據探索域、聚合整合域、深度處理域、落地域和共享域六層邏輯架構,降低了數據處理復雜度,并提供易于數據使用的多形態接口,方便業務人員使用多種工具進行復雜數據挖掘,進而提升大數據處理效率。
山東移動網絡部通過基于用戶網絡畫像的大數據開放引擎的方案設計和落地實現,在短時間內已自主開發了4G流量駐留比提升、深度覆蓋不足定位、投訴溯源、投訴預測、區域畫像等10余種應用,同時從網絡感知、位置、業務特征等六個維度,生成106個統一的、易理解的標簽,實現了對用戶進行全方位網絡畫像,有效支撐了山東移動網絡部轉型到“以用戶為中心進行運營支撐”工作模式的變革。