如果說貨幣是金融市場流動的血液,數據就是信息社會得以運轉的血液。“運營商在大數據的應用領域具有天然優勢,在通信網絡上,承載了用戶所有的通信行為,相比互聯網公司,運營商獲取的信息更準確、更全面、更便捷。”在日前通信學會舉辦的“2014國際數據產業峰會”上,中國聯通研究院平臺與云計算研究中心主任張云勇表示。目前三大運營商都在引入大數據的分析,希望能夠進一步分析和挖掘數據價值。
擁有五大數據源
運營商數據包括IT生產系統的數據、業務平臺數據、通信網絡數據、互聯網數據、外部合作伙伴數據等五類數據資源。
張云勇認為,運營商數據包括五大類數據源。
第一類是IT生產系統的數據。特點是核心基礎數據,覆蓋面廣;總量達到10PB,已經整合M/B城域數據近1PB;數據價值密度高;可信度高,但目前分散的建設模式,給數據生產質量保證帶來困難。
第二類是業務平臺數據。目前正在整合VAC,是基站業務數據,總量已經達到PB級,其數據價值密度低,但包含了用戶在增值業務方面的關鍵信息,而且由于是內部數據,可信度高。
第三類是通信網絡數據。目前僅采集了互聯網流量數據,總量達到100PB/年,數據價值密度低,但包含了用戶位置、事件、體驗等關鍵信息,數據的可信度高。
第四類是互聯網數據。目前尚未采集,互聯網數據總量達到1000PB/年,價值密度低,包含了互聯網上的各種行為/言論,由于外部數據,可信度低,需要驗證。
第五類是外部合作伙伴數據。目前尚未采集,初期總量不大,數據價值密度中等,包含了第三方的用戶、企業的各方面信息。因為是外部數據,可信度中等,需要與內部可信數據相互驗證。
但同時這些數據的水平參差不齊。運營商獲得的數據中存在的主要問題有:企業內數據定義缺失,數據項缺失;數據屬性不完整,企業外數據無暇顧及;數據在多個系統中重復采集、重復存儲;系統數據無法關聯、共享,數據整合困難;系統林立,數出多門;數據時效性差,使用者無法及時獲得所需信息;數據使用不方便,方法繁瑣;手工報表多。有的數據質量差,數據不完整,數據不一致。“沒有準確的數據支撐,就難以進行深度分析,決策缺乏可靠依據。”張云勇說。
數據如何應用
運營商可以在市場開拓、企業管理、業務開發、客戶服務和網絡優化等方面實現大數據的分析應用。
目前大數據的所有權和大數據創新思維在大數據價值鏈構成中重要性在上升,而大數據技術能力的重要性在下降。運營商的五類大數據來源不同,結構不同,數據的整合、分析以及挖掘特點也各不相同。張云勇認為可以在市場開拓、企業管理、業務開發、客戶服務和網絡優化等方面實現大數據的分析應用。
他說:“在市場開拓上,可以利用社交媒體收集用戶信息,了解客戶滿意度和消費習慣,為用戶提供針對性的套餐;通過情感分析、語義分析等技術,針對客戶的喜好、情緒,進行個性化的業務推薦;收集用戶呼叫行為、互聯網行為等,為每個客戶構建交往圈,可用于交叉營銷。”
在企業管理上,可以基于內部和外部數據實時得到報表與分析報告,可以發現并降低收入的流失。在業務開發上,可以發現與內容提供商共同進行流量經營與合作的新機制,可以獲取用戶位置情況,做時空分析,為公共部門提供數據;監測電話、即時消息、郵件、博客等信息,實現輿情監控,配合安全部門采取措施。在客戶服務上可以收集各個接觸渠道的信息,了解服務投訴情況和用戶滿意情況,實時地了解用戶呼叫接通和掉話情況,為客戶滿意度和流失預測提供依據。在網絡優化上,實時發現網絡瓶頸,并快速進行解決;預測網絡流量峰值,預警導演流量,防止網絡堵塞和宕機。
在大數據技術選擇上,目前沒有一項技術能夠同時滿足所有的技術要求,需要選擇混搭架構。運營商通過選擇MPP數據庫、HADOOP、流數據處理作深度融合,形成大數據整合架構;并在特殊的場景,選擇內存數據庫、列存數據庫作為補充。
建設大數據能力
三大運營商都在建設自己的大數據能力,同時也在研究如何使通信網絡更適合云計算、大數據的發展需求。
三大運營商都在建設自己的大數據能力,同時也在研究如何使通信網絡更適合云計算、大數據的發展需求。
目前,中國移動利用大數據做了三種嘗試。一是改善用戶體驗。中國移動增加語音搜索,通過知識庫實現機器人智能回答;二是利用大數據幫助進行市場決策;三是利用大數據優化網絡質量,包括移動網絡、終端。目前,中國移動已經開發了大數據批處理系統、大數據查詢、大數據分析挖掘系統。
中國移動通信研究院云計算系統部徐萌說:“去年年底,中國移動發布了大云2.5產品架構。我們還將建設大云產品開源社區,增強產品的研發和推廣能力,希望能夠有更多針對運營商系統做的開源軟件。”
張云勇說:“中國聯通建立大數據能力的思路是以集中數據為種子,統一頂層架構設計、集中數據統一管理、開放數據能力服務;以數據集中引領生產系統集中,以數據模型(字典)規范化促進生產系統邏輯集中;加速數據應用面向生產系統的支撐,促進生產應用的流程貫穿。”
中國聯通目前正在建立大數據云化應用體系U-Cloud-D技術架構。數據源來自生產系統、業務平臺、通信網絡、互聯網和外部合作伙伴,在PaaS層面,形成統一數據服務支撐體系,包括:數據采集與交換平臺、數據服務支撐平臺、開放式應用平臺和數據管控平臺。在應用層上,形成大數據云化應用體系,可以有企業內部應用、自助式服務、大數據擴展應用和大數據創新應用。