傳統的電信市場已經淪為徹底的“紅海”,OTT對傳統電信業務的替代和沖擊也日益嚴重,電信運營商迫切需要從傳統的“話音經營”模式向“流量經營”模式轉變。“沒有數據就沒有發言權”,在這場轉型過程中,大數據將扮演和發揮怎樣的角色?如何幫助電信運營商拓展新的價值藍海?為此,《人民郵電》報記者專訪了中國聯通信息化事業部副總經理耿向東。
技術進步:驅動大數據時代到來
大數據時代的真正到來,與技術進步密不可分。正如耿向東所說,數據所擁有的價值的發現和使用,“是技術進步給我們帶來的一個奇跡”。
“云計算改變IT架構,大數據改變商業模式”,耿向東強調。在未來,企業所有能夠量化的內容,全部都會數字化、數據化。在這個過程中,云計算使得計算能力和存儲能力高彈性、高擴展、低成本,大數據海量分布式處理與數據價值分析挖掘能夠以更高的效率、更低的成本,去涵蓋那些原本我們認為沒有價值或者是沒有能力處理的數據,讓我們可以用更全面、更多維的數據去衡量企業經營管理,提升客戶感知與服務,也使得新的商業模式創新成為可能。可以說,云計算、大數據等技術的成熟為數字化、數據化企業奠定了基礎,而數據也將成為企業未來核心的、關鍵的資產之一。
值得注意的是,數據挖掘成本的降低,是大數據規模商用的一個重要前提。“很多數據,盡管有價值,但價值的力度卻非常低,例如移動用戶的上網日志,一天的數據量就會達到二三十個T。”耿向東介紹道,“但通過對這些數據的挖掘分析就可以發現許多有價值的信息,例如發現用戶消費行為和使用偏好等。”過去,正是因為要得到“高價值的數據”需要付出很高的代價,因此海量的數據盡管存在,但卻無人問津;今天,大數據挖掘成本的降低,讓在浩瀚的“數據海洋”中獲取高價值、高密度、高聚合的結構化的數據成為可能,大數據時代才真正來臨。
五大特征:勾勒運營商眼中的大數據
面對已經存在或者正在誕生的海量數據,究竟什么樣的數據才是有價值的呢?耿向東認為,電信運營商關注的大數據,應該是具備“真、大、快、活、全”特征的五大類數據。
其中,“真”是指真實準確的基礎數據,“大”是涵蓋核心生產運營、客戶行為感知、網絡網元等的海量數據,“快”則強調數據應具有時效性,“活”則指易擴展、松耦合、可靈活開放的數據,“全”則是指應覆蓋結構化、半結構化、非結構化多類型數據和多種數據源。這些數據的分布、特征、應用場景各不相同,必須采用不同的技術手段予以采集、存儲、加工與整合,進而形成高價值、高密度、高聚合的結構化的數據,并服務于各類應用。
對電信運營商而言,大數據要求其必須從傳統的以BSS為核心的數據的慣性思維和局限中解脫出來,進一步涵蓋業務平臺、通信網絡、互聯網、外部合作等各類數據,面向市場、面向客戶、面向服務,加快這五大類數據的整合與關聯,兼顧數據處理的成本與效率,快速提升數據的挖掘與應用能力,充分發揮企業大數據的核心價值與邊際效應。
應對挑戰:發揮優勢 彌補短板
大數據轉化為商業價值的能力已經被互聯網行業充分證明。面對大數據的價值藍海,電信運營商如何才能把握住機會呢
“挑戰在于你掌握哪些數據,你對于數據的分析、挖掘水平和能力怎么樣,產品轉化速度怎么樣,商業運作能力怎么樣。”耿向東表示。客觀來看,運營商掌握的真實用戶資料、通信特征、消費行為、流量訪問、終端類型、位置等信息,更準確、更全面、更便捷、更具商業價值,但電信運營商過去積累的主要經驗,來自于傳統的通信產品和服務,很難做到面向每一個用戶的精準的洞察和業務提供,許多的數據白白流失,沒能將其真正轉化為價值。
今天,云計算和大數據提供了基礎的技術可能,使得我們可以發揮電信運營商的先天優勢,把這些數據整合起來,管理好這些數據,進一步分析和挖掘,提煉出面向新的商業模式的,或者面向客戶感知的數據,并大力推進數據應用從傳統的報表分析,向企業全景分析、決策輔助、生產能力嵌入和智慧服務轉化,真正地參與到大數據、互聯網、移動互聯網的競爭中來。毫無疑問,對客戶的感知能力、對流量的感知能力,是流量經營轉型和應對OTT挑戰,促進與互聯網企業競爭與合作的關鍵能力。
在大數據領域,中國聯通無疑是一個先行者。耿向東表示,對于移動用戶上網流量數據的挖掘,已經讓中國聯通看到了大數據所蘊含的巨大價值。中國聯通首先重點解決客戶流量計費爭議的難題,倡導“透明消費”,讓客戶能夠清楚、直觀地去實時查詢自己的流量使用情況,進而合理安排自己的流量消費計劃;而后,中國聯通又通過這些數據,感知客戶需求,用于改善客戶的服務體驗,為用戶提供更好更合適的產品和服務,以最低的成本,精準快速地推送給客戶;也進一步用于判斷網絡基站的使用是否飽和、網絡規劃是否合理,進而有針對性地指導后續網絡建設等……
策略轉變:構筑大數據平臺
要應對大數據時代的挑戰,運營商就必須求“變”。
與此相應,中國聯通全面啟動了以數據為中心的集中化、一體化IT系統建設。過去,每個系統從應用到數據,全部采用的是煙囪式的建設模式,這導致在數據層面,分散、割裂的數據難以具備一致性,數據和數據之間整合的代價也就非常高昂,數據的應用很難發揮其整合優勢。為了徹底改變這一局面,中國聯通未來的建設模式全部要轉變為“數據+平臺+應用”的模式,構建全集團唯一的、集中的、開放的大數據平臺,并在這個平臺上由各級經營主體和外部合作以自主、靈活、可控地構建各種各樣的應用。
在這場非常重要的建設模式的轉變中,大數據平臺的構建無疑是重中之重。中國聯通計劃把所有IT核心的數據、網元側的數據、互聯網的數據,乃至外部合作中和關聯企業或者第三方交換的數據,全部整合,形成能夠反映企業全景、客戶全景、所有產品、渠道的大數據平臺。這個平臺采用大數據技術處理海量數據,并且能夠將不同需求、不同業務有效整合,為上層應用提供定制化的服務。簡單講就是“統一平臺,應用百花齊放”。
而對于構建大數據平臺的關鍵即技術選擇而言,由于運營商大數據平臺數據類型復雜,涵蓋了傳統的結構化數據,也涉及信令等實時流數據,以及互聯網等非結構化數據,因此單一技術無法滿足要求,“大數據平臺的技術選擇未來應以深度定制的混搭結構為主”,耿向東特別強調。傳統關系型數據庫能進行復雜的關聯分析、多維挖掘,對于結構化數據的處理有它的獨到之處。Hadoop比較擅長非結構化和半結構化數據的加工和提煉,對海量分布式數據的處理效率非常高,但不擅長做復雜多維關聯分析。也就是說,對于海量的低價值、低密度數據的加工和處理,運營商可以采用Hadoop這樣的計算體系;在處理完這些數據,并整合、關聯、匯總,形成高價值數據后,運營商可以使用Oracle等傳統的數據庫或MySQL這樣的新型數據庫。
“基礎設施的云化,是應對大數據挑戰的必然。”耿向東表示。中國聯通強調資源的池化和云化建設,計算和存儲資源應該集中、共享、開放,技術選擇也依據這幾個基本原則,所有應用全面向云化的方向遷移,利用“X86+虛擬化”以及大數據分布式計算,構建超級大的集群,面向應用提供計算能力和存儲能力。
在大數據環境下,為了應對急劇膨脹的接口、數據、作業和應用等,電信運營商必須對數據進行“全面的管控”。在耿向東看來,“全面的管控”應以元數據管理為基礎,覆蓋數據質量管理、數據生命周期管理、數據安全管理的全過程;而在運營過程中,通過元數據驅動開發進程,并始終保持元數據與生產環境的同步更新。
“數據安全,是數據資產的保護傘,大數據時代尤其如此。”耿向東強調。鑒于大數據價值和經濟利益的驅動,各種機構、各種企業、各種群體出于主動的訴求或者被動的泄露,大數據多源頭、多維度的數據關聯和分析使得個人信息更加容易被獲取、被利用,個人信息安全、個人隱私面臨前所未有的挑戰。但是目前,我國在個人信息安全方面的社會意識和法律基礎相對薄弱,個人信息資源的合法和非法利用之間的邊界相對模糊。因此,面向大數據時代,應快速構建個人信息安全保障體系,完善個人信息安全法律細則,強化行業自律,加大懲治力度,促進個人信息的合理利用。中國聯通非常強調對客戶信息、客戶隱私的安全保障,目前已經成立專門的信息安全部,并制定了一整套的信息安全保護機制和流程,以確保數據在內部流轉、系統流轉乃至外部流轉的過程中是安全可控的。