在ICT產業的發展歷程中,總是不乏有新概念的引領,眼見著云計算從盲目熱炒漸漸走向了務實應用,“大數據”又揭竿而起,再度成為今年以來產業界的最熱門詞匯。
不過,與云計算在概念初期的“云里霧里”不同,大數據顯得更加“有理有據”。事實上,早在幾年前,當國內還在討論“大數據究竟是什么”這個問題的時候,美國總統奧巴馬就已經利用數據挖掘技術,幫助其自己實現政界連任的目標。
2014年春節期間,以百度為代表的一系列互聯網巨頭開始在中國的大數據舞臺上粉墨登場,如央視新聞就利用了百度地圖定位而來的數據,詳盡且真實地展現了極具中國特色的“春節遷徙大潮”。隨即,騰訊、阿里等互聯網企業也紛紛開放了自己的數據后臺,以供產業鏈的相關企業進行精準營銷和廣告推送。
然而,大數據應用并非互聯網企業的“特長”,而應該是電信運營商的主場。中國移動通信集團公司業務支撐系統部項目經理何鴻凌也表示,數據是第一等競爭力,更多的數據會勝過更好的算法,數據甚至可以列入資產負載表。
“云-管-端”數據全息采集
眾所周知,大數據之所以受到業界追捧,是因為基于海量巨大的信息數據,通過復雜的挖掘技術在合理時間內獲取、清洗、提煉而形成的對企業經營策略和銷售行為益的信息。確切地說,傳統的咨詢分析是基于抽樣數據,而大數據得到的結論卻是基于全體數據的結果,其準確性顯然更勝一籌。而放眼當下的互聯網產業,除了BAT(百度、阿里、騰訊)之外,恐怕再難找出具備相當“數據實力”的企業。
讓我們看看,運營商的數據實力究竟如何?根據中國移動2013年底的內部統計資料顯示,中國移動的網絡上每天將產生100TB的信令數據,每分鐘產生800萬次通話,每秒發送2.4萬條短信,每分鐘應用下載量1142人次。
另據記者了解,目前,國內運營商已經能夠做到從云-管-端中的各環節中采集數據,其中的云,即運營商自己的后臺網站和APP服務器,運營商根據自己的采集準則獲取數據資源;在管道方面,運營商不僅面向無線網絡、有線寬帶獲取數據,同時也能延伸至一些軟的管道上(百度輕應用);在端的部分,運營商一方面積累了用戶終端的流經軌跡,這部分與管道數據類似,另一方面也通過瀏覽器插碼和APP SDK等軟件,獲取了更加直觀的個體用戶數據。
不同系統間數據難統一
既然已經具備了完整的大數據布局,而且后臺系統每年、每分鐘甚至是每秒都在產生大量的數據,那么,運營商過去在大數據分析方面的表現又是如何,答案恐怕是令人遺憾的。由于運營商后臺系統多為省級割據,不同業務系統間也是相互獨立且無法互通,這使得運營商的大數據能力“廣而不深”。
有相關廠商的技術人士對此表示,運營商內部過去多采用傳統的技術平臺(小型機+存儲陣列),數據采集上難以適應大數據規模性采集的需要,加上傳統的數據源系統和數據庫方式,無法源源不斷地提供分布式的數據導出,這也是為什么如今的分布式架構X86服務器在數據中心大行其道的原因。
除以之外,大量的非結構化數據也成為了擋在大數據面前的難關,以圖片、視頻、文件等形式存在的非結構化數據,使得計算機難以輕易識別,尤其還要實現結構化數據與非結構化數據的結合。
正是意識與技術上的雙重匱乏,使得大數據分析在國內電信運營業多年來都處在小步潛行的狀態,難有實質性進展。雖然國內運營商2002年就已出現了大數據的“雛形”——經營分析系統,也稱BI,但經過多年發展BI系統也無法全局化,很多時候只是針對某省中某一個特定業務的分析系統,更多是時候BI也只是業務過后領導辦公桌上的一張統計報表。
國外成功案例得借鑒
與此相比,國外電信運營商在大數據方面卻得到了長足的發展,不僅是數據挖掘和分析的技術日漸成熟,相應的商業模式和合作機制也得到了不同程度的探索和拓展。
比較典型的有,西班牙電信基于大數據分析能力推出了“Smart Steps”產品,通過無線網絡中的用戶數據,獲得某固定商圈內的人流特征、消費特征甚至是客戶標簽(包括識別規模用戶的身份地位、生存需求、成長需求以及社交需求等),以此來幫助那些想要開分店的零售商選擇更恰當的開店地址。AT&T的大數據應用更加直接,通過分析用戶實現在電視、郵箱、手機亦或是電腦上的廣告推動和精準投放。
正是看到了國外運營商將大數據變現的一個個真實案例,近兩年,國內運營商也逐漸放大了自身在大數據領域的步子,開始思索如何向數據要效益的課題,比如利用綜合性數據對用戶進行深入洞察,用數據分析定位識別體系歸納出哪些是校園用戶、政企客戶以及家庭用戶,從而進行更加精準的營銷。
在外部合作方面,以中國移動為例,近年來也不斷加強與政府組織和企業商戶的數據挖掘,比如智慧城市OD分析、商店選址助手、營銷指南針、景區客源分析、分析報告服務等方面。而在未來,運營商也有意愿在個性化推薦、地理信息服務、金融征信以及流量趨勢和熱點分析方面,尋找合作伙伴共同探索。