“一千個人眼里有一千個哈姆雷特”,用這句話形容大數據認知并不為過。
在中興通訊中心研究院副院長陳堅的眼里,大數據更是一個用來提升社會生產總效率的工具。“透過各種表象,究其大數據價值的本質,在于提升人類活動的準確性,減少傳統方式下的試錯成本,從而提升社會的總效率。”
的確如此。自大數據風靡整個世界以來,零售行業、保險行業、金融行業、醫療行業等諸行業正從中受益,實現工作效率和業績的雙提升。
陳堅向記者舉例說,商家利用大數據可以實現精準營銷,提高廣告的準確性,減少對無效客戶的推送,從而提高信息傳播效率;警察則可以通過攝像頭記錄的大量數據進行分析,提高案件偵破的效率。“這些歸根結底,都是通過大數據來提高人類活動的準確性,進而來提高整個社會的生產效率。”他說。
而在過去的幾年中,電信市場更是品嘗到了大數據的紅利。法國電信開展了針對用戶消費的大數據分析評估,借助大數據改善服務水平,提升用戶體驗;NTTDoCoMo通過制作精細化表格,收集用戶詳細信息,改善CRM系統和知識庫能力,準確定位目標客戶,業務辦理的成功性大大提升;AT&T在滿足隱私法規的前提下,則將與用戶相關的數據出售給政府和企業以獲利。
“可以說,大數據已經成為運營商新的戰略發展引擎。”陳堅向記者強調。
認清數據的價值
相比于其他行業,電信運營商擁有獨有的“管道”優勢。在這條浩瀚的管道里,記錄了用戶的各種信息——我是誰,我在哪里,我即將去往何處,我更喜歡發短信還是打電話,我是喜歡上網看新聞還是聊天抑或是看視頻。
越來越多的運營商將這些信息轉化為生產力,提高市場競爭力,并實現利潤的提升。來看一下中興通訊是如何幫助運營商將信息轉換為生產力的。
Smartfren(金光)作為印尼本土最大的CDMA運營商,面臨來自Telekomsel、Indosat等多家移動運營商的激烈競爭,長期飽受用戶流失率高,新增用戶發展緩慢等問題的困擾。
中興通訊對其運營支撐系統進行了深入分析,認識到由于系統缺乏海量數據處理和挖掘分析能力,在目標用戶識別、用戶群細分、用戶行為分析等關鍵環節,Smartfren無法有效支撐市場營銷活動,導致營銷活動針對性不強,營銷手段單一等問題,缺乏對營銷效果的有效評估和對沉默用戶/高危用戶的及時識別和維系、挽留。
為此,中興通訊提出了大數據精準營銷解決方案。2013年5月,Samrtfren大數據精準營銷系統正式上線。結果表明,Smartfren的營銷轉化率提高到6.6%,月利潤增長了3.1%,離網率降低到0.8%,運營收益顯著提升。
一個不可忽視的問題是,隨著移動用戶的增多,管道里產生的數據越來越多。面對每天暴增的數據量,運營商也很迷茫:如果對所有的信息都進行分析,那么顯然是不現實的。而且這些信息里面有很多“垃圾信息”,沒有任何意義,運營商希望能夠更加精準地篩選數據。
來自微軟的專家便指出,并非所有有價值的數據都是“大數據”,也并非數據都一定對運營商的業務具有戰略意義。
對此,中興通訊中心研究院總工王德政在接受《通信產業報》(網)采訪時表示:“一個高價值的數據集,應該滿足如下幾個特征:其一,該數據與物理世界有較為廣泛的對應關系,而不應是純粹的虛擬數據;其二,該數據集是可以實時更新的數據集,而不應是純粹的靜態數據;其三,如果該數據集具備物理位置等信息,將具備更大的價值。
他進一步指出,數據是否具備價值在很大程度上還和數據處理手段有關。例如,作為化石能源,頁巖氣的儲藏量很大但卻一直沒有被開采。這是因為,在老舊的技術手段下,開采所付出的環境成本與經濟成本太大。但隨著開采技術的進步,頁巖氣的開采逐漸具備了經濟可行性,則頁巖氣就與天然氣、石油一樣,成為重要的戰略資源。
對于電信領域的大數據來說,也是一樣的道理,以前對于信令、日志等數據的存儲/處理成本太高,對其進行深加工則很難具備經濟效益,當隨著云計算等技術手段的進步,這些數據就如頁巖氣一樣,成為各個運營商的戰略資源。
“未來隨著數據處理技術的進步,以及處理成本的降低,在當前看來是‘垃圾’的數據,也將會成為寶貴的資源,為電信運營商創造價值。”王德政指出。
集中化是前提
微軟委托IDC進行的一項最新全球研究發現,全球通信和傳媒行業有望在未來四年內從數據挖掘中獲得超過2350億美元的數據紅利。
不過,獲得這些紅利不是一件容易的事情。大數據服務創業公司Connotate對800多名商業和IT主管進行了調查。結果顯示,60%受調查者稱“目前就說這些大數據投資項目肯定能夠帶來良好回報尚為時過早”。
之所以如此,是由于當前大數據缺乏必需的開放性:數據掌握在不同的部門和企業手中,而這些部門和企業并不愿意分享數據。而大數據是通過研究數據的相關性來發現客觀規律,這依賴于數據的真實性和廣泛性。顯然,數據之間的無法對話已經成為大數據的一個掣肘。
猶記得,在奧巴馬競選連任時,其競選團隊中有一個神秘的數據挖掘團隊,他們通過對海量數據進行挖掘幫助奧巴馬籌集到10億美元資金;他們通過數據挖掘使競選廣告投放效率提升了14%;他們通過制作搖擺州選民的詳細模型,每晚實施6.6萬次模擬選舉,推算奧巴馬在搖擺州的勝率,并以此來指導資源分配。
這個數據挖掘團隊很早就意識到數據分散存在將成為他們面臨的一個挑戰。為此,在競選開始前的18個月,該團隊就創建了一個單一的龐大數據系統,可以將來自民意調查者、捐資者、現場工作人員、消費者數據庫、社交媒體,以及“搖擺州”主要的民主黨投票人的信息整合在一起。
這個整合后的巨大數據庫不僅能告訴競選團隊如何發現選民并獲得他們的注意,還幫助數據處理團隊預測哪些類型的人有可能被某種特定的事情所說服。
而對于運營商來說,數據條塊分割存在的現象更是普遍存在。“現實中的數據條塊分割,將會大大降低數據的價值。可以說,未來電信運營商大數據系統建設的一個重點與難點就是數據的獲取與整合工作。”陳堅向記者指出。
目前,中國聯通計劃把所有IT核心的數據、網元側的數據、互聯網的數據,乃至與外部合作和關聯企業或者第三方交換的數據,全部整合,形成能夠反映企業全景、客戶全景、所有產品/渠道的大數據平臺。
王德政進一步告訴記者,數據的整合只是大數據應用的基礎性工作。真正要讓數據產生價值,還必須通過相應的業務建模與數據挖掘,從這些數據中獲取知識與智慧,才能真正產生價值。中興通訊對電信數據的理解非常深入,具備對電信數據進行建模與應用的能力,可以幫助電信運營商實現數據價值的發掘。
保護數據隱私和安全
在大數據的強大分析能力之下,用戶的個人行為變得日益透明。
2012年,來自美國羅徹斯特大學的亞當·薩迪克(Adam Sadilek)和來自微軟實驗室的工程師約翰·克拉姆(John Krumm)發現他們可以大致預測一個人未來可能到達的位置,最多可以預測到80周后,其準確度高達80%。
而帶來的后果是,越來越多的用戶擔心他們的隱私被識破。因此,如何保護用戶數據隱私和安全已經成為大數據的一個重要話題。
陳堅認為,隨著法規的健全,未來有兩條原則應該作為大數據應用的基本法則被明確寫入法規。其一是匿名性原則。數據擁有者向大數據應用所提供的數據,必須是匿名的,不能直接暴露個人的隱私信息。其二是聚合性原則。數據擁有者向大數據應用所提供的數據,必須是聚合數據,而不是基于單個用戶的數據,以防止通過匿名數據推導出個人隱私信息。
當然,在大數據時代,最終用戶也可能需要放棄少量的隱私,而換取自己的便利性以及整個社會生產力的提高。例如,用戶要是使用基于位置的服務,就必然要放棄自己地理位置的隱私信息。用戶希望使用云服務自動匹配識別陌生來電,必然要部分放棄自己通訊錄的隱私權。
陳堅介紹,中興的DAP大數據平臺在數據的處理與提供上,完全遵循匿名性原則與聚合性原則,為用戶的隱私保護提供清晰的行為原則與邊界。
助力運營商挖掘管道價值
作為電信領域的專家,中興通訊可以針對電信大數據進行專家級的建模。中興通訊的大數據平臺DAP就是這個大時代下的產物,它可以利用云存儲與云計算的技術,對海量的數據進行存儲、挖掘分析,以幫助企業充分開發數據的價值。
王德政向記者闡釋了DAP的優勢:“與其他大數據系統相比,DAP有三個最重要的特征,給運營商和企業帶來更多的價值。”
第一,DAP采用貨架式架構,采用企業總線ESB的技術,可以靈活地對各個組件模塊進行裁剪與拼裝,滿足“集成”與“被集成”的兩種角色要求。
當前各個行業已有大量的生產系統在線運行,完全重構這些系統無論是經濟成本,還是時間成本,都將無法承受。所以,未來的大數據系統必然要同時承擔兩種角色,即大數據系統既可以作為原有生產系統的一個子系統被集成,也可以作為主系統去集成原有的生產系統。
DAP貨架式架構可以靈活適應各類“集成”與“被集成”的場景,在不影響生產系統穩定性的前提下,與原有生產系統無縫集成,引入大數據系統。
第二,DAP在數據分析挖掘層面的智慧生成的特征,可以提高企業活動的準確性。未來的大數據系統能否生成智慧,替代人類專家,將是區分大數據系統與傳統IT系統的關鍵特征。一個無法生成智慧的系統,無論數據量有多大,充其量也就是一個大型的傳統系統,而不是大數據系統。DAP通過針對性的挖掘算法改進,可以做出超越人類專家經驗與直覺的智慧建議,提升人類活動準確性,提高社會生產能力。
第三,DAP具備平臺特性。DAP作為中興通訊公司級的大數據平臺,聚焦于數據的存儲、處理時效以及挖掘算法,為上層應用解決大數據應用的技術難點與障礙。上層應用可以根據自身的需求,快速地進行定制開發,以很短的時間周期與研發成本推出新的大數據應用。未來,DAP還可以對第三方開放,支撐第三方的大數據業務開發。
目前,已經有不少運營商部署了中興通訊的DAP大數據平臺。“通過DPI抓取電信網絡中產生的過程信令以及業務數據流,并對這些原來‘無價值’的數據進行挖掘分析,產生網絡優化建議,指導對現網的建設與優化,節約運營商大量的運維成本。”陳堅向記者表示。
同時,運營商可以對這些數據進行深加工,對用戶進行標簽分類,描繪用戶的全方位畫像。并將這些用戶畫像數據與其他行業數據進行結合,實現數據的二次增值。例如,可以與交通行業結合,利用電信數據做實時的人流量模擬分析,以檢測道路規劃的合理性等。
“未來,中興通訊將進一步助力運營商挖掘管道價值,獲取更多的數據紅利。”陳堅向記者表示。