要談起大數(shù)據(jù),必然要提到BAT等互聯(lián)網(wǎng)公司,它們在大數(shù)據(jù)領(lǐng)域是先發(fā)者,不過這也很正常,因為它本身是有數(shù)據(jù)基因的,其天然的在線性,其血液中流淌著BIT的血,并通過BIT的形式來售賣自己的產(chǎn)品和服務(wù),它如果不提大數(shù)據(jù),不提DT,反倒是不正常了,況且他的數(shù)據(jù)處理能力和應(yīng)用成熟度也是領(lǐng)先的。但是,從對整個社會的價值角度講,其數(shù)據(jù)也是很受局限的,而運營商的數(shù)據(jù)也許更有代表性和競爭力。
互聯(lián)網(wǎng)大數(shù)據(jù)公司的劣勢
先來說說BAT等互聯(lián)網(wǎng)公司的大數(shù)據(jù),其數(shù)據(jù)存在局部性、割裂性、封閉性和全面性等問題哦,當(dāng)然這僅代表個人觀點,如有異議,歡迎大家探討:
(1)數(shù)據(jù)局部性:互聯(lián)網(wǎng)公司的數(shù)據(jù)還是相互割裂的,比如淘寶只有淘寶的售賣數(shù)據(jù),京東也一樣,即使淘寶聯(lián)合京東,他也只有在線銷售的數(shù)據(jù),它并沒有百度搜索的數(shù)據(jù),沒有一家互聯(lián)網(wǎng)公司的數(shù)據(jù)能夠代表全局,具有戰(zhàn)略眼光的互聯(lián)網(wǎng)公司當(dāng)然意識到這一點,當(dāng)前的收購兼并相當(dāng)程度是為數(shù)據(jù)而來。
(2)數(shù)據(jù)割裂性:互聯(lián)網(wǎng)的數(shù)據(jù)整合困難,比如你在百度搜索了褲子,又在淘寶買了褲子,你的行為數(shù)據(jù)在兩個地方以不同的形式存儲,百度用了張三ID來代表你,而淘寶會用李四ID來代表你,但誰都不知道這是同一個人,還有廣告?zhèn)€推的COOKIE等技術(shù),也是短期的,不穩(wěn)定的,當(dāng)前大家都看得到很多互聯(lián)網(wǎng)業(yè)務(wù)都依托QQ賬號注冊,非常方便,其實一定程度也反映了QQ希望ID融合的思路,互聯(lián)網(wǎng)公司數(shù)據(jù)建模中的一個核心就是各類數(shù)據(jù)ID的統(tǒng)一。
(3)數(shù)據(jù)封閉性:很少有互聯(lián)網(wǎng)公司愿意開放自己的數(shù)據(jù),畢竟這是他的資產(chǎn),是核心競爭力所在,因此所提的開放更多是商業(yè)模式層面和應(yīng)用層面,而絕對不是指數(shù)據(jù),“你來合作,數(shù)據(jù)給我”,現(xiàn)在互聯(lián)網(wǎng)公司還是更多的在搜集數(shù)據(jù),即使開放了一些,主要也是一些高度收斂的數(shù)據(jù),當(dāng)然一些互聯(lián)網(wǎng)公司會相互合作交換數(shù)據(jù),但這與開放無關(guān),當(dāng)前環(huán)境下,如何讓互聯(lián)網(wǎng)公司能夠開放共享數(shù)據(jù),從而推進(jìn)社會的進(jìn)步是值得研究的課題。
(4)數(shù)據(jù)全面性:在客戶、業(yè)務(wù)、時間、空間等多個層次上,互聯(lián)網(wǎng)公司的數(shù)據(jù)受限于自身的業(yè)務(wù),其數(shù)據(jù)的范圍和深度都是有限的,某寶也許對于線上購物用戶有一定的刻畫,但對于搜索領(lǐng)域、社交領(lǐng)域等很多互聯(lián)網(wǎng)領(lǐng)域的信息仍然一無所知,同時其在空間、ID貫通上天生數(shù)據(jù)上的軟肋,使得其對于人物興趣偏好的客戶還是比較片面的,以前某寶不是分析出來新疆的泳衣賣得好嗎,但如果你深問為什么,可能只能回答也許新疆人好奇唄,但其實這個答案也許是瞎掰,我們只有知道買衣服的人從事什么職業(yè),有什么特征,才能推測出具體的原因,從而制定更好的銷售策略,誰知道買得人是不是個批發(fā)商啊或中間商呢。
為什么運營商的數(shù)據(jù)更具優(yōu)勢?
當(dāng)然,BAT等互聯(lián)網(wǎng)公司的數(shù)據(jù)也具有自己的優(yōu)勢,比如對于自己從事的垂直領(lǐng)域數(shù)據(jù)具有較大的發(fā)言權(quán),但從全面性、完整性等角度講,運營商的數(shù)據(jù)也許更有代表性和競爭力,為什么呢?
因為運營商是數(shù)據(jù)管道,任何個人、企業(yè)的上網(wǎng)和通話的行為都以BIT的形式流淌在運營商的管道里,并且任何時候你的位置都需要上報給運營商的基站以便能夠隨時溝通,移動互聯(lián)網(wǎng)越發(fā)展,運營商的數(shù)據(jù)規(guī)模優(yōu)勢就越大。
運營商以號碼為唯一的ID來整合各類數(shù)據(jù),因此刻畫客戶的完整性是一般企業(yè)難以企及的,因為號碼就是業(yè)務(wù)本身,而且還有終端ID作為移動通信網(wǎng)天生的業(yè)務(wù)屬性而存在。
運營商承擔(dān)著相當(dāng)大的社會責(zé)任,從偏遠(yuǎn)地區(qū)不惜成本的建立基站可見一般,運營商也在不斷踐行這些責(zé)任,前段時間中國移動和招商銀行準(zhǔn)備建立征信公司就是起步的象征哦,但你一般不會看到互聯(lián)網(wǎng)公司會有分享數(shù)據(jù)的行為,數(shù)據(jù)基本是在它的體內(nèi)循環(huán),畢竟是競爭所在,而三家運營商雖然業(yè)務(wù)上有競爭,但從大數(shù)據(jù)角度來講,我甚至認(rèn)為是互補的,可以形成良好的合作生態(tài)。
客觀的來說,運營商的數(shù)據(jù)資源是比較全面的,基于這類數(shù)據(jù),能更立體的描述客戶,也許還能回答我們在移動互聯(lián)網(wǎng)時代最為關(guān)注的三個問題?我是誰,我在哪里,我在干什么,這是很多企業(yè)的數(shù)據(jù)難以比擬的。
最具價值的運營商的八類數(shù)據(jù)
下面就從技術(shù)、業(yè)務(wù)角度簡要解讀下最具價值的運營商的八類數(shù)據(jù)(當(dāng)然運營商的數(shù)據(jù)遠(yuǎn)不止于此),這些數(shù)據(jù)在運營商內(nèi)是被安全保存的,用戶不用擔(dān)心個人隱私會被泄露,如果要開放這些數(shù)據(jù),也需要征得個人的同意和授權(quán),我僅僅希望通過運營商的數(shù)據(jù)的一些解釋來表明,運營商大數(shù)據(jù)對于未來社會的推動作用是巨大的:
1.位置
其實運營商有多種定位客戶的手段,潛力很大。
(1)以手機附著的基站位置來判定用戶的位置,城鎮(zhèn)的誤差在幾百米,農(nóng)村、山區(qū)在1公里以上。
(2)以MR數(shù)據(jù)來判定用戶的位置,主要基于多個基站與手機的信號的距離衰減來定位,目前誤差已可以做到幾十米。
(3)WLAN熱點定位、應(yīng)急車、無人飛機等等:也許是幾米哦。
因此,并不是運營商不擁有精準(zhǔn)的位置數(shù)據(jù),更多的在于投入成本的考慮,比如MR數(shù)據(jù),涉及所有基站測量數(shù)據(jù)的搜集整合,會涉及系統(tǒng)的標(biāo)準(zhǔn)化和擴容。
但通過運營商的位置等信息,可以幫助用戶帶來生活的極大便利,舉個例子,比如你想買房吧,買在哪個地段呢,以前你可能只能依賴于特定的媒體或房產(chǎn)商的忽悠,但賣瓜的說瓜好到底有多少真實性呢?,你可不希望所住的小區(qū)基本是一幫小年輕,每天三更半夜的活動,你也不希望每天聽到廣場舞,你希望是高端商務(wù)區(qū),周邊鄰居用戶好歹是一群白領(lǐng),又比如政府想規(guī)劃一條路啊,想建立一個發(fā)電站啊,企業(yè)想開個店啊,廣告主想租一個戶外媒體廣告啊,所有的場景大家都希望了解周邊的人群情況,判斷下這些人群是否是你的目標(biāo)客戶哦,而所有這些,運營商的數(shù)據(jù)就可以幫到忙。
2.身份
當(dāng)前國家要求手機實名認(rèn)證,無論是手機、寬帶都會提供更多的信息,數(shù)據(jù)的準(zhǔn)確度是很高的。也許銀行會說我的客戶資料更靠譜吧,但運營商不僅客戶信息覆蓋完整,還可以基于實際行為進(jìn)行驗證,這是一般銀行及其它企業(yè)無法比擬的。通過身份信息,可以幫助金融機構(gòu)快速的判定用戶的信用程度,貸款也許不再像以前那么困難,在銀行,小貸,保險,投資各個領(lǐng)域,運營商的數(shù)據(jù)都具有極大的應(yīng)用潛力,可以有效推進(jìn)社會誠心體系的建立,阿里現(xiàn)在推出了芝麻信用,實際上就是通過身份相關(guān)信息的分析,來測算你的信用程度,從而為不同用戶提供不同等級的服務(wù)。
3.上網(wǎng)
移動互聯(lián)網(wǎng)時代大家將衣食住行信息都搬到了線上,所有的上網(wǎng)數(shù)據(jù)都以BIT的方式傳給運營商以便計費,包括訪問了什么網(wǎng)址,下載了什么應(yīng)用,訪問了什么內(nèi)容等,這些信息都蘊藏著極大的價值,堪稱網(wǎng)上生活的記錄儀,當(dāng)前部分運營商業(yè)開始嘗試提供訪問明細(xì)詳單查詢服務(wù),以幫助用戶理解自己的上網(wǎng)消費行為,不僅如此,在用戶允許的條件下,運營商基于這些數(shù)據(jù)的挖掘,還可以高效的撮合需求方和提供方,比如幫助女性化妝品公司將它的新產(chǎn)品推薦給喜歡時髦化妝的女性,而不是亂發(fā)廣告,幫助出版商向用戶推薦他感興趣的書,而不是將賣的最火的玄幻類書籍推薦給一個老人讀者,讓垃圾廣告滾蛋吧,這個就是大數(shù)據(jù)的魅力,可以真正做到個性化服務(wù)。
4.社交
運營商擁有天然的社交數(shù)據(jù),即通信交往圈(含語音,短信及彩信等),在一定程度上,其粘性是遠(yuǎn)高于QQ等交往圈的。
(1)通信交往圈:基于通信交往圈的大小,主被叫,時間序列,很容易得到任何一個用戶的社交特征,比如某人的影響力,人與人之間的親密程度,人群之間的上下屬關(guān)系,甚至可以得到人脈路徑,理論上,任何兩個人都可以通過多個中間人的傳遞而認(rèn)識對方哦。
(2)簇群網(wǎng)絡(luò):中國移動話務(wù)經(jīng)營近幾年最成功的產(chǎn)品是什么?,那就是推出了虛擬網(wǎng),家庭網(wǎng),親情網(wǎng),校訊通系列以簇群為核心的產(chǎn)品,這些產(chǎn)品一方面極大的提升了存量客戶的穩(wěn)定度,另外一方面,基于這些數(shù)據(jù)天然的形成了以工作,家庭和朋友的社交網(wǎng)絡(luò),這些社交數(shù)據(jù)是運營商巨大的金礦哦。
相信未來,通過用戶之間的歷史交往分析,能幫助找到遺失的朋友和曾經(jīng)的用戶,讓志同道合的朋友聚合在一起,讓陌生的雙方有緣千里來相會;通過歷史的連接,可以追蹤到失信用戶的蹤跡,幫助維護(hù)公司正當(dāng)權(quán)益;通過社交異動分析,可以找到欺詐電話和欺詐用戶的規(guī)律,讓欺詐無處遁形,從而讓社會更加和諧。有次路過相親大會,發(fā)現(xiàn)有大量的人聚集在那里,還在到處貼小紙條招親哦,如果有了大數(shù)據(jù),我想一定會讓大家更快找到心儀的對象。
5.支出
用戶每月愿意在通信上怎么花錢,能夠深刻的反映用戶的很多特征。
(1)支付能力:ARPU即用戶每月的消費總額(當(dāng)然周期也可以到每天),這個數(shù)據(jù)很有價值,因為它一定程度代表了某人的消費能力,我們曾經(jīng)將這個數(shù)據(jù)作為重要變量以區(qū)分商務(wù)人士,發(fā)現(xiàn)其效果遠(yuǎn)遠(yuǎn)好于其他注冊的一些信息,一些消費的變化還能微妙的感覺用戶,比如每到月底有些用戶的消費會突然降下來,說明這個用戶屬于消費敏感型哦。
(2)消費類型:運營商有客戶最為詳實的消費賬單,賬單中的每個費用項是有業(yè)務(wù)含義的,比如流量費,短信費、語音費、新業(yè)務(wù)費等等,這些信息都能反映用戶的一些特征,比如流量很多說明喜歡上網(wǎng),沒流量說明是老人、打工仔、農(nóng)民的可能性會大點。
通過用戶支出額度、支付及時性、欠費情況等的分析,可以構(gòu)建用戶信用模型,為金融企業(yè)提供風(fēng)控服務(wù),通過消費類型的判斷,可以幫助更好的刻畫用戶,讓企業(yè)減少廣告投放的盲目性,比如一個ARPU不到30元的男性用戶就不要考慮投放寶馬汽車廣告了,一個消費敏感型的用戶商家可以考慮多發(fā)些打折優(yōu)惠券,說不定他會更感興趣。
6.通信
運營商通過每次通信行為數(shù)據(jù)(包括語音,短信或彩信)的記錄進(jìn)行計費,這個數(shù)據(jù)其實也有很大的價值,除了可以了解用戶的通信使用情況(比如本地,漫游,長途,國際等),還可以通過對端解讀更多的信息,從而為用戶提供更為便利的服務(wù),比如運營商發(fā)現(xiàn)用戶喜歡煲電話粥,就會推薦虛擬網(wǎng),親情網(wǎng)等產(chǎn)品,讓大家享受更為便捷的通信服務(wù),實際上,未來,運營商可以聯(lián)合更多的企業(yè),為用戶提供更多貼心的服務(wù),比如發(fā)現(xiàn)用戶經(jīng)常打快餐電話,會結(jié)合位置推薦適合你的快餐店,同時將快餐企業(yè)的優(yōu)惠券及時推送給你,讓每個人都能享受到價格公道的服務(wù)。當(dāng)然,通信中蘊藏的巨大數(shù)據(jù)價值還有待我們?nèi)ネ诰颍@里僅作拋磚引玉。
7.終端
移動互聯(lián)網(wǎng)時代,我們每天面對最多的是什么,終端,是的,掌握了終端的數(shù)據(jù),你就理解了很多行為,也理解了終端產(chǎn)業(yè)的發(fā)展,而運營商天然就有終端的基因。
(1)手機終端:基于移動通信協(xié)議,每次你使用通信業(yè)務(wù),你的終端信息就需要上傳到運營商的網(wǎng)絡(luò)中,并被忠實的記錄下來,這個信息我們一般叫作(IMEI),是這款終端全球的唯一標(biāo)識。每個廠家在生產(chǎn)終端時,都有自己特定的IMEI的格式,這就是在當(dāng)前移動互聯(lián)網(wǎng)中準(zhǔn)確識別你終端型號的基礎(chǔ),任何終端的使用,變更,都被運營商系統(tǒng)準(zhǔn)確的記錄下來,因此,關(guān)于終端的大多數(shù)分析運營商都能做哦。
(2)平板終端/PC:如果你通過固話寬帶上網(wǎng),我們的系統(tǒng)記錄的是你的網(wǎng)卡標(biāo)識MAC,照樣能夠識別出你哦,也許你會說MAC無法判別PC或PAD型號吧,好吧,我告訴你瀏覽網(wǎng)頁的時候還有個數(shù)據(jù)叫UA,他暴露了你的終端型號哦,甚至是操作系統(tǒng)。 基于這些數(shù)據(jù),能幫助各類企業(yè)理解終端產(chǎn)業(yè)的發(fā)展情況,比如任何一款終端的使用情況,用戶使用特征,發(fā)展趨勢,用戶換機周期等等,從而幫助終端企業(yè)改進(jìn)產(chǎn)品,從而為用戶帶來更喜愛的產(chǎn)品;還能維護(hù)公平正義,杜絕一些終端廠商銷售造假,比如雙11銷量的造假,在運營商的數(shù)據(jù)里,有真實的用戶終端使用記錄,是否造假,一查就明哦。
8.時序
基于運營商數(shù)據(jù)的多樣性,比如通過用戶上網(wǎng),位置,通話等行為按照時間排列,可以了解更多規(guī)律,從而提供更多服務(wù)。比如,基于大量通話時序分析可以找到詐騙電話和短信的規(guī)律,從而實現(xiàn)精準(zhǔn)的定位,在欺詐發(fā)生的時刻進(jìn)行攔截,這些規(guī)律包括某個電話交往圈很多,對端都不一樣,每次通話模式類似等;也可以對于防止銀行卡盜刷提供支持,比如發(fā)現(xiàn)當(dāng)前刷卡的POS機所處位置時間與該卡歸屬戶主號碼當(dāng)前所處位置時間無法匹配等。
當(dāng)然,運營商的大數(shù)據(jù)遠(yuǎn)不止于上面幾類,其大數(shù)據(jù)全面性、多維性、中立性、完整性是其它企業(yè)很難比擬的,而且通過這些不同維度數(shù)據(jù)的交叉關(guān)聯(lián),可以創(chuàng)造更多的新數(shù)據(jù)和新價值。當(dāng)前國家發(fā)布了《促進(jìn)大數(shù)據(jù)發(fā)展的規(guī)劃綱要》,將數(shù)據(jù)上升到國家基礎(chǔ)性戰(zhàn)略資源的高度,提出要加強頂層設(shè)計和頭籌協(xié)調(diào),大力推動公共數(shù)據(jù)互聯(lián)網(wǎng)開放共享,消除信息孤島,很多省也提出了推動大數(shù)據(jù)產(chǎn)業(yè)的相關(guān)舉措,比如貴州成立了國內(nèi)首家大數(shù)據(jù)交易所。
作為大數(shù)據(jù)的擁有者,運營商更應(yīng)該承擔(dān)其相應(yīng)的責(zé)任,在確保客戶信息安全的條件下,通過開放共享的方式,積極參與大數(shù)據(jù)生態(tài)體系的建立,通過創(chuàng)造大數(shù)據(jù)價值應(yīng)用,有效得連接個人,企業(yè)和政府,讓大數(shù)據(jù)真正服務(wù)于社會。
上述觀點均來源于作者。