數(shù)據(jù)產(chǎn)生于各行各業(yè),在互聯(lián)網(wǎng)時代大數(shù)據(jù)概念提出后,人們發(fā)現(xiàn)自己手中的數(shù)據(jù)不再毫無用處,通過強大的技術(shù)手段,無形的數(shù)據(jù)可轉(zhuǎn)化為有形資產(chǎn)。所以在這個大數(shù)據(jù)的時代,得數(shù)據(jù)者得天下!那么對于一個企業(yè)來說如何讓大數(shù)據(jù)發(fā)揮出價值,推動企業(yè)業(yè)績的增長呢?來自北京航空航天大學(xué)計算機(jī)碩士,美團(tuán)網(wǎng),數(shù)據(jù)開發(fā)與數(shù)據(jù)挖掘,法國電信研發(fā)中心云計算與大數(shù)據(jù)研究員梁堰波對此做了一個非常全面的分析。
有一種說法,未來所有的行業(yè)都會被互聯(lián)網(wǎng)改造,這種說法可能會有點絕對,但確實說明了一個趨勢。前幾天參加BDTC2013,看到了越來越多的原來在傳統(tǒng)IT企業(yè)的同學(xué)和朋友紛紛加入移動互聯(lián)網(wǎng)、大數(shù)據(jù)、云計算的陣營,越來越多的傳統(tǒng)企業(yè)在眾多IT巨頭的忽悠之下開始投身大數(shù)據(jù)的浪潮。雖然很多老板對大數(shù)據(jù)的了解僅僅停留在Google搜索引擎或者Amazon的推薦系統(tǒng)這樣的產(chǎn)品層面,但是大數(shù)據(jù)的浪潮顯然已經(jīng)不可阻擋。大數(shù)據(jù)在改造傳統(tǒng)企業(yè)中能發(fā)揮多大的力量,怎么樣才能發(fā)揮更大的力量,我談?wù)勎业挠^點吧。
PS:我是一個數(shù)據(jù)挖掘工程師,我不是PM,我是一個無證Data Scientist,我熱愛大數(shù)據(jù),希望大數(shù)據(jù)能夠給企業(yè)帶來價值,我為自己代鹽。
其實移動互聯(lián)網(wǎng)、大數(shù)據(jù)已經(jīng)不單單是一個IT的概念了,它更多的是一個改變?nèi)祟惿罘绞降漠a(chǎn)業(yè),而且誕生了一個新的名詞O2O。O2O被譽為未來一個萬億市場規(guī)模的行業(yè)。O2O企業(yè)本質(zhì)是傳統(tǒng)行業(yè)的互聯(lián)網(wǎng)化或者說用互聯(lián)網(wǎng)的方法改造傳統(tǒng)行業(yè),那么本質(zhì)上解決的問題和傳統(tǒng)行業(yè)沒有區(qū)別,還是人們?nèi)粘I钕⑾⑾嚓P(guān)的衣食住行等問題。例如通過電商買衣服和生活用品,通過微信解決朋友之間通信的需求,團(tuán)購買餐飲,嘀嘀打車,網(wǎng)上買機(jī)票和火車票,支付寶交水電煤氣費,余額寶理財,甚至一度被叫停的醫(yī)院掛號等。要做的事還是一樣的,只是做事的方法不一樣,目的是讓用戶的生活更加便利。那么什么樣的玩法更受用戶歡迎呢?過去傳統(tǒng)企業(yè)或者靠領(lǐng)域知識的傳承,或者是靠用戶問卷調(diào)查的形式反饋的,顯然周期長、反應(yīng)慢、服務(wù)內(nèi)容和服務(wù)方式跟不上時代的發(fā)展和用戶的需求。而經(jīng)過互聯(lián)網(wǎng)化之后,所有的用戶行為都被記錄和存儲下來,我們可以快速精準(zhǔn)的分析和挖掘出用戶的需求變化和每一個用戶的個性化需求,從而給每一個用戶制定不同的服務(wù)策略。
我們都知道,領(lǐng)域知識是一個人在某個行業(yè)安身立命的本錢。過去傳統(tǒng)行業(yè)的領(lǐng)域知識是靠在行業(yè)內(nèi)不斷摸爬滾打積累出來的,而互聯(lián)網(wǎng)化之后的這些行業(yè)的領(lǐng)域知識將是從海量的用戶行為數(shù)據(jù)中分析和挖掘出來的。過去的傳統(tǒng)企業(yè)一旦確立了領(lǐng)導(dǎo)地位,那么被同行業(yè)的其他企業(yè)顛覆的可能性是比較小的;而互聯(lián)網(wǎng)化之后的這些行業(yè)中,從海量用戶的行為中挖掘出的領(lǐng)域知識的時效性是非常明顯的,一旦一個企業(yè)不能夠與時俱進(jìn)將很快被別人超過去。舉個例子來說,著名的“啤酒和尿布”的故事在最開始的時候會給相應(yīng)的企業(yè)創(chuàng)造價值,但是當(dāng)同行業(yè)內(nèi)其他企業(yè)也學(xué)會了這招之后,這個就不是一個利潤增長點了。那么企業(yè)就需要不斷的挖掘新的利潤增長點,這個時候海量用戶數(shù)據(jù)的價值就會體現(xiàn)出來。未來全面互聯(lián)網(wǎng)化的時代中“三天不學(xué)習(xí),趕不上劉少奇”這句話就會有深刻的體會。所以像Coursera這樣的在線教育平臺會非常有前途,因為僅僅靠十幾年的學(xué)校學(xué)習(xí)已經(jīng)不能滿足一個人一生的知識和能力的需求,未來是個終身學(xué)習(xí)的時代。很多大佬們也看到在線教育這塊大蛋糕了,都開始跑馬圈地。
那么對于一個企業(yè)來說如何讓大數(shù)據(jù)發(fā)揮出價值,推動企業(yè)業(yè)績的增長呢?我想首先需要考慮的一個重要問題就是:你的企業(yè)是一個平臺還是一個垂直行業(yè)?
平臺就好像淘寶、京東、騰訊,上面的商品或者服務(wù)的種類非常非常多,而且不同商品或者服務(wù)的特點可能差別很大,同時對用戶數(shù)據(jù)的積累是多方面的;垂直行業(yè)就是類似攜程、聚美優(yōu)品,上面的商品或者服務(wù)是某一個垂直領(lǐng)域的,只有當(dāng)用戶在這樣的垂直領(lǐng)域有所需求或者感興趣的時候才會光顧,那么一般情況下你只能得到用戶在這個領(lǐng)域的一些數(shù)據(jù);不過這里面有個灰色地帶,就是互聯(lián)網(wǎng)金融。因為從本質(zhì)上講這是個垂直行業(yè)(金融行業(yè)),但是想到金融行業(yè)在人們?nèi)粘I钪械闹匾裕覀儐螁螐囊粋€垂直行業(yè)的角度來衡量這個用戶的價值顯然是不夠的,因為金融影響到人們的方方面面。
對于大數(shù)據(jù)從業(yè)者來說這三種類型的企業(yè)在利用大數(shù)據(jù)的過程中是有很大的不同的。舉個簡單的例子,在對用戶進(jìn)行細(xì)分或者用戶畫像的過程中,如果一個用戶有好幾個月沒有買東西,那么怎么界定這個用戶是否流失了呢?仔細(xì)想想,如果一個用戶好幾個月沒有在淘寶、京東上買東西,那么顯然是流失了;但是如果沒有在攜程上買東西,未必能認(rèn)為他流失了。因為用戶對旅游類產(chǎn)品的平均購買周期可能就有好幾個月,所以顯然單單是這樣一個因為未必可以把這個用戶標(biāo)定為流失。
對于不同的企業(yè)在利用大數(shù)據(jù)的方法上也是不一樣的:
像阿里巴巴的目的就是做基礎(chǔ)設(shè)施,像自來水公司、煤氣公司、電力公司這樣人們生活中必不可少的一部分,也就是所謂的“剛需中的剛需”,所以阿里巴巴整合了多個部門的廣告團(tuán)隊成立了阿里媽媽。京東在這方面也不甘示弱,一直養(yǎng)活著獨立DSP服務(wù)商MediaV,而且兩家企業(yè)不斷傳出收購緋聞。騰訊的廣點通也是這方面的典型代表。阿里巴巴、京東、騰訊的共同特點就是解決了用戶的剛需,成為了用戶每天生活中必不可少的一部分,然后培養(yǎng)起一系列的產(chǎn)業(yè)鏈。
阿里和京東解決了用戶購買商品的需求,騰訊解決了用戶通信和社交的需求,而且提供的服務(wù)都是免費的,這樣用戶把自己的一些數(shù)據(jù)不知不覺中就送給了這些平臺級企業(yè),這些企業(yè)就可以利用這些大數(shù)據(jù)分析出用戶的年齡、性別、興趣偏好、收入水平、家庭構(gòu)成等跟消費密切相關(guān)的特征,從而成為一個廣告上的目標(biāo)客戶群體,把這些用戶買個廣告商。這是這些平臺級企業(yè)賺錢的主要方式,說白了就是拉皮條的。而且隨著互聯(lián)網(wǎng)金融的興起,一旦這些平臺廠商了解了和你相關(guān)的數(shù)據(jù)越來越多,那么就可以給你推銷一些金融產(chǎn)品(典型的例子就是余額寶),從而控制你的個人金融體系,這些平臺可以像銀行一樣吸納你的存款用于投資。
這才是第一步,在金融機(jī)構(gòu)最重要的風(fēng)險防范體系中,由于這些平臺廠商知道你交水電費很及時,剛剛買了一輛車,最近又沒怎么生病掛號,而且還定期出國旅游。那么顯然你是一個優(yōu)質(zhì)客戶,不需要你提供任何證明來抵押貸款給你的風(fēng)險。這個就是互聯(lián)網(wǎng)金融/大數(shù)據(jù)金融的玩法。那么對于垂直類企業(yè)(包括互聯(lián)網(wǎng)金融)該怎么使用大數(shù)據(jù)呢?
垂直類企業(yè)特別是傳統(tǒng)企業(yè)的最大特點就是在自己的CRM系統(tǒng)里面有用戶大量的高質(zhì)量數(shù)據(jù),這個是像上面的平臺級企業(yè)所不具備的。典型的例子就是像電信、金融這樣的企業(yè)擁有質(zhì)量非常高的用戶金融數(shù)據(jù)、交易數(shù)據(jù)、關(guān)系鏈數(shù)據(jù)等,這些數(shù)據(jù)所表達(dá)出的意思是最真實可靠的。但是這些垂直類企業(yè)所積累的數(shù)據(jù)量往往沒有像前面所說的平臺級企業(yè)那么多。這個時候可以考慮通過引入第三方數(shù)據(jù)的方式來補充用戶的數(shù)據(jù),美國twitter公司的IPO文件中顯示其15%的收入來源是“倒賣”用戶的數(shù)據(jù),在國內(nèi)阿里巴巴與新浪微博戰(zhàn)略合作之后也打通了微博和淘寶的用戶數(shù)據(jù),雖然很多微博用戶在吐槽這件事。數(shù)據(jù)交換首先要保證用戶數(shù)據(jù)的安全性,讓數(shù)據(jù)流動起來數(shù)據(jù)才能發(fā)揮更大的價值。
對于面向用戶的企業(yè)來說,如何利用大數(shù)據(jù)現(xiàn)在的玩法應(yīng)該是比較清楚了。簡單來說就是以用戶和業(yè)務(wù)為核心,對用戶的相關(guān)維度進(jìn)行數(shù)據(jù)挖掘,構(gòu)建用戶和業(yè)務(wù)的屬性和特征庫,服務(wù)業(yè)務(wù)需求。具體再實施過程中還需要重點考慮以下問題:
1.以用戶和業(yè)務(wù)為核心,以思路為重點,以數(shù)據(jù)挖掘技術(shù)為輔助
企業(yè)使用大數(shù)據(jù)的目的是解決問題(說白了就是賺錢),賺錢的方法就是跟自己的business model密切相關(guān)的,也就是我們通常說的業(yè)務(wù)。在這個過程中大數(shù)據(jù)技術(shù)只是一個手段,是幫助我們解決業(yè)務(wù)問題的。所以說在大數(shù)據(jù)技術(shù)選型和架構(gòu)的時候,一定要搞清楚自己的業(yè)務(wù)模式,不能別人用什么架構(gòu)就跟著用,別人挖掘什么就跟風(fēng)挖。
2.小步快跑,快速迭代,持續(xù)優(yōu)化
千萬別想著一次就搞出個大新聞,在互聯(lián)網(wǎng)領(lǐng)域永遠(yuǎn)是beta版的,只要這次比上次好就行了。大數(shù)據(jù)的思想就是把現(xiàn)實世界中的現(xiàn)象用數(shù)學(xué)的形式表示出來,分析和挖掘這些現(xiàn)象之間的關(guān)系,并且能夠定位到哪些群體具備哪些特征,哪些特征會影響企業(yè)的盈利。所以很多問題并沒有或者需要嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)證明,我們重點關(guān)注的是關(guān)聯(lián)關(guān)系而不是因果關(guān)系。
在大數(shù)據(jù)時代,ABtest是非常重要的,很多現(xiàn)象是不需要理論證明的,ABtest會告訴我們該怎么改進(jìn)產(chǎn)品,哪些產(chǎn)品的哪些特征更受用戶歡迎。
3.用戶的反饋很重要,要積極調(diào)動用戶的參與度
傳統(tǒng)的調(diào)動用戶參與度的方式就是發(fā)優(yōu)惠券或者促銷券。這種方法在有些情況下是有效的,有些情況下可能需要更深入的了解用戶的需求,例如用戶為什么來我們這個平臺?為什么流失了?舉個例子來說吧,對于有些用戶來說你給他發(fā)了10塊錢優(yōu)惠券,但是他沒有買的需求或者找不到他想買的東西,那么他不會因為這10塊錢的優(yōu)惠券去制造一個需求。或者有些用戶可能比較有錢,每次買東西都是大手筆,你給他10塊錢優(yōu)惠券可能他根本看不上。用戶細(xì)分模型可以幫助我們針對不同的用戶群體采用不同的調(diào)動用戶參與的方式。
大數(shù)據(jù)是幫助我們補充行業(yè)知識的一種重要的方式。現(xiàn)在越來越多的行業(yè)是數(shù)據(jù)驅(qū)動的,那么這個行業(yè)的很多行業(yè)知識都是通過大數(shù)據(jù)挖掘出來的。而獲取這些數(shù)據(jù)的主要方式就是用戶的行為和對運營動作反饋的挖掘,這也是未來以數(shù)據(jù)為核心的企業(yè)的價值所在。
4.從運營驅(qū)動到數(shù)據(jù)驅(qū)動
關(guān)于誰來主導(dǎo)大數(shù)據(jù)服務(wù)用戶這個需求,其實有很多的使用場景。例如一個推薦系統(tǒng)由產(chǎn)品經(jīng)理來主導(dǎo)比較合適;對于一個數(shù)據(jù)化運營系統(tǒng),那么從事運營或者市場相關(guān)的人員來主導(dǎo)會是比較合適的。對于很多大公司來說,慢慢會發(fā)展出專門從事數(shù)據(jù)驅(qū)動業(yè)務(wù)的部門和人員,例如我們經(jīng)常提到的Data Scientist的概念。
5.業(yè)務(wù)人員和數(shù)據(jù)挖掘人員的密切配合
這個也是我們大部分公司經(jīng)常遇到的一個問題:做業(yè)務(wù)的不太懂技術(shù)或者數(shù)據(jù),做數(shù)據(jù)挖掘的對業(yè)務(wù)又不是特別了解,目前社會上最缺的就是既懂業(yè)務(wù)又懂技術(shù)的。如何把數(shù)據(jù)挖掘的結(jié)果應(yīng)用到業(yè)務(wù)中是個比較難的問題,我們常說沒有數(shù)據(jù)是無價值的,只是要找到它發(fā)揮價值的地方。因為數(shù)據(jù)挖掘的結(jié)果往往表現(xiàn)出的是用戶在某一方面的屬性或者特征,那么在實際業(yè)務(wù)中用戶的行為往往受到多個因素的影響,所以在把數(shù)據(jù)挖掘的結(jié)果推廣到具體的業(yè)務(wù)過程中要和業(yè)務(wù)方密切合作,找到合適的促銷方式、展位、文案、刺激手段、效果評估方法等。
大數(shù)據(jù)的范疇內(nèi)我們應(yīng)該把用戶還原成一個人,而不要割裂的看他的某些行為,而要把這些行為和他的社會學(xué)屬性、生活背景、活動時間、地點、氣候因素和應(yīng)用上下文聯(lián)系起來。目前的大數(shù)據(jù)Ecosystem沒有一個很好的BI工具,給對應(yīng)的分析師或者挖掘工程師帶來了很大的難度。
6.與客戶的溝通方式(運營手段)很重要
現(xiàn)在社會大家都很忙碌,像過去那種通過call center給用戶打電話推銷的方式的效果越來越差,因為用戶很忙碌的時候是不希望被打擾的。那么異步通信的需求就比較強烈,典型的應(yīng)用就是微信,可以很好的利用碎片時間,那么對于企業(yè)營銷來說也是非常好的通道。同樣對于企業(yè)給用戶的各種促銷或者運營手段的時機(jī)也會比較重要,而且不同興趣偏好的用戶的瀏覽和購買時間最好也要區(qū)別對待。
同時運營活動設(shè)計的巧妙程度、文案和展位比大數(shù)據(jù)技術(shù)可能會發(fā)揮更重要的作用。聽過一個真實的例子,某公司的推薦系統(tǒng)在模型完全沒有改變的情況下只是改了下展位的位置,導(dǎo)致最后的下單率有明顯的提升。
7.大數(shù)據(jù)帶來的價值如何衡量
企業(yè)養(yǎng)了一個大數(shù)據(jù)團(tuán)隊,那么對這樣的團(tuán)隊怎么衡量他們帶來的價值呢?例如天貓雙十一的交易額有350億,那么這350億中有多少是通過大數(shù)據(jù)來提升的?
我覺得大數(shù)據(jù)的短期回報是精準(zhǔn)營銷,而從長期的角度來看對于一個企業(yè)或者平臺來說更重要的是客戶關(guān)系維護(hù),增加用戶的粘性和購買力,從而使得用戶很難遷移到其他平臺上,那么對于你這個企業(yè)來說就有點類似于壟斷了,就屬于躺著都賺錢了(就像現(xiàn)在的可口可樂、寶潔類似的公司)。所以說大數(shù)據(jù)的價值可以在產(chǎn)品的各個層次得到體現(xiàn),而具體價值的衡量也要因不同的業(yè)務(wù)模式而有所不同。同時大數(shù)據(jù)也幫助企業(yè)更好的理解這個行業(yè),建立起行業(yè)的壁壘,從而更好的支撐管理者的決策。