要做大數(shù)據(jù),首先要了解自己的企業(yè),或者自己所在的行業(yè)的核心是什么。我們現(xiàn)在經(jīng)常發(fā)現(xiàn),有很多企業(yè)在競爭的過程中,最終不是被現(xiàn)在的競爭對手打敗,而是被很多不是你的競爭對手所打敗。很簡單的一個例子,大家都認為亞馬遜是做電商的,但這是錯的,它現(xiàn)在最主要的收入來自于云(云服務(wù))。也就是說企業(yè)需要找到自己的核心數(shù)據(jù)(價值)。
目前國內(nèi)外關(guān)于大數(shù)據(jù)的談?wù)摵芏啵蠖嗍钦勥\營級別的,或者說從服務(wù)端、服務(wù)方提得較多一些。筆者要跟大家交流的問題是作為各類企業(yè)尤其是客戶方的企業(yè)來說,大數(shù)據(jù)跟他們有什么關(guān)系,或者說作為企業(yè)方怎樣去參與,這是企業(yè)方現(xiàn)在面臨的最大問題。
這個問題的答案重點在于大數(shù)據(jù)應(yīng)該從小數(shù)據(jù)開始。因為現(xiàn)在很多企業(yè)面臨的最大問題不是怎么用大數(shù)據(jù),而是內(nèi)部的一些小數(shù)據(jù)整合出現(xiàn)問題,或者小數(shù)據(jù)都沒用好的情況下怎么用大數(shù)據(jù)。大數(shù)據(jù)應(yīng)該是從小數(shù)據(jù)逐漸演變上去的,是一個正常的生態(tài),而不是瞬間變化的。大數(shù)據(jù)這個概念跟自媒體的概念類似,需要企業(yè)自己去建設(shè),而不是從一開始就想著依靠別人。很多企業(yè)在談自媒體的時候,像談別人的事情一樣。比如一談自媒體,就覺得那是第三方提供的一個平臺,大家在那兒發(fā)發(fā)牢騷。自媒體是自己的媒體,企業(yè)自己也要參與進去。同樣大數(shù)據(jù)不是別人的大數(shù)據(jù),我們假設(shè)有一個第三方提供了大量的數(shù)據(jù),有很多很多信息,CI、BI之類的很多模塊化東西供我們來用。如果這樣的話,你有,競爭對手也有,你能得到的東西,競爭對手也能得到的情況下,就不能稱之為核心競爭力。大數(shù)據(jù)作為企業(yè)來說要變成自身的一個競爭力,企業(yè)必須得建立自己的企業(yè)級的數(shù)據(jù)。
要做大數(shù)據(jù),首先要了解自己的企業(yè),或者自己所在的行業(yè)的核心是什么。我們現(xiàn)在經(jīng)常發(fā)現(xiàn),有很多企業(yè)在競爭的過程中,最終不是被現(xiàn)在的競爭對手打敗,而是被很多不是你的競爭對手所打敗。很簡單的一個例子,大家都認為亞馬遜是做電商的,但這是錯的,它現(xiàn)在最主要的收入來自于云(云服務(wù))。也就是說企業(yè)需要找到自己的核心數(shù)據(jù)(價值),這個是最關(guān)鍵的。只有在這個基礎(chǔ)上,建立自己的大數(shù)據(jù)才有可能,才能做一些延伸。其次,要找到內(nèi)部的一些外圍相關(guān)數(shù)據(jù),去慢慢地成長它。有點像滾雪球,第一層是核心,第二層是外圍相關(guān)的數(shù)據(jù)。第三層是什么?就是外部機構(gòu)的一些結(jié)構(gòu)化數(shù)據(jù)。第四層是社會化的,以及各種現(xiàn)在所謂的非結(jié)構(gòu)化的數(shù)據(jù)。這幾層要一層一層地找到它,而且要找到與自己相關(guān)的有價值的東西。這樣你的大數(shù)據(jù)才能建立起來。
第一步,找到核心數(shù)據(jù)。核心數(shù)據(jù)現(xiàn)在對很多企業(yè)來說實際上就是CRM,自己的用戶系統(tǒng),這是最重要的。第二步,外圍數(shù)據(jù)。比如企業(yè)經(jīng)常會在線上線下舉辦一些活動,在做活動的時候,消費者的信息只是簡單地提供在表單里面,還是進入了CRM的系統(tǒng)里? 第三步,常規(guī)渠道的數(shù)據(jù)。舉例來說一個銷售快銷品的企業(yè),能不能夠得到沃爾瑪?shù)臄?shù)據(jù),家樂福的數(shù)據(jù)?很多國外大數(shù)據(jù)的案例,說消費者買啤酒的時候也會購買剃須刀之類,或者一個母嬰產(chǎn)品的消費者她今天在買這個產(chǎn)品,預示著她后面必然會買另一個產(chǎn)品。這就有一個前期的挖掘。這些價值怎么來的,這就需要企業(yè)去找常規(guī)渠道里面的數(shù)據(jù),跟自己的CRM結(jié)合起來,才能為自己下一步做市場營銷、做推廣、產(chǎn)品創(chuàng)新等建立基礎(chǔ)。第四步,外部的社會化的或者非結(jié)構(gòu)化的數(shù)據(jù),即現(xiàn)在所謂的社會化媒體數(shù)據(jù)。這方面信息的主要特征是非結(jié)構(gòu)化,而且非常龐大。這對企業(yè)來說最大的價值是什么?當你的用戶在社會化媒體上發(fā)言的時候,你有沒有跟他建立聯(lián)系?這里有個概念叫做DC(digital connection)。所謂的互聯(lián)網(wǎng)實際就是一種DC,但是通常互聯(lián)網(wǎng)上的那種DC是在娛樂層面。用到商業(yè)里面的話,就是企業(yè)必須得跟消費者建立這種DC關(guān)系,它的價值才能發(fā)揮出來。否則,你的數(shù)據(jù)以及很多的CRM數(shù)據(jù)都是死的。就像國外CRM之父Paul Greenberg寫的四本CRM相關(guān)書籍,前面三本都是在講數(shù)據(jù)庫、系統(tǒng)之類的。第四本書的時候,就沒有再講那些東西,講什么?講互動,講DC,講怎么跟消費者建立關(guān)系。
小數(shù)據(jù)向大數(shù)據(jù)邁進
有了這個數(shù)據(jù)庫去進行數(shù)據(jù)挖掘,或者在建立數(shù)據(jù)的過程中,企業(yè)需要從什么方向去探索,也不是漫無目的的。首先應(yīng)該跟著你的業(yè)務(wù),業(yè)務(wù)現(xiàn)在有哪些問題,或者說這個行業(yè)里面主要的競爭點在哪里,這是很關(guān)鍵的。有了這個業(yè)務(wù)關(guān)系以后,再形成假設(shè),也就是說未來的競爭點可能在哪里,大到未來的戰(zhàn)略競爭,小到哪些方面。然后下一步要怎么做,這些形成一個假設(shè),其次做一些小樣本的測試。很多企業(yè)一看大數(shù)據(jù)就很恐怖,說我也買不起那些大數(shù)據(jù),也雇不起那么專業(yè)的團隊,怎么辦?自己做一些小樣本的測試,甚至通過電子表格Excel都可以做數(shù)據(jù)挖掘。不一定非要那么龐大、那么貴的數(shù)據(jù)。然后再做大樣本的驗證,驗證出來的結(jié)果就可以應(yīng)用到現(xiàn)實中去。
在大數(shù)據(jù)尤其是互聯(lián)網(wǎng)時代還有一個最重要的點,就是失效預警。即你發(fā)現(xiàn)一個規(guī)律,在現(xiàn)實中應(yīng)用了,但是你一定要設(shè)立一些預警指標。就是當指標達到什么程度的時候,之前發(fā)現(xiàn)的規(guī)律失效,那你就必須發(fā)現(xiàn)新的、相關(guān)的,否則也會造成一種浪費。筆者看到一篇文章,其中有一個重要結(jié)論。大家都在說大數(shù)據(jù)的價值很有用的時候,很多企業(yè)說我積累了多少TB,多少PB,但是你基于老的數(shù)據(jù)得出的很多結(jié)論實際是在浪費你的資源。你挖掘出來很多數(shù)據(jù)、很多規(guī)律,如果錯了,明天按這個去做,就是浪費。因此需要有一個失效預警。在這樣的過程中,最終你需要對應(yīng)建立起內(nèi)部團隊,他們對數(shù)據(jù)的敏感度也才能培養(yǎng)起來。這時候你再去買大數(shù)據(jù)服務(wù)的時候才是有價值的。
所有這些工作作為企業(yè)來說是需要內(nèi)部去做的,最終才能開花結(jié)果,有一些收獲。企業(yè)大數(shù)據(jù)起步,要從小數(shù)據(jù)開始。
注1:關(guān)于數(shù)據(jù)挖掘過程中是直接上來就大數(shù)據(jù)、全數(shù)據(jù),還是可以從一些小數(shù)據(jù)、小樣本入手,這方面目前存在一些爭論。本文為復旦大學主辦的“大數(shù)據(jù)與營銷傳播”高峰論壇的演講稿整理,僅代表作者觀點,供參考。