要談大數據就繞不過兩個案例:一個是塔吉特,一個是紙牌屋。
塔吉特的確典型,而紙牌屋真的像Netflix所宣稱的那樣,是來源于大數據的功勞嗎?故事的真相并沒有那么炫目。
大致是這么一個節奏:一家名叫MRC的制作公司準備進入電視圈,MRC的一個實習生推薦了英劇《紙牌屋》這個劇本;然后MRC找英方買了版權,并與好萊塢最大的經紀公司CAA合作;搞定劇本后MRC和CAA又去找了HBO和AMC之類的頻道去賣片,也包括Netflix。沒錯,Netflix直到前期準備工作都完成時,才介入紙牌屋這個項目。
Netflix看好這部片子,拋出了一堆讓人難以拒絕的條件,而Netflix和大數據搭上關系,則借助于公司的CCO喬納森·費里蘭德和CMO凱利·本奈特的包裝和宣傳,這是一個再普通不過的資本市場的故事而已。
大數據這個概念如此火爆,但其中裝的有多少是概念,有多少又是群起的炒作,有多少人真的了解大數據的意義,我們全在霧里看花。
大數據當然很大,但大并不代表一切。在數據統計里有這樣一個經典案例:1936年總統大選時,美國著名期刊《讀者文摘》以全國各地的電話簿為參考,發出了1000萬份讀者調查表,最終回收了200萬份,要知道在那個年代,這是一次有可怕數據量支撐的調查。最后得出的結論是共和黨的蘭登將以57%對43%的絕對優勢戰勝民主黨的羅斯福。結果呢?羅斯福以62%的支持率得以連任,《讀者文摘》也由于這次慘敗于1937年被迫停刊。
原因很簡單,1936年正值大蕭條時期,那些裝得起電話的都是有錢人,而偏偏是那些裝不起電話的中低收入者和失業者,都是羅斯福堅強的后盾。以電話簿為參考做調查,即使數據再大也是無用功,因為從一開始就走錯了方向。
到了今天,我們依然有可能會犯70多年前《讀者文摘》的錯誤,我們并不會因為科技的發展、互聯網的強大和數據的海量存儲就成為全知全能的上帝。相反,手中掌握的這筆龐大的數據反而可能使我們變得盲目和愚蠢。大數據的大的真正意義在于,人們有能力掌握宏觀資料,去進行交叉融合的綜合分析研究,使之產生乘法效應。
一個人在網上只買過驗孕棒并不會使塔吉特為其推送嬰兒產品,相反,一個人在網上買毓婷也不代表她不需要尿布,這是一個道理。只有對綜合的、細顆粒的、微觀的數據進行有邏輯的相關性分析,才能發揮大數據的核心價值。
比如,我們追蹤一位女性顧客的消費行為,不僅僅是追蹤其購買服飾的價格帶、品牌喜好,更應該與海量的周邊信息進行關聯。比如下單時間、瀏覽時間,甚至她喜歡的零食、書籍等發生了什么變化。如果之前看青春小說現在看科特勒,是不是意味著她已經開始步入職場?那么她的瀏覽時間段有變化嗎?這對于主打職場服裝的品牌是否意味著推廣機會?還有哪些數據可以為這一點作證?進而是否可以分析出她具體進入了什么類型的公司?擔任什么職務?有沒有必要為其推薦筆記本電腦?
毫無疑問,大數據是個遠景客觀的項目。大數據的完美應用,正像我們大腦每時每刻都在做的那樣,接收無數的信息,從中剔除或者暫時存儲低級別信息或者無用信息,然后與目標相關的高級別信息進行運算和處理,最后得到結論。
很可惜,我們無法存儲海量的信息,而丟失信息和誤存儲信息的比率又大得驚人。所以,大數據對我們而言才如此迷人。