最近,一家公司的大數據中心通過對用戶代駕數據的分析,發布了一個“應酬指數報告”。聯想到兩個月前另一家公司還發布過一個“燒烤大數據報告”,不禁讓人產生一種錯覺——聽上去高大上的大數據不但就在我們身邊,而且就像孩子手中的玩具一樣,信手拈來,可愛慈祥。
因被谷歌用來成功預測流感,大數據聲名鵲起。隨著今年成為國家戰略,中國互聯網公司也開始言必稱大數據。對于大數據的原理筆者無力解釋。但我想真正從“大數據”中得出的結論,至少應該具備兩個特征。
首先是能夠被驗證。
百度通過大數據分析,100%命中了2014年世界杯淘汰賽階段所有比賽的結果。同樣的命題,谷歌、百盛和微軟都有失手之處。后來在《黃金時代》的票房預測上百度也跌了跟頭。實際上即使谷歌,2011年到2013年之間對流感趨勢的預測也比實際情況高出50%。
其次是能夠被應用。
今年“黑色星期五”前夕,谷歌在“Think with Google”網站上放出了與黑五相關的各種數據,告訴人們什么時間去購物不必被人群擁擠,以及哪些店鋪可能不至于人山人海。在金融領域,2010年印第安納大學商學院教授Johan Bollen報告說,推特的數據能以87.6%的準確率預測出道瓊斯工業平均指數。彭博也已經講twitter、Facebook等社交網站上的“社交情緒分析”列入財經數據推送服務。
如果只是頂著大數據的帽子,既無法被驗證,也看不到有任何可用之處,充其量只是基于大量數據的歸納罷了。實際上無論最近的“應酬指數”、“燒烤地圖”,還是早些年幾家電商網站發布的“文胸數據報告”、“北京性福地圖”,正是這種既無法驗證、又沒什么卵用的“大數據”成果。
但對不明真相的群眾來說,大數據既神奇又神秘。因為神奇所以可以用來炫技,因為神秘所以可以隨心所欲的定義。
當然,讓“大數據”為營銷服務也是極好的。
“文胸數據報告”第一年發布時,就因為“黑龍江女性胸最小”引來一片吐槽,“胸越大的妹子越有錢”的結論更是讓人浮想聯翩。去年雙11之后,京東特意將肥皂、手紙和套套的銷量公之于眾,既迎合了公眾的獵奇心理、又分散了行業對阿里雙11的關注、同時也悄悄告訴網友“京東賣快消也很牛”。
一旦被冠以“大數據”的名頭,這些東西立刻高大上起來。但他們和大數據可能只有一毛錢的關系,就是數據量確實挺大。
制造錯覺一直是我們所擅長的。就像本來和驢肉火燒一個級別的麥當勞、肯德基,在中國一度要穿得體體面面才能去消費。甚至土生土長的仿制品,對不少人來說也是比驢火和肉夾饃牛逼N倍的食物。尚處于探索中的大數據,在中國互聯網行業卻已經得到“廣泛應用”,其實并不是什么好事。畢竟如果謊話說得多了,自己可能真的會信。