中文字幕亚洲欧美,久久久久国产成人精品,日本不卡一区二区三区在线观看

你確定這是大數據？不是大玩具？

責任編輯：editor007

作者：何雙宇

2015-12-26 18:49:47

摘自：界面

最近，一家公司的大數據中心通過對用戶代駕數據的分析，發布了一個“應酬指數報告”。“文胸數據報告”第一年發布時，就因為“黑龍江女性胸最小”引來一片吐槽，“胸越大的妹子越有錢”的結論更是讓人浮想聯翩。

最近，一家公司的大數據中心通過對用戶代駕數據的分析，發布了一個“應酬指數報告”。聯想到兩個月前另一家公司還發布過一個“燒烤大數據報告”，不禁讓人產生一種錯覺——聽上去高大上的大數據不但就在我們身邊，而且就像孩子手中的玩具一樣，信手拈來，可愛慈祥。

因被谷歌用來成功預測流感，大數據聲名鵲起。隨著今年成為國家戰略，中國互聯網公司也開始言必稱大數據。對于大數據的原理筆者無力解釋。但我想真正從“大數據”中得出的結論，至少應該具備兩個特征。

首先是能夠被驗證。

百度通過大數據分析，100%命中了2014年世界杯淘汰賽階段所有比賽的結果。同樣的命題，谷歌、百盛和微軟都有失手之處。后來在《黃金時代》的票房預測上百度也跌了跟頭。實際上即使谷歌，2011年到2013年之間對流感趨勢的預測也比實際情況高出50%。

其次是能夠被應用。

今年“黑色星期五”前夕，谷歌在“Think with Google”網站上放出了與黑五相關的各種數據，告訴人們什么時間去購物不必被人群擁擠，以及哪些店鋪可能不至于人山人海。在金融領域，2010年印第安納大學商學院教授Johan Bollen報告說，推特的數據能以87.6%的準確率預測出道瓊斯工業平均指數。彭博也已經講twitter、Facebook等社交網站上的“社交情緒分析”列入財經數據推送服務。

如果只是頂著大數據的帽子，既無法被驗證，也看不到有任何可用之處，充其量只是基于大量數據的歸納罷了。實際上無論最近的“應酬指數”、“燒烤地圖”，還是早些年幾家電商網站發布的“文胸數據報告”、“北京性福地圖”，正是這種既無法驗證、又沒什么卵用的“大數據”成果。

但對不明真相的群眾來說，大數據既神奇又神秘。因為神奇所以可以用來炫技，因為神秘所以可以隨心所欲的定義。

當然，讓“大數據”為營銷服務也是極好的。

“文胸數據報告”第一年發布時，就因為“黑龍江女性胸最小”引來一片吐槽，“胸越大的妹子越有錢”的結論更是讓人浮想聯翩。去年雙11之后，京東特意將肥皂、手紙和套套的銷量公之于眾，既迎合了公眾的獵奇心理、又分散了行業對阿里雙11的關注、同時也悄悄告訴網友“京東賣快消也很牛”。

一旦被冠以“大數據”的名頭，這些東西立刻高大上起來。但他們和大數據可能只有一毛錢的關系，就是數據量確實挺大。

制造錯覺一直是我們所擅長的。就像本來和驢肉火燒一個級別的麥當勞、肯德基，在中國一度要穿得體體面面才能去消費。甚至土生土長的仿制品，對不少人來說也是比驢火和肉夾饃牛逼N倍的食物。尚處于探索中的大數據，在中國互聯網行業卻已經得到“廣泛應用”，其實并不是什么好事。畢竟如果謊話說得多了，自己可能真的會信。

谷歌數據推送數據中心