隨著疾病預測、世界杯預測的火爆,“大數據”成了每個IT圈人士張口閉口離不開的話題,好像一切都朝著蘋果6的潮流發展——“bigger than bigger”,越大的就是越好的。隨著大數據的不斷應用創新,大數據預測日益被人們“神話”,100%準確率似乎成為了人們衡量大數據能力硬性指標,但事實并非如此。神乎其神的大數據預測有“顯靈”一刻,也有“烏龍”一刻。今天小編就帶領大家來盤點下大數據史上的關鍵時刻。
大數據史上的“神”預測
2009年,谷歌推出“流感趨勢預測“項目,在甲型H1N1流感暴發的幾周前,“谷歌流感趨勢”成功預測了流感在美國境內的傳播,其分析結果甚至具體到特定的地區和州,并且非常及時,令公共衛生官員備感震驚。此舉一炮打響了谷歌在大數據預測的地位。
2014年,百度大數據預測團隊通過對海量賽事信息的挖掘和分析,對2014年巴西世界杯全部64場比賽的勝負結果,以及冠軍和黑馬進行預測。無論是四分之一決賽還是16強淘汰賽,百度預測結果準確率都達到100%!斬高盛,贏谷歌,世界杯預測徹底火了百度。
在天氣預測方面的“預測帝“是美國EarthRisk公司,該公司利用大數據對未來天氣情況作出預報,它采用的預測模型項不同于以往的數值預報模式,可基于 820 億次計算以及 60 年的氣象歷史數據來識別天氣模式,然后將這些模式與當前的氣候條件進行比較,再運用預測性分析進行天氣預測,其預測時間更長、預測準度更高,最長可提前 40 天生成冷熱天氣概率。傳統主觀預測模型在EarthRisk面前簡直是弱爆了。
大數據史上的”烏龍“預測
2011年至2013年間,谷歌流感趨勢預測開始走下坡路,從2011年8月到2013年9月108周中,它高估了流感流行趨勢超過50%。英國《自然》雜志報道稱:在最近一次流感暴發中,“谷歌流感趨勢”不起作用了!這個工具曾經可靠地運作了幾個冬天,在海量數據分析和號稱“不需要理論模型”的條件下,提供了快速、準確的流感暴發趨勢。而這一次,谷歌產品顯示的數據,與美國疾病控制中心匯總后的結果比起來,夸大了幾乎一倍!項目多數高估了類流感發病率。
遭遇了流感預測的低谷,谷歌預測再逢強敵。在今年的世界杯預測,四分之一決賽前,百度、谷歌、微軟和高盛就對世界杯四強進行了預測,結果顯示,這一次百度、微軟、高盛三家對結果進行了準確預測,而谷歌只準確預測到四強中的三支隊伍。預測結果是否準確,預測模型的構建的作用十分關鍵,正是因為微軟、高盛、百度、谷歌采用了不同的預測模型,才導致了它們之間預測結果的差異。與百度的高準確率相比,谷歌、微軟、高盛恐怕要齊齊反思下這次的失誤了。
可是,世界杯的余溫剛剛散去,百度在9月底推出的電影票房預測首次試水也遭遇了小小的尷尬。在產品上線的內測階段,百度預測《黃金時代》的票房為2.0~2.3億,10月16日,《黃金時代》的累計票房為4698萬(已上映16天),如此成績對于片方、媒體和公眾而言都是出乎意料,對于百度預測來說也是一次“烏龍”。
當今互聯網行業發展風起云涌,“大數據”炙手可熱。大數據預測的前提是承認其不確定性,有對有錯,有成有敗。我們不能因為某一次偏差,而全盤否定大數據的技術和成果。盡管這些項目目前暫時還存在缺陷,但這并不足以否定大數據對社會的潛在貢獻。任何新生事物都有一個發展的過程。大數據預測功能在各行各業的價值,有些已經順應天時地利而突顯,有些還需假以時日才能達到人們理想中的要求。我們有理由相信大數據的未來價值也會和這時代潮流一樣“bigger than bigger”。