今年有一句流行語“在大數據面前,你連底褲都不剩”。而足球絕對是世界上運用大數據最領先、最成功的領域。就在剛剛結束的巴西世界杯,包括百度、微軟等互聯網巨頭紛紛透過大數據業務,預測出了相當部分球賽結果。有人甚至大膽評價:在大數據面前,互聯網公司完勝高盛、德銀為代表的華爾街。2014年世界杯將成為一個新起點:大數據業務正式從單純的技術走入日常生活的實際應用。
用什么模型很關鍵
今年世界杯沒有“章魚帝”,但有央視美女主持“烏賊劉”和大數據公司的“對賭”。最終理工男設計的數學模型打敗了央視美女的好運氣,央視體育頻道主播劉語熙在預測中敗給了百度。
據記者了解,2014年巴西世界杯期間,百度,微軟、谷歌等國內外技術巨頭和大投資銀行高盛、德意志銀行乃至彭博等,均推出了大數據預測。
互聯網公司方面,除了雅虎,幾乎全面大勝。百度、微軟、谷歌預測正確了全部的16強(谷歌只預測了八強),以及八強;微軟、百度對了全部的四強,谷歌在四強的預測中惜??;在半決賽中,百度和微軟甚至還準確預測了巴西對德國的賽果。而本來一向預測準確的雅虎,今年被認為為推廣業務而亂用模型,才導致預測結果錯誤大半。
相反,高盛、德銀和彭博三家傳統的華爾街公司則錯得離譜。今年高盛世界杯報告的出品人是大經濟學家凱文·戴利(Kevin Daly),他帶領高盛的量化分析師建立了自1960年以來正式國際足球比賽數據的模型,對其進行回歸分析。但高盛的八強預測錯了三個(哥斯達黎加、比利時和哥倫比亞),四強錯了一個(西班牙),小組賽的賽果正確率只有37.5%。
彭博的方法與高盛類似,是在各國國家隊FIFA積分的基礎上,模擬了1萬次比賽結果,結果也與高盛類似,彭博認為西班牙會在和阿根廷打平后點球進入決賽,最終輸給巴西,但實際情況則是西班牙早已回家。
德意志銀行的模型更離譜,它的模型據說綜合了FIFA排名、歷史戰績、球員構成和賭球賠率等因素,計算結果是巴西無緣8強,而英格蘭將奪冠。
今年或成大數據元年
業內分析認為,受云計算能力的局限,高盛、德銀、彭博為代表的華爾街公司采用的數據并不夠龐大,是導致他們計算錯誤的主因。其實回顧往屆世界杯,幾大投行的預測都是瞎猜。上一屆大摩說英格蘭會奪冠,瑞銀說意大利能進四強,與實際結果均差距甚遠。
“大數據最缺的不是技術,而是應用。”艾媒咨詢董事長張毅說。而業內普遍認為,隨著對大數據業務的發掘,2014年世界杯將成為國內大數據業務正式成熟的起點。
據百度相關人士介紹,目前,百度大數據已經在旅游、教育、賽事產業進行了多次嘗試,部分產品有望在年內實現商業化。繼世界杯之后,百度大數據預測還將相繼推出票房預測、房地產預測、金融預測、中小企業指數預測等一系列產品,并在9月中旬的時候推出預測開放平臺,最大程度地開放百度在大數據領域的數據和技術能力,推動整個大數據行業的快速發展。百度還剛剛從谷歌大腦挖來了人工智能三位頂級專家之一吳恩達,并宣布“百度大腦”已經達到2~3歲智力。
鏈接
世界杯預測準確率
百度:預測在16場世界杯淘汰賽,僅在3、4名決賽中失手,最終取得16場15中的成績,預測準確率為93.75%。而今年頻頻爆冷的小組賽階段,百度對比賽結果的預測準確率也達到了58.33%。
微軟:微軟成功預測出世界杯淘汰賽16場比賽全部勝負結果。它甚至在巴西對德國半決賽之前,就預言到德國人將在巴西人主場橫掃主隊。而今年頻頻爆冷的小組賽階段,微軟得出56.25%的準確率。
高盛:高盛預測巴西將捧杯笑到最后,現在我們看當然知道高盛的預測錯得離題。經計算,高盛對本次世界杯的預測準確率只有34%。
觀點
大數據不可盡信
有本地經濟學者則向記者表示,大數據系統再強大,也無法避免“黑天鵝”事件的出現。經濟學博士陳龍認為,由于世界杯這種頂尖賽事,球員都是最頂級的球員,發揮失常的概率非常低,大數據才有可能配備上用途。“但如果是更復雜的經濟估算,大數據系統失敗的風險就高得多。”
“實際上每一場國際足球賽背后都有巨大的賭博集團在操控,大數據不能全信,否則你會輸得很慘。”有本地資深球迷則向記者表示。