經(jīng)歷過(guò)上屆南非世界杯的球迷一定記得“章魚(yú)保羅”這個(gè)名字,這只八爪魚(yú)在南非世界杯上“成功預(yù)測(cè)”了德國(guó)勝澳大利亞、加納輸給塞爾維亞的小組賽賽果。在2008歐洲杯和2010世界杯兩屆大賽中,預(yù)測(cè)14次猜對(duì)13次、成功率飆升至92%,甚至還與球王貝利針對(duì)德國(guó)與阿根廷的比賽進(jìn)行了世紀(jì)“預(yù)測(cè)”大對(duì)決。
一只章魚(yú),被媒體和球迷們消費(fèi)到這個(gè)程度,其實(shí)無(wú)非是體育結(jié)果預(yù)測(cè)在背后吸引人們的注意力。但是把一只章魚(yú)的游走方向和體育比賽的結(jié)果聯(lián)系到一起,無(wú)論如何都讓人覺(jué)得…… 有點(diǎn)荒謬。但是考慮到體育比賽從某種程度上有娛樂(lè)的成份在內(nèi),其實(shí)也就可以理解了。那么怎樣的體育結(jié)果預(yù)測(cè)手段才是科學(xué)的呢?
大數(shù)據(jù)分析。
今年的世界杯,再拿小動(dòng)物做文章就說(shuō)不過(guò)去了。提到分析預(yù)測(cè),所有人都知道這是大數(shù)據(jù)的強(qiáng)項(xiàng)。就拿谷歌公司的大數(shù)據(jù)預(yù)測(cè)平臺(tái)來(lái)說(shuō),已經(jīng)成功預(yù)測(cè)了巴西世界杯16強(qiáng)比賽每場(chǎng)比賽的結(jié)果,也就是說(shuō)世界杯8強(qiáng)全部命中。
谷歌的做法是搜集來(lái)自O(shè)pta Sports的海量賽事數(shù)據(jù),通過(guò)球隊(duì)實(shí)力的排序模型,以及基于“各個(gè)國(guó)家球迷到巴西的數(shù)量和熱情度”的主場(chǎng)優(yōu)勢(shì)模型,來(lái)構(gòu)建其最終的預(yù)測(cè)模型。而微軟則與百度類似,是在歷史和球隊(duì)狀態(tài)數(shù)據(jù)基礎(chǔ)上,通過(guò)對(duì)必發(fā)博彩交易市場(chǎng)數(shù)據(jù)來(lái)分析構(gòu)建預(yù)測(cè)模型。
還有更絕的,第一場(chǎng)半決賽——巴德之戰(zhàn)前,當(dāng)幾乎所有的民間預(yù)測(cè)都一邊倒地傾向于巴西隊(duì)獲勝,但百度仍預(yù)測(cè)德國(guó)隊(duì)具有51%的得勝概率,事實(shí)證明日耳曼戰(zhàn)車以7:1血洗巴桑軍團(tuán)。百度在淘汰賽以來(lái)的賽果預(yù)測(cè)準(zhǔn)確率是100%。
百度的做法是搜索過(guò)去5年內(nèi)全世界987支球隊(duì)(含國(guó)家隊(duì)和俱樂(lè)部隊(duì))的3.7萬(wàn)場(chǎng)比賽數(shù)據(jù),同時(shí)與中國(guó)彩票網(wǎng)站樂(lè)彩網(wǎng)、歐洲必發(fā)指數(shù)數(shù)據(jù)供應(yīng)商Spdex進(jìn)行數(shù)據(jù)合作,導(dǎo)入博彩市場(chǎng)的預(yù)測(cè)數(shù)據(jù),建立了一個(gè)囊括199972名球員和1.12億條數(shù)據(jù)的預(yù)測(cè)模型,并在此基礎(chǔ)上進(jìn)行結(jié)果預(yù)測(cè)。
可見(jiàn),谷歌和百度所做的,就是搜集數(shù)據(jù),再基于這個(gè)數(shù)據(jù)建立預(yù)測(cè)模型,之后的事情交給機(jī)器去做就可以了。
交給機(jī)器去做的事情,看似簡(jiǎn)單,只需要敲幾下鍵盤(pán),但其實(shí)卻是最難的。這就和足球比賽一樣,教練在場(chǎng)下指揮,但是真正在場(chǎng)上拼命的,是揮汗如雨的球員。
IT 業(yè)界認(rèn)為,大數(shù)據(jù)的精準(zhǔn)分析不僅有賴于數(shù)據(jù)資源的擴(kuò)充,更要基于大數(shù)據(jù)引擎的發(fā)展進(jìn)步。還是用足球比賽舉例,教練再好,球員不夠強(qiáng),再好的戰(zhàn)術(shù)也贏不了比賽。多么精密的預(yù)測(cè)模型,沒(méi)有足夠強(qiáng)悍的大數(shù)據(jù)引擎做支撐,終歸也只能是紙上談兵。
出色的球員代表著強(qiáng)健的體魄,快速的反應(yīng)能力和更好的體力,出色的硬件設(shè)備則需要更強(qiáng)的計(jì)算能力、更快的傳輸速度和更穩(wěn)定的系統(tǒng)運(yùn)行時(shí)間。用英特爾公司高級(jí)副總裁兼數(shù)據(jù)中心事業(yè)部總經(jīng)理柏安娜 (Diane Bryant)的解釋,就是能夠“利用數(shù)據(jù),獲取洞察,獲得優(yōu)勢(shì)”的英特爾服務(wù)器。
強(qiáng)悍的大數(shù)據(jù)引擎,加上谷歌和百度工程師的聰明才智,就有了體育預(yù)測(cè) 100% 準(zhǔn)確率。
這才是科學(xué)的。
為了鼓勵(lì)更多人參與數(shù)據(jù)分析預(yù)測(cè),英特爾還聯(lián)手?jǐn)?shù)據(jù)挖掘競(jìng)賽平臺(tái)Kaggle舉辦了“March Madness Learning Mania”(瘋狂三月,意即NCAA籃球最激烈的賽期)比賽,讓參賽者通過(guò)數(shù)據(jù)分析更精準(zhǔn)地預(yù)測(cè)每場(chǎng)和本年度賽事結(jié)果。英特爾的考慮 是,通過(guò)使它的大數(shù)據(jù)技術(shù)更便宜、有效、簡(jiǎn)單,使數(shù)據(jù)信息更有價(jià)值,不僅能幫助人們?cè)陬A(yù)測(cè)賽事比賽結(jié)果時(shí)更富勝算,甚至還會(huì)為新型科學(xué)技術(shù)和商業(yè)模型的研發(fā)創(chuàng)造更多的便利條件。
數(shù)據(jù)分析如果只是應(yīng)用在體育娛樂(lè)上,用章魚(yú)做文章或許并無(wú)大礙,畢竟只是一場(chǎng)游戲而已。但如果是商業(yè)或其他領(lǐng)域的預(yù)測(cè),或許就沒(méi)有那么輕松和隨性了,畢竟,沒(méi)有一個(gè)公司愿意聽(tīng)一只章魚(yú)做出來(lái)的預(yù)測(cè)。那太可笑了。
章魚(yú)保羅,這個(gè)只會(huì)在水里游來(lái)游去的小家伙。2010年8月23日章魚(yú)保羅竟然成為英格蘭2018年世界杯的申辦大使!不幸的是,僅僅兩個(gè)月后,10月25晚,它就在德國(guó)的奧博豪森水族館去世,享年2歲半。
德國(guó)奧博豪森水族館的工作人員為悼念章魚(yú)保羅的去世,在外墻上的大幅保羅海報(bào)掛上了黑布,工作人員也陸續(xù)在悼念冊(cè)上簽名。這……
你說(shuō)趁著新鮮的時(shí)候,把它烤著吃了,多好。