據(jù)中國之聲《新聞縱橫》報道,時間過的飛快,眼看著世界杯就只剩下四場比賽了。過去的一個月里,除了看球、評球,恐怕很多人的樂趣都在預(yù)測、競猜上。而要說到世界杯預(yù)測,過去大家最為熟悉的無非是兩張面孔。一個是負(fù)面典型——挺誰誰輸?shù)?ldquo;烏鴉嘴”球王貝利;另一個是正面典型——幾乎是百發(fā)百中的章魚保羅。
可是,如今貝利偶爾也能蒙對了,章魚保羅則駕鶴西去了,在世界杯預(yù)測的圈子里,似乎失去了領(lǐng)軍人物。不過沒關(guān)系,今年的世界杯,一眾互聯(lián)網(wǎng)企業(yè)群雄并起,通過他們的官方平臺,比如搜索引擎或者語音工具,你可以提前獲知他們的預(yù)測結(jié)果。而拿著“大數(shù)據(jù)分析”的現(xiàn)代化武器的他們,也的確成了名副其實(shí)的預(yù)測帝。比如,谷歌預(yù)測中了所有的16強(qiáng)席位;百度和微軟則是淘汰賽階段一場不錯。他們有著怎樣的秘訣?
今年的世界杯,除了各國球迷、博彩公司、彩票玩家,看球時最緊張的,恐怕要數(shù)各家企業(yè)的大數(shù)據(jù)工程師了。從互聯(lián)網(wǎng)行業(yè)的谷歌、百度、微軟、雅虎,到投資銀行公司高盛和德意志銀行,包括新聞業(yè)的彭博社,都想爭當(dāng)一把科技保羅。
但截止目前,當(dāng)之無愧的科技保羅只有三家:谷歌、百度和微軟。前半段,谷歌的工程師們心情最好,通過其云計算平臺,16強(qiáng)全部猜對。此后的淘汰賽,他們也只猜錯了德國和法國的賽果。相較之下,一場一場猜結(jié)果的百度和微軟工程師們在小組賽表現(xiàn)平平,48場比賽,百度的正確率是58.33%,微軟也只有56.25%。不過到了淘汰賽,百度和微軟揚(yáng)眉吐氣,截止目前的14場比賽場場命中。
大數(shù)據(jù),是工程師們的共同武器,但是刀槍棍棒又有不同。微軟(亞洲)互聯(lián)網(wǎng)工程院人工智能組曹川博士表示:
曹川:會遇到歷史上所有的對戰(zhàn)結(jié)果,以及預(yù)選賽的情況、他們的狀態(tài),這是大的方面。然后還會考慮博彩公司的盤口,因?yàn)樗麄儠M(jìn)行非常復(fù)雜的,比如針對球員狀態(tài)的分析,我們可以利用各個博彩公司的數(shù)據(jù)進(jìn)行綜合。
如曹川所說,他們運(yùn)用一個特別復(fù)雜的數(shù)據(jù)模型,賦予不同的參數(shù)不同的系數(shù),得出最終的結(jié)論,當(dāng)基礎(chǔ)數(shù)據(jù)不足時,就會更多的依仗博彩數(shù)據(jù)。與微軟類似,百度官方資料顯示,他們的工程師整合分析了過去5年內(nèi)全世界987支球隊(duì)的3.7萬場比賽數(shù)據(jù),在加上對469家歐賠公司的賠率數(shù)據(jù)分析等等,構(gòu)建起最終的數(shù)據(jù)模型。百度公關(guān)部張麗媛表示:
張麗媛:通過球員球隊(duì)賽事基礎(chǔ)數(shù)據(jù)進(jìn)行分析需要更加詳細(xì)、詳盡的海量球員數(shù)據(jù),因此,賠率數(shù)據(jù)僅僅是現(xiàn)階段球隊(duì)球員賽事基礎(chǔ)數(shù)據(jù)整合過程中的一個階段性解決方案,未來更加精準(zhǔn)的預(yù)測模型,一定還是圍繞球隊(duì)球員賽事基礎(chǔ)數(shù)據(jù)來構(gòu)建模型的。
相較之下,谷歌更加依賴這些所謂的基礎(chǔ)數(shù)據(jù)——球隊(duì)實(shí)力的排序模型、以及各個國家球迷到巴西的數(shù)量和熱情度構(gòu)建的球隊(duì)主場優(yōu)勢模型。博彩公司被他們拋在了一邊。微軟曹川對此表示:
曹川:這是他們做的一個很有意思的嘗試。用盤口的話很多人的因素就進(jìn)去了,不用盤口的話,就純粹是用歷史上的數(shù)據(jù)。
實(shí)際上,不僅在體育場外,大數(shù)據(jù)已經(jīng)滲透到了體育的方方面面。比如近年來一直表現(xiàn)搶眼的德國隊(duì),今年就擁有一個大數(shù)據(jù)的新型武器——他們和早在NBA數(shù)據(jù)統(tǒng)計領(lǐng)域取得豐富經(jīng)驗(yàn)的SAP公司共同研發(fā)的球員數(shù)據(jù)采集和分析軟件。
在這套軟件中,球員的運(yùn)動軌跡、進(jìn)球率、攻擊范圍等數(shù)據(jù)都會通過飛速運(yùn)算而得以呈現(xiàn),之后教練會針對球員的表現(xiàn)提出建議和改進(jìn)方案,對手的情況也能被數(shù)據(jù)化的掌握。
大數(shù)據(jù)如何商業(yè)化,是一個爭議頗多的話題。舉一個生活中已經(jīng)廣泛使用的例子就是,電商企業(yè)能夠根據(jù)大數(shù)據(jù)精準(zhǔn)的向你推薦商品,或者在促銷日選出最受關(guān)注的產(chǎn)品。
由此來看,無論對于谷歌、百度、還是微軟,預(yù)測世界杯,只是一個能力的展臺,他們的野心絕不僅僅如此。
百度在其官方回應(yīng)中表示,百度大數(shù)據(jù)已經(jīng)在旅游、教育、賽事產(chǎn)業(yè)進(jìn)行了多次嘗試,部分產(chǎn)品有望在年內(nèi)實(shí)現(xiàn)商業(yè)化。百度公關(guān)部張麗媛:
張麗媛:繼世界杯之后,百度大數(shù)據(jù)預(yù)測還將相繼推出票房預(yù)測、房地產(chǎn)預(yù)測、金融預(yù)測、中小企業(yè)指數(shù)預(yù)測等一系列產(chǎn)品,并在9月中旬的時候推出預(yù)測開放平臺,最大程度地開放百度在大數(shù)據(jù)領(lǐng)域的數(shù)據(jù)和技術(shù)能力。
再比如微軟,實(shí)際上,他們此前也預(yù)測過奧斯卡、美國選舉……成績也都頗為不俗,微軟(亞洲)互聯(lián)網(wǎng)工程院人工智能組曹川博士說,大數(shù)據(jù)的意義在于,成為人類決策的參考,而將大數(shù)據(jù)能力開放出來,也的確是所謂商業(yè)模式的發(fā)展方向。
曹川:比如有些公司不具備這樣的能力,就可以提供這樣的服務(wù)。這肯定是一個趨勢,就是我給你提供一些分析的方法、分析的平臺。
不過,從目前來看,大數(shù)據(jù)的隱私風(fēng)險仍然有待評估、分析預(yù)測能力也還遠(yuǎn)未完善。比如,2013年,谷歌對于流感的預(yù)測與美國疾病控制中心匯總后的結(jié)果相比,就夸大了幾乎一倍。如何用好大數(shù)據(jù),仍然是一個需要人類長時間研究的課題。
放眼當(dāng)下,即將開始的決賽,百度預(yù)測日耳曼戰(zhàn)車將以58%的勝率最終問鼎大力神杯,微軟也于昨夜給出了同樣的結(jié)果。不過微軟在語音助手中還說道,在一場精彩的比賽中,什么都有可能發(fā)生。你會相信他們嗎?