上個月,當葡萄牙超級巨星C羅在曼聯對紐卡斯爾的比賽還剩18分鐘時被罰下場,他臉上的愁容登上了國際新聞的頭版頭條。但他絕非唯一有這種情緒的人。很少有球員認同主教練用新球員替換他們的決定。
在此次卡塔爾世界杯足球賽期間,球員們將有一種更科學的方式來爭取上場時間。在終場哨響后的幾分鐘內,賽事組織者將向每位球員發送一份詳細的表現明細。例如,中鋒的傳球、帶球和射門表現;以及當對方控球時,防守隊員對對方的搶斷頻率和程度數據等。
這是數字對這場競賽的完美加持。現在,數據分析有助于指導一切,從球員轉會到訓練強度,到瞄準對手,再到建議最佳射門點等等。
與此同時,足球運動員還面臨著航天員級別的數據審查強度。可穿戴背心和肩帶可以感知運動,用GPS追蹤位置,并計算每只腳的射門次數。攝像機從多個角度捕捉一切,從頭球得分到球員持球時間。為了讓這些信息有意義,大多數精英足球隊現在都雇傭了數據分析師,其中包括數學家、數據科學家以及從頂級公司和實驗室——比如計算巨頭微軟和歐洲核子研究中心(CERN,位于瑞士日內瓦附近的歐洲粒子物理實驗室)——挖來的物理學家。
作為回報,分析人士的見解正在改變比賽的進行方式:中鋒遠距離射門的頻率減少,邊鋒傳球給隊友而不是傳中(cross),教練癡迷于提高球場控球權——這些戰術轉變都有確鑿證據來支持教練的直覺。
德國科隆體育大學的體育科學家丹尼爾·梅默特(Daniel Memmert)表示,“大數據開創了足球的新時代。它改變了球隊的理念和行為,改變了他們分析對手的方式,改變了他們培養人才和發掘球員的方式。”
覆蓋所有項目
關于數據如何改變體育運動,最著名的案例之一來自一項不同的比賽。邁克爾·劉易斯(Michael Lewis)在2003年出版的《點球成金(Moneyball)》一書中詳細描述了奧克蘭運動家隊(Oakland Athletics)的經理比利·比恩(Billy Beane)是如何依靠球員數據在2002年以極低的預算打造了一支獲勝的棒球隊。據悉,Beane根據球員表現的詳細數據招募球員,包括以前被低估的測量值,比如擊球手上壘的頻率。
Memmert表示,“通過利用數據,Beane獲得了極大的優勢。不過,足球要比棒球復雜得多。棒球是一種自然的‘停止-開始’(stop–start)游戲,在同一時間只有一支球隊試圖得分,而且幾十年來,棒球統計數據一直被例行收集和大規模研究。相比之下,足球是一種移動的、得分低的‘入侵’游戲,而且要記錄誰做了什么以及它如何影響結果也困難得多。”
幾十年來,足球統計學家傾向于關注進球數和失球數,并尋找一種方法對它們進行建模來進行預測。這種方法的變種至今仍被用于預測比賽結果。英國牛津大學開發了一個數學模型,該模型假設進球數和丟球數分布在一個平均值附近,并正確預測了意大利將在2020年歐洲杯上擊敗英格蘭。它還正確判斷了8個進入1 / 4決賽的選手中的6個。
這樣的成功案例并不罕見。牛津大學的博士生馬修·佩恩(Matthew Penn)也曾開發了一個2020年歐洲杯的模型,他說,統計匹配預測比許多人意識到的更準確。對于正在進行的卡塔爾世界杯,Penn的模型顯示,比利時最有可能捧得冠軍獎杯,其次是巴西。
誰將贏得世界杯?
根據一種“雙泊松”(double Poisson)統計模型,考慮到各男子足球隊的攻守實力,比利時奪冠幾率最高,而巴西則在FIFA排名中位列第一。
模型排名 |
獲勝幾率(%) |
FIFA排名 |
1.比利時 |
13.88 |
1.巴西 |
2.巴西 |
13.51 |
2.比利時 |
3.法國 |
12.11 |
3.阿根廷 |
4.阿根廷 |
11.52 |
4.法國 |
5.荷蘭 |
9.65 |
5.英格蘭 |
6.德國 |
7.24 |
6.意大利 |
7.西班牙 |
6.37 |
7.西班牙 |
8.瑞士 |
5.29 |
8.荷蘭 |
9.葡萄牙 |
3.78 |
9.葡萄牙 |
10.烏拉圭 |
3.36 |
10.丹麥 |
11.丹麥 |
3.17 |
11.德國 |
12.英格蘭 |
2.56 |
12.克羅地亞 |
13.波蘭 |
2.33 |
13.墨西哥 |
14.克羅地亞 |
1.46 |
14.烏拉圭 |
15.墨西哥 |
0.67 |
15.瑞士 |
完美球場
對教練來說,更有趣的是球場上發生的事件以及球員如何影響事態走向。
足球分析家一直在記錄這類信息。最成功的是,前皇家空軍會計師查爾斯·雷普(Charles Reep)花了20世紀50年代的大部分時間在英格蘭觀看比賽,并對球場位置和傳球順序等因素進行了基本觀察。Reep甚至用他的數據來分析球隊的表現,并提出策略和戰術建議。在伍爾弗漢普頓流浪者足球俱樂部(FC),他甚至幫助引進了一種直接而犀利的打法,這種打法不允許橫傳,成功助力球隊在五年內贏得三次聯賽冠軍。
現代技術使這些數據的獲取和分析變得非常容易,以至于大多數頂級俱樂部和許多國家隊在十多年前就開始聘請數據分析師。目前,它的用途已經延伸到足球金字塔的深處。在攻讀博士學位的同時,Penn還在牛津城(Oxford City)俱樂部擔任兼職數據分析師。牛津城是一家半職業俱樂部,在英國足球體系的第六梯隊國家南部聯盟(National League South)中踢球。
許多分析人士將倫敦俱樂部布倫特福德(Brentford FC)最近的成功部分歸功于一種內部算法,該算法為不同聯賽的球員打分,并幫助球隊招募被低估的球星。利物浦足球俱樂部的數據團隊——包括曾在歐洲粒子物理研究所和英國劍橋大學工作的物理學家——已經建立了一個模型,可以評估球員在球場上的動作是否更有可能進球。去年,葡萄牙里斯本大學的體育科學家與西班牙豪門巴塞羅那足球俱樂部合作,發表了一份分析報告,分析了比賽中不同類型的傳球機會能持續多久。
Penn表示,“我認為我們(在牛津城俱樂部)做的最有用的事情是賽前報告。我們觀察其他球隊球員的屬性,然后繪制一些圖表來顯示他們的比賽和控球情況。之后,我會針對性地提出一些戰術建議或改變。在最近一場對陣‘霸主’球隊的比賽之前,我們的分析發現該球隊左后衛的頭球數據很糟糕。所以我建議讓我們的大中鋒站在球場的右側。最終,牛津城俱樂部贏得了比賽。”
當然,一些有經驗的偵察員用肉眼也能觀察到這些結果。但Penn認為,“數據提供的結果偏見性要比人為見解少得多”。
俱樂部不需要自己生成這些戰術分析的原始數據。相反,他們可以從商業公司那里購買信息,這些公司用視頻記錄了約3000個主要比賽事件的結果,包括運球、傳球和搶斷。起初,這些數據是手動記錄的,但現在通常使用一種名為計算機視覺的人工智能來完成。通常情況下,這些數據帶有匯總的統計數據,比如每個球員的完成率。
喬安娜·馬克斯(Joanna Marks)是英國華威大學數學專業的本科生,今年早些時候,她與牛津城俱樂部的Penn合作,開發了一個模型,利用這些原始數據來評估牛津聯賽中所有球員的傳球強度——這種詳細的分析通常無法從公司提供的原始數據中獲得。
Marks解釋稱,“你需要考慮到他們的傳球方式。你不能只看完成率,因為有些傳球要難得多。這種模式有助于球隊做好準備,因為如果你知道對手在球場的某個區域傳球很好,那么你就知道應該注意什么。”
拉維·拉米內尼(Ravi Ramineni)曾是微軟的一名數據分析師,2012年調往美國職業大聯盟(MLS)俱樂部西雅圖海灣人(Seattle Sounders)擔任類似的工作。他的首要任務之一是使用GPS數據記錄球員跑了多遠,以優化他們的訓練和準備過程。
他解釋稱,“在訓練期間收集這些數據,你可以看出今天的訓練可能太多或太少,這樣可以避免球員受傷。當我們運用這些方法的時候,我們確實有了一個非常完美的賽季。”
鏡頭之外的行動
分析人士現在越來越關注球員沒有球權時會發生什么。
Ramineni解釋稱,“在足球分析中,你總會聽到一件事,那就是我們需要知道球員在無球狀態下做了什么。”
這更困難,因為它需要專門的攝像機,不僅要跟蹤主要行動,還要密切關注那些沒有直接參與的球員,并以每秒25次的速度標記他們的位置。
Ramineni補充道,“提供這類數據的公司傾向于與國家聯賽簽訂獨家協議,這使得外來者很難獲得數據。這樣一來,如果我從南美或歐洲為美國足球大聯盟物色一名國際球員,那么我將無法獲悉他們的無球率(off-the-ball)指標。”
近年來,出現了一種更強大的技術,它利用人工智能來預測拍攝比賽中球員的動作,即使他們沒有被攝像機直接捕捉到。這意味著數據公司可以使用比賽的直播畫面(不受限制)為世界上任何地方的球員提供全面的有球和無球分析。
谷歌旗下、總部位于倫敦的人工智能公司DeepMind的研究人員與利物浦FC3的數據團隊合作開發了這樣一個預測模型。
利物浦足球俱樂部的研究主管伊恩•格雷厄姆(Ian Graham)稱,“有了這種應用程序,你就可以開始提出戰術問題。對于比賽中的一個特定事件,該模型可以生成數千個不同的模擬結果,以預測可能發生的情況。所以,你有能力談論在那段時間的比賽中,一個進攻動作進行得有多好。”
俱樂部的數據團隊傾向于不分享他們正在做什么或工作效果如何的具體信息,所以公布這項工作對利物浦來說是充滿挑戰的一步。但這是與Deep Mind合作的一個條件。
Graham表示,“利物浦擁有足球界最大、最發達的分析部門之一,但我們自己卻沒有建立這些模型所需的任何資源(其他俱樂部也一定做不到),所以只能與Deep Mind合作開發這一模型。”
和其他數據分析師一樣,Graham并不認為自己是球場上取得勝利的“功臣”。他認為,“足球是一種瞬息萬變的游戲,所以球隊經常會在不該輸的時候輸,在不該贏的時候贏。在很多時候,當球隊表現不佳時,我們的工作更容易,因為我們的分析可以幫助他們踢得更好。如果我們保持這樣的表現,我們將贏得本賽季預期的比賽數量。”
DeepMind公司計算機科學家卡爾•圖爾斯(Karl Tuyls)表示,鏡頭外(off-camera)建模工作是創建一個虛擬的、由人工智能驅動的助理教練的第一步,該助理教練使用實時數據指導足球和其他運動的決策。他表示,“你可以想象,AI看到上半場的表現后,會建議改變陣型,這樣可能會做得更好。這種方法在球場之外也很有用,比如在繁忙的城市街道上為自動駕駛汽車和行人的軌跡建模。”
接下來該怎么做?和所有優秀的科學家一樣,研究足球數據的專家強調,仍需要進行更多的研究。前微軟數據科學家莎拉•路德(Sarah Rudd)去年離開了阿森納俱樂部(Arsenal FC),此前他在這家倫敦俱樂部從事了近10年的分析工作。現在,她對賽車產生的海量遙測數據十分垂涎,這些數據可以幫助車隊調整和提高賽車性能。
她表示,“我經常看F1,并且總是想著我們足球也能有如此高水平的數據就太好了。目前,足球界仍然有很多東西沒有被衡量,或者它正在被衡量,只是我們還沒有弄清楚如何從中得出見解而已。”
下一個進步可能是數據顯示球員的方向,甚至他們如何轉移重心。Rudd認為,“跟蹤數據可能還沒有達到人們想要的細粒度。我們還沒有注意到球員為了讓防守者失去平衡或給守門員‘虛晃一槍’而采取的假動作。”
即使是利物浦俱樂部的人工智能驅動的分析也可能會被這種行為所迷惑。Graham表示,“該模型可能會顯示這個球員出現異常行為,在本該跑的時候并沒有做出預期動作。但那可能是因為他被絆倒了,正躺在球場上。”
隨著現代足球被數據淹沒,數字如何改變了比賽?
Ramineni認為,“數據分析帶來的最大好處可能體現在球員招募方面。另一個領域則是定位球的策略,即球隊在比賽暫停后獲得任意球。”
從數據分析中得到的一個明確的教訓是,球員不應該在距離球門很遠的時候射門。Ramineni解釋稱,“如果你觀看世界上任何一個聯賽,十年前球員射門的距離要遠得多。這一切改變都得益于從事數據分析的人強調,‘你為什么要從那里射擊?只有2%的機會!’”
他補充說,許多球隊現在也不鼓勵球員嘗試向禁區長傳,因為數據顯示大多數傳中都是無意義的。
最后,Ramineni認為,隨著生成的數據量不斷增長,應用場景也會不斷增加。現在,數據足跡已經遍布整個體育界,也將改變整個體育界的運行方式。
關于企業網D1net(hfnxjk.com):
國內主流的to B IT門戶,同時在運營國內最大的甲方CIO專家庫和智力輸出及社交平臺-信眾智(www.cioall.com)。同時運營18個IT行業公眾號(微信搜索D1net即可關注)。
版權聲明:本文為企業網D1Net編譯,轉載需注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。