算出你的跑動

2021-02-18 摩緒奴



摩緒奴按:小時候看日本動畫片《加油!吉塔斯》(がんばれ!キッカーズ,又譯《足球小將》,勿與大空翼那部混淆),有一集大戰計算機隊,看時驚慌,其餘感覺已記不清楚。豈知北原小學有一個大地翔。漫畫首刊於 1984 年,又豈知三十年後,這個情節一點也不讓人驚慌了。

麻省理工學院斯隆商學院體育分析學大會(MIT Sloan Sports Analytics Conference),由斯隆商學院校友、NBA 休斯敦火箭隊總經理達瑞爾·莫雷和傑西卡·蓋爾曼於 2006 年創立。

本文發表於 2016 年度大會(3 月 11 至 12 日,波士頓會展中心)。

原文:Analyzing In-Game Movements of Soccer Players at Scale @ sloansportsconference.com

作者:László Gyarmati, Mohamed Hefeeda @ Qatar Computing Research Institute, HBKU

譯者:摩緒奴


感謝 RosarioVonLi @ FCB1899.net 審稿

感謝 Amaris @ FCB1899.net 製圖

《對足球運動員比賽中跑動的大數據分析》

一,導言

過去十年,對運動員表現的量化分析,成為主流。倩全新技術,分析的焦點漸趨於競技層面的測量。這些系統測量運動員的動作,以及訓練和比賽中的一舉一動。既然可對職業運動員進行更細化的評估,自然牽涉諸如偵察對手,計劃訓練,考察運動員等領域。

前人對足球領域記錄的分析,聚焦在球員和球隊場上的表現。這些方法論的絕大多數,把精力放在捕捉球員一部分策略的描述性數據上。例如,足球中,會有對球隊和球員平均射門數、進球數、犯規數、傳球數的統計 [見參考文獻 1,5]。其他研究則識別、分析各支球隊所採取策略的結果 [見參 18,16,13,11,9,24,14]。然而,對身體表現,尤其是球員的跑動,所作分析尚未細化。

接觸與足球運動員身體表現相關的數據源,殊為不易。各支球隊將此等信息視作高度機密,涵蓋比賽中的表現時尤甚。儘管多支球隊在球場內設置了球員追蹤系統,此類數據源仍不開放給研究及公眾之用。獲取一項比賽中所有球隊的身體表現量化信息,幾無可能。因此,大多數對球員表現的分析與評估,不包含許多比賽中身體方面的信息,使之成為表現分析中的盲點。

本文即通過對足球運動員跑動特徵的提煉,呈現一種解決該問題的全新方法。我們使用數據提供商覆蓋 50 餘個聯賽的事件型數據源,無任何大筆投入,便可分析幾萬名球員的跑動檔案。我們的方法論,不需要昂貴、專用的球場內球員追蹤系統。只要比賽轉播,我們的方法論即可使用。所以,我們的技術不需要所涉及球隊的同意,卻能為不同球隊眾多球員的身體表現,提供洞見。

我們的研究,有以下三層主要貢獻:

1. 我們提供了一種提取球員跑動特徵的方法論;

2. 我們計算球員之間的相似性,以此識別某位球員的潛在替代者;

3. 我們量化了球員在比賽中跑動的獨一性和穩定性。

目力所及,我們的研究是用大數據聚焦足球運動員跑動的先行者,它從事件型數據源中,為足球產業提煉了全新的,可操作的洞見。

二,勾勒跑動的挑戰

如上文所示,我們的方法論並非以大數據,直接量化足球運動員的跑動。此問題的核心在於,我們可能採用的數據源的屬性。在足球產業中,應用有三個主要的數據採集方法論:事件型,追蹤型,可穿戴傳感器。我們簡要描述一下此三類方法論牽涉球員跑動分析的屬性。

第一,事件型數據源闡釋了比賽中最重要的,與球相關的事件。此方法基於比賽視頻源的呼應,依靠人力操作,描述比賽。儘管數據提供商運用質量保障技術(如:多名操作人闡釋比賽,最終數據源由投票多數而定),此方法依然易發生人為錯誤。儘管如此,為加強球迷的比賽體驗,其數據源依然廣泛用於媒體。另一方面,其數據源又接近實時,數據生產也不需要在球場中設置任何專用系統。

第二,追蹤型數據源包括球員跑動和皮球移動的高精度細節。數據由專用的,準確放置的攝像鏡頭生成。再經光學追蹤算法,從視頻中提取軌跡;然而有一些場景(如:球員相撞),仍需操作人監督。最近一份研究表明,不同的追蹤系統,會存在不一致,如,一名球員的運動軌跡可能只在幾米之內 [見參 12]。此項技術的一個主要缺點,便是它要在球場內放置一個系統。因此,收集此類數據必須經過主隊許可。而若有人想分析一項賽事所有球員的跑動,就應該徵得所有球隊同意(通常還有聯盟)。此乃用大數據分析身體表現的一項主要障礙。

第三,可穿戴傳感設備收集球員跑動的精細數據源 [見參 8,20,4]。傳感器捕捉球員的移動,加速和變速等等。此項技術最近已由國際足聯決議,可在比賽中應用 [見參 7]。2015 年 7 月,允許球員在正式比賽中穿戴傳感設備。然而,最近的一些研究也發現,此種設備的精確度和穩定性,亦有差池,因而此類數據應當謹慎使用 [見參 3]。應用此項技術,還有一個更關鍵的問題:數據源僅收集一支球隊球員的信息,球和對方球員的細節卻缺失。這便阻礙了不同球隊球員之間的比較,以及對球員的戰術分析。

回顧現有的數據採集技術,可見任何用大數據量化評估球員跑動的研究,均非易事。如本文所示,事件型數據源可用來處理這個問題,並提供球員跑動的洞見。下一章將介紹我們的方法論。

三,方法論

本章介紹我們的方法論,它提取球員的跑動,隨之建立其跑動特徵。我們的最終目的,是基於跑動特徵,量化球員之間的相似性,即他們在一個賽季中所採取的跑動。下面的描述及分析,皆採用事件型數據源。

3.1 數據源

我們使用由 OPTA 生成的 2012-13 賽季西甲的事件型數據源 [見參 17]。它包括傳球,射門,盤帶,搶斷等足球比賽中的所有主要事件。例如,該數據源有超過 30 萬腳傳球,接近 1 萬腳射門。它還包括以上事件發生的時間,位置以及所涉球員。因此,就可能提煉出球員跑動的粗糙時間序列 [見參 10]。在此說明,數據源中的時間描述精度為 1 秒。

3.2 跑動向量的提取

我們用一個七參數向量來描述每一次跑動:(x1,y1,x2,y2,T,s,b)。一次跑動在時間 T,位置(x1,y1)開始,以速度 s 進行,在位置(x2,y2)結束,b 代表控球。如此,我們總共提取了該賽季中 542 名球員的 660848 次跑動的向量。無論在數量還是屬性上,球員在一個賽季中的跑動千差萬別——每名球員的跑動平均數為 1219 次(多可至 4998 次),所有跑動的平均距離為 19.4 米(遠可至 100 米)。我們在「圖 1」中展示了三名球員在同一場比賽中經提取的跑動。此圖顯示了球員意圖跑向的區域,揭示了其在球隊中的角色。例如,沙維主要在中場活動,並有一些高強度跑動(示以紅箭頭)。梅西的活動偏向右路,五次衝入對方禁區(指向禁區內的箭頭)。克裡斯蒂亞諾·羅納爾多則在左路活動,其跑動距離更長。這便是我們方法論的第一步:提取球員的跑動向量。在此說明,我們使用的事件型數據源,在球員位置的採集上較為稀疏,即,只有當一名球員涉及了與球相關的事件,他所在的位置才會被記錄下來(這是數據採集過程的後果:對比賽的闡釋,基於一直聚焦在皮球周圍的電視轉播。)。因此,一名球員所涉兩個事件的時間跨度,短可至數秒,長卻可至幾分鐘。




圖 1:從事件型數據源中提取的同一場比賽中三名球員的跑動向量。箭頭顏色代表跑動速度(綠為慢,紅為快)。球隊進攻方向為由左至右。

在建立跑動向量時,我們把足球場大小不必一樣的因素也考慮在內。足球規則中有一項很有趣,即場地尺寸並不規定一致,即使是國際比賽,亦有設計足球場的餘地。根據第一部足球規則,場地長度應在 100 至 110 米之間,寬度應在 64 至 75 米之間 [見參 6]。現如今,則有一項標準化方案讓大多數新建球場的尺寸設計成 105 × 68 米 [見參 22]。西班牙在這方面也不例外,埃爾切的主場尺寸為 108 × 70 米,閃電巴列卡諾的球場則只有 100 × 65 米大 [見參 15]。

我們採用的另一項數據準備技術,與處理數據源中的傳球有關。對傳球來說,我們對傳球者有一個完整的數據點(即時間戳和位置),然而,數據源卻不包括對接球者的時間戳。為克服這一問題,並豐富所提取的時間序列,我們使用了前一事件的時間戳,即球的傳出。如「參考文獻 10」中所述,這是預計中的最佳方法。

3.3 跑動特徵的建立

我們的目標,是提取能讓我們比較球員表現,分析其場上角色穩定性以及整個賽季狀態的跑動特徵。球員的向量數目天差地別,為此,我們採用了下面的方法論。第一,在所有球員的所有向量中,我們提取最相關的跑動向量 K。我們利用分批處理 K 平均算法(mini-batch K-means clustering)[見參 19],決定這些特點:質心的移動代表向量屬於一個特定聚簇。我們採用這個方法,而非為各個位置建立坐標,以獲得平滑、平衡的聚簇(以免在網格圖中使各個聚簇中的向量呈現高偏斜度)。本文通篇設定,K = 200。第二,在一名球員的每次跑動中,我們決定它所屬的聚簇,即我們計算出最相似的特點向量(feature vector)。在「附錄」中,我們展示出一些特點向量覆蓋的例子,即哪些跑動向量屬於一個特定的特點向量(見圖 8)。第三,我們統計一名球員採用每種特點向量的次數,由此建立一個各種特點的頻率向量。最後,我們用這名球員的跑動總數,將這些頻率歸一化。通過歸一化,我們得到了這名球員的跑動特徵。作為示例,我們在「圖 2(a)」中展示了梅西最常採用的 50 個跑動方向。該圖揭示了梅西傾向於在前場採取短距離跑動,而他的中長距離跑動則從右路開始。




圖 2:整個賽季梅西最重要的 50 個跑動方向。箭頭越粗,該類跑動採用頻率越高。依賴於這些跑動,此方法論揭示了梅西身體表現的萬千變化。

過濾第一組跑動向量,我們便可聚焦在球員的特點跑動上。其中一個這樣的過濾器,是控球。球員帶球時如何移動,是關鍵中的關鍵。為聚焦於此,我們在一名球員拿球時決定所有事件的組合(即跑動的起始和終止事件應該是拿球狀態)。像搶下球,斷下球和接傳球這樣的事件,標誌球員拿球狀態下跑動的起始,即球員與球一起移動。相反,如果一次跑動的第一個事件是傳球,這名球員在這次跑動向量中就沒有控球了。過濾之後,我們建立了球員的特點向量和特徵向量(characteristic vector)。我們在「圖 2(b)」中展示了梅西最重要的控球跑動特徵。當梅西控球時,有六條主要線路(示以粗箭頭)。所有這些跑動,都位於剛過前場的中路。

另一方面是跑動速度:快速跑動大體發生在比賽重要事件的同一地方。我們設立了跑動速度的門檻,即至少應達到 14 公裡/小時(約為 3.9 米/秒)。這與在足球產業中廣泛應用的標準契合 [見參 23,2]。「圖 2(c)」展示了梅西的高速跑動:既有他在中場最常採取的特點,也有他如何接近並進入對方禁區的傾向。

3.4 獨一性與穩定性

跑動特徵的一個主要應用,是找到或可替代某名球員的相似者。我們會在後文識別候選者,來替代一些球員,某些相似處第一眼看去,令人驚嘆。然而,這並非我們能從檔案中獲取的惟一洞見。球員的跑動特徵,讓我們可以量化球員的兩項額外的關鍵素質:獨一性和穩定性。為此,我們用餘弦相似度來測量兩名球員之間的差距。獨一性測量找到有相似跑動的球員的難度。我們使用從整個賽季提煉出的跑動特徵,每名球員我們設定 M 個最相似的特徵(我們的評估中 M = 5)。通過識別與特定球員距離最近的球員(即最小餘弦距離的球員)完成。用 di j = D (ci , cj) 表示球員 i 與球員 j 之間的餘弦距離,ci 表示球員 i 的跑動特徵。我們用以下公式計算球員 i 的獨一性:


測量範圍為 (0, M),值越高,一名球員就越獨特。為了比賽中的跑動,可對獨一性測量進行歸納:在此情況下,測量的是每場比賽中的跑動特徵的差距,而非整個賽季。

若一名球員的跑動難以複製,則是好事。然而,貫穿整個賽季的穩定表現同樣重要。我們用球員在比賽中的跑動特徵評估它。用 t = 1, ... , N 表示一名球員出場的比賽,表示球員 i 在比賽 k 中的跑動特徵。球員 i 在比賽 k 中的穩定性由其跑動特徵的平均成對差距(average pairwise distance)定義:


穩定性的範圍為 (0, 1)。如果穩定性數量 C 小,球員整個賽季中的跑動就越相似,即整個賽季中可以看到同一種跑動。

四,實證結果和洞見

下面,我們用 2012-13 賽季西甲的數據源,實驗我們的方法論。首先,我們來識別相似球員,然後,我們研究球員的獨一性和穩定性。最後,我們在方法論可以提煉的新洞見下,開闢一個額外的領域:與創造進球機會相關的跑動。

4.1 相似性

我們在球員整個賽季的所有跑動中提煉出其跑動特徵,由此決定其相似性。在「表 1」中,我們為梅西,克裡斯蒂亞諾·羅納爾多和沙維各自找出了五名與其最相似的球員。此名單,或許可視作今後替代他們的候選名單——至少基於他們的比賽跑動。此表包括了球員之間的差距。我們也列出球員的市場價值,作為參考。市場價值均為 2013 年 6 月賽季結束時德國網站 Transfermarkt 估計 [見參 21]。一些比對結果直截了當,像梅西與薩維奧拉,沙維與蒂亞戈。然而,克裡斯蒂亞諾·羅納爾多的名單很有意思。按照我們的方法論,與羅納爾多最相似的球員是皇家貝蒂斯的魯本·卡斯楚。我們在「圖 3」中闡明二人的跑動的相似性。該圖展示了二人常採取的特點向量及其頻繁程度。二人非常相似,儘管卡斯楚沒羅納爾多實力強,市場價值上也是雲泥之別(1 億歐元和 450 萬歐元)。這個例子點出了我們方案的首要好處:我們能依照著名球員的模板,找到與其有相同跑動模式,身價卻僅是其幾分之一的球員。

#球員差距市值(萬歐元)利昂內爾·梅西  -  巴薩120001哈維埃爾·薩維奧拉  -  馬拉加0.155
3002拉達梅爾·法爾考  -  馬德裡競技0.15860003迭戈·博納諾特  -  格拉納達0.1742004奧巴費米·馬丁斯  -  萊萬特0.1803505恩裡克·德-盧卡斯  -  維戈塞爾塔0.19350克裡斯蒂亞諾·羅納爾多  -  皇家馬德裡100001魯本·卡斯楚  -  皇家貝蒂斯0.0794502安託萬·格裡茲曼  -  皇家社會0.08915003埃爾德爾·波斯蒂加  -  皇家薩拉戈薩0.1255004豪爾赫·莫利納  -  皇家貝蒂斯0.1273505霍納森·比埃拉·拉莫斯  -  瓦倫西亞0.132300沙維  -  巴薩15001蒂亞戈·阿爾坎塔拉  -  巴薩0.06922002薩米·赫迪拉  -  皇家馬德裡0.109
22003盧卡·莫德裡奇  -  皇家馬德裡0.11335004伊格納西奧·因薩  -  維戈塞爾塔0.116905丹尼埃爾·帕雷霍  -  瓦倫西亞0.1221000

表 1:與梅西,克裡斯蒂亞諾·羅納爾多和沙維最相似的五名球員及其市場價值



圖 3:克裡斯蒂亞諾·羅納爾多和與其最相似者魯本·卡斯楚的 50 大跑動特點。二人非常相似,市場價值卻是雲泥之別。

4.2 獨一性

下面來看球員的獨一性,即,球員在整個賽季中能夠執行相同跑動的難度。在獨一性上,我們僅把整個賽季至少有 500 次跑動的球員考慮在內,以避免出場過少帶來的偏差。我們在「表 2」中展示了西甲十名最獨特的球員。作為參照,我們把十人在賽季中的總跑動次數也列出來。十人中大多數,是打過相當長時間左右兩路的後衛。例如,巴薩的阿德裡亞諾既踢左邊後衛,又踢右邊後衛。梅西在人們眼中是一名獨特的球員,我們的排行榜中他位列第八,足以說明。我們在「附錄」(見圖 9)中示以這十人最顯著的特點向量。

球員
獨一性
跑動次數阿德裡亞諾·科雷亞1.246
2067馬丁·蒙託亞1.0211485弗蘭科·巴斯克斯0.978659
丹尼爾·拉爾森0.974738
奧耶爾·桑胡爾霍·馬特0.9212209
胡安·託雷斯·魯伊斯0.892
743
塞爾吉奧·拉莫斯0.876
2957
利昂內爾·梅西0.8603809
魯本·加西亞·桑託斯0.8481148
恩裡克·德-盧卡斯0.842611

表 2:西甲中最獨特的十名球員。結果揭示,難以替代可以踢多個位置(比如左右兩路)的球員。

4.3 穩定性

下面再進一步,來看跑動穩定性。各支球隊的經理偏愛表現穩定的球員。表現穩定,跑動就符合預期。相反,難以指望跑動飄忽不定的球員。分析西甲的趨勢之前,我們先用「圖 4」中的一個例子,展示沙維整個賽季跑動的穩定性。橫軸為他出場的比賽,縱軸為他的穩定性。看看沙維在賽季的大多數時間裡是多麼穩定。賽季初和賽季末的兩個離群值,他都替補出場。我們在「圖 5」中展示了比賽 10,比賽 12,比賽 23 的跑動向量。(譯註:沙維全賽季出場 30 次,首發 24 次,替補 6 次,踢滿全場 17 次,共出場 2193 分鐘;數據來源:laliga.es)該圖展示了相似的軌跡。沙維在中場有不少邊路跑動,向對方禁區也有高強度的跑動,同時他負責踢角球。也正如前面「圖 1(a)」中所示,沙維在對陣皇家馬德裡時也是這麼踢。在比賽 23 中,沙維的跑動相似,然而,他未踢滿全場,造成比賽穩定性價值稍欠。


圖 4:沙維整個賽季的穩定性。其跑動絕大多數時間相似且穩定,兩個離群值是他替補出場時。




圖 5:三場比賽中沙維所有的跑動向量。跑動趨勢相似。

最後,我們從獨一性和穩定性兩方面來分析西甲球員(見圖 6)。大體上,後衛的表現穩定,但他們之間不易區分。中場與前鋒之間則無明顯差別。倒是兩個屬性之間有清晰關係:獨一性越高,則穩定性越差。該數據源中有三個離群值,奇怪,都是巴薩球員。作為後衛,阿德裡亞諾極其獨特,即同與其最相似的球員還是有很大差別,其表現亦不穩定(穩定值為 0.75)(譯註:阿德裡亞諾全賽季出場 23 次,首發 18 次,替補 5 次,踢滿全場 9 次,共出場 1432 分鐘;數據來源:laliga.es)。伊涅斯塔的跑動極其穩定(穩定值為 0.40)(譯註:伊涅斯塔全賽季出場 31 次,首發 24 次,替補 7 次,踢滿全場 15 次,共出場 2093 分鐘;數據來源:laliga.es),也相當獨特(獨一值為 0.78)。梅西則是前鋒中的異數,兼具高獨一性(0.86)和高穩定性(0.30)(譯註:梅西全賽季出場 32 次,首發 28 次,替補 4 次,踢滿全場 27 次,共出場 2627 分鐘;數據來源:laliga.es)。梅西的跑動與克裡斯蒂亞諾·羅納爾多大相逕庭,後者在跑動獨一性(0.55)和穩定性(0.51)上似乎只是一個平常人(譯註:克裡斯蒂亞諾·羅納爾多全賽季出場 34 次,首發 30 次,替補 4 次,踢滿全場 25 次,共出場 2717 分鐘;數據來源:laliga.es)。


圖 6:西甲球員的獨一性和穩定性。紅色代表後衛,綠色代表中場,藍色代表前鋒。三個位置的異數分別是阿德裡亞諾,伊涅斯塔,梅西(譯註:克裡斯蒂亞諾·羅納爾多的顏色疑為誤標,應為藍色)。

4.4 創造機會

用我們的方法論,可以提取球員所有的跑動。因此,我們或許該關注球員與比賽特定事件相關的跑動。這為用大數據分析創造進球機會的跑動的研究,打開了一扇新的大門。這裡,我們僅用兩個例子,來點出這個領域的潛力。

「圖 7(a)」揭示了梅西在射門前的跑動。在這些區域裡,梅西能夠創造進球機會。為進入前場,射門得分,他有三條主要線路:在禁區左側直插(譯註:棕黃色箭頭),從中場對角線跑向禁區邊緣,從右路啟動對角線插入禁區。我們注意到,這些跑動中相當一部分是高強度跑動。

大多數情況下,進球機會不是一名球員獨自創造的,而是整支球隊一系列精心跑動的成果。如「圖 7(b)」所示,用我們的方法,也可以一窺其貌。該圖顯示一支球隊在射門前 20 秒內的跑動。不同顏色代表不同的球員。五名球員高速跑動,全部直插向對方禁區。這一球中,球員的目標是壓迫對方後衛線,而不是打開空間。

這些洞見僅僅是完整的,用大數據理解球員跑動與進球機會之間關係的初探。此現象的全面分析是未來的工作。


梅西在射門前的跑動(顏色代表跑動速度)


一支球隊在一次射門前的跑動(顏色代表不同球員)

圖 7:本文方法論的額外應用:創造進球機會的洞見。

五,結論

本文對足球運動員一整個賽季的跑動進行了量化分析。我們的方法論揭示了在球隊比賽戰略方面的,球員角色及表現的細化洞見。我們在特定球員及其潛在替代者之間找出了相似性。我們的成果揭示並量化了球員的跑動,為考察球員及偵察對手領域提供了有價值的訊息,在所涵蓋球隊和球員的數量上,前所未見。

參考文獻:

[1] Chris Anderson and David Sally. The Numbers Game: Why Everything You Know about Football is Wrong. 2013.

[2] Jens Bangsbo, Lene Nørregaard, and F Thorsoe. Activity profile of competition soccer. Canadian journal of sport sciences= Journal canadien des sciences du sport, 16(2):110–116, 1991.

[3] Martin Buchheit, Adam Allen, Tsz Kit Poon, Mattia Modonutti, Warren Gregson, and Valter Di Salvo. Integrating different tracking systems in football: multiple camera semi-automatic system, local position measurement and gps technologies. Journal of sports sciences, 32(20):1844–1857, 2014.

[4] Catapult. http://www.catapultsports.com/benefits/performance-analysis/. 2014.

[5] Jordi Duch, Joshua S Waitzman, and Luís A Nunes Amaral. Quantifying the performance of individual players in a team activity. PloS one, 5(6):e10937, 2010.

[6] FIFA. Laws of the Game. 2014.

[7] FIFA. Approval of Electronic Performance and Tracking System (EPTS) devices. 2015. URL http://resources.fifa.com/mm/document/affederation/administration/02/66/27/

59/circularno.1494-approvalofelectronicperformanceandtrackingsystem(epts)

devices_neutral.pdf.

[8] GPSports. http://home.gpsports.com. 2014.

[9] Laszlo Gyarmati and Xavier Anguera. Automatic extraction of the passing strategies of soccer teams. Proc. ACM KDD Workshop on Large-Scale Sports Analytics, 2015.

[10] Laszlo Gyarmati and Mohamed Hefeeda. Estimating the maximal speed of soccer players on scale. In Proc. Machine Learning and Data Mining for Sports Analytics Workshop, 2015.

[11] Laszlo Gyarmati, Haewoon Kwak, and Pablo Rodriguez. Searching for a unique style in soccer. In Proc. 2014 KDD Workshop on Large-Scale Sports Analytics, 2014.

[12] Ian Graham. Data Analysis at Liverpool FC. FC Barcelona Sports Technology Symposium, 2015.

[13] Patrick Lucey, Dean Oliver, Peter Carr, Joe Roth, and Iain Matthews. Assessing team strategy using spatiotemporal data. In Proc. 19th ACM SIGKDD. ACM, 2013.

[14] Patrick Lucey, Alina Bialkowski, Mathew Monfort, Peter Carr, and Iain Matthews. 「quality vs quantity」: Improved shot prediction in soccer using strategic features from spatiotemporal data. MIT Sloan Sport Analytics Conference, 2015.

[15] Marca. Cual es el campo mas grande de la Liga? 2014.

[16] Takuma Narizuka, Ken Yamamoto, and Yoshihiro Yamazaki. Statistical properties of positiondependent ball-passing networks in football games. arXiv:1311.0641, 2013.

[17] OptaPro. http://optasportspro.com. 2014.

[18] Javier López Peña and Hugo Touchette. A network theory analysis of football strategies. arXiv preprint arXiv:1206.6904, 2012.

[19] David Sculley. Web-scale k-means clustering. In Proceedings of the 19th international conference on World wide web, pages 1177–1178. ACM, 2010.

[20] STATSports. http://www.statsports.ie. 2014.

[21] Transfermarkt. Market values. 2013. URL http://www.transfermarkt.com.

[22] UEFA. Guide to Quality Stadiums. 2014.

[23] Di Salvo Valter, Collins Adam, McNeill Barry, and Cardinale Marco. Validation of prozone®: A new video-based performance analysis system. International Journal of Performance Analysis in Sport, 6(1):108–119, 2006.

[24] Qing Wang, Hengshu Zhu, Wei Hu, Zhiyong Shen, and Yuan Yao. Discerning tactical patterns for professional soccer teams: An enhanced topic model with applications. In Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, KDD 』15, pages 2197–2206, New York, NY, USA, 2015. ACM.

附錄:







圖 8:對一些特點向量(總數 200 個)的覆蓋。聚簇的區域並不一樣,因而,球場最重要的部分,其細節處理精度更高。











圖 9:十名最獨特的球員的跑動特徵


如果覺得有意思,請分享本號至朋友圈

相關焦點

  • 無球跑動的能力,正是你足球智商的體現
    正確地閱讀比賽,不僅僅體現在你接球的時候知道下一步怎麼傳,其實在你接球之前,你無球狀態下的跑動,跑到合適的位置去接應,已經說明你在正確地閱讀比賽了,接下來的身體方向調整、停球、擺脫、加速、過人等等,都是根據你接球的場區來決定的。所以說,無球跑動的能力,正是你足球智商的體現!
  • 無球跑動的魅力所在
    一.什麼是無球跑動顧名思義,無球跑動就是在「無球」的狀態下進行「跑動」。
  • 凱西場均跑動10.82千米,是米蘭場均跑動最多的球員
    直播吧8月16日訊 據義大利媒體米蘭新聞網統計,本賽季米蘭防守型中場凱西場均跑動10.82千米,這一數據在米蘭隊中佔據首位。根據米蘭新聞網的統計,凱西場均跑動10.82千米,是米蘭隊中場均跑動最多的球員,這一數據部分反映了凱西本賽季的表現。本賽季凱西為米蘭出戰38場比賽,攻入4粒進球並送出2次助攻。(木子)
  • 小聶:您來說說,跑動中呼吸技巧真的有那麼重要嗎?
    和實際的技術運用關係不大,你根本就不需要考慮或去練習。在不同的配速下,你的呼吸節奏和技術,都能對應那些研究結果。自然產生的東西,幹嘛還要花時間去刻意考慮呢?也就是說,無論是3到3,2到2,2到1或是1到1,這些呼吸速率都是你在不同配速下跑動的自然結果,算不上什麼技巧。你跑慢一點自然就是3到3或是2到2,如果你以均勻加速的方式到自己的最大配速奔跑,自然也就是2到1和1到1的呼吸速率。
  • 看無球跑動!技巧君來教你
    在NBA的典型例子是納什時代的太陽,納什持球,其餘的人進行無球跑動,颳起了一陣小球風熱潮。如果防守者很積極,必然會干擾我們接球,那麼,我們該怎樣給自己爭取到接球的空間呢——keep moving!(好熟悉的一句話啊,哈哈)像雷吉·米勒、漢密爾頓、雷·阿倫這些投手,都具備一項技能,就是不知疲倦地跑動。當然了,無球跑位絕對不是盲目地跑,無球跑位也是一門學問。
  • 打假中超聯賽APP:跑動數據錯漏百出,球員0分鐘跑一萬米,神仙?
    尤其跑動距離是多少?球迷們根據客觀的數據來探討和分析比賽,其樂無窮。有一款叫中超聯賽的APP,在球迷們之間普遍受歡迎,因為只有這款APP上可以免費的看到球隊和部分球員的跑動數據。然而,隨著查閱次數的增多,筆者逐漸發現這款APP上的有關跑動距離的部分,數據似乎有些問題。今天筆者仔細對前四輪和前五輪的數據做了對比,結果大跌眼鏡!
  • 無球跑動 隱蔽的實力
    數據統計上體現不到,但是在比賽中有隊員進行無球跑動,其他隊員會感到很舒服,壓力變小就、空間變大。          中場隊員具備好的無球跑動能力,控制的區域就非常大,進可攻退可守,前後串聯。有效無球跑動的隊員在這個球隊中不可或缺。也許數據不那麼顯眼,在為隊友扯開防線時自己得分助攻不多,但是起到的作用同樣重要。
  • 【好波世界】何輝:利物浦的轉會運作模式算唔算高明?系歐洲算唔算前列?
    今天何輝將會聊聊 利物浦的轉會運作模式算唔算高明?系歐洲算唔算前列?
  • 足球意識 | 學會大師級的無球跑動,成為球隊的核心
    今天為大家分享在比賽時如何無球跑動的幾個要點,喜歡的小夥伴記得分享給朋友,共同提高!在一場比賽中,每個球員在90%以上的時間都在進行無球跑動,不論這些跑動是傾向於進攻還是防守,只要掌握以下這幾個要點,你就會踢出一場高質量的比賽。對於鋒線球員而言,跑位拉扯對方後防線互相配合是非常重要的。比如中鋒向側翼跑位,為邊鋒內切創造空間;
  • 6種無球跑動訓練,增強你的爆發力和敏捷性
    今天,我們將為大家介紹6種無球跑動訓練,這項訓練對每名球員的跑動爆發力和敏捷性很有幫助。第一個標誌盤作為起點,先跑到第二個標誌盤,然後向後倒退,接著衝刺跑向最後一個標誌盤。兩名速度相差較小的球員為一組,其中一名球員盡力通過跑動擺脫另一名球員完成「衝關」。
  • 魯能學霸半場7次失誤,不積極跑動聯絡老大哥,上限最多金敬道
    對陣深圳魯能學霸段劉愚半場就高達7次失誤,跑動也不算積極,與前場隊友連線不默契,照此發展上限最多金敬道水平。要不是U23身份保護,根本無法出場,成長之路不容樂觀!2、這張很典型,後面推前面搶,根本不給你機會。對手很會研究魯能學霸的特點,不改進會越來越難。
  • 【每日籃球技巧教學】無球跑動技巧!!
    像雷吉·米勒、漢密爾頓、雷·阿倫這些投手,都具備一項技能,就是不知疲倦地跑動。當然了,無球跑位絕對不是盲目地跑,無球跑位也是一門學問。如果是一對一落位的情況下,可以向中鋒一樣卡位要球,當然也可以通過跑動來拉出空間,可以這樣:
  • 中超球員跑動距離排名,您認為誰的跑動對球隊貢獻最大?
    中超前10輪球員跑動距離TOP10:在前廣州恆大的保利尼奧可能是中超最好的B2B型球員,進可攻、退可守,持續的跑動,讓他為球隊奉獻了7粒進球和數次成功防守在跑動距離這項數據中,除您認為哪名球員的持續跑動價值最大,對球隊的貢獻最高呢?
  • 教程 | 幾種無球跑動訓練,想防住我?不存在的!
    在業餘球場上,大家最缺乏的就是無球跑動的能力,通過無球跑動創造出額外的時間和空間,從而達到進攻或組織的目的。
  • 小聶:跑動中控制發力點的意義,一個視頻告訴你
    在跑動中控制發力點,這是一個看似簡單、但真正運用起來非常困難的技巧。我們經常遇到的那些理論家就是非常典型的反面例子:表達理論知識的時候往往可以口若懸河滔滔不絕,聽上去貌似很有道理。然而,真正跑起來,你會發現他們的動作和他們的理論表達大相逕庭,現場就會比較尷尬。這是為什麼呢?
  • 貝巴談『懶散』球風:球員很聰明且球感出色時,就不用怎麼跑動
    保加利亞人表示,這是因為他自己踢球很聰明,所以不怎麼跑動。訪談主持人:「你(貝爾巴託夫)擁有令人難以置信的第一球感,埃裡克(坎通納)也是如此,他擁有出色的視野和傳球。埃裡克在球場上也不怎麼跑動,你讓球做了該做的工作,那也是埃裡克的踢球方式。」貝爾巴託夫:「那就是為什麼有時候你問我,一些人認為我在球場上很『懶散』的球員,我(的回答)。
  • 籃球對抗強度高,足球跑動距離長,到底哪個更累?答案你可能不信
    籃球對抗強度高,足球跑動距離長,到底哪個更累?答案你可能不信生活當中,每個人都有自己喜歡的體育項目,有人喜歡羽毛球,有人喜歡籃球,當然也有人喜歡足球,對於籃球和足球,這2項受眾群眾非常廣泛的運動,不管到哪一個地方,我們都能找到籃球和足球的球迷,然而對於籃球和足球,我們更好奇,籃球對抗強度高,足球跑動距離長,到底哪個更累?答案你可能不信!
  • 索爾斯克亞:曼聯的特點就是永不放棄;卡瓦尼的跑動是頂級的
    關於比賽半場的時候,我相當平靜,重要的是你不能再丟一球,同時需要先進一球。在這樣的比賽中,進球還會出現。本場比賽,我們肯定有5到6次明顯的進球機會,因此,我們需要在獲得機會時抓住它們。關於卡瓦尼當然,他發揮出非常棒的作用,他是一位想要在禁區內比賽的9號位球員,他總是在跑動,他想要搶在對方的身前,我對他的表現感到非常滿意。無論是在訓練場、更衣室還是午餐時間,卡瓦尼都很細緻,他知道想要吃什麼以及需要恢復到怎樣的程度。他在場上的跑動是頂級的,對於時機的把握非常棒。
  • 足球的基本素養05:如何進行無球跑動?做到這三點你會完全不同
    給隊友一個好的傳球角度與三步原則相同,這個建議的目的仍然是為了讓你能夠給隊友製造一個好的傳球角度。作為一個無球跑動球員,你隨時可能會接到隊友的傳球,因此當你想要持球的時候,你最好能夠為隊友提供一個足夠好的傳球角度。
  • 為什麼梅西跑動這麼少,在轉會市場卻如此搶手,還擁有六座金球
    ,然後更精細化地分析球員的跑動效率、覆蓋區域、技戰術能力。體能是一切技術的基礎,你以為哈維、伊涅斯塔離開巴薩是因為技術水平不行了嗎?我鬥膽再硬生生舉個例子,02年國足打巴西還踢了半場好球呢,只是下半場體力跟不上才被踢爆的,至於現在的國足,踢的都是養生足球,節奏一快,根本適應不了。