本輪西甲,西班牙人2-1戰勝阿拉維斯,武磊再次——是的,再次——成為了whoscored評分中的全隊最低分。
對比初來乍到時的風光無限,現如今武磊的風評逐步走低,而民間輿論最核心的依據之一,就是這個whoscored的評分。
事實上,隨著現在足球數據逐步更受重視,完全免費而又賽事覆蓋極廣的whoscored,已經成為很多足球app與自媒體的主要數據工具。
然而另一方面,對武磊的評分卻又引起了巨大爭議,甚至這套之前評價過無數球員的系統,在中國大陸引發的爭議從來沒有這麼大過。
反對者認為:武磊踢球靠的是腦子,這是whoscored永遠無法評價的,甚至數據這套東西,就是分析比賽的幹擾項。
針對這個現象,我們要問兩個問題:
一 whoscored的評分到底靠不靠譜?
要回答這個問題,我們先要明白:whoscored的評分機制究竟是什麼。
當然,whoscored的網站並沒有公布具體算法,但網站給出了一個大致的解釋:該系統依據的是超過200項原始數據,用一個比較複雜的算法進行計算,在6分的起評分基礎上,或加或減,得出一個最終的分數。
熟悉whoscored的同學肯定知道:全部數據,都是圍繞著「球」在運轉,且進攻數據遠多於防守;因此,這套評分系統存在一個重大隱患:天然對球權多的球隊和球員,存在嚴重傾斜。
比如whoscored網站自身給出過一個例子:假設某球員在前場過人成功,那麼就是加分項。
然而,足球是一個22個人踢1個球的遊戲,一人持球時,其他人都是比賽內容的一部分,都在執行著教練的布置。
你只盯著球看,實際上是同教練的戰術布置完全脫節的。
甚至我們可以先不論防守,只看個人持球戲份更重的進攻,無球跑動的意義一點不比持球技術更差,有時候甚至意義更大。
這裡我先放一個動圖,大家看看轉播方意在說明什麼:
很顯然,轉播方給出了傳球路徑,武磊的跑位路線,其用意並不是強調武磊的射門,而是在說他的這次無球告訴前插跑位。
然而這個動圖如果用目前的數據記錄來表示是什麼呢?
達德爾向前送出傳球(傳球類型:progressive pass; smart pass);武磊射門,而由於這腳傳球直接導致武磊射門,所以記作達德爾的一次「key pass」(不同的數據網站,key pass的定義是不同的,這裡描述的是whoscored的key pass含義)。
數據上看,這次進攻誰收穫的好評最多?顯然是達德爾。
這其中Progressive Pass指的是向前超過一定距離的傳球(對後場、中場和前場的傳球標準不同);而smart pass則是「穿過防守人的傳球」,我們通常理解的「直塞球」,就是smart pass的一種。這兩點都是目前衡量傳球威脅性的重要指標。
武磊呢?他收穫的只是1次射門,0次射正,0次射正是什麼概念?這意味著你的射門雖然質量不低,雖然很有威脅,但在數據統計上和一腳悶到角旗區沒有任何區別……
然而,如果沒有武磊的這次跑位,達德爾的傳球能出的來嗎?
事實上,如果按照whoscored的數據統計系統,達德爾的收穫也遠遠沒有上面描述的那麼多。因為whoscored沒有progressive pass和smart pass兩項統計……達德爾的最大收穫,是一腳key pass。
whoscored的Key Pass是什麼意思?導致射門的最後一傳,換言之,武磊不射,達德爾這腳key pass也會變成普通傳球。
看到這裡諸位應該就發現問題了:這分明是一次隊友協同完成,彼此之間功勞不相上下的進攻,何以最後達德爾和武磊收穫的正面數據積累差距如此之大?
根源在於,數據統計一直在盯著球看,持球者對球的每一次處理都會被記錄在案,而引領皮球移動方向的無球跑動,則會被忽略。
我們再來看西班牙人對陣瓦倫西亞時的鏡頭,這場比賽武磊在whoscored的評分是倒數第一,也就是這場比賽,第一次導致了網絡上whoscored評分與「武腦吹」之爭:
門前搶點的那個就是武磊。這是不是好機會呢?是的。武磊收穫了什麼?如果按照whoscored的標準,答案是,區區一次觸球而已。
順便再問一個問題:這腳傳中如何?其實非常不錯;但數據記錄的是什麼呢?羅塞雷斯傳中1次,準確傳中0次,因為武磊控球失敗了。
你們說這樣的數據記錄客觀真實嗎?顯然不。
武磊繞前點的跑動非常好,沒有記錄;羅塞雷斯的傳中很有威脅,但因為武磊沒碰到球,被歸入了「傳向看臺」的那一檔。
也就是說,whoscored這套數據評分系統,完全就是一個基於不全面的有球數據統計,極度傾向於持球更多一方的評分體系。且不說每項技術統計之間的係數權重,就其現有的統計範疇,甚至連其它數據網站已有的統計細節都沒做到,還談什麼評分?
注意,這可不是單純為武磊說話,像他這一類持球較少的球員,在這個系統中相當吃虧——C羅不要說和梅西比,就連內馬爾都呈現出對他的碾壓態勢。
為何?像下面這種情況,C羅一場比賽要跑多少次?但他撈到了什麼數據嗎?並沒有。
如果C羅搶前點,曼朱基奇就可能會陷入1V3的局面中
而且,受影響的可不止是球員,whoscored這種過度傾向於持球者的打分系統,在評價球隊表現的時候,出現的問題甚至更為誇張——那些控球率低、靠防守立足的球隊,在這套系統裡簡直就是「受歧視」的存在。
以本賽季為例,西甲第4赫塔菲打到現在只丟27球,失球數之少高居聯賽前三,相反,其控球率和傳球成功率卻是整個西甲最差的,射門數相應最少,進球數也只是聯賽末段,說白了能競爭歐冠資格全靠防守。
但你能說防守不如進攻價值大麼?結果whoscored的評分硬生生給人弄到西甲第12……
再比如意甲,尤文到目前已經領先第二名17分,但7.01的評分卻根本和那不勒斯沒有檔次差距,為何?那不勒斯的踢法更強調控球和進攻,積累的正面基礎數據更多。
其實這種現象,最誇張的是瓜式巴薩如日中天的幾年:巴塞隆納憑藉恐怖的控球率在whoscored的評分系統中,簡直是霸榜。
2011-12賽季,穆裡尼奧的皇馬靠著一手防守反擊百分奪冠,結果評分第一卻是亞軍巴薩。要知道皇馬的射門數和進球數都要更多,失球也僅僅比巴薩多出3個而已。之所以造成這種情況,完全是巴薩的高傳球次數導致的。
也就是說,至少這次,決定評分的是風格,而非表現。
這些傳遞會收穫無數的「成功傳球」數據積累
這種反擊,如果沒有形成射門,那麼收穫的就是兩腳傳球和一腳失敗的傳中而已
熟悉我之前文章的朋友們可能也知道,我也會用whoscored的數據統計,然後自己做一些簡單的二次計算,但唯獨對媒體應用最廣的「評分」,我一次都沒用過……
這其實是數據應用的一個基本原則:數據當然有用,但為了避免濫用,你一定要先搞明白,這個數據是幹嘛的,至少要明白它的基本邏輯是什麼。
二 數據到底能不能客觀真實的評價武磊?
言簡意賅的給出答案吧:
不能,且永遠不能;但是,數據統計的愈發詳細,和數據分析方法論的進步,將會讓數據對武磊,對每一個球員和球隊的反映,越來越趨近於客觀真實。
如果你覺得這個答案有些太籠統,太「原則化」,那麼我換一個說法:
即便在足球數據統計不健全、系統的數據分析方法論尚不存在的今天,用比whoscored更趨近客觀真實的方法,來通過數據評價武磊,仍舊是可行的;並且,想要進一步推動這個數據統計,其實並不難。
這裡貼兩張比賽當中非常常見的動圖,大家可以體會一下,很多球隊都普遍奉行的戰術,到底是什麼樣的。
這裡要說明的一點是:下面兩張圖,按照whoscored的數據記錄,對武磊而言是十分不利的,因為這是「不成功的觸球」,是減分項。
西班牙人斜吊入禁區,武磊停球被破壞
同樣的情況,武磊禁區內接斜傳,停球被破壞
可能有不少朋友會覺得這個打法特別沒意思,就是簡單的45°傳中,屬於「沒有辦法的辦法」。
但這裡請諸位把集錦裡那些精彩配合過濾掉,想想看這樣的斜線吊球,和那些妙到巔毫的手術刀傳球,到底哪一個才是比賽中最經常出現的內容?毫無疑問是前者。
這種斜吊是不是毫無意義呢?顯然不是,我們假定武磊控制住了皮球,是不是身後插上的隊友就有接應打門的機會?是不是皮球就運行到了一個讓防守方非常難處理的區域?
當然,我不是要給武磊停球時對抗吃虧這個缺點洗白,我只是想說:這樣的戰術其實是構成一支球隊進攻套路的最基本元素之一。你可以說它最終沒打成,是武磊對抗差導致的。
但這裡我請問一點:如果武磊沒有向禁區內的跑位,是不是隊友連球都傳不成?那麼,為什麼我們一定要根據最終結果來給武磊減分,而忽視他之前的跑位呢?難道跑入禁區不是比賽內容的一部分?
你一定以為我還是在強調,whoscored的數據評分是有漏洞的。
其實,我想說的是:有一個很簡單的統計,是會把武磊的這次表現列為加分項的——至少是必須要統計到的「進攻環節」——禁區內觸球。
這其實是這兩次進攻中戰術目的的精髓所在:你製造了這些禁區內觸球,才有可能談得上後續的對對方球門的威脅。
武磊的禁區內觸球什麼水平?每90分鐘3.8次,西班牙人隊內毫無爭議的第一!並且在本輪之前,他是西班牙人唯一一個禁區內觸球進入西甲前30的球員。
當然,事實上這個數據仍舊不甚完善,因為武磊這樣的踢法,有時候會造成下面這種情況:
武磊沒碰到球,但幹擾了門將
你說上面這球,武磊有沒有功勞?太有了,他插前點的選擇其實是最有威脅的,無論是從效果上,還是從戰術理論上看,武磊在這次進攻中都扮演了不可或缺的作用。
但他收穫了什麼技術統計嗎?並沒有。
但是不是數據層面永遠無法解決這個問題呢?也不一定——
我們只需要引入一個「跑入禁區」,或者「禁區內球門方向移動」的統計就行了。當然,這個數據可能存在漏洞,但樣本足夠大、差距足夠大的話,仍舊能夠說明很多問題。
事實上做到這點並不難,因為目前是有「向前移動」的數據統計的,只不過統計的是持球的移動,wyscout將之稱為「progressive run」。而反映無球狀態的數據,才是opta這些基礎數據供應商下一步的努力目標。
而且這裡必須要指出一點:數據的作用不僅僅是反映出「誰好誰不好」,它首先表現的是一個球員的風格。
比如倘若有「禁區內向球門方向移動」這個統計,我們就可以量化一些我們每天都在吹跑位的球員,其跑位風格究竟是什麼樣的。這裡貼一個圖:
注意C羅在進球前的跑位
C羅在進球之前做了什麼?其實就是一件事——直插禁區。這件事看似簡單,但實際上能做到的人並不多,否則……皇馬也不用琢磨著賣貝爾了……
為什麼要放這個圖?因為如果引入「禁區內向球門方向移動」這個統計,完全可以把C羅的這次進球描述的更全面;為什麼要描述C羅的跑位?看看下面這張圖就知道了:
武磊也是一樣的跑位目標,區別只是在於沒碰球
這是本輪西班牙人的第二個進球,武磊沒有撈到任何數據,但他做的其實和C羅之前做的完全一樣——就是直插禁區,奔著球門去。
我當然不是說武磊和C羅一個級別,但這裡要強調的是:兩個人在某種意義上,在風格上具備一定的重合度。那麼,加入我們引入一個「禁區內向球門方向移動」的數據統計,是不是能更好的量化這一類型風格的球員呢?
數據沒能客觀反映武磊的價值,不是數據本身的問題,而是數據統計需要一個進步過程。
事實上在這方面,數據甚至具有一定的先驗意義。
早在武磊確定加盟西甲之時,我就多次在新聞回覆中提到:西班牙人是一支踢法極度追求冒險的球隊,他們的Progressive pass和smart pass佔傳球總數的比重極高,有點「西甲利物浦」的味道,然而禁區內觸球頻率卻很少。
而武磊在中超的數據則表明,他恰恰最善此道。不考慮水平差距的話,二者的結合對彼此而言都是最佳選擇——所以,數據進階性越強,就越能幫助我們。
結語: 我們當然不能迷信數據,但「武腦吹」,真的合適嗎?
再次直接給出答案吧:無論whoscored的評分有多麼不靠譜,現階段的「武腦吹」,即便在戰術讀場層面,也有些過分了。
最主要的表現有兩點:一是對足球場上每天都在發生的事大書特書,然而這些內容不是武磊再做,是所有人只要上場都會做。比如下面這張圖,被說成是「武磊深知收回拳頭再打人」的道理,沒有一味求快,而是選擇回傳:
武磊回傳
武磊做的對不對?當然對。
但這是一個相當常見的選擇,僅以西班牙人為例,這賽季西甲他們場均回傳56.81次,從中找出一些前鋒不急於進攻的鏡頭一點不難,比如這次伊格萊西亞斯的回傳:
伊格萊西亞斯回傳
第二個問題則是賦予一些明明目的非常明確、單純的跑位以某種特殊色彩,使之看上去像是日本動漫裡的「技能」。比如下面這張圖:
傳說中武磊的「蛇形跑位」……
這是讓「武腦吹」達到最巔峰的一球,跑位路線被稱之為「蛇形跑位」……
然而,這個跑動的意義其實就是簡單的兩點:1,從邊路到中路,在更靠近對手球門的位置接球;
2,為了避免越位,先往回跑一點,壓住倒數第二名防守球員。
換言之,如果武磊第一時間沒有越位,或者他人就在中路,那他根本就不需要跑出來這麼一個「蛇形」……
武磊的跑位是很好,但非要冠之以這麼個稱謂,是不是有點強行拔高的意思?
歸根結底,武磊所做的並不高大上,他只是在按照足球場上非常簡單而又質樸的道理,盡力體現自身的戰術價值而已。
而早晚有一天,數據能夠體現出這些價值,那不僅是武磊的福音,也是所有這一類球員——如C羅、因扎吉、小豌豆等等這些人的福音。
(文:唯心)