作者:Ramy Elitzur
編譯:清華大學體育產業發展研究中心 姜本橋
如欲閱讀原文,全文見於:
Rotman School of Management, University of Toronto, Toronto, Ontario, M5S-3E6, Canada
在過去二十年中,數據分析的使用在職業體育,商業和政府中得到了重新崛起。這種復甦歸功於魔球理論(Moneyball),它讓讀者了解了高級棒球數據分析,以及它如何改善球員的選擇和比賽管理。本研究首先研究的問題是,與棒球數據分析相關的分析內容知識是否在競爭激烈的美國職業棒球大聯盟(MLB)市場中提供了任何優勢。第二個研究問題是,一旦這種專有知識公之於眾,戰略優勢是否能夠持續下去。首先,我們確定了數據分析團隊和高管,即依賴棒球數據分析的人員,並跟蹤他們的薪酬/績效。接下來,使用計量經濟學模型,分析這些團隊和經理是否比其他人員享有薪酬表現優勢,以及在信息公開後這種優勢是否仍然存在。
研究簡介
數據分析被定義為「廣泛使用數據,統計和定量分析,解釋和預測模型,以及基於事實的管理來推動決策和行動」。體育數據分析的早期(也是最著名的)應用之一是比利比恩(Billy Beane)在奧克蘭運動家隊(Oakland Athletics)使用的高級棒球統計數據和賽伯計量學,以幫助球隊在競爭激烈的美國職業棒球大聯盟(MLB)市場中脫穎而出,並寫成了暢銷書《魔球》(Moneyball)。該書導致了數據分析使用的復興。這本書的重要性還可以通過術語「魔球」(Moneyball)這個詞已經成為日常詞彙的一部分來證明。
魔球理論的影響及其受歡迎程度遠遠超出了體育文化。這本書銷量超過一百萬本,隨後在2011年被拍成了電影(點球成金)。電影由布拉德皮特出演比利比恩,並獲得六項奧斯卡獎提名,包括最佳影片和最佳男主角。這本書使運籌學(Operations Research)的重要性得到了證實,魔球理論的結果也受到了了企業和政府部門的熱烈歡迎。此外,數據分析對管理科學作為一門學科的重要性得到了證明,對商業數據分析的使用提出了專門的特殊要求。
本文主要研究的是在競爭性的很強的美國棒球大聯盟市場中,數據分析作為特有的知識見解產生的戰略優勢是絕對的還是相對的,以及在數據公開後的影響。由於可以確定團隊採用高級數據分析的精確時間點,所以棒球很適合研究數據分析的效果。數據分析尤其適用於棒球的決策,因為棒球不像其他幾大聯盟體育項目那樣以團隊為導向(例如,NFL,NBA或NHL)。雖然棒球有雙人互動(擊球手面對投手),但其他大聯盟體育運動有更大的團隊內互動,使得統計分析更為複雜。我們主要分析數據分析在競爭市場中提供的信息優勢,以及它是絕對的還是相對的,在MLB的背景下使用適應性市場假設(AMH)的概念進行操作。
研究背景
美國職業棒球大聯盟(MLB)是所有北美職業體育聯盟中最古老的。它目前有30支球隊參加兩個聯賽:美國聯盟的15支球隊和國家聯盟的15支球隊。每個聯盟有三個分區(東區,中區和西區),每個區有5個隊。每個MLB球隊在常規賽中打162場比賽,賽季從4月初到10月初,每個球隊在主場和客場各打81場比賽。常規賽的輸贏記錄決定了哪些球隊可以進入季後賽以及季後賽中的種子排位。在所有大聯盟的體育項目中,棒球可以說是最難進入季後賽的項目,目前體系中只有三分之一的球隊能夠進入季後賽。
《魔球》(Moneyball)講述了奧克蘭運動家隊總經理比利比恩如何選擇使用數據分析(包括選秀和與其他團隊交易)和對比賽管理的探索。由於運動家隊的所有權在九十年代中期發生了變化,新的所有者決定削減球員工資,因此團隊轉向數據分析的使用。奧克蘭運動家隊通過數據分析成功發現被低估的球員,並使得球隊儘管擁有MLB中最低的工資之一,但從2000到2003年之間連續進入季後賽。
在所有大聯盟體育項目中,棒球特別適合研究薪酬-績效關係,因為它本質上是一個擊球手和投手之間一對一對決的比賽。用棒球大聯盟來研究,提供了一種相對簡單的方法來衡量數據分析相對於球員的內在價值,並測試市場是否能夠快速適應估值異常,從而解決信息公開後數據分析是否具有優勢的問題。與其他研究相比,本文的一個與眾不同之處在於,它側重於單一產業中組織的適應性。這種對組織本身的關注使得有可能在更深層次上檢查哪些組織能夠更快地適應,以及決定調整過程的因素是什麼。此外,這項關於美國棒球大聯盟的研究能夠表明非數據分析的管理對於現在MLB的新環境而言是不合適的。
MLB中的數據分析符合Barney對企業資源的定義:它由MLB團隊控制,制定和實施戰略,以提高其影響力和效率。
研究背景
假設1:擁有獨特的數據分析信息為競爭激烈的MLB市場中的數據分析團隊提供了競爭優勢。
假設2:數據分析提供的競爭優勢是比較而非絕對的,並且與適應性市場假設一致,一旦這些信息可供其他市場參與者使用,隨之而來的優勢隨著時間的推移而消失。
假設3:數據分析形式的專有組織知識為數據分析高管提供了優於其他高管的薪酬績效優勢。
假設4:數據分析為高管提供的薪酬績效優勢是比較而非絕對的,一旦這些信息可供其他市場參與者使用,隨之而來的優勢隨著時間的推移而消失。
研究方法
定義為球隊j的勝率,為相對工資。研究為三個時期,分別是1997-2002年,2003-2008年以及2009-2013年,這三個時期分別是使用數據分析前,使用數據分析後和數據分析信息公開後。定義為三個時期的修正虛擬變量。通過五分位數將SNP定義為縮放的NormPay。GM代表數據分析團隊的高管的虛擬變量。MBGM代表使用數據分析後的虛擬變量。
對於假設1和假設2,使用公式:
對於假設3和假設4,使用公式:
研究結果及討論
本文研究的主要問題是數據分析的內容是否在競爭市場中提供了戰略優勢,以及這種優勢是絕對的還是相對的。數據分析的優勢在於通過分析數據分析團隊和經理是否享有相對於競爭對手的超高薪酬性能來進行測試。為了測試數據分析的優勢是絕對的還是相對的,我們分析了它是否隨著時間的推移而持續存在,以及時候信息公開後優勢消失。研究的第一個假設是數據分析是否為數據分析團隊在競爭中提供了薪酬表現優勢。為了測試這種優勢是相對還是絕對(第二個假設),我們檢查了在這些信息公開後是否仍然存在。結果顯示,數據分析團隊在使用數據分析出結果(1997-2002)之前的這段時間內具有優勢,這一優勢在這一知識公開期間被削弱(2003-2008)然後消散(2009-2013)。因此,在競爭市場中顯示此類專有信息具有戰略價值,並且該信息的價值是相對的,而不是絕對的。
接下來,分析各個團隊經理。這一分析表明,比利比恩及其導師在2002年出版《魔球》之前表現得更好,從而證明了這種專有組織知識的價值。一旦信息公開可用,這種薪酬-績效優勢就會消失,從而支持這樣一種觀點,即從數據分析相關的組織知識中獲得的戰略優勢是相對而非絕對的。與任何研究一樣,該研究存在一些局限性,這些可以在未來的研究中改進。首先,數據分析團隊的識別是基於每個MLB球隊建立棒球數據分析部門的年份的結構化搜索的。然而,這種搜索可能會遺漏一些關於建立這些部門的重要信息。因此,通過檢查團隊所做的交易類型(例如,交易有潛力的球員或者已經成名的球員),團隊籤署的自由球員的類型和數量,或者球隊自己培養球員的表現,可以進一步擴展識別數據分析團隊。其次,這裡使用的數據分析高管的概念是基於網際網路搜索,因此缺乏客觀性。一個拓展的結果方法是應用Hambrick和Mason的觀點,使用戰略選擇和績效,來反映是高層管理背景。這樣的選擇可以更好的從管理人員的背景及變化識別身份。
本文由「清華體育產業研究中心」微信公眾號(ID:TUDSI_2016)首發,經授權轉載發布。原文標題:數據分析對美國職業棒球大聯盟的影響