文章作者:
謝可欣、王丹妮、周蕾、梁哲,同濟大學經濟與管理學院
黃蕾,杭州優邁科思UMAX算法團隊
排版校對:
郭斯琪,同濟大學經濟與管理學院
在做航線相關決策時,我們需要參考市場需求和份額的預測結果,QSI模型和MNL模型是被廣泛應用的重要工具。航線網絡規劃第二期,我們聊一聊QSI和MNL的歷史由來、構建及應用。
上期我們介紹了,航線網絡規劃旨在通過增減航線、調整航線頻率、調整時刻等措施,提升航空公司的收益。具體可點擊以下連結閱讀:
此外,隨著市場份額的提高,規模經濟效應使得航空公司對市場的控制能力及管理效率得到提升,其收益將進一步提高。因此,提升或者維護市場份額,也是航線網絡規劃的重要目標。
實際上,航空公司在預估收益的時候,往往分為兩步:1)預測總體市場需求,即預測「蛋糕」有多大;2)預測可以獲得的市場份額,即預測可以分到多少「蛋糕」。因此,在做航線網絡規劃時,航空公司經常會考慮相關決策對市場份額的影響。而市場份額可以進一步細分到各個航線市場(也被稱之為O&D市場),每個航線市場都有很多可選的行程。行程可以由一段或者多段航節組成,一般情況下,單航節的行程可稱為直達航班,而由兩段或以上的航節組成的行程則被稱之為聯程航班。這些行程在該航線市場中都存在著競爭關係,如下圖所示。
航空領域常用的市場份額預測方法有:服務質量指數(quality of service index,QSI)模型、離散選擇模型(discrete choice model,DCM)、航班頻率「S 曲線」市場份額模型。航班頻率「S曲線」在上期已經介紹過,本期將詳細介紹QSI和DCM中的的多項Logit模型(Multi-nominal Logit,MNL)。
QSI是一種根據多個指標來預測、估算市場份額的指標體系,也是用於預估航線市場份額的代表性方法。QSI由波音公司運籌實驗室開發,其認為對某一個航線市場,決定某一航空公司市場份額的主要因素為該航空公司提供的航班質量和飛機有效載量等。QSI模型方法是一種通用性較強的預估方法,尤其適合在較為不熟悉的航線市場上運用。目前世界上先進的航空公司例如荷蘭航空(KL)、美國航空(AA)、達美航空(DL)等都會利用自己的市場數據,建立起符合自身實際情況的QSI體系,用以輔助航線決策。
如上所述,我們利用QSI衡量旅客對隸屬於同一個航線市場的不同行程的偏好。這可以被粗略理解為對同市場的每個行程進行打分。
既然是「打分」,就涉及旅客在選擇行程時所關心的要素,例如承運的航空公司、是否直飛、所需飛行時長、機票價格和執飛的機型等等。
購票平臺展示旅客所關心的要素
圖源:ctrip.com
假設,針對行程i,我們考慮4個要素(service characteristic),記作X1,X2,X3,X4,那麼我們可以用(包括但不限於)以下形式表示QSI模型:
其中,β表示旅客對相應要素的偏好權重(preference weight)。得到同航線市場不同行程的「打分」QSI之後,我們可以估計旅客選擇不同行程的概率,或者說是該行程在其市場的份額:
表示和行程i分享同一個航線市場的行程的服務質量指數之和。
對於具體的某家航空公司而言,它在一個航線市場中承運的所有行程的市場份額的總和,就是它在這個市場的份額。
在訓練模型時,我們通常有兩種方法來確定QSI模型中β的值:
① 根據經驗或業內專家的建議設定;
② 基於歷史數據,使用統計學或是機器學習的方法對β進行參數估計。
QSI模型非常容易理解,粗略來講,就是給每個行程「打分」,依據「分數」QSI,把份額按比例分配給每個行程。但QSI模型也有兩個明顯的缺點:
不論是由專家直接給定,還是利用歷史數據進行參數估計,不同要素X的偏好權重β的獲取是相互獨立的。換句話說,QSI模型不能反映不同要素之間的相關性。例如,直飛航班(途徑中間站點數為0)所需的飛行時長通常小於聯程航班所需的飛行時長(途徑中間站點數大於等於1)。
彈性問題(the elasticity problem)
受不同行程間相關性影響,行程i的改變對同市場中其他行程的影響應該是有所差異的,但QSI模型認為這種影響是相同的。理論上,我們也可以通過計算行程i的QSI變化所引起的行程j市場份額變化的交叉彈性方程(cross-elasticity equation)來體會:
等式右邊是關於i的表達式,也就是說,行程i的QSI變化所引起的行程j的市場份額變化只與i有關,與j無關。這顯然是不合理的。例如,i作為上午的行程,當它降低票價,導致了QSIi的變化,則會對臨近時間的行程有較大影響(旅客都跑去選i了),對下午以及晚上的行程影響較小。
各個行程的市場份額深受旅客的選擇行為影響,因此航空業經常用離散選擇模型來預測市場份額。Mcfadden於1973年最早提出了Logit離散選擇模型,基於效用最大化理論對個體的選擇行為進行模擬。通過多年的研究應用發展出了二項式Logit(Binary Logit)、多項式Logit(MNL)、嵌套Logit(Nested Logit)等模型。其中,MNL模型是出行行為研究領域應用最廣泛最成熟的方法之一。Coldren 等人第一次採用MNL模型來預測航線市場各個行程的市場份額,他們考慮了產品服務評分、路徑銜接質量、航空公司市場佔有率、機票價格、機型等影響因素。
MNL旨在通過效用函數,分析個體對於不同行程的選擇概率,進而估算市場份額。其行為理論基礎是隨機效用理論,該理論認為人們在做決策時都是按照效用最大化的原則進行。一般情況下,MNL的效用函數和QSI模型的線性表現形式相似,為:
考慮到不可觀測的誤差部分,效用函數也可以被表示為:
由此,從旅客n的某航線備選行程集合中的j個備選行程中選擇行程i的MNL概率,可以被表示為:
估計方法和QSI相似,在實際應用中,MNL的參數估計通常會採用最大化對數似然估計法。
由於結構簡單、穩定性高,MNL模型在離散選擇模型中是最為常用的。同時它的限制性也較強,體現在:
同市場中,選擇行程i的概率Pi和選擇j的概率Pj的比率與其它該市場中的任何行程z的Uz變化無關。該性質和QSI的彈性問題相似,同樣可以通過觀察行程i要素值變化引起行程j概率變化的交叉彈性方程來得到:
在這個式子中,最右邊的表達式與j無關,體現了交叉彈性在不同行程方案之間沒有差別,這意味著一個行程效用的改善將從所有其他替代行程方案中按相同比例獲得市場份額。這顯然不符合實際。
除了航線的決策和評估,在考慮重捕獲率的航網優化建模和基於旅客選擇的收益管理中,它同樣發揮著重要的作用。
可以看到,不論是QSI模型,還是MNL模型,我們在使用它們來估計市場份額的時候,都需要以下步驟:
QSI模型和MNL模型都是被廣泛應用的估計航空公司市場份額的模型,我們到底怎麼選擇好呢?
Coldren等人的實驗結果顯示,MNL預測總是優於QSI模型,其預測誤差相對於QSI減少了10-15%,而且預測結果相對穩定。然而,Jacobs等人曾在《Quantitative Problem Solving Methods in the Airline Industry》一書中提到,根據他們對行業專家的採訪,使用MNL等方法的航空公司考慮重新使用QSI模型,因為航司覺得MNL等模型很複雜,參數估計很麻煩。對比Jacobs等人解釋稱,使用效果和預想的有差異並不是MNL的問題,而在於採用了過度參數化的效用函數。此外,雖然QSI模型和MNL模型都存在不能反映行程之間動態的相互影響的問題,但是Garrow提到可以通過MNL的拓展模型來鬆弛IIA這個假設。
杭州UMAX算法團隊利用國內的民航數據進行了MNL和QSI的對比實驗。綜合考慮了:航線區域(華北、華中、華東、華南、東北、西北、西南)、航線性質(商務線、旅遊線、混合線)、航線密度(日均航班數)、競爭程度(承運人數量)、航線距離和航線盈利能力(客座率、客公裡收入)等因素。以儘可能包含各類航線為目標,篩選出了12條航線,以它們一個月的數據來進行模型訓練與效果評估,力求使結果更具有說服力。
UMAX實驗結果:MNL模型基本上優於QSI模型的結果
為了測試模型的泛化誤差,團隊使用了交叉驗證留一法(Leave-One-Out Cross Validation)對兩個模型的效果進行評估,即將某航線整月的數據集按日分為30組,每次只留某航線一天的數據作為測試集,剩下的作為訓練集。並選擇RMSE均方根誤差作為評估指標,取多次驗證得到的評估指標均值作為最終評估結果。結果表明:①MNL模型的訓練效率更高:初始值依賴小,收斂更快;②MNL有7條航線預測更準確,預測效果總體上優於QSI。
由前一節可知,MNL模型效果相對更好。因此團隊基於訓練得到的MNL模型對廈門西安航線進行了兩種場景下的市場份額預測:
基於這個結果,航司B便可以評估通過新增該航班來擴大自己的市場份額是否值得。在已經確定要新增該航線航班的情況下,同樣可以通過MNL模型來判斷不同的時刻價值和飛機容量價值,幫助決策。
可見,新航司的航班投放會一定程度降低現有航司的市場份額。通過MNL模型,可以幫助航司評估開闢一條新航線的必要性。
關於QSI模型和MNL模型,以及利用它們評估是否增加航班頻率或者新開航線,你都get了嘛?下期,我們將介紹機型分配問題的建模與拓展,敬請期待哦!
喜歡我們的內容就關注我們並點個讚吧!
參考:
[1] Kloth R J, et al. Method and apparatus for implementing a quality of service policy in a data communications network: US, US6870812[P]. 2005.
[2] Barnhart C, Smith B (2012). Quantitative Problem Solving Methods in the Airline Industry: A Modeling Methodology Handbook. Boston, MA: Springer.
[3] Coldren G M, Koppelman F S, Kasturirangan K, Mukherjee A (2003). Modeling aggregate airtravel itinerary shares: logit model development at a major U.S. airline. Journal of Air Transport Management 9(6):361–369.
[4] Garrow LA (2010) Discrete choice modelling and air travel demand: theory and applications. Ashgate, Aldershot.
[5] Mcfadden D. Conditional Logit Analysis of Qualitative Choice Behavior[J]. Frontiers in Econometrics, 1974:105-142.