隨機係數Logit模型及Stata實現

2020-12-01 騰訊網

歡迎投稿(薦稿)計量經濟圈,計量相關都行

作者:北京交通大學經濟管理學院博士生,王琦珀。歡迎你加入計量經濟圈社群,一起探討前沿計量理論和實證方法。

一、隨機係數Logit模型

1.背景

實證產業組織(Empirical Industrial Organization,EIO)是目前產業組織理論的前沿,其中又以Ariel Pakes為帶頭人,其近期工作論文包括The Competitive Effects of Information Sharing、Moment Inequalities for Multinomial Choice with Fixed Effects等(Asker et al.,2016;Pakes&Porter,2016)。其中Berry,Levinsohn&Pakes(1995)建立的隨機係數離散選擇模型(現通常稱為BLP模型)結合了隨機係數和Logit模型,允許價格的內生性,所以是當前需求估計建模理論和應用的熱點。

國內應用較好的文章如陳立中、李鬱芳(2011),餘東華、王蒙蒙(2015),肖俊極、譚詩羽(2016),研究的都是乘用車市場,主要原因是數據的適用性,研究主題包括稅收政策、汽車減排、併購合謀等。國外的文章中,較新的有Friberg& Romahn(2015),Barros(2016),Zhang et al.(2016)等,研究的範圍有啤酒市場、運輸市場等。Vincent(2015)開發了Stata的blp estimator,幫助廣大的Stata用戶進行研究,但是目前使用該程序的文章較少。

2.模型結構

Nevo(2000)對BLP模型進行了深入的介紹,BLP模型的具體內容可參照該文章,在此轉引知乎「驚記」的回答:

BLP模型假設消費者選擇產品j的效用函數是

其中是產品的特徵(比如在汽車市場就是性能,大小,品牌等等)是價格,

是對應這兩個變量的係數。和普通的logit model區別在於,在不同消費者之間可以不同(比如張三更在乎性能,而李四不太在乎性能)。為了加入這種偏好差異同時不加入過強的假設,我們假設他們的形式是

其中是兩個常數,而是期望為的隨機變量,所以這個模型是random coefficient。對於的分布假設,一般會直接取正態分布然後估計他們的standard deviation;對於價格係數這種肯定為負的係數,可以把它的隨機部分假設為log normal來保證符號不會變化。至於叫logit model的原因在於效用函數裡的一般假設為GEV分布。

BLP模型在估計參數時分為兩步(1)通過擬合市場份額來估計非線性參數;(2)通過GMM來估計線性參數。在此不作細緻介紹,詳細可見「驚記」的回答或Nevo原文。

3.適用範圍

首先,消費者的效用偏好要有顯著差異。在blp中需要表徵產品特徵差異的變量,如汽車市場中人們可能對汽車的大小、顏色這些指標有不同的偏好。

其次,數據為市場份額。如電商市場,若能得到華為Mate10,蘋果X在某一年的市場銷售份額數據,那麼就可以用BLP。

第三,一般不同市場的價格要有變化。若不同市場中產品一直保持一個價格,那麼估計會無效。

最後,模型儘量是非動態模型。BLP已經有兩層iteration,在計算上很耗時間,如果再加上動態模型,比如耐用品,或者serially correlated cost這種情況,就相當於又加上了一到兩層iteration,跑起來簡直遙遙無期。(轉自驚記)

劉忠等(2012)總結了BLP模型的應用領域,主要包括兼併審查、新產品經濟特性、產業政策審查、福利測算等。目前論文的寫作方法一般為研究對象的事實(案例)分析+理論推導+BLP估計結果分析+彈性分析,在對其中的數據進行合併時,就可推演出併購合謀、新政策影響等預測,從而估計福利變化。但由於數據的可獲取性,最為保險的應用領域仍然是乘用車市場,若能夠利用數據爬取或內部資料,可分析諸如電商市場、運輸市場等。

二、Stata安裝及基本語法

1.命令安裝和示例數據獲取

net install st0408.pkg

net get st0408.pkg

2.語法

可以看出,在option裡面有三個是必填的,即endog、stochastic和markets。具體含義如下:

endog //內生,需填寫內生變量=工具變量,如:汽車價格=燃料價格cpi人口數……

stochastic //產品特徵,即與其他產品產生差異的變量,當使用非調查問卷(人口統計數據)時,可直接填寫如: 排量,車型……

markets //市場,表示市場的變量

三、示例及含義解釋

1.無人口統計數據時

use blp_nodemo //使用樣本數據,該數據中包含10種產品25個市場:s為市場份額,p為產品價格,w1、w2、w3代表影響產品成本的工具變量,x1為產品特徵,mkt為市場,product代表產品。

gen w12=w1^2 //生成其他影響產品成本的變量,下同

gen w22=w2^2

gen w32=w3^2

gen x12=x1^2

bysort mkt: egen x1s=sum(x1) //生成代表競爭的產品差異化水平的變量

replace x1s=x1s-x1

blp s x1, stochastic(x1) endog(p=w1 w2 w3 w12 w22 w32 x12 x1s) markets(mkt) //使用Standard instruments進行估計,結果如圖1

blp s x1, stochastic(x1) endog(p=w1 w2 w3 w12 w22 w32 x12 x1s) markets(mkt) optinst(w1 w2 w3) //使用Optimal instruments進行估計,結果如圖2

圖1 Standard instruments估計結果

圖2Optimal instruments估計結果

2.使用人口統計數據時

use blp_demo //使用樣本數據,該數據中包含10種產品50個市場,含義同上,其中x1由人口統計變量d1、d2表示,d1、d2存儲在專門的數據集demodata.dta中。

gen w12=w1^2

gen w22=w2^2

gen w32=w3^2

gen x12=x1^2

bysort mkt: egen x1s=sum(x1)

replace x1s=x1s-x1

blp s x1, stochastic(x1=d1 d2,p) endog(p=w1 w2 w3 w12 w22 w32 x12 x1s) markets(mkt) optinst(w1 w2 w3) demofile(demodata) initdemo(1,1) initsd(1,1) elast(p,1,product) //使用Optimal instruments估計,結果如圖3

matrix list e(elast) //報告價格彈性矩陣,如圖4(只截取1-5產品價格彈性矩陣)

圖3 Demographic data的Optimal instruments估計結果

圖4 產品價格彈性(部分)

References

Asker, J., Fershtman, C., Jeon, J., & Pakes, A. (2016). The competitive effects of information sharing. Nber Working Papers.http://www.nber.org/papers/w22836

Barros, C.P., Demand analysis in Angola seaports.Maritime Policy & Management, 2016. 43(6): p. 676-682.

Berry, S., J. Levinsohn, and A. Pakes,Automobile prices in market equilibrium.

Econometrica,1995.63: p. 841–890.

Friberg, R. and A. Romahn, Divestiture requirements as a tool for competition policy: A case from the Swedish beer market.International Journal of Industrial Organization, 2015. 42: p. 1-18.

Nevo, A., A Practitioner's Guide to Estimation of Random-Coefficients Logit Models of Demand. Journal of Economics & Management Strategy, 2000. 9(4): p. 513-548.

Pakes, A., & Porter, J. (2016). Moment inequalities for multinomial choice, with fixed effects. Nber Working Papers.http://www.nber.org/papers/w21893

Vincent, D.W., The Berry-Levinsohn-Pakes estimator of the random-coefficients logit demand model.Stata Journal, 2015. 15(3): p. 854-880.

Zhang, Y., et al., The impact of car specifications, prices and incentives for battery electric vehicles in Norway: Choices of heterogeneous consumers.Transportation Research Part C-Emerging Technologies, 2016. 69: p. 386-401.

驚記回答:誰能簡單解釋一下經濟學中的BLP模型?-知乎https://www.zhihu.com/question/63050927/answer/205227770

陳立中、李鬱芳,汽油價格、稅收政策與乘用車市場的微觀選擇行為——基於需求側、供給側和節能減排效應估計.中國工業經濟, 2011(08):第15-24頁.

劉忠等,隨機係數LOGIT模型的最新發展及其應用.經濟學動態, 2012(12):第125-130頁.

肖俊極、譚詩羽,中國乘用車行業的縱向一體化與橫向共謀實證分析.經濟學(季刊), 2016(04):第1387-1408頁.

餘東華、王蒙蒙,橫向併購反壟斷審查中的競爭損害模擬分析——以一汽併購華晨為例.財貿研究, 2015(06):第47-54+115頁.

作者準備的PDF 版本連結: https://pan.baidu.com/s/1jyEevwNaOn-gvL4c35JnTg 密碼: 5vqc

給推文作者讚賞,我們會全部移交於他,如果你覺得推文作者辛苦或者用心,那就在文後給該作者打賞吧。歡迎你加入計量經濟圈社群,一起探討前沿計量理論和實證方法。

幫點擊一下下面的小廣告,謝謝支持!

相關焦點

  • OLS估計Logit模型參數
    logit 模型主要是探究解釋變量對離散的被解釋變量的影響,而判別分析需要用已有的訓練集進行訓練,得到判別準則係數,從而實現對目標樣品的歸類,從這個維度看,判別分析是一種機器學習的方法。然而部分用於進行判別分析的電腦程式不提供 Logit 模型係數的估計值、標準誤、T 值。
  • 似然比檢驗、Wald檢驗和拉格朗日檢驗的Stata實現 討論
    似然比檢驗(LR)、Wald檢驗、拉格朗日檢驗(LM)都基於最大似然估計(MLE),本文以logit模型為例討論三類檢驗的
  • 乾貨|教你如何用Stata做二元選擇模型
    先確定二元選擇模型的類型,通常有Probit模型、Logit模型、Extreme模型等,前面兩種最常用。如果隨機誤差項服從標準正態分布,就用Probit模型;如果隨機誤差項服從邏輯分布,就用Logit模型。當然,事先也不知道隨機誤差項究竟服從何種分布,所以Probit模型和Logit模型任選一種即可,問題不是很大。二元選擇模型是非線性模型,所以參數估計要用最大似然估計法(MLE)。
  • 【ECON-01】貿易引力模型及其Stata實現
    2.2 研究步驟針對短面板數據,一般要確定選擇固定效用模型還是隨機效用模型,固定效用模型是否要考慮時間效用等步驟,具體流程如下:3 應用實例3.1 參數估計由於本數據集共包括75個變量,且本案例僅為演示模型的計算過程,故只考慮部分候選變量對雙邊貿易出口額的影響。
  • 零基礎的同學如何用stata做一元線性回歸模型?
    stata軟體越來越受研究生的喜歡,很多研究生在做統計研究、學術分析的時候,也多選用此軟體。網上有關stata的教程有很多,但對於沒有基礎的同學來說,學起來稍微就有些吃力了。那麼,零基礎的同學應該如何學習呢?如何用stata做出滿意的一元線性回歸模型呢 ?
  • 零基礎的同學如何用stata做多元線性回歸模型?
    上一期,我們分享了如何用stata做一元線性回歸模型,不知道同學們學的怎麼樣呢?有沒有自己動手操作一遍呢?這一期:我們將學習如何用stata做多元線性回歸模型!這些是小王(邀請者)最近學習計量時的一些心得和體會,希望能與大家一起分享。
  • Tobit, Truncreg, Heckman, Probit及其邊際效應實現程序及解讀
    logit和probit模型中的交叉項, 如何求邊際效應,2.一個完整的實證程序, 以logit或ologit為例,3.混合Logit模型跨越標準Logit模型三座大山,4.條件Logit絕對不輸多項Logit,而混合模型最給力,5.
  • 實戰:用Python實現隨機森林
    因為有Scikit-Learn這樣的庫,現在用Python實現任何機器學習算法都非常容易。實際上,我們現在不需要任何潛在的知識來了解模型如何工作。雖然不需要了解所有細節,但了解模型如何訓練和預測對工作仍有幫助。比如:如果性能不如預期,我們可以診斷模型或當我們想要說服其他人使用我們的模型時,我們可以向他們解釋模型如何做出決策的。
  • Stata 15 統計數據分析軟體
    Stata15正式發布,這是Stata有史以來最大的一次版本更新,除了界面、DO轉碼、set more off的自動設置和do file edit美化等一些變化外,還增加了擴展回歸模型、 潛在類別分析(LCA)、 貝葉斯前綴指令、 線性動態隨機一般均衡(DSGE)模型、 web 的動態Markdown文檔、 非線性混合效應模型、 空間自回歸模型(SAR)、 區間刪失參數生存時間模型、
  • 看不懂Logistic模型?別慌,先來了解它和線性回歸模型的區別!
    #計量經濟學#Logistic回歸在統計學領域也是一種非常常見的線性回歸模型。作為回歸模型的一種,其實它和簡單線性回歸模型分析有著非常相似的地方,它們的模型方程形式是一致的,右邊都可以寫成b1x+c的方程形式,並且b1和c都是未知的係數參數。
  • 如何用Matlab/Python/Stata做簡單回歸分析
    來源:金融民工新語 作者:劉新宇 NO.1 |問題描述: (1)簡單的描述性統計:均值、中位數等 (2)求出多個變量的相關係數矩陣
  • 2019-2020(1)學期計量經濟學倒數第2課:5分鐘構建面板數據模型:原理要點、操作視頻與流行問題命令精選匯總
    二、固定效應模型1.固定效應v.s.隨機效應、混合最⼩⼆乘固定效應估計量與隨機估計量的優缺點:從假設強弱來看:固定效應所需假設更弱,更穩健隨機效應、POLS假設更強:需假設個體誤差項與解釋變量不相關另⼀個重要區別:固定效應不能估計不隨時間變化的變量的係數隨機效應、POLS可以。實踐中:固定效應最穩健,應優先考慮。實踐中:xtreg命令、reghdfe命令第三節 面板數據模型的估計方法
  • Stata:格蘭傑因果檢驗
    具體來說,我們建立時間序列模型如下,並提出假設H0:βm=0,m=1,2…p。如果接受該假設,則意味著x過去值不能夠預測y未來值;如果拒絕該假設,則可以,即x是y的格蘭傑因(Granger cause)。格蘭傑因果關係檢驗假設了有關y和x每一變量的預測的信息全部包含在這些變量的時間序列之中。檢驗要求估計以下的兩個回歸模型:模型1
  • 從頭開始:用Python實現帶隨機梯度下降的Logistic回歸
    它容易實現、易於理解,並在各類問題上有不錯的效果,即使該方法的原假設與數據有違背時。在本教程中,你將了解如何在 Python 中實現隨機梯度下降的 logistic 回歸算法。學完本教程後,你將了解:如何使用 logistic 回歸模型進行預測。
  • 怎麼在Stata實現
    下面,本文以農業生產函數估計為例,介紹三類檢驗的Stata實現。使用的數據是一套有關農戶種植業投入產出的微觀調查數據。(無約束模型)與一個簡單模型(有約束模型)哪個模型更適合當前數據分析。LR檢驗應用的一個前提條件是這兩個待比較的模型應該是分級的巢式模型。也就是說,相對於簡單模型,複雜模型僅僅是多了一個或者多個附加參數。LR檢驗統計量的計算公式為:
  • Stata結果輸出:Yes, Yes, No 回歸結果中不報告年度、行業虛擬變量的係數
    問題在實證分析中,我們經常需要在模型中加入行業虛擬變量、年度虛擬變量等,以便控制不可觀測的行業個體效應或年度個體效應。然而,在正式報告結果時,我們無需報告這些虛擬變量的係數,否則結果表格會變得非常冗長。
  • 什麼是結構方程模型(SEM)?
    聚合效度主要是指測量同一個潛變量的各個指標之間要有相對較高的載荷係數(>0.7);區分效度主要是指不同潛變量(因子)之間的相關係數不能太高(<0.9)。簡言之,各個指標要確實是在測量同一個因子,而不同因子之間又要有區分度,能區別開來。第二部分是描述潛變量之間內在關係路徑的結構模型(structural model)。
  • 【乾貨】隨機森林的Python實現
    【新智元導讀】在機器學習中,隨機森林是一個包含多個決策樹的分類器,並且其輸出的類別是由個別樹輸出的類別的眾數而定。隨機森林幾乎是任何預測類問題(甚至非線性問題)的首選。本文介紹了隨機森林的原理、用途,以及用 Python 實現隨機森林的方法。