Logit-Probit:非線性模型中交互項的邊際效應解讀

2021-12-23 連享會

👇 連享會 · 推文導航 | www.lianxh.cn

「十年口碑,桃李三千」
🎦 2021 Stata 暑期班
📅 2021 年 7 月 20-30 日
🔑 連玉君(中山大學);江艇 (中國人民大學)
🍓 課程主頁:https://gitee.com/lianxh/PX

  

作者:展一帆 (復旦大學) ,周依仿(復旦大學)郵箱:simonzhanyf@163.com

Source:

Maarten L. Buis. Stata Tip 87: Interpretation of Interactions in Nonlinear Models[J]. The Stata Journal, 2010, 10(2) : 305-308. -Link-Dow W H, Norton E C, Donahoe J T. Stata tip 134: Multiplicative and marginal interaction effects in nonlinear models[J]. The Stata Journal, 2019, 19(4): 1015-1020. -Link-

目錄

1. 問題背景

2. 四種解釋方法

3. 一個警示性例子

4. 實操案例分析

4.1 優比度量下的乘積交互效應解釋方法

4.2 優比度量下的邊際交互效應解釋方法

5. 參考資料

6. 相關推文


溫馨提示: 文中連結在微信中無法生效。請點擊底部「閱讀原文」。或直接長按/掃描如下二維碼,直達原文:

  

1. 問題背景

在非線性計量模型(例如 logit,probit 等),如何解釋交互項的效應,很多學者在應用上仍存在混淆之處。本文通過介紹 Buis (2010 和 Dow et al. (2019) 來說明這一問題。

2. 四種解釋方法

我們使用一個 logit 模型作為例子:

在 stata 中可用 margins 和 nlcom 命令獲得:

. logit y i.x##i.z
. margins x#z, post
. nlcom (_b[1.x#1.z] / _b[1.x#0.z]) / (_b[0.x#1.z] / _b[0.x#0.z])

(2) 概率度量下的邊際交互效應(marginal interaction effects)概率度量下的邊際交互效應定義則為:

stata 中可以使用如下命令獲得:

. margins, dydx(z) at(x=(0 1)) contrast(atcontrast(r._at)) post

(3) 優比度量下的乘積交互效應(multiplicative interaction effects)如果將被解釋變量轉化為優比(odds ratio),則乘積交互效應(multiplicative interaction effects)可定義為

這種解釋方式是文獻中最為常見的,在 stata 中的實現方式也非常簡單,僅需增加 or 選項

. logit y i.x##i.z, or

(4) 優比度量下的邊際交互效應(marginal interaction effects)

. margins x#z, expression(exp(xb())) post
. lincom (_b[1.x#1.z] - _b[1.x#0.z]) - (_b[0.x#1.z] - _b[0.x#0.z])

3. 一個警示性例子

在很多文獻中,對於非線性模型交互項的解釋只匯報了上述解釋方法中的一種。本小節中通過一個簡單例子說明上文四種方法可能得到不一樣的結論,需要針對研究問題謹慎選擇。

這個簡單例子只有四個數據點(見圖 1 的面板 A)。不妨考慮這個例子的背景為一個自然實驗,變量 x 代表處理前後,0 代表處理前,1 代表處理後。變量 z 標記組,z=0 為控制組,z=1 為處理組。樣本在處理前並不平衡,控制組的 p 為 0.05,處理組的 p 為 0.1。

在處理前(x = 0)時,隨著 z 從 0 增加到 1,被解釋變量取 1 的概率 p 從 0.05 上升到 0.10。當 x = 1 時,隨著 z 從 0 增加到 1,被解釋變量取 1 的概率從 0.10 增加到 0.19。圖 1 的面板 B 則為轉換成優比後的相同的四個數據點。

圖1

一方面,概率度量上的乘積交互效應為 0.95(表 1 最後一列,面板 A),因為在處理前(x=0)時,處理組(z=1)的 p 為控制組的兩倍(0.1/0.05),而在處理後則僅為 1.9 倍(0.19/0.1),這意味著隨著 x 增加,z 對 y 的效應在減小。相比之下,優比度量上的乘積交互效應是 1.0(表 1 的最後一列,面板 B),這意味著隨著 x 的增加,z 的效應是不變的。

另一方面,概率度量上的邊際交互效應為 0.04(表 1 中列,面板 A),因為在處理前(x=0)時,處理組(z=1)的 p 比控制組大 0.05(0.1-0.05),而在處理後則升至為 0.09(0.19-0.1)。這意味著隨著 x 增大,z 的效應增大。優比度量上的邊際交互效應為 0.06,也顯示了類似的遞增效應(儘管在其他例子中,它可能與概率度量上的邊際交互效應有顯著不同)。

由此可見,在該簡單例子中,交互項的解釋根據解釋方法不同,即可能為正,為零也可能為負。即隨著 x 增大,z 的效應可能:

表1

4. 實操案例分析

進一步,我們可以通過 Buis(2010)中的一個例子加深對上文的理解。比如我們要研究對於黑人和白人來說,是否擁有大學學位 collgrad 對於是否能獲得高級別工作(high_occ)優比的效應差異。

4.1 優比度量下的乘積交互效應解釋方法
. sysuse nlsw88   // 採用系統自帶的美國婦女工資數據集

// 生成「高級別」工作變量
. generate byte high_occ = occupation < 3 if occupation < .

. generate byte black = race == 2 if race < .
. drop if race == 3

. generate byte baseline = 1

// 添加or選項,匯報odds ratio
. logit high_occ black##collgrad baseline, or noconstant nolog

結果如下:

. logit high_occ black##collgrad baseline, or noconstant nolog 

Logistic regression Number of obs = 2,211
Wald chi2(4) = 504.62
Log likelihood = -1199.4399 Prob > chi2 = 0.0000

---
high_occ | Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]
-+-
1.black | .4194072 .0655069 -5.56 0.000 .3088072 .5696188
|
collgrad |
college grad | 2.465411 .293568 7.58 0.000 1.952238 3.113478
|
black#collgrad |
1#college grad | 1.479715 .4132536 1.40 0.161 .8559637 2.558003
|
baseline | .3220524 .0215596 -16.93 0.000 .2824512 .3672059
---

針對上表的解讀,首先看基準組(沒有大學學歷的白人),表格中可得其優比為 0.322。由於優比的定義是 p/(1-p),所以我們可以解讀為,對於每一個非高級別工作的人,樣本中可以找到對應 0.322 個有高級別工作的人。

collgrad 的優比為 2.47,也即是說,擁有大學文憑的白人相對於沒有大學文憑的白人,優比提升 2.47 倍(注意這裡是乘法運算,即上文提到的 multiplicative effects)。所以對於有大學文憑的白人,總優比是 0.79 (0.32×2.47)。也即是說此時對於每一個非高級別工作的人,樣本中可以找到對應 0.79 個有高級別工作的人。顯然擁有大學文憑大幅度提升了獲取高級別工作的可能性。

black的優比為 0.42,所以沒有大學文憑的黑人的優比為 0.14 (0.32×0.42)。交乘項的優比為 1.48 (注意,這裡對應上文中的「優比度量下的乘積交互效應」解釋方法),也即黑人有大學文憑相比白人有大學文憑,對於找到高級別工作的優比的邊際提升為 1.48 倍。換言之,對於有大學文憑的黑人來說,總優比是 0.49 (0.32×0.42×2.47×1.48)。

4.2 優比度量下的邊際交互效應解釋方法

繼續該例子,但我們換做優比度量下的邊際交互效應解釋。用 margins 命令得到 black 和 collgrad 不同組合下的優比。可以看到四種組合下的優比分別為 0.32,0.79,0.14 和 0.49(上一小節中已經通過乘法運算得到了這四個數字)。

用邊際交互效應解釋,則大學文憑對於白人的邊際效應為 0.47 (0.79-0.32), 而對於黑人的邊際效應則僅有 0.36 (0.49-0.14)。

由此可以看出, collgrad 的邊際交互效應對於白人來說大於黑人,但其乘積交互效應則是黑人大於白人。產生差異的原因就在於計算乘積交互效應時,不同組的基準是不一樣的,白人為 0.32,但黑人僅 0.14,所以雖然從乘積角度, collgrad 提升黑人的優比的比例更高,從 0.14 提升至 0.49,約 3.6 倍,但從邊際上看優比只增加了 0.36。而白人的優比從 0.32 提升至 0.79,增加的倍數不如黑人,但邊際上的增加量卻達 0.47,大於黑人的 0.36。這就是兩種解釋方法差異的來源。

margins, over(black collgrad) expression(exp(xb())) post
*結果如下:
Predictive margins                              Number of obs     =      2,211
Model VCE    : OIM

Expression   : exp(xb())
over         : black collgrad


                    |          Delta-method                                 
                    |   Margin   Std. Err.      z    P>|z|  [95% Conf. Interval]
+----
     black#collgrad |                                                           
0#not college grad  | .3220524   .0215596    14.94   0.000  .2797964    .3643084
    0#college grad  | .7939914    .078188    10.15   0.000  .6407457    .9472371
1#not college grad  | .1350711   .0190606     7.09   0.000   .097713    .1724292
    1#college grad  | .4927536   .1032487     4.77   0.000    .29039    .6951173

. lincom 0.black#1.collgrad - 0.black#0.collgrad
( 1)  - 0bn.black#0bn.collgrad + 0bn.black#1.collgrad = 0

----
     |    Coef.   Std. Err.    z    P>|z|   [95% Conf. Interval]
+---
 (1) |  .471939    .081106   5.82   0.000   .3129742    .6309038
----
. lincom 1.black#1.collgrad - 1.black#0.collgrad
 ( 1)  - 1.black#0bn.collgrad + 1.black#1.collgrad = 0


     |     Coef.   Std. Err.    z    P>|z|   [95% Conf. Interval]
+----
 (1) |  .3576825   .1049933   3.41   0.001   .1518994    .5634656

總結一下,乘積交互效應(multiplicative interaction effects)和邊際交互效應(marginal interaction effects)並不一樣,回答的是不同的問題,在特定情況下可能給出完全相反的結論。故而學者在解釋非線性模型的交乘項時,應當注意其中微妙的差別,謹慎的對交互項做出經濟學解釋。

5. 參考資料Maarten L. Buis. Stata Tip 87: Interpretation of Interactions in Nonlinear Models[J]. The Stata Journal, 2010, 10(2) : 305-308. -Link-Dow W H, Norton E C, Donahoe J T. Stata tip 134: Multiplicative and marginal interaction effects in nonlinear models[J]. The Stata Journal, 2019, 19(4): 1015-1020. -Link-, -PDF-

6. 相關推文

Note:產生如下推文列表的 Stata 命令為:
  lianxh 調節 u型 交乘 交叉
安裝最新版 lianxh 命令:
  ssc install lianxh, replace

Logit-Probit 中的交乘項及邊際效應圖示interactplot:圖示交乘項-交互項-調節效應Stata:交乘項該如何使用?-黃河泉老師 PPT

New! Stata 搜索神器:lianxh 和 songbl  GIF 動圖介紹
搜: 推文、數據分享、期刊論文、重現代碼 ……
👉 安裝:
  . ssc install lianxh
  . ssc install songbl
👉  使用:
  . lianxh DID 倍分法
  . songbl all

🎦 🎦 🎦
🎧 暑期 空間計量專題
📅 2021 年 8 月 21-24 日
🔑 範巧 (蘭州大學);楊海生 (中山大學)
🍓 課程主頁:https://gitee.com/lianxh/SP

🍏 關於我們直通車: 👉【百度一下:連享會】即可直達連享會主頁。亦可進一步添加 「知乎」,「b 站」,「面板數據」,「公開課」 等關鍵詞細化搜索。

相關焦點

  • 「離散選擇模型」Probit模型、Logit模型
    我們主要介紹三個模型,即線性概率模型(LPM模型),logit模型,probit模型,其中LPM模型最簡單,並且可以用普通OLS進行估計,而probit和logit模型都較為複雜,只能用極大似然估計法進行估計。
  • 二值選擇模型(2):Probit與Logit
    由於Probit與Logit模型本質上屬於非線性模型,通常採用最大似然估計法(MLE)進行估計。但是對於本質是非線性模型的Probit與Logit,其估計量 在實際運用中,有三種常用的邊際效應:1)平均邊際效應。即先分別計算在每個樣本觀測值上的邊際效應,然後進行簡單算術平均得到最終的邊際效應。這種邊際效應也是Stata默認計算的邊際效應。2)樣本均值處的邊際效應。
  • 互助問答第68期:分組檢驗和邊際效應問題、ivprobit交乘項設計
    (1)在分組回歸中,其實每個變量都有各自的係數,比如在OLS回歸中可以根據係數影響大小(若係數表示的是邊際效應)。那為什麼又需要進行假設檢驗?這裡可以這樣想,這個結果僅僅是根據一組樣本做出來的,是否會因為隨機誤差而引起的這個差異呢?所以不能僅根據這一組樣本數據就得出結果,需要進行更為嚴謹的檢驗,即這裡的假設檢驗。
  • Stata:邊際效應知多少?f_able命令(下)
    我還描述了 nl 能夠估計除交互作用之外的變量變換的邊際效應,使用數值導數來近似解析導數。事實上,在估計非線性模型時,已經使用數值導數來估計邊際效應。換句話說,當模型中使用交互和多項式以外的變換時,Stata 已經具有估計邊際效應的能力。
  • Stata: 為何使用 Logit 模型?Logit 模型評價
    在我2015年4月的文章中,我討論了邏輯回歸的一些特性,正因為這些特性使得它比其他非線性替代方法(如 probit 或互補對數)更具吸引力。但我沒有將邏輯模型與線性概率模型進行比較。下面是我對 von Hippel 論點的看法,以及我為什麼更喜歡 Logit 回歸的原因。1. Logit 模型的優點1.1 速度線性回歸採用的最小二乘估計確實比邏輯回歸的極大似然估計要快。
  • ​主流: KHB法測度中介效應, 無論線性還是非線性模型, KHB都能分解出直接和間接效應!
    計量經濟學中"交互項"相關的5個問題和回應,3.實證機制分析那些事,機制分析什麼鬼?,4.政策評估中"中介效應"因果分析, 增添了文獻和Notes,5.內生變量的交互項如何尋工具變量, 交互項共線咋辦,6.
  • 基礎方法 | Logit回歸和Probit回歸有區別嗎?
    因變量的類型決定了回歸模型的使用! 1、使用場景的一致性都是針對二分類變量,也都發展出序次logit/probit回歸和多分類logit/probit回歸,並且在Stata中,命令長的也基本一樣。針對二分類變量:logit y xprobit y x針對定序變量:ologit y xoprobit y x針對多分類變量:mlogit y xmprobit y x2、本質上的一致性
  • 醫學統計與R語言:Probit回歸模型及邊際效應(Marginal effects)
    (1,2,6)] <- lapply(bilog[,c(1,2,6)] ,as.factor)xtabs(~Gender + Smoking_status, data = bilog)結果1: Smoking_statusGender  0  1     0 94 27     1 17 80輸入2:logitmodel
  • 【Stata更新】新增中介效應、調節效應、交互項及Stata操作--手把手教你Stata系列課程更新啦!
    】 12.2  傾向得分匹配介紹【理論微課】依可測變量選擇、依不可測變量選擇 12.3  傾向得分匹配法建模步驟 12.4  傾向得分匹配【Stata案例操作】 12.5  處理效應模型【Stata案例操作】 12.6  模型設定檢驗、實證分析中如何操作【Stata案例操作】 Ch13   斷點回歸模型
  • suest:跨模型比較與廣義豪斯曼檢驗
    模型和 probit 模型的係數是否相等。模型和 probit 模型對相同樣本的回歸結果顯著不同。因此,有理由認為 logit 模型的係數和 probit 模型的係數之間成比例,這就必需用非線性形式的 Wald 檢驗。原假設為:非線性的 Wald 檢驗對模型設定相當敏感,我們也可以構造一個更加 「線性化」 的原假設:我們用 testnl 命令執行非線性 Wald 檢驗。
  • Stata:多元 Logit 模型詳解 (mlogit)
    但解釋變量對各組別發生概率的邊際效應存在以下規律:在實證研究中,我們常用最大似然法對多元 Logit 模型進行估計。在模型解讀中,我們通常採用平均邊際效應 ( average marginal probability effects ) 來衡量解釋變量對各組別發生概率產生的影響:一方面,我們通過計算平均預測概率及其標準差、或最大預測概率和最小預測概率對模型進行解讀。
  • 關於交互項的那些事(二):畫交互效應圖原來如此簡單
    這隱含地假設了,在交互項的兩個變量中,至少有一個為連續變量,故可以求偏導數。顯然,如果兩個變量都是離散變量(比如虛擬變量),則此法不通,因為無法求導數。 但離散變量的交互效應也有其方便之處,可以將相應的回歸方程用分段函數來表示。
  • probit模型中的probit究竟是指什麼?
    前兩篇聊了Logistic函數相關的歷史;今天我們說一說Probit模型。如果你去查一下probit這個單詞含義,你會發現字典上給出的probit的含義是「概率單位」。probit 單詞釋義在說Probit模型之前,我們先講一個關於小強的故事。對小強來說,這個故事有點悲傷,因為這是殺蟲劑和小強的故事…
  • 線性概率模型、probit模型和logit模型的聯繫與區別
    如果被解釋變量是離散的,而非連續值,則需要運用"離散選擇模型"(discrete choice
  • reg2logit:用OLS估計Logit模型參數
    LDM 模型來源於 LPM 和 logit 模型的轉換。首先,LDM 可以轉換為一個 logit 模型,其次,線性概率模型 (LPM) 的參數估計能夠轉換為「第一步轉換後的 Logit 模型」參數的極大似然估計。
  • 計量回歸中的交互項到底什麼鬼? 捎一本書給你
    「交互作用」概念  (1)主效應:某一變量不依賴於其他變量的獨立作用  (2)交互效應:條件效應,某一變量發揮作用的同時,也會與其他變量協同發揮作用,或者依賴於其他某個變量。  (3)交互效應應考慮變量間的協方差和聯合顯著性(test _b[var1]=_b[var2]=0)  (4)虛擬變量:由分類變量編碼而成,作為「分類」的自變量使用。
  • Stata:圖示交互效應-調節效應
    期刊論文中的調節效應圖2. 如何繪調節效應圖 ?2.1 在excel中繪出交互圖2.2 在 Stata 中繪出交互圖3. 呈現調節作用的其他方式 實證分析中,交乘項的使用非常的普遍。期刊論文中的調節效應圖一般我們在檢驗調節(交互)作用的時候,得到回歸結果之後往往需要在文章中附上調節作用圖,能夠直觀的從圖形上觀察到調節效應。示例 1: Li, J., & Tang, Y. (2010).
  • Stata: 手動計算和圖示邊際效應
    連享會-交乘項 (調節效應) 專題系列在建立模型時,我們往往會根據一定的經濟理論加入一些交乘項,在 Stata 裡,用 margins 命令可以直接得到相關變量的邊際效應,進而可以使用 marginsplot 圖示邊際效應,詳情參見 [Stata:邊際效應分析]。
  • regife:面板交互固定效應模型-Interactive Fixed Effect
    交互固定效應簡介一般而言,面板數據模型誤差項由以下幾部分組成:面板數據模型的好處之一是,在模型中引入個體和時間固定效應,並通過去均值處理把不可觀測因素差分掉,從而可以減少由於不隨時間或個體變化的遺漏變量與解釋變量相關導致的內生性問題。