統計計量丨傾向得分匹配:psmatch2 還是 teffects psmatch

2021-03-02 數據Seminar

傾向得分匹配（Propensity Score Matching，簡記 PSM）常用於估計微觀數據的處理效應（treatment effects），特別適用於樣本容量較大，而且協變量（控制變量）較多的情形。在 Stata 命令中，psmatch2 是較早出現的PSM非官方命令。然而，雖然 psmatch2 提供了豐富的具體匹配方法，但它最大的缺陷則在於其標準誤（standard errors）並不正確。基於標準誤對於統計推斷的重要性，這是 psmatch2 的致命弱點。事實上，psmatch2 在匯報 PSM 估計結果時，已經委婉暗示了此局限性。比如，在下圖 psmatch2 估計結果底部的 Note 中，已經聲明「所提供的標準誤並未考慮到傾向得分是估計的」（S.E. does not take into account that the propensity score is estimated）。這意味著，在計算此標準誤中，有個不現實的假定，即假設所估計的傾向得分就是真正的傾向得分；這自然會導致偏差。那麼，能否用自助法（bootstrap）來得到正確的標準誤呢？很遺憾，也不行，Abadie and Imbens (2008, Econometrica) 已經證明了這一點。這是因為，bootstrap standard errors 的成立有一個前提條件，即統計量必須是樣本數據的連續函數；而對於傾向得分匹配，這一前提並不成立。不難想像這樣一種的情形，即雖然協變量只有微小的變動，卻導致匹配到另一位個體，使得匹配結果發生不連續的劇烈變動。PSM的正確標準誤直到2012年才由 Abadie and Imbens (2012, working paper) 給出，並最終於2016年發表於Econometrica。Abadie與 Imbens 所提出的 PSM 標準誤，充分考慮到了第一階段估計傾向得分的誤差，故為一致估計。說起這兩位作者，均是當今的計量大牛。其中，MIT 經濟系教授 Alberto Abadie正是如今炙手可熱的「合成控制法」（Synthetic Control Method）之創始人。而 Stanford 經濟系教授 Guido Imbens 在因果推斷方面建樹頗豐；比如，在使用局部線性回歸（local linear regression）進行斷點回歸時，常用於確定帶寬的IK法，即來自於Imbens and Kalyanaraman (2010)。當然，Imbens 還有一位或許名氣更大的妻子 Susan Athey（曾為微軟首席經濟學家），在此按下不表。自 Stata 13 以來，推出了關於處理效應的官方命令 teffects，其中的一個主要子命令即為 teffects psmatch。此官方命令雖然提供的匹配方法不如 psmatch2 豐富，但最大的優點是給出了由 Abadie 與 Imbens 所提出的正確標準誤，稱為「AI穩健標準誤」（AI Robust Standard Errors）。猛一看，還以為是「人工智慧穩健標準誤」……命令 teffects psmatch 的基本格式很簡單：

teffects psmatch (y) (t x1 x2 x3), atet nn(#) caliper(#)

左右滑動查看更多

其中，y 為結果變量（outcome variable），t 為處理變量（treatment variable），而 x1，x2 與 x3為協變量（covariates）。默認使用 Logit 估計傾向得分。
選擇項「atet」表示估計「參與者平均處理效應」（Average Treatment Effect on the Treated），默認估計所有個體的「平均處理效應」（Average Treatment Effect）。選擇項「nn(#)」表示進行「一對#」的最近鄰匹配（nearest neighbor matching），默認為「nn(1)」，即一對一匹配。選擇項「caliper(#)」表示在某個卡尺範圍內進行匹配；比如「caliper(0.1)」，表示僅考慮在傾向得分的差異不超過0.1的個體之間進行匹配。下面以 Stata 自帶的數據集 cattaneo2.dta 為例。該數據集可用於研究「懷孕期母親是否抽菸」（mbsmoke）對於「新生兒體重」（bweight）的影響。此例子中的協變量為「母親是否結婚」（mmarried），母親年齡（mage）及其平方，「是否第一胎」（fbaby），以及「母親的教育年限」（medu）。

左右滑動查看更多

先看一下相關變量的統計特徵：

sum bweight mbsmoke mmarried c.mage##c.mage fbaby medu

左右滑動查看更多

其中，上述命令中的「c.mage##c.mage」包括了「mage」及其平方「c.mage#c.mage」。
進一步，考察吸菸組（處理組）與不吸菸組（控制組）的新生兒體重差異特徵。

bysort mbsmoke: sum bweight

左右滑動查看更多

從上表可知，不吸菸組（nonsmoker）的新生兒平均體重為3412.912克，而吸菸組（smoker）的新生兒平均體重僅為3137.66千克。這兩組新生兒體重的平均差異是否顯著呢？為此，下面進行一對一的傾向得分匹配。

teffects psmatch (bweight) (mbsmoke mmarried c.mage##c.mage fbaby medu)

左右滑動查看更多

上表所提供的標準誤即為「AI Robust Std. Err.」。由上表可知，吸菸組與非吸菸組的新生兒平均體重的差異在1%水平上顯著（p 值為0.000）。teffects psmatch 默認進行一對一的傾向得分匹配。一對一匹配的優點是偏差（bias）較小，但方差（variance）可能較大。為此，加上選擇項「nn(4)」，進行一對四的傾向得分匹配。更多關於命令 teffects psmatch 的介紹，參見help teffects psmatch，以及相應的Stata手冊（Stata manual）。

_____________________________________

陳強，《高級計量經濟學及Stata應用》，第2版，高等教育出版社，2014年。陳強，《計量經濟學及Stata應用》，高等教育出版社，2015年。

►一周熱文

數據呈現丨R畫樹狀圖：一種輕量級方法

因果推斷丨中國學者用雙重差分做了哪些工作？

數據呈現丨R語言相關關係可視化函數梳理

數據呈現丨R語言可視化學習筆記之gganimate包

統計計量丨工具變量法（四）：GMM

軟體應用丨經濟學專業學習Python之數據存儲篇

軟體應用丨38個常用Python庫：數值計算、可視化、機器學習等8大領域都有了

相關焦點

傾向得分匹配:psmatch2 還是 teffects psmatch

在 Stata 命令中，psmatch2 是較早出現的PSM非官方命令。時至今日，仍不時有學生來諮詢我在使用 psmatch2 過程中所遇到的種種問題，可見其依然流行。然而，雖然 psmatch2 提供了豐富的具體匹配方法，但它最大的缺陷則在於其標準誤（standard errors）並不正確。基於標準誤對於統計推斷的重要性，這是 psmatch2 的致命弱點。
傾向匹配得分教程【pscore、psmatch2、官方命令Teffects操作及應用】

本文主要包括傾向匹配得分命令簡介、語法格式、傾向匹配得分操作步驟思路，涉及傾向匹配得分應用、平衡性檢驗、共同取值範圍檢驗、核密度函數圖等內容。
關於 psmatch2 與 teffects psmatch 估計結果差異的一個原因

關於 psmatch2 與 teffects psmatch 估計結果差異的一個原因關於具體 PSM 方法的原理，我不做過多闡述，這裡我僅討論teffects psmatch和psmatch2在stata中的估計結果不相同的一個原因。
傾向匹配得分教程(附PSM操作應用、平衡性檢驗、共同取值範圍、核密度函數圖)

計量百科·資源·乾貨：本文主要包括傾向匹配得分命令簡介、語法格式、傾向匹配得分操作步驟思路，涉及傾向匹配得分應用、平衡性檢驗、共同取值範圍檢驗、核密度函數圖等內容。在傾向得分匹配方法（ Propensity Score Matching ）中，根據處理指示變量將樣本分為兩個組，一是處理組，在本例中就是在 NSW 實施後接受培訓的組；二是對照組（ comparison group ），在本例中就是在 NSW 實施後不接受培訓的組。
傾向得分匹配(PSM)操作過程與問題反思

方法五：馬氏距離由於在傾向得分匹配第一階段估計傾向得分時存在不確定性，Abadie and Imbens的相關研究又重新回到更簡單的馬氏距離，進行有放回且允許並列的k近鄰匹配，針對非精確匹配一般存在偏差，提出了偏差校正的方法
一文讀懂傾向得分匹配法(PSM)舉例及stata實現(一)

本文主要包括傾向匹配得分命令簡介、語法格式、傾向匹配得分操作步驟思路，涉及傾向匹配得分應用、平衡性檢驗、共同取值範圍檢驗、核密度函數圖等內容。
PSM-傾向得分匹配分析的誤區

[Link1], [Link2]❝「目錄」❞1.背景2.傾向得分匹配3.會計研究中使用情況4.應用案例4.2 解讀：採用 regress 命令完成 PSM 的回歸分分析5.PSM 使用建議相關課程❝1.
內生性問題和傾向得分匹配, 獻給準自然試驗的厚禮

方法五：馬氏距離由於在傾向得分匹配第一階段估計傾向得分時存在不確定性，Abadie and Imbens的相關研究又重新回到更簡單的馬氏距離，進行有放回且允許並列的k近鄰匹配，針對非精確匹配一般存在偏差，提出了偏差校正的方法，通過回歸的方法估計偏差，然後得到偏差校正匹配估計量。
Stata新命令:psestimate - 傾向得分匹配中協變量的篩選

-連享會傾向得分匹配分析 (PSM) 已經在諸多領域得到了應用。平衡性假設在 PSM 匹配時，用treat變量對控制變量進行Logit回歸，得到傾向得分值。傾向得分值最接近的控制組個體即為實驗組的配對樣本，通過這種方法可以最大程度減少實驗組與控制組個體存在的系統性差異，從而減少估計偏誤。
玩轉Stata | 傾向得分配對(PSM)內生性檢驗利器

所以在此介紹傾向得分匹配方法（PSM）。本文在此就不介紹相關理論了，因為小編的理論也不是特別的好，如果想學習的可以參閱連玉君老師的相關視頻（重點推介），大概有5個課時；同時也可以參考陳強老師的《高級計量經濟學及stata應用》中的第28章處理效應。在此小編僅僅介紹stata的相關操作。
Propensity Score Matching 傾向得分匹配

因此，依據傾向得分進行匹配是一個簡單易行的選擇。我們丟棄觀測組中傾向得分低於實驗組傾向得分最小值、以及高於實驗組傾向得分最大值的數據，保證只比較有相似的傾向得分的實驗組和觀測組對象，然後分析數據的分布。
王群勇教授《給小白的計量入門課》答疑分享

異方差問題可以直接修正標準誤，使用xtreg y x1 x2, fe vce(robust)。當你面板數據時間維度t比較長的，要做單位根檢驗，避免出現偽回歸問題。③Cragg-Donald Wald F統計量，原假設為存在弱工具變量。
傾向得分匹配法的詳細解讀.doc

今天，商小研就要給大家介紹一種可以用來緩解自選擇偏誤的計量方法——傾向得分匹配法！個體的協變量集是多維度的，我們需要考慮如何將個體按照現有的多維度協變量集進行適當的匹配，這就是引入傾向得分值的緣由了。到了這裡，想必大家對傾向得分匹配（PSM）的基本邏輯有了一定的認識了吧！1.選擇合適的協變量集協變量集中的協變量一般來說應該對被解釋變量和解釋變量都有影響。2.確定選擇性的存在確定我們的解釋變量不是隨機的。
因果推斷簡介之四:因果推斷簡介之四:觀察性研究,可忽略性和傾向得分

Neyman; propensity score; 傾向得分; 匹配; 可忽略性; 回歸分析; 因果推斷; 混雜因素; 觀察性研究; 隨機化試驗這節採用和前面相同的記號。Z 表示處理變量（1 是處理，0是對照），Y 表示結果，X 表示處理前的協變量。
統計計量丨如何正確運用計量經濟模型進行實證分析

計量經濟學是結合了經濟學理論和統計學的定量分析方法，沒有經濟學理論基礎的計量經濟分析，很可能會導致偽回歸結果。某些特殊的數據結構，如非平穩的時間序列或非平穩的空間數據，都可能導致偽回歸結果。再次，計量經濟學的基礎雖然是統計學，但是兩者之間還存在一些差異。由於技術上的限制，現有的計量經濟模型的檢驗還是基於統計檢驗，所謂「顯著性」都是統計上的顯著性，這不同於「經濟上的顯著性」。
一篇博士生難讀懂卻又必讀的神文, 它來自於QJE的計量方法精粹之作!

首先需要檢驗除安全得分外的所有變量在捨入閾值處是否平穩變化。表1反映了前期平衡結果，樣本前期特徵作為被解釋變量代入模型，列1和列2反映第季度，列3和列4反映整個前期，結果係數均較小，且在統計上不顯著，再考慮到抽樣誤差，幾乎沒有統計上的顯著差異。
計量經濟學常用英語詞彙,都在這裡了!

1、零基礎起步，初級+高級課程，涵蓋數據管理+橫截面+時間序列+面板數據+門限回歸+傾向匹配得分+合成控制法+斷點回歸+雙重差分+空間計量等專題，幫助你建立系統的計量體系2、理論與軟體並重，課程涵蓋理論介紹、軟體操作、案例應用、解釋結果、講解答疑等，手把手教你學Stata軟體操作與分析3、在原有4天班精彩內容基礎上，這次5天高級班又增加了很多乾貨內容
統計計量丨常見統計檢驗的本質都是線性模型(或:如何教統計學) Python版(上)

注意scipy.stats.pearsonr和smf.ols（scaled）如何具有相同的斜率，p值和t值。還要注意，來自scipy.stats的統計函數不提供置信區間，而使用smf.ols進行線性回歸則可以。
傾向得分配對宏

本篇文章所使用的數據與宏文件如下：連結：http://pan.baidu.com/s/1c2s9LoG 密碼：ytwh連結：http://pan.baidu.com/s/1i5nFSpv 密碼：n7xg[問題]配對好睏難呀，請問傾向得分配對要如何處理呢
傾向性匹配得分分析(PSM)是一種不太靠譜的方法

2. 我們也可以通過PSM的方法，試驗組接受職業培訓的185例，對照組未接受職業培訓429例，我們從429例對照裡篩選一些人，讓這些人的協變量（age, educ, black, hispan, married, nodegree, re74, re75）與試驗組均衡可比。我們首先進行多元線性回歸分析，多元線性回歸的軟體操作略，計算結果如圖2.所示。

統計計量丨傾向得分匹配:psmatch2 還是 teffects psmatch

相關焦點

傾向得分匹配:psmatch2 還是 teffects psmatch

傾向匹配得分教程【pscore、psmatch2、官方命令Teffects操作及應用】

關於 psmatch2 與 teffects psmatch 估計結果差異的一個原因

傾向匹配得分教程(附PSM操作應用、平衡性檢驗、共同取值範圍、​核密度函數圖)

傾向得分匹配(PSM)操作過程與問題反思

一文讀懂傾向得分匹配法(PSM)舉例及stata實現(一)

PSM-傾向得分匹配分析的誤區

內生性問題和傾向得分匹配, 獻給準自然試驗的厚禮

Stata新命令:psestimate - 傾向得分匹配中協變量的篩選

玩轉Stata | 傾向得分配對(PSM)內生性檢驗利器

Propensity Score Matching 傾向得分匹配

王群勇教授《給小白的計量入門課》答疑分享

傾向得分匹配法的詳細解讀.doc

因果推斷簡介之四:因果推斷簡介之四:觀察性研究,可忽略性和傾向得分

統計計量丨如何正確運用計量經濟模型進行實證分析

一篇博士生難讀懂卻又必讀的神文, 它來自於QJE的計量方法精粹之作!

計量經濟學常用英語詞彙,都在這裡了!

統計計量丨常見統計檢驗的本質都是線性模型(或:如何教統計學) Python版(上)

傾向得分配對宏

傾向性匹配得分分析(PSM)是一種不太靠譜的方法

傾向匹配得分教程(附PSM操作應用、平衡性檢驗、共同取值範圍、核密度函數圖)