teffects psmatch (y) (t x1 x2 x3), atet nn(#) caliper(#)左右滑動查看更多
其中,y 為結果變量(outcome variable),t 為處理變量(treatment variable),而 x1,x2 與 x3為協變量(covariates)。默認使用 Logit 估計傾向得分。
選擇項「atet」表示估計「參與者平均處理效應」(Average Treatment Effect on the Treated),默認估計所有個體的「平均處理效應」(Average Treatment Effect)。選擇項「nn(#)」表示進行「一對#」的最近鄰匹配(nearest neighbor matching),默認為「nn(1)」,即一對一匹配。選擇項「caliper(#)」表示在某個卡尺範圍內進行匹配;比如「caliper(0.1)」,表示僅考慮在傾向得分的差異不超過0.1的個體之間進行匹配。下面以 Stata 自帶的數據集 cattaneo2.dta 為例。該數據集可用於研究「懷孕期母親是否抽菸」(mbsmoke)對於「新生兒體重」(bweight)的影響。此例子中的協變量為「母親是否結婚」(mmarried),母親年齡(mage)及其平方,「是否第一胎」(fbaby),以及「母親的教育年限」(medu)。左右滑動查看更多
先看一下相關變量的統計特徵:
sum bweight mbsmoke mmarried c.mage##c.mage fbaby medu左右滑動查看更多
其中,上述命令中的「c.mage##c.mage」包括了「mage」及其平方「c.mage#c.mage」。
進一步,考察吸菸組(處理組)與不吸菸組(控制組)的新生兒體重差異特徵。bysort mbsmoke: sum bweight左右滑動查看更多
從上表可知,不吸菸組(nonsmoker)的新生兒平均體重為3412.912克,而吸菸組(smoker)的新生兒平均體重僅為3137.66千克。這兩組新生兒體重的平均差異是否顯著呢?為此,下面進行一對一的傾向得分匹配。teffects psmatch (bweight) (mbsmoke mmarried c.mage##c.mage fbaby medu)左右滑動查看更多
上表所提供的標準誤即為「AI Robust Std. Err.」。由上表可知,吸菸組與非吸菸組的新生兒平均體重的差異在1%水平上顯著(p 值為0.000)。teffects psmatch 默認進行一對一的傾向得分匹配。一對一匹配的優點是偏差(bias)較小,但方差(variance)可能較大。為此,加上選擇項「nn(4)」,進行一對四的傾向得分匹配。更多關於命令 teffects psmatch 的介紹,參見help teffects psmatch,以及相應的Stata手冊(Stata manual)。_____________________________________
陳強,《高級計量經濟學及Stata應用》,第2版,高等教育出版社,2014年。陳強,《計量經濟學及Stata應用》,高等教育出版社,2015年。►一周熱文
數據呈現丨R畫樹狀圖:一種輕量級方法
因果推斷丨中國學者用雙重差分做了哪些工作?
數據呈現丨R語言相關關係可視化函數梳理
數據呈現丨R語言可視化學習筆記之gganimate包
統計計量丨工具變量法(四):GMM
軟體應用丨經濟學專業學習Python之數據存儲篇
軟體應用丨38個常用Python庫:數值計算、可視化、機器學習等8大領域都有了