因果推斷異質性是什麼? 邊際處理效應讓你與眾不同

2021-01-20 計量經濟圈

凡是搞計量經濟的，都關注這個號了

郵箱：econometrics666@126.com

所有計量經濟圈方法論叢的code程序, 宏微觀資料庫和各種軟件都放在社群裡.歡迎到計量經濟圈社群交流訪問.

微觀數據有兩個基本特徵: 異質性以及缺少與實際相反的狀況。由於存在未被觀測到的異質性，即使在所有可以被觀測到的方面都相同的人們仍然會做出不同的決策、獲得不同的收入、選擇不同的投資組合缺。少與實際相反的狀況引發了數據缺失問題，如果某人實際選擇了一種狀況，我們就不可能觀測到他(她)做出其他選擇時的結果。如果我們觀測到某大學畢業生的當前收入水平,我們就不可能同時觀測到假使他(她)高中畢業就參加工作的當前收入水平。

過去 ,解決選擇和數據缺失問題的方法大多沒有考慮異質性 ,他們一般都假設不同的個人具有同質性。但Heckman, Vytlacil和Carneiro這三位前輩等研究所形成的邊際政策效應(MTE)方法認為，人們會根據比較優勢原理對是否參與某項政策或倡議進行抉擇。只有當參與這項政策或倡議所帶來的收益大於為此付出的機會成本，該個體才會有積極性參與該項政策或倡議。這些人根據未被觀測到的自身特徵(比如個人能力、個人態度等)選擇接受(拒絕)參與某項政策或倡議。邊際政策效應MTE,是指處於接受或不接受某項政策或倡議的臨界狀態的人在最終選擇接受該項政策或倡議時的平均收益(成本)。

現在，假設我們想要看看讀大學是不是對我們的收入有所增加，即看看教育回報率水平。考慮如下明瑟爾(Mincer)方程，其參數為常數，這是假設不存在異質性時的傳統教育回報模型。lnYi =βSi +γXi +Ui (方程1)，其中 i 表示不同的個人(i =1 , 2 , …, n)，lnYi 為收入的對數形式，Si 表示受教育水平, Xi 為解釋變量向量 ,比如工作年限、工作年限的平方、以及性別、地區、產業、企業所有制等虛擬變量，Ui 是期望為零的隨機誤差項，β 為教育回報率, γ為係數向量。直接運用普通最小二乘法(OLS)對方程(1)進行估計存在一個問題：該模型可能遺漏了個人能力變量 Ai，它被包含在誤差項 Ui 之中。許多實證分析認為Cov(Ai, Si)≠0 ,因此 E(Ui Si)≠0 。此時最小二乘法只能得出有偏、非一致的估計量。可是，在現實生活中，大多數數據並不包括對個人能力的度量。於是不少經濟學家想方設法運用一些變通的方法, 試圖來消除或減弱個人能力偏差。

然而，當存在異質性和選擇偏差時，傳統工具變量方法通常也無法準確估計教育回報參數。當存在異質性和選擇偏差時，Heckman等研究表明，可以通過局部工具變量方法 (LIV)對參數進行估計，通過邊際處理效應 (MTE)估計異質教育回報。MTE表示當Xi(可觀測到的異質性)與未觀測到的異質性給定的情況下，處於接受或不接受教育臨界狀態的人最終選擇接受教育時的平均回報(局部水平)。在這種情況下，我們想一種比方程(1)更為普遍的形式 ,它考慮了教育的異質性回報，用隨機係數的形式表示如下：lnYi = βiSi +γXi +Ui (方程2)其中 βi 表示存在異質性時的教育回報率，因人而異。Xi 是由其他解釋變量組成的向量，該模型在一種更為普遍的條件下對個人能力偏差進行了校正。

如果我們想著重討論兩種教育水平的選擇：高中和大學。令 Si =1 表示大學學歷，Si =0 表示高中學歷(沒有接受大學教育)。大量證據表明, 在多數情況下，教育回報與受教育年限並不成線性關係，使用傳統的收入對數對於學歷的回歸係數將導致對教育回報率估計的嚴重偏差。兩種潛在的選擇結果(lnY0i, lnY1i)可以表示為(不要跳過去下面這個簡單的公式):

由於存在數據缺失問題,在橫截面上想同時獲知一個人的 lnY0i 和 lnY1i 通常是不可能的。我們僅僅可以確定分布而不可能確定分布和。由於異質性及選擇問題的普遍存在，我們不可能再使用諸如 OLS 和 IV 的傳統方法來估計參數。對結果進行整理，有 :

其中，βi表示個體 i 的異質性教育回報。當 γ1 ≠γ0(即存在觀測到的異質性(γ1 -γ0)Xi),或 U1i ≠U0i(即存在未觀測到的異質性(U1i -U0 i))時，βi 在總體中是一個變量，教育回報是一個服從於一定分布的隨機變量。在給定 X 的條件下，βi 的平均值為:

假設人們根據下述選擇規則來決定是否進入大學學習，這本質上是一個典型的「收益—成本分析」問題。

其中 S i 星為隱藏變量, 代表入學的淨收益, Zi 是可觀測到的變量向量(Zi 可能包含部分 Xi)。Pi =Pi(Zi)表示參與或接受政策(比如進入大學學習)的概率，它可用概率模型或邏輯模型估計出來。Usi 表示個體i 在政策選擇過程中未被觀測到的異質性——未觀察到的選擇該政策時遇到的阻力(比如因為在讀書期間需要付出的機會成本)。對於個體 i來說，是否進入大學學習完全取決於觀測到的異質性 Pi(Zi)與未被觀測到的異質性 Usi 之間的比較。即我們是通過可以觀測到的個人特徵變量(比如父母教育、父母收入、戶口、黨員身份等)去預測這個個體是否上大學。

然後，我們以預測得到的傾向得分(propensity score)與這個個體不能被觀測到的選擇該政策時遇到的阻力(resistance to treatment)進行比較。此時，預測到的傾向得分P與未被觀測到的個體異質性Usi都在[0,1]區間，在不失一般性的情況下，可以假定二者都服從均勻分布(uniform distribution)。這樣，我們就有了二個連續均勻分布函數，只要他們倆有足夠的共同支持區間(common support)，那我們就可以得到個體上大學學習的可能性。當然Usi越小——選擇上大學這個決策時所遇到的未能觀測到的阻力越小，那這個個體去讀大學的可能性越高。

我們有三種方法去求出邊際處理效應MTE：局部工具變量法local IV，分離方法(separate approach)——我們分別估計InYi在處理組和控制組的條件期望值，極大似然法——我們知道誤差項U0i, U1i和Vi的概率分布通過似然函數最大化估計。具體是怎麼回事，咱們就不累贅了，因為這會牽扯到很多多餘的公式計算。

考慮到是否讀大學在mincer方程中是內生變量，因此，我們使用到當地大學的距離來衡量這個地方的「農村化程度」(城市化程度)，畢竟越是距離當地大學越近，那麼這個個體更加有可能上大學(可能有爭議)。下面這個式子是局部工具變量法估計時所需要求得的參數，比如β0，β0-β1，K(p)。

下面第一、二欄的這些回歸結果都是關於協變量的exp, exp2, district的，而真正讓我們感興趣的部分是黃顏色的「effects」裡的ATE，ATT，ATUT這些關於上大學的政策效應。從這個回歸結果中，我們知道上大學的導致的收入效應約為32.8%(整體樣本)，而在上了大學的那部分樣本中的效應上升為53.7%，在沒有上過大學的那部分樣本中的效應只為12%。

ssc install mtefe

set seed 1234567

mtefe_gendata, obs(10000) districts(10)

mtefe lwage exp exp2 i.district (col=distCol)

上面最後二行的test，都表明不僅可觀測的特徵變量Xi存在這異質性，而且不可觀測的個體特徵Ui也存在異質性。鑑於此，我們使用MTE這種方法在這裡是適當的，而且也是更加合適和有效的選擇。

以下就是咱們通過probit或logit方程得到的個體上大學的傾向得分在處理組和控制組中的分布情況。我們可以看出，在整個0-1的區間裡，傾向得分P在處理組和控制組都有重合的部分，即沒有出現只有處理組(控制組)的情況。

下面這張圖是我們最關心的，因為它集中展示了邊際處理效應在整個Ui上的變化趨勢。Ui越小表示個體上大學的概率越大，Ui越大表示個體上大學的概率越小。因此，隨著個體上大學的概率變大，上大學的教育回報率是在增加的；而隨著個體上大學的概率變小，上大學的教育回報率是減少的(MTE在整個區間上的均值為32%)。這足以看出來我們的個體存在selection into treatment on unobservables，個體會根據不能觀察的因素而選擇是否讀大學(這個不能通過Xi來單獨刻畫)。因此，我們需要通過如下的一個「是否讀大學」的概率分布，來刻畫政策處理效應在個體間的不同。

參考文獻：https://link.springer.com/chapter/10.1007/978-94-007-6094-3_11

有些學術神器，推薦給各位：①找合適的英文期刊發表的神器! 親測太好用了！②神器! SSCI分區及影響因子查詢, 還有國人發表比例，③學術神器Endnote的最詳盡使用方法，④一數學神器誕生! 手寫公式和符號, 竟免費轉成LaTex，⑤讓LaTeX排版流行起來, 讓效率助你奔跑助你飛。

拓展性閱讀："實證研究13篇"功夫秘笈, 中青年學者研究必備錦囊！①關於各種因果識別方法的120份經典實證文獻匯總」，②哈佛大學新修訂完成的因果推斷經典大作免費下載！附數據和code，③因果推斷的統計方法總結, 177份文獻，④政策評估的計量方法綜述, 包括最新因果推斷方法，⑤在教育領域使用IV, RDD, DID, PSM多嗎? 使用具體文獻，⑥看完頂級期刊文章後, 整理了內生性處理小冊子，⑤工具變量精闢解釋, 保證你一輩子都忘不了，⑦DID, 合成控制, 匹配, RDD四種方法比較, 適用範圍和特徵，⑧關於雙重差分法DID的32篇精選Articles專輯！⑨關於(模糊)斷點回歸設計的100篇精選Articles專輯！⑩匹配方法(matching)操作指南, 值得收藏的16篇文章等，⑪MIT廣為流傳的政策"處理效應"讀本，⑫DID的研究動態和政策評估中應用的文獻綜述，⑬最新政策效應評估的四種方法，⑭政策效應評估的基本問題。

下面這些短連結文章屬於合集，可以收藏起來閱讀，不然以後都找不到了。

2.5年，計量經濟圈近1000篇不重類計量文章，

可直接在公眾號菜單欄搜索任何計量相關問題,

Econometrics Circle

計量經濟圈組織了一個計量社群，有如下特徵：熱情互助最多、前沿趨勢最多、社科資料最多、社科數據最多、科研牛人最多、海外名校最多。因此，建議積極進取和有強烈研習激情的中青年學者到社群交流探討，始終堅信優秀是通過感染優秀而互相成就彼此的。

因果推斷異質性是什麼? 邊際處理效應讓你與眾不同

相關焦點

哈佛大學Hernan教授《因果推斷:What If》新書,311頁講解因果效應(附下載)

異質性、隨機誤差、效應修飾——談談Meta分析的固有缺陷

再談合成控制法SCM, 幫你尋找因果推斷控制組

搞懂因果推斷中內生性問題解決方法必讀的書籍和文獻已搜集好!

跨媒體因果推斷

Stata講座:因果推斷中的雙重差分法開講

千奇百怪的效應——邊際效應

Python實現固定效應回歸模型實現因果關係推斷

「深度」AB測試中的因果推斷——隨機化分流

邊際效應遞減:滿足感的加減法

因果推理「三問」:是什麼?為什麼需要?如何使用?|內生性|因果關係|...

『因果推斷』主要英文期刊推薦

隨機分配是什麼, 為什麼重要, 對因果關係影響幾何?

因果推理「三問」:是什麼?為什麼需要?如何使用?

因果推斷領域新書(附PDF):Causal Inference: What If

聊聊那些擁有「邊際效應」的產品

異質性與貨幣政策傳導機制研究進展

加班,致使邊際效應遞減

邊際遞減效應:教育,更多的時候不能是錦上添花,而應該雪中送炭

反向人與蝴蝶效應,因果關係有什麼區別?