因果推斷異質性是什麼? 邊際處理效應讓你與眾不同

2021-01-20 計量經濟圈


凡是搞計量經濟的,都關注這個號了

箱:econometrics666@126.com

所有計量經濟圈方法論叢的code程序, 宏微觀資料庫和各種軟件都放在社群裡.歡迎到計量經濟圈社群交流訪問.

微觀數據有兩個基本特徵: 異質性以及缺少與實際相反的狀況。由於存在未被觀測到的異質性,即使在所有可以被觀測到的方面都相同的人們仍然會做出不同的決策、獲得不同的收入 、選擇不同的投資組合缺。少與實際相反的狀況引發了數據缺失問題,如果某人實際選擇了一種狀況,我們就不可能觀測到他(她)做出其他選擇時的結果。如果我們觀測到某大學畢業生的當前收入水平,我們就不可能同時觀測到假使他(她)高中畢業就參加工作的當前收入水平 。


過去 ,解決選擇和數據缺失問題的方法大多沒有考慮異質性 ,他們一般都假設不同的個人具有同質性。但Heckman, Vytlacil和Carneiro這三位前輩等研究所形成的邊際政策效應(MTE)方法認為,人們會根據比較優勢原理對是否參與某項政策或倡議進行抉擇。只有當參與這項政策或倡議所帶來的收益大於為此付出的機會成本,該個體才會有積極性參與該項政策或倡議。這些人根據未被觀測到的自身特徵(比如個人能力、個人態度等)選擇接受(拒絕)參與某項政策或倡議。邊際政策效應MTE,是指處於接受或不接受某項政策或倡議的臨界狀態的人在最終選擇接受該項政策或倡議時的平均收益(成本)。


現在,假設我們想要看看讀大學是不是對我們的收入有所增加,即看看教育回報率水平。考慮如下明瑟爾(Mincer)方程,其參數為常數,這是假設不存在異質性時的傳統教育回報模型。lnYi =βSi +γXi +Ui  (方程1),其中 i 表示不同的個人(i =1 , 2 , …, n),lnYi 為收入的對數形式,Si 表示受教育水平, Xi 為解釋變量向量 ,比如工作年限、工作年限的平方 、以及性別 、地區 、產業、企業所有制等虛擬變量,Ui 是期望為零的隨機誤差項,β 為教育回報率, γ為係數向量 。直接運用普通最小二乘法(OLS)對方程(1)進行估計存在一個問題:該模型可能遺漏了個人能力變量 Ai,它被包含在誤差項 Ui 之中。許多實證分析認為Cov(Ai, Si)≠0 ,因此 E(Ui Si)≠0 。此時最小二乘法只能得出有偏、非一致的估計量。可是,在現實生活中,大多數數據並不包括對個人能力的度量。於是不少經濟學家想方設法運用一些變通的方法, 試圖來消除或減弱個人能力偏差。


然而,當存在異質性和選擇偏差時,傳統工具變量方法通常也無法準確估計教育回報參數。當存在異質性和選擇偏差時,Heckman等研究表明,可以通過局部工具變量方法 (LIV)對參數進行估計,通過邊際處理效應 (MTE)估計異質教育回報。MTE表 示當Xi(可觀測到的異質性)與 未 觀 測 到 的 異 質 性 給 定 的 情 況 下,處於接受或不接受教育臨界狀態的人最終選擇接受教育時的平均回報(局部水平)。在這種情況下,我們想一種比方程(1)更為普遍的形式 ,它考慮了教育的異質性回報,用隨機係數的形式表示如下:lnYi = βiSi +γXi +Ui (方程2)其中 βi 表示存在異質性時的教育回報率,因人而異 。Xi 是由其他解釋變量組成的向量,該模型在一種更為普遍的條件下對個人能力偏差進行了校正。


如果我們想著重討論兩種教育水平的選擇:高中和大學。令 Si =1 表示大學學歷,Si =0 表示高中學歷(沒有接受大學教育)。大量證據表明, 在多數情況下,教育回報與受教育年限並不成線性關係,使用傳統的收入對數對於學歷的回歸係數將導致對教育回報率估計的嚴重偏差。兩種潛在的選擇結果(lnY0i, lnY1i)可以表示為(不要跳過去下面這個簡單的公式):

由於存在數據缺失問題,在橫截面上想同時獲知一個人的 lnY0i 和 lnY1i 通常是不可能的。我們僅僅可以確定分布而不可能確定分布。由於異質性及選擇問題的普遍存在,我們不可能再使用諸如 OLS 和 IV 的傳統方法來估計參數。對結果進行整理,有 :

其中,βi表示個體 i 的異質性教育回報。當 γ1 ≠γ0(即存在觀測到的異質性(γ1 -γ0)Xi),或 U1i ≠U0i(即存在未觀測到的異質性(U1i -U0 i))時,βi 在總體中是一個變量,教育回報是一個服從於一定分布的隨機變量。在給定 X 的條件下,βi 的平均值為:

假設人們根據下述選擇規則來決定是否進入大學學習 ,這本質上是一個典型的「收益—成本分析」問題。

其中 S i 星為隱藏變量, 代表入學的淨收益, Zi 是可觀測到的變量向量(Zi 可能包含部分 Xi)。Pi =Pi(Zi)表示參與或接受政策(比如進入大學學習)的概率,它可用概率模型或邏輯模型估計出來。Usi 表示個體i 在政策選擇過程中未被觀測到的異質性——未觀察到的選擇該政策時遇到的阻力(比如因為在讀書期間需要付出的機會成本)。對於個體 i來說,是否進入大學學習完全取決於觀測到的異質性 Pi(Zi)與未被觀測到的異質性 Usi 之間的比較。即我們是通過可以觀測到的個人特徵變量(比如父母教育、父母收入、戶口、黨員身份等)去預測這個個體是否上大學。


然後,我們以預測得到的傾向得分(propensity score)與這個個體不能被觀測到的選擇該政策時遇到的阻力(resistance to treatment)進行比較。此時,預測到的傾向得分P與未被觀測到的個體異質性Usi都在[0,1]區間,在不失一般性的情況下,可以假定二者都服從均勻分布(uniform distribution)。這樣,我們就有了二個連續均勻分布函數,只要他們倆有足夠的共同支持區間(common support),那我們就可以得到個體上大學學習的可能性。當然Usi越小——選擇上大學這個決策時所遇到的未能觀測到的阻力越小,那這個個體去讀大學的可能性越高。


我們有三種方法去求出邊際處理效應MTE:局部工具變量法local IV,分離方法(separate approach)——我們分別估計InYi在處理組和控制組的條件期望值,極大似然法——我們知道誤差項U0i, U1i和Vi的概率分布通過似然函數最大化估計。具體是怎麼回事,咱們就不累贅了,因為這會牽扯到很多多餘的公式計算。


考慮到是否讀大學在mincer方程中是內生變量,因此,我們使用到當地大學的距離來衡量這個地方的「農村化程度」(城市化程度),畢竟越是距離當地大學越近,那麼這個個體更加有可能上大學(可能有爭議)。下面這個式子是局部工具變量法估計時所需要求得的參數,比如β0,β0-β1,K(p)。


下面第一、二欄的這些回歸結果都是關於協變量的exp, exp2, district的,而真正讓我們感興趣的部分是黃顏色的「effects」裡的ATE,ATT,ATUT這些關於上大學的政策效應。從這個回歸結果中,我們知道上大學的導致的收入效應約為32.8%(整體樣本),而在上了大學的那部分樣本中的效應上升為53.7%,在沒有上過大學的那部分樣本中的效應只為12%。


ssc install mtefe  

set seed 1234567  

mtefe_gendata, obs(10000) districts(10) 

mtefe lwage exp exp2 i.district (col=distCol)  


上面最後二行的test,都表明不僅可觀測的特徵變量Xi存在這異質性,而且不可觀測的個體特徵Ui也存在異質性。鑑於此,我們使用MTE這種方法在這裡是適當的,而且也是更加合適和有效的選擇。


以下就是咱們通過probit或logit方程得到的個體上大學的傾向得分在處理組和控制組中的分布情況。我們可以看出,在整個0-1的區間裡,傾向得分P在處理組和控制組都有重合的部分,即沒有出現只有處理組(控制組)的情況。


下面這張圖是我們最關心的,因為它集中展示了邊際處理效應在整個Ui上的變化趨勢。Ui越小表示個體上大學的概率越大,Ui越大表示個體上大學的概率越小。因此,隨著個體上大學的概率變大,上大學的教育回報率是在增加的;而隨著個體上大學的概率變小,上大學的教育回報率是減少的(MTE在整個區間上的均值為32%)。這足以看出來我們的個體存在selection into treatment on unobservables,個體會根據不能觀察的因素而選擇是否讀大學(這個不能通過Xi來單獨刻畫)。因此,我們需要通過如下的一個「是否讀大學」的概率分布,來刻畫政策處理效應在個體間的不同。

參考文獻:https://link.springer.com/chapter/10.1007/978-94-007-6094-3_11

有些學術神器,推薦給各位:①找合適的英文期刊發表的神器! 親測太好用了!②神器! SSCI分區及影響因子查詢, 還有國人發表比例,③學術神器Endnote的最詳盡使用方法,④一數學神器誕生! 手寫公式和符號, 竟免費轉成LaTex,⑤讓LaTeX排版流行起來, 讓效率助你奔跑助你飛。

拓展性閱讀:"實證研究13篇"功夫秘笈, 中青年學者研究必備錦囊!①關於各種因果識別方法的120份經典實證文獻匯總」,②哈佛大學新修訂完成的因果推斷經典大作免費下載!附數據和code,③因果推斷的統計方法總結, 177份文獻,④政策評估的計量方法綜述, 包括最新因果推斷方法,⑤在教育領域使用IV, RDD, DID, PSM多嗎? 使用具體文獻,⑥看完頂級期刊文章後, 整理了內生性處理小冊子,⑤工具變量精闢解釋, 保證你一輩子都忘不了,⑦DID, 合成控制, 匹配, RDD四種方法比較, 適用範圍和特徵,⑧關於雙重差分法DID的32篇精選Articles專輯!⑨關於(模糊)斷點回歸設計的100篇精選Articles專輯!⑩匹配方法(matching)操作指南, 值得收藏的16篇文章等,⑪MIT廣為流傳的政策"處理效應"讀本,⑫DID的研究動態和政策評估中應用的文獻綜述,⑬最新政策效應評估的四種方法,⑭政策效應評估的基本問題。

下面這些短連結文章屬於合集,可以收藏起來閱讀,不然以後都找不到了。

2.5年,計量經濟圈近1000篇不重類計量文章,

可直接在公眾號菜單欄搜索任何計量相關問題,

Econometrics Circle

計量經濟圈組織了一個計量社群,有如下特徵:熱情互助最多、前沿趨勢最多、社科資料最多、社科數據最多、科研牛人最多、海外名校最多。因此,建議積極進取和有強烈研習激情的中青年學者到社群交流探討,始終堅信優秀是通過感染優秀而互相成就彼此的。

相關焦點

  • 哈佛大學Hernan教授《因果推斷:What If》新書,311頁講解因果效應(附下載)
    harvard.edu/miguel-hernan/causal-inference-book/在本書中,我們強調需要足夠認真對待因果問題,才能明確表述它,我們還區別了數據和因果推斷假設的不同作用。一旦建立了這些基礎,因果推斷就必然變得不那麼隨意,這有助於防止混淆。
  • 異質性、隨機誤差、效應修飾——談談Meta分析的固有缺陷
    剛才的答案是因為隨機誤差的存在,而現在我們需要再加一個因素:因為效應修飾的存在。 效應修飾是什麼?每一個RCT的樣本特徵不同,即基線協變量的聯合分布不同,使得不同RCT出現相對應於其基線分布特點的效應量。
  • 再談合成控制法SCM, 幫你尋找因果推斷控制組
    歡迎到以尋找因果關係為宗旨的因果推斷研究小組交流訪問.計量社群徐 Chang群友推薦.今天,我們「因果推斷研究小組」將為計量經濟圈的圈友們進一步引薦「合成控制法」。關於該方法的一些基礎性知識和實證中的操作,圈友們可以看看之前的文章合成控制法什麼鬼? 因果推斷的前沿方法指南。
  • 搞懂因果推斷中內生性問題解決方法必讀的書籍和文獻已搜集好!
    8.廣義合成控制法gsynth, Stata運行程序release,9.廣義合成控制法gsynth, 基於交互固定效應的因果推斷,10.再談合成控制法SCM, 幫你尋找因果推斷控制組,11.合成控制法什麼鬼? 因果推斷的前沿方法指南關於面板數據模型,1.面板數據方法免費課程, 文章, 數據和代碼全在這裡, 優秀學人好好收藏學習!
  • 跨媒體因果推斷
    跨媒體智能的主要基礎理論問題是借鑑生物的跨媒體信息表達和處理機理,實現智能感知和認知並做出決策。本論壇將從跨媒體智能的抽象歸納、演繹推理及因果推斷等方面,討論跨媒體大數據表徵與推理、分析因果計算的前沿理論和方法、探索跨媒體因果推斷的未來發展趨勢,並暢想未來的創新應用方向。
  • Stata講座:因果推斷中的雙重差分法開講
    主講嘉賓是中央財經大學社會發展學院王存同教授,講座題目為《因果推斷中的雙重差分法》。來自全國多所高校及科研機構的10596多名師生及研究者觀看了本場直播。本次講座王老師為大家帶來了因果推斷模型中的雙重差分法(DID)的介紹。因果推斷模型與方法是現代社會科學研究者利用計量模型發表高水平實證論文的核心利器,其中雙    重差分法(DID)佔有舉足輕重的地位。
  • 千奇百怪的效應——邊際效應
    邊際效應也是生活中很常見的效應,大意是在其他投入固定不變時,連續地增加某一項投入,新增的產出或收益反而會逐漸減少。邊際效應也叫做邊際效用,這個詞已經有100多年的歷史了。經濟學中有個學派叫邊際效用學派,他們的出現挑戰了當時的主流經濟學。
  • Python實現固定效應回歸模型實現因果關係推斷
    眾所周知,「相關並不意味著因果關係」。 我要告訴你,相關可以表示因果關係,但需要一定條件。 這些條件已在計量經濟學文獻中被廣泛討論。 在本文中,我將以一種易於理解的方式對其進行總結。 我將解釋如果不滿足這些條件為什麼標準的普通最小二乘(OLS)無法確定因果關係。 然後,我將介紹可以提供有效解決方案的固定效應(FE)模型。
  • 「深度」AB測試中的因果推斷——隨機化分流
    本文作者詳細的介紹了在統計推斷中對A/B模型的應用。上一篇文章「「深度」A/B測試中的因果推斷——潛在結果模型」中我們介紹了用於A/B測試因果推斷的潛在結果模型,現在我們來看看在統計推斷中如何應用這個模型,對試驗的因果效果進行估計。
  • 邊際效應遞減:滿足感的加減法
    在心理學上,邊際效應遞減規律是指:人們在某事物上投入情緒時,第一次接觸到此事物時情感體驗也最為強烈,但隨著接觸該事物的次數越多,情感體驗也越為淡漠,一步步趨向乏味。類似的,還有貝勃定律和韋伯定律也都闡述了這種現象。
  • 因果推理「三問」:是什麼?為什麼需要?如何使用?|內生性|因果關係|...
    譯者:AI研習社(聽風1996)  作為一名經濟學博士,我致力於尋找某些變量之間的因果關係,用來完成我的論文。因果關係強大到可以讓人們有足夠的信心去做決策、防止損失、求解最優解等。在本文中,我將討論什麼是因果關係,為什麼需要發現因果關係,以及進行因果推理的常用技巧。  1. 什麼是因果關係?
  • 『因果推斷』主要英文期刊推薦
    很多小夥伴在問,如何快速地獲取最新的『因果推斷』相關研究成果,小編的建議就是有針對性地選擇幾本經常刊發『因果推斷』理論、方法與應用的期刊,跟蹤期刊最新的文章
  • 隨機分配是什麼, 為什麼重要, 對因果關係影響幾何?
    附數據和code,③因果推斷的統計方法總結, 177份文獻,④政策評估的計量方法綜述, 包括最新因果推斷方法,⑤在教育領域使用IV, RDD, DID, PSM多嗎?⑩匹配方法(matching)操作指南, 值得收藏的16篇文章等,⑪MIT廣為流傳的政策"處理效應"讀本,⑫DID的研究動態和政策評估中應用的文獻綜述,⑬最新政策效應評估的四種方法,⑭政策效應評估的基本問題等,在學術同行間引起巨大反響
  • 因果推理「三問」:是什麼?為什麼需要?如何使用?
    在本文中,我將討論什麼是因果關係,為什麼需要發現因果關係,以及進行因果推理的常用技巧。1. 什麼是因果關係?因果關係描述的是兩個變量之間的關係,即一個變量如何誘發另一個變量的發生。它比相關關係要強得多,因為相關關係只是描述兩個變量之間的共同運動模式。通過繪製散點圖,可以很容易地觀察到兩個連續變量的相關性。對於分類變量,我們可以繪製柱狀圖來觀察其關係。
  • 因果推斷領域新書(附PDF):Causal Inference: What If
    因果推斷是當今機器學習領域炙手可熱的研究方向,而圖靈獎得主貝葉斯網絡之父 Judea Pearl 的著作《為什麼》更是讓該領域的知識得以普及。而在2020年末,由哈佛大學公共衛生學院的 Miguel Hernan 與 Jamie Robins 教授合作完成的因果推斷領域的新書 Causal Inference: What If,更是詳細全面地闡述了因果推斷領域的基本概念與背後的理論基礎。
  • 聊聊那些擁有「邊際效應」的產品
    這次與大家分享的是邊際效應對應不同線上線下產品的不同狀態以及優勢。現如今對於大多數的網際網路產品來說,其實都大致會用到「邊際效應」這個概念,在看似華麗渲染的網際網路背後,真正支撐著的是對人的深刻認識與理解。
  • 異質性與貨幣政策傳導機制研究進展
    雖然近年來對於異質性條件下貨幣政策的最新研究成果不斷湧現,但系統的梳理非常缺乏。本文梳理了這一領域的最新研究成果,總結並詳細闡述了異質性條件下貨幣政策四個新的傳導機制:實際利率變動的收入效應機制、再分配機制、謹慎性儲蓄機制與流動性保險機制。
  • 加班,致使邊際效應遞減
    加班,已經成了職場中的一種常態老闆希望的是,你的付出得遠遠大於他給你的報酬。 他雖然買的是你的8小時,但實際上希望榨出你十幾個小時的價值。 更何況,很多人工作可能沒有忙到需要加班得地步,純粹是工作的軟性要求。
  • 邊際遞減效應:教育,更多的時候不能是錦上添花,而應該雪中送炭
    這在心理學上,其實有一個專門的說法(效應)——邊際遞減效應。01、邊際遞減效應。有人做過一個實驗,一個沒有鞋穿的人意外得到一雙鞋,讓他給這雙鞋子評分,不管它是否趕得上潮流,是否適合他,他都立刻給這雙雪中送炭的鞋子高分。
  • 反向人與蝴蝶效應,因果關係有什麼區別?
    因果人們熟悉的因果關係,是我們熟悉的哲學,一個因(因素)一個果(現象),不需要任何介入的因素,而形成的因果關聯。簡而言之就是原因和結果,什麼的原因會有什麼樣的最終結果,什麼樣的結果是因為什麼原因而來的!