一文讀懂內生性專題(上)

2021-03-02 計量經濟學服務中心

本文主要為大家匯總出內生性介紹以及計量經濟學軟體Eviews和 Stata的二階段最小二乘法操作步驟,增進內生性問題處理。

1、內生性介紹 

在面板數據分析,尤其是Arellano-Bond 估計方面作出了貢獻。該方法利用面板數據中的時間模式來估計對政策或其他變量變化的經濟響應,同時對永久性的未觀察到的混淆變量進行控制。

一個典型的線性回歸模型:y = β0 + β1x1 + βX + ε (1),這裡y為被解釋變量,x1為自變量,或者解釋變量,也即「因」。大寫的 X 為外生控制項向量( 也即一組假定為外生的其他控制變量,例如年齡、性別等等) ,ε則為誤差項。如果ε與x1不相關,那麼我們可以利用OLS 模型對方程進行無偏估計。 

然而,如果一個重要變量x2被模型(1) 遺漏了,且x1和x2也相關,那麼對β1的OLS 估計值就必然是有偏的。 此時,x1被稱作「內生」的解釋變量,這就是 「內生性」問題。遇到「內生性」問題腫木辦?有一個方法就是找工具變量Z。 

如果存在內生性,則稱解釋變量為 「內生變量」(endogenous variable);反之,則稱為 「外生變量」(exogenous variable)。 內生性的嚴重後果是使得 OLS估計量不一致(inconsistent),即無論樣本容量多大,OLS 估計量也不會收斂至真實的參數值 。 

在計量經濟學中,把所有與擾動項相關的解釋變量都稱為「內生變量」。這與一般經濟學理論中的定義有所不同。 1。與誤差項相關的變量稱為內生變量(endogenous variable)。 2。與誤差項不相關的變量稱為外生變量(exogenous variable)。

2、內生性的來源: 

(1)遺漏變量偏差 (2)經典的測量誤差問題 (3)聯立性(逆向因果) 

首先我們來看下反向因果關係的解釋,例如根據凱恩斯的消費函數,首先模型的設定為C=a+bY+Ui,其中C為消費,Y為國民收入,Ui為隨機誤差擾動項。然而國民帳戶的恆等式又有Y=C+I+G+NX,即Y等於消費投資政府購買和淨出口的和,很顯然,消費是國民收入的重要組成部門,消費又是誤差的函數,這樣消費與國民收入的函數之間存在反向因果關係,主要因為消費函數裡面的Y與Ui相關,本來應該是X與Ui不相關,擾動項的信息應該全部包括或者表現概括在已經有的X裡面了。 

遺漏變量主要值得是某些不可觀測的解釋變量沒有納入到回歸模型中,如果北一樓的變量能夠同時對因變量和自變量產生影響,那麼會出現內生性的問題。一個比較經典的案例例如研究一個人受教育程度與他的收入之間的關係,其中收入作為被解釋變量Y,然後樣本中的隔熱的教育程度作為解釋變量,這個模型中例如能力、性別以及其他變量都有可能同時影響該模型變量受教育程度以及收入,例如個人能力比較高的人可能這個收入比較高,而個人能力有可能作為遺漏變量包含在隨機誤差擾動項中,因此會出現這個內生性的問題。

另外還有一種就是存在的度量誤差現象,到時候也是主要表現在內生性的這個與X和Ui不相關,但是卻相關了。

解決內生性問題的常見方法,主要包括工具變量( instrumental variable,簡稱IV) 、固定效應模型( fixed effects model,簡稱FE) 、傾向值匹配( propensity score matching,簡稱PSM) 、實驗以及準實驗( experimentsand quasi-experiments) 等等。本文主要介紹工具變量法。

內生性的選擇標準

要解決這一內生性問題,我們需要引入更多信息來進行無偏估計。工具變量的方法就是引入一個外生變量Z,且Z 必須滿足以下兩個條件: 與隨機誤差擾動項不相關,但與x1(與內生變量)相關。或者說,Z 僅僅通過影響x1來影響y。(總結為:與擾動項無關,與內生變量相關,能夠替代或者表達原內生變量的信息)工具變量IV應該儘量是外生的(如歷史/自然/氣候/地理之類),它應該在理論上對被解釋變量(以下稱Y)沒有直接影響,但應該通過影響被工具的變量(以下稱X)而間接影響被解釋變量Y。

一個合理的工具變量應該同時主要滿足兩個條件:

(1)、強度條件,即工具變量應該與內生自變量具有較強的相關性,即該工具變量的應該能夠代替或者表達原內生變量的信息,數學表達式為:

COV(Z,X)=/0

(2)、排除限制條件,即工具變量應該與誤差項不相關,也就是與因變量Y中不能被已有的自變量x所表達的部分無關(也是與誤差項無關)

COV(Z,u)=/0

如果第一個條件不滿足,我們認為這個工具變量是若工具變量,如果第二個條件得到不滿足,我們認為該工具變量不具備足夠的外生性,所謂外生性就是Z與誤差項不相關。這樣將導致工具變量的估計值出現類似於OLS估計的回歸偏誤。

二階段最小二乘法的第一階段就是利用原模型的內生解釋變量對工具變量進行OLS,得到解釋變量的擬合值;第二步,利用得到解釋變量的擬合值對原模型進行最小二乘法,從而得到方程模型的估計值,這樣就可以消除內生性的影響。

二階段最小二乘法Eviews操作介紹

例如本文使用如下1991-2014年Y與I的數據,在Eviews10.0軟體中對其分別取對數,記為lny,lni。(案例所用的Eviews文件名稱記為二階段最小二乘法01.wfl

在Eviews軟體中對其進行二階段最小二乘法的操作,相關步驟截圖如下: 首先在回歸的主菜單的Equation Estimation對話框中的Instrument List選擇lny,lni的滯後一期作為工具變量,然後選擇的method為TSLS—Two-Stage Least Squares方法,由於常數項本身也是一個合適的工具變量,因此也需要輸入,系統默認的,最後確定結果為:

最後的結果為:

可以看出在5%的顯著性水平下方程都是顯著的。本文主要選取了y以及i的滯後一期作為工具變量,一般解釋變量以及被解釋變量的滯後期均可以作為工具變量,一般情況下,根據模型的階條件,為了使結構方程能夠識別,工具變量的變量數一定要多餘結構方程的自變量個數。

二階段最小二乘法Stata操作介紹

本文根據Stata提供的ivregress中的數據進行講解,用到的數據為hsng.dta

首先了解一下二階段最小二乘法Stata中的命令為ivregress,語法格式為

利用該數據進行二階段最小二乘法的兩種操作,然後進行對比,其中dofile的命令如下:

ivregress2sls rent pcturban (hsngval = faminc i.region)

或者二階段最小二乘法的原理推導

reg  hsngval pcturban faminc i.region

predictyhat

regrent yhat pcturban

首先ivregress 2sls rentpcturban (hsngval = faminc i.region)的結果為:

然後依次進行reg  hsngval pcturban faminc i.region

predictyhat

regrent yhat pcturban

得到結果為:

然後將上述模型的結果進行對比,分別用到如下完整的命令:

可以看到模型的2SLS與工具變量的回歸係數完全相同,但是標準誤並不相同。

本文綜合整理自2018大數據與計量經濟學發展論壇會議手冊,下期本文將為大家介紹內生性相關檢驗等知識,敬請期待。

轉載請註明來源

相關焦點

  • 一文讀懂內生性與工具變量法知識大全
    回顧計量經濟學服務中心推文:16篇內生性與工具變量好文匯總
  • Stata:內生性與工具變量一文讀懂(附完整do文檔)
    此時,x1被稱作「內生」的解釋變量,這就是 「內生性」問題。遇到「內生性」問題腫木辦?有一個方法就是找工具變量Z。 如果存在內生性,則稱解釋變量為 「內生變量」(endogenous variable);反之,則稱為 「外生變量」(exogenous variable)。
  • reshape命令一文讀懂!
    連享會 · 計量專題 🍓 因果推斷-內生性 專題數據處理-reshape命令一文讀懂。 3. xpose命令:官方提供的數據轉置命令在這裡,我們將官方提供的數據轉置命令 xpose 也納入本篇推文,並做簡要介紹。
  • 一文讀懂電容傳感器
    藍色標題,獲取文章】 10、一文讀懂光纖傳感器 11、一文讀懂溫溼度傳感器 12
  • 獨家 | 一文讀懂Adaboost
    前面已經說明了Adaboost算法其最終模型訓練集的誤差是有上確界的,也就是說該算法是確切可以收斂到誤差界的。這一點保證了Adaboost算法的可收斂性。算法的優劣勢:前面就Adaboost算法分析了這麼多,那麼它到底有哪些優勢,又有哪些不足呢?
  • 一文讀懂磁傳感器(必須收藏)
    【點擊藍色標題,獲取文章】 >、一文讀懂接近傳感器 3、一文讀懂磁傳感器 4、一文讀懂流量傳感器
  • 一文讀懂「2020限塑令」!
    一文讀懂「2020限塑令」!06 16:58 來源:澎湃新聞·澎湃號·政務 一張圖讀懂限塑令新規
  • 一文收藏stata14&15小抄:常用命令匯總
    軟體操作:Geoda | Matlab  | ArcGIS  | Python經典書單 | Eviews9.0簡介  | Stata 16  | SPSS常見數據分析方法比較匯總 | 一文讀懂:內生性專題(上) | 內生性專題(中) | 面板數據 | 數據管理  | 門限回歸 |格蘭傑因果檢驗 | 空間計量命令面板數據:短面板 | 長面板
  • 「內生性」 到底是什麼鬼? New Yorker告訴你
    由於小編的失誤,在文章末尾處寫著「獲得PDF版本,給推文作者打賞1元」。推文作者本意是公開這個推文PDF的,以方便大家的查閱和交流,而且附在了文章評論區。給推文作者帶去的煩擾和讀者帶來的不便,咱們所有小編都感到很抱歉。通告:請圈友 閆文收 和 王陽,聯繫計量經濟圈公郵,你們可以進入Ca文獻交流小組。
  • locmtest:非線性模型的內生性檢驗
    非線性模型的內生性檢驗本命令是在 Lochner and Moretti (2015, Review of Economics and Statistics 97: 387–397) 提出的非線性模型的內生性檢驗基礎上開發的。
  • 獨家 | 一文讀懂Hadoop(三):Mapreduce
    讀者可以通過閱讀「一文讀懂Hadoop」系列文章,對Hadoop技術有個全面的了解,它涵蓋了Hadoop官網的所有知識點,並且通俗易懂,英文不好的讀者完全可以通過閱讀此篇文章了解Hadoop。本期獨家內容「一文讀懂Hadoop」系列文章先介紹Hadoop,繼而分別詳細介紹HDFS、MAPREDUCE、YARN的所有知識點,分為四期內容在近幾天推送。敬請關注後續內容。
  • 內生性問題研究:4篇推薦與8點認識
    對此,該文的解釋之一是「春節拜年是中國社會尤其是農村最重要的文化傳統和習俗之一,對進城務工人員網絡的建立、維持和拓展具有積極影響」。該文的解釋之二是「在中國農村,春節期間給親朋好友拜年是傳統文化習俗,與宗族網絡有密切的關係,對於進城務工人員的工資具有外生性」。第二步:工具變量相關性檢驗。「表7展示了社會資本回報率估計的一階段結果。其中因變量為社會資本,主要自變量是拜年變量」。
  • 內生性問題:起因,類型和解決辦法
    (聯繫電話:15503649793)內生性問題是個既重要,又複雜的問題。說它重要,是因為現在的管理學實證文章(用二手數據),如果在穩健性檢驗部分不提內生性問題,那審稿人一定會說你方法部分不嚴謹。經濟學金融學文章更是這樣,他們對計量的要求比管理學高。說它複雜,是因為它的來源複雜,解決方法複雜。
  • 專題梳理09 || 一文讀懂「培養」理論
    及時響應同學們的需求今天小篤為大家梳理「培養」理論專題其他專題梳理請查看「專題梳理」合集它是1967年以來唯一一個持續對電視劇中暴力角色跟蹤趨勢的獨立研究,未來暴力測量的相關研究無一不以此作為進一步研究的背景。
  • 解讀「中國模式」的制度內生性
    一個國家社會經濟制度的形成,是自己國家和民族特色長期演繹和變革的結果,即「內生性」,制度內生性不僅體現出「中國模式」的基本特點,也是「中國模式」的創新之所在  發達國家或發展中國家市場經濟不斷演進的歷程表明:一個國家社會經濟制度的形成,既是自己國家和民族特色長期演繹和變革的結果,即「內生性」;同時
  • 實現內生性增長的關鍵何在
    內生性增長如何形成?  使經濟形成可持續的內生性增長,這應當是我們的一個戰略目標。怎麼來形成內生性增長呢?從三大需求來說,關鍵是消費。消費率的提升是衡量經濟增長從外部刺激型到內生性增長的一個重要指標。對一個國家來說,消費是實現經濟穩定的定海神針,任何一個國家的經濟增長,如果是主要靠投資或者外需,那肯定是很脆弱的。所以,怎麼擴大消費,是實現內生性增長形成的關鍵。
  • 一文讀懂Python裝飾器
    打開APP 一文讀懂Python裝飾器 工程師3 發表於 2018-04-28 10:48:00
  • 一文讀懂CAN總線(三)
    點擊上方藍字關注我們在一文讀懂CAN總線(一)中我們介紹了標準CAN和擴展CAN以及CAN消息類型;在一文讀懂CAN總線(二)中為大家介紹了CAN總線的位填充機制、錯誤檢測和故障界定、網絡拓撲、終端匹配
  • 專題梳理07 || 一文讀懂「創新擴散」理論
    及時響應同學們的需求今天小篤為大家梳理「創新擴散」理論專題其他專題梳理請查看「專題梳理」合集這項創新能夠在多大程度上和現有的價值體系,這是從人們所能接受的角度來說,這項創新是否在人們所認可的文化傳統之內,又是否滿足人們的需求。第三是複雜性。這一創新投入使用後的學習成本和理解閾值。過於複雜或高端的創新對使用者的要求過高,是十分不利於其快速擴散傳播。
  • 內生性問題研究|4篇文章推薦+8點認識
    該文考慮到社會資本的內生性可能導致OLS估計存在偏誤,嘗試用工具變量法解決這個問題。對此,該文的解釋之一是「春節拜年是中國社會尤其是農村最重要的文化傳統和習俗之一,對進城務工人員網絡的建立、維持和拓展具有積極影響」。該文的解釋之二是「在中國農村,春節期間給親朋好友拜年是傳統文化習俗,與宗族網絡有密切的關係,對於進城務工人員的工資具有外生性」。