面板數據固定效應 vs. 隨機效應

2021-01-10 網易

2021-01-03 12:45:04 來源: 科技料

舉報

  

  一般來說,經濟數據有三種類型:橫截面數據(包括混合橫截面數據)、面板數據和時間序列數據。對於應用微觀研究而言,主要還是採用前兩種數據類型,時間序列數據多應用於金融等方面的研究,由於我基本不做時間序列分析,以下就不再提及該數據類型。在有選擇權的情況下(對於同一個研究主題,同時有橫截面和面板數據可供選擇),建議毫不猶豫地採用面板數據。

  理由在於,相對於橫截面數據,面板數據具有眾多優勢。簡單講三個優勢:一是面板數據具有更多的樣本量和信息量,可以降低變量之間共線性的可能性、增加檢驗統計量的自由度和增強估計結果的有效性;二是面板數據除了截面維度外,還具有時間維度,從而可以考察效應的時間變化趨勢,進行動態分析;三是面板數據一定程度上可以減輕萬惡的內生性問題(由遺漏變量引起的內生性),至於原因,將是下面要講的重點。

  在建立好計量模型和選用了面板數據後,接下來就是用適當的計量方法對模型進行估計了。對於面板數據下的模型,有三種常用的估計方法:固定效應估計、隨機效應估計和混合效應估計。什麼叫混合效應估計呢?就是把時間維度和截面維度的數據混合起來,極端地將面板數據看成一般的截面數據,然後用OLS來估計。可以發現,混合效應估計根本就沒有發揮出面板數據應有的優勢,因而在實踐中並不推薦使用。從而面對面板數據時,或者用固定效應估計,或者用隨機效應估計。

  什麼叫固定效應模型或者隨機效應模型呢?對於如下的靜態面板模型(解釋變量中不包含被解釋變量的滯後項,否則叫動態面板模型):

  其中,下表i表示個體,t表示時間。對於所有的解釋變量,可以將其劃分為隨時間變化的個體特徵(比如年齡和收入)以及不隨時間變化的個體特徵(比如性別)。可以進一步將擾動項進行劃分:

  其中,為擾動項中不可觀測的不隨時間變化的個體上的差異,具體叫做個體效應;為擾動項中不可觀測的不隨個體變化的時間上的差異,具體叫做時間效應。為擾動項中的餘下部分,並假定其滿足球形擾動方差等假設。

  此時,可以根據個體效應或者時間效應與解釋變量的關係來定義固定效應模型與隨機效應模型:

  (1)如果個體效應與某個解釋變量相關,則模型可稱之為「個體固定效應模型」;

  (2)如果時間效應與某個解釋變量相關,則模型可稱之為「時間固定效應模型」;

  (3)如果個體效應和時間效應均與某個解釋變量相關,則模型可稱之為「雙向固定效應模型」;

  (4)如果個體效應和時間效應與所有的解釋變量均不相關,則模型可稱之為「隨機效應模型」。

  從以上的定義可以發現,在隨機效應假設滿足的情況下,複合擾動項與解釋變量無關,因而可以得到一致估計。但是,由於此時不是球形擾動項(為球形擾動項,但不是),從而OLS估計不是最優效率的,此時採用廣義最小二乘法(GLS)可以得到最佳線性無偏估計,這也是用Stata進行隨機效應回歸時軟體採用GLS的原因,如下圖:

  

  而在固定效應假設滿足的情況下,複合擾動項與解釋變量相關,從而無法得到一致估計(回憶一下,假設不成立是造成內生性的原因)。因此,固定效應模型估計方法的核心思想就在於消除擾動項中與解釋變量相關的個體效應或者隨機效應。一般來說,固定效應模型的估計方法有如下幾種:

  (1)組內估計(Withinestimate):即組內去均值處理;

  (2)一階差分估計(FD);

  (3)最小二乘虛擬變量法(LSDV):在模型中加入固定效應的虛擬變量。

  這裡以個體固定效應模型為例講一下組內去均值估計的基本思想,組內估計也是Stata默認採用的估計方式。對於如下的個體固定效應模型(3):

  用模型中的每一項減去其均值,得到新的模型,如下所示:

  由於u、Z和α均為不隨時間改變的值,因而其均值就是其本身,也就是說

  ,從而模型(4)可以轉化為:

  其中。此時可以發現,新的擾動項h與新的解釋變量k明顯不相關,因而通過OLS可以得到一致估計。現在應該能理解固定效應估計為什麼能夠一定程度上緩解因遺漏變量造成的內生性了吧?

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺「網易號」用戶上傳並發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關焦點

  • 統計學中「固定效應 vs. 隨機效應」
    固定效應(fixed effect, FE)vs.本文將以「多層線性模型(HLM)」作為切入口和線索,把眾多統計方法中都可能會遇到的FE和RE問題串起來一併梳理清楚:從方差分析到回歸分析,從多層線性模型到面板數據模型,以及元分析和元回歸。先上結論,再詳細解讀。匯總表:固定效應 vs.
  • 固定效應模型與隨機效應模型
    大部分的Meta分析需要選擇固定效應模型與隨機效應模型對數據進行合併。本期,我們就介紹下固定效應模型與隨機效應模型這些事。
  • 非平衡面板固定效應門限回歸模型
    固定效應門限回歸模型(Hansen, 1999)是時間門限自回歸模型在面板數據中的擴展。Stata的xthreg程序(Wang, 2015)適用於平衡面板。而微觀數據中非平衡面板是更常見的情況,在將非平衡面板整理為平衡面板時很容易導致樣本選擇偏差等問題。因此,利用非平衡面板進行估計和檢驗則可以有效避免這些問題。
  • 固定效應與隨機效應:計量結果和我想要講的故事不一樣怎麼辦?
    先做了固定效應回歸效果不好,又做了隨機效應回歸效果除了某個參數效果不好,其他都很好,p值很漂亮0.0000。接著hausman檢驗,p值為0.0000。。。納尼,這是讓我接受效果不好的固定效應麼???求大神指點啊,故事怎麼寫啊?這的確是一個在實證中特別常見且特別讓人抓狂的事情。
  • 固定效應模型與隨機效應模型的差別
    緊接前期介紹的固定效應模型與隨機效應模型,今天,我們主要聊聊兩者之間的差別。從假設來看,兩種模型的差別在於: 相應的,固定效應模型得出的結果為「真實值估計值」,而隨機效應模型得出的結果為「真實值平均值的估計值」。這也是源於各自的假設不同。兩者均是得出真實值平均值的估計值,差別是固定效應模型的真實值只有一個,所以得出的結果為真實值的估計值。
  • 元分析:固定效應模型和隨機效應模型
    兩種常用見的元分析統計模型:固定效應模型和隨機效應模型在固定效應模型下,我們假定在納入分析的所有研究存在一個真實的效應量,並且觀察效應量的所有差異均歸因於取樣誤差。雖然我們遵循將其稱為固定效應模型的做法,但更具描述性的術語將是共同效應模型(common-effect model)。無論哪種情況,我們都使用單數(effect),因為只有一個真實的效應量。
  • 面板數據裡處理多重高維固定效應的神器, 還可用工具變量處理內生性
    今天,我們「面板數據研究小組」將為計量經濟圈的圈友引薦一個處理多重高維固定效應的方法(multiple high dimensional fixed effects)。我們經常聽說面板數據相對於截面數據有更大的空間去控制異質性,尤其是那些看不見的卻不隨著時間變動的異質性。
  • 面板數據_面板數據分析 - CSDN
    固定效應和隨機效應的選擇是大家做面板數據常常要遇到的問題,一個常見的方法是做huasman檢驗,即先估計一個隨機效應,然後做檢驗,如果拒絕零假設,則可以使用固定效應,反之如果接受零假設,則使用隨機效應。但這種方法往往得到事與願違的結果。
  • 【固定效應模型】
    在meta分析時,我們常會面臨選擇合併分析的模型-固定效應模型或者隨機效應模型,本期就為大家介紹一下固定效應模型,揭開meta分析神秘的面紗。
  • Python實現固定效應回歸模型實現因果關係推斷
    面板數據(Panel Data):也稱為縱向或橫向時間序列數據。 在面板數據中,您擁有所有時間段內個人的數據點。 基本的面板數據回歸模型類似於方程式(1),其中和是係數,而i和t是個體和時間的指標。 面板數據使您可以控制變量並說明各個變量的差異性。 有趣的是,在Python中使用Pandas模塊時,您可能會奇怪為什麼開發人員將其稱為「 Pandas」-非常可愛!
  • Stata: reghdfe-多維固定效應
    本篇推文介紹實現多維固定效應線性回歸的命令,reghdfe。該命令類似於 areg 及 xtreg,fe,但允許引入多維固定效應。此外,該命令在運行速度方面遠遠優於 areg 及 xtreg, 因此倍受研究者青睞。
  • r語言 動態面板模型 - CSDN
    面板數據面板數據(Panel Data),也成平行數據,具有時間序列和截面兩個維度,整個表格排列起來像是一個面板。Fa,則接受H2,認為樣本數據符合混合效應模型;反之,則繼續檢驗假設H1; 若F1統計量的值小於給定顯著水平下的相應臨界值,即F1小於Fa,則接受H1,認為樣本數據符合固定效應模型;反之,則認為樣本數據符合隨機效應模型;隨機效應模型 (1)1.LM檢驗。
  • 2019-2020(1)學期計量經濟學倒數第2課:5分鐘構建面板數據模型:原理要點、操作視頻與流行問題命令精選匯總
    二、固定效應模型1.固定效應v.s.隨機效應、混合最⼩⼆乘固定效應估計量與隨機估計量的優缺點:從假設強弱來看:固定效應所需假設更弱,更穩健隨機效應、POLS假設更強:需假設個體誤差項與解釋變量不相關另⼀個重要區別:固定效應不能估計不隨時間變化的變量的係數隨機效應、POLS可以。實踐中:固定效應最穩健,應優先考慮。實踐中:xtreg命令、reghdfe命令第三節 面板數據模型的估計方法
  • 異質性、隨機誤差、效應修飾——談談Meta分析的固有缺陷
    而當權重同時考慮研究內方差和研究間方差時,則變為隨機效應模型,等同於隨機效應方差分析模型,即: 而從隨機效應模型中,即可以引出Meta分析的異質性檢驗,也就是檢驗隨機效應中的研究間方差是否顯著,當效應量取OR時,此方法退化為Woolf Method,即:
  • 固定效應模型初探
    而差異是由於城市間的個體效應帶來的,此時我們可以認為模型中每個城市對應的截距項都不相同,這些差異全都體現在模型的截距項中,因此得到模型2。等式2固定效應模型的思想就是對每個城市進行組內去心,就是計算每個城市指標的平均值並與原指標相減。(等式3-等式2)等式3如此一來,城市間的個體效應就被消除掉了。之後就是我們喜聞樂見的最小二乘法估計參數。
  • 春節前後該買什麼——過往「春節效應」歸納分析
    4.春節效應下個股特徵:為了研究春節效應期間,估值PE、流通市值AMV、換手率Turnover這三個因素對個股收益影響與其餘時間段的區別,分別利用春節效用期間數據、春節前後30個交易日的數據來進行面板回歸(PLM),前後30個交易日的數據作為對照組。
  • 國家級貧困縣政策的收入分配效應
    內容提要:本文基於農業農村部農村固定觀察點1986-2011年微觀面板數據,使用雙重差分方法評估國家級貧困縣設立的減貧效果及收入分配效應。研究發現:對國家級貧困縣的扶貧政策使貧困地區的貧困率平均下降了11個百分點;同時,扶貧政策存在顯著的正外部性,能改善國家級貧困縣內部收入分配情況。
  • 中泰證券:春節前後該買什麼——過往「春節效應」歸納分析
    4.春節效應下個股特徵:為了研究春節效應期間,估值PE、流通市值AMV、換手率Turnover這三個因素對個股收益影響與其餘時間段的區別,分別利用春節效用期間數據、春節前後30個交易日的數據來進行面板回歸(PLM),前後30
  • 空間計量及R應用:從橫截面數據到空間面板(一)
    計量百科·資源·乾貨:空間計量經濟學創造性地處理了經典計量方法在面對空間數據時的缺陷,考察了數據在地理觀測值之間的關聯。2、面板數據分析3、空間面板數據分析3.1隨機效應空間面板分析spml.re <-spml(fm, data = Produc, index =c("state"
  • 面板模型回歸操作指南,適合初學者!
    面板數據(panel data)是指不同對象在不同時間上的指標數據。目前面板數據被廣泛地應用於經濟研究中。本文簡單介紹下,使用SPSSAU進行面板數據回歸分析步驟。一、數據格式下圖中,展示的就是一個面板數據的例子。數據為9個地區2008~2018共11年的各項經濟指標數據。地區列反映的是數據不同的截面,即不同的研究個體。