面板數據主要分析方法匯總

2020-12-13 學術世界

你,和經濟,密不可分。

讀中國經濟,關注經管世界

【資源】精美簡歷模板+自薦信+面試技巧免費共享

來源:綜合整理自計量經濟學及計量經濟學服務中心

步驟一:分析數據的平穩性(單位根檢驗)

按照正規程序,面板數據模型在回歸前需檢驗數據的平穩性。李子奈曾指出,一些非平穩的經濟時間序列往往表現出共同的變化趨勢,而這些序列間本身不一定有直接的關聯,此時,對這些數據進行回歸,儘管有較高的R平方,但其結果是沒有任何實際意義的。這種情況稱為稱為虛假回歸或偽回歸(spurious regression)。

他認為平穩的真正含義是:一個時間序列剔除了不變的均值(可視為截距)和時間趨勢以後,剩餘的序列為零均值,同方差,即白噪聲。因此單位根檢驗時有三種檢驗模式:既有趨勢又有截距、只有截距、以上都無。

因此為了避免偽回歸,確保估計結果的有效性,我們必須對各面板序列的平穩性進行檢驗。而檢驗數據平穩性最常用的辦法就是單位根檢驗

首先,我們可以先對面板序列繪製時序圖,以粗略觀測時序圖中由各個觀測值描出代表變量的折線是否含有趨勢項和(或)截距項,從而為進一步的單位根檢驗的檢驗模式做準備。

單位根檢驗方法的文獻綜述:在非平穩的面板數據漸進過程中,Levin andLin(1993) 很早就發現這些估計量的極限分布是高斯分布,這些結果也被應用在有異方差的面板數據中,並建立了對面板單位根進行檢驗的早期版本。後來經過Levin et al. (2002)的改進,提出了檢驗面板單位根的LLC 法。Levin et al. (2002) 指出,該方法允許不同截距和時間趨勢,異方差和高階序列相關,適合於中等維度(時間序列介於25~250 之間,截面數介於10~250 之間) 的面板單位根檢驗。Im et al. (1997) 還提出了檢驗面板單位根的IPS 法,但Breitung(2000) 發現IPS 法對限定性趨勢的設定極為敏感,並提出了面板單位根檢驗的Breitung 法。Maddala and Wu(1999)又提出了ADF-Fisher和PP-Fisher面板單位根檢驗方法。

由上述綜述可知,可以使用LLC、IPS、Breintung、ADF-Fisher 和PP-Fisher5種方法進行面板單位根檢驗。

其中LLC-T 、BR-T、IPS-W 、ADF-FCS、PP-FCS 、H-Z 分別指Levin, Lin & Chu t* 統計量、Breitung t 統計量、lm Pesaran & Shin W 統計量、ADF- Fisher Chi-square統計量、PP-Fisher Chi-square統計量、Hadri Z統計量,並且Levin, Lin & Chu t* 統計量、Breitung t統計量的原假設為存在普通的單位根過程,lm Pesaran & Shin W 統計量、ADF- Fisher Chi-square統計量、PP-Fisher Chi-square統計量的原假設為存在有效的單位根過程, Hadri Z統計量的檢驗原假設為不存在普通的單位根過程。

有時,為了方便,只採用兩種面板數據單位根檢驗方法,即相同根單位根檢驗LLC(Levin-Lin-Chu)檢驗和不同根單位根檢驗Fisher-ADF檢驗(註:對普通序列(非面板序列)的單位根檢驗方法則常用ADF檢驗),如果在兩種檢驗中均拒絕存在單位根的原假設則我們說此序列是平穩的,反之則不平穩。

如果我們以T(trend)代表序列含趨勢項,以I(intercept)代表序列含截距項,T&I代表兩項都含,N(none)代表兩項都不含,那麼我們可以基於前面時序圖得出的結論,在單位根檢驗中選擇相應檢驗模式。

但基於時序圖得出的結論畢竟是粗略的,嚴格來說,那些檢驗結構均需一一檢驗。具體操作可以參照李子奈的說法:ADF檢驗是通過三個模型來完成,首先從含有截距和趨勢項的模型開始,再檢驗只含截距項的模型,最後檢驗二者都不含的模型。並且認為,只有三個模型的檢驗結果都不能拒絕原假設時,我們才認為時間序列是非平穩的,而只要其中有一個模型的檢驗結果拒絕了零假設,就可認為時間序列是平穩的。

此外,單位根檢驗一般是先從水平(level)序列開始檢驗起,如果存在單位根,則對該序列進行一階差分後繼續檢驗,若仍存在單位根,則進行二階甚至高階差分後檢驗,直至序列平穩為止。我們記I(0)為零階單整,I(1)為一階單整,依次類推,I(N)為N階單整。

步驟二:協整檢驗或模型修正

情況一:如果基於單位根檢驗的結果發現變量之間是同階單整的,那麼我們可以進行協整檢驗

協整檢驗是考察變量間長期均衡關係的方法。所謂的協整是指若兩個或多個非平穩的變量序列,其某個線性組合後的序列呈平穩性。此時我們稱這些變量序列間有協整關係存在。因此協整的要求或前提是同階單整。

但也有如下的寬限說法:如果變量個數多於兩個,即解釋變量個數多於一個,被解釋變量的單整階數不能高於任何一個解釋變量的單整階數。另當解釋變量的單整階數高於被解釋變量的單整階數時,則必須至少有兩個解釋變量的單整階數高於被解釋變量的單整階數。如果只含有兩個解釋變量,則兩個變量的單整階數應該相同。

也就是說,單整階數不同的兩個或以上的非平穩序列如果一起進行協整檢驗,必然有某些低階單整的,即波動相對高階序列的波動甚微弱(有可能波動幅度也不同)的序列,對協整結果的影響不大,因此包不包含的重要性不大。而相對處於最高階序列,由於其波動較大,對回歸殘差的平穩性帶來極大的影響,所以如果協整是包含有某些高階單整序列的話(但如果所有變量都是階數相同的高階,此時也被稱作同階單整,這樣的話另當別論),一定不能將其納入協整檢驗。

協整檢驗方法的文獻綜述:(1)Kao(1999)、Kao and Chiang(2000)利用推廣的DF和ADF檢驗提出了檢驗面板協整的方法,這種方法零假設是沒有協整關係,並且利用靜態面板回歸的殘差來構建統計量。(2)Pedron(1999)在零假設是在動態多元面板回歸中沒有協整關係的條件下給出了七種基於殘差的面板協整檢驗方法。和Kao的方法不同的是,Pedroni的檢驗方法允許異質面板的存在。(3)Larsson et al(2001)發展了基於Johansen(1995)向量自回歸的似然檢驗的面板協整檢驗方法,這種檢驗的方法是檢驗變量存在共同的協整的秩。

我們主要採用的是Pedroni、Kao、Johansen的方法。

通過了協整檢驗,說明變量之間存在著長期穩定的均衡關係,其方程回歸殘差是平穩的。因此可以在此基礎上直接對原方程進行回歸,此時的回歸結果是較精確的。

這時,我們或許還想進一步對面板數據做格蘭傑因果檢驗(因果檢驗的前提是變量協整)。但如果變量之間不是協整(即非同階單整)的話,是不能進行格蘭傑因果檢驗的,不過此時可以先對數據進行處理。引用張曉峒的原話,「如果y和x不同階,不能做格蘭傑因果檢驗,但可通過差分序列或其他處理得到同階單整序列,並且要看它們此時有無經濟意義。」

下面簡要介紹一下因果檢驗的含義:這裡的因果關係是從統計角度而言的,即是通過概率或者分布函數的角度體現出來的:在所有其它事件的發生情況固定不變的條件下,如果一個事件X的發生與不發生對於另一個事件Y的發生的概率(如果通過事件定義了隨機變量那麼也可以說分布函數)有影響,並且這兩個事件在時間上又有先後順序(A前B後),那麼我們便可以說X是Y的原因。考慮最簡單的形式,Granger檢驗是運用F-統計量來檢驗X的滯後值是否顯著影響Y(在統計的意義下,且已經綜合考慮了Y的滯後值;如果影響不顯著,那麼稱X不是Y的「Granger原因」(Granger cause);如果影響顯著,那麼稱X是Y的「Granger原因」。同樣,這也可以用於檢驗Y是X的「原因」,檢驗Y的滯後值是否影響X(已經考慮了X的滯後對X自身的影響)。

Eviews好像沒有在POOL窗口中提供Granger causality test,而只有unit root test和cointegration test。說明Eviews是無法對面板數據序列做格蘭傑檢驗的,格蘭傑檢驗只能針對序列組做。也就是說格蘭傑因果檢驗在Eviews中是針對普通的序列對(pairwise)而言的。你如果想對面板數據中的某些合成序列做因果檢驗的話,不妨先導出相關序列到一個組中(POOL窗口中的Proc/Make Group),再來試試。

情況二:如果如果基於單位根檢驗的結果發現變量之間是非同階單整的,即面板數據中有些序列平穩而有些序列不平穩,此時不能進行協整檢驗與直接對原序列進行回歸。但此時也不要著急,我們可以在保持變量經濟意義的前提下,對我們前面提出的模型進行修正,以消除數據不平穩對回歸造成的不利影響。如差分某些序列,將基於時間頻度的絕對數據變成時間頻度下的變動數據或增長率數據。此時的研究轉向新的模型,但要保證模型具有經濟意義。因此一般不要對原序列進行二階差分,因為對變動數據或增長率數據再進行差分,我們不好對其冠以經濟解釋。難道你稱其為變動率的變動率?

步驟三:面板模型的選擇與回歸

面板數據模型的選擇通常有三種形式:

一種是混合估計模型(Pooled Regression Model)。如果從時間上看,不同個體之間不存在顯著性差異;從截面上看,不同截面之間也不存在顯著性差異,那麼就可以直接把面板數據混合在一起用普通最小二乘法(OLS)估計參數。一種是固定效應模型(Fixed Effects Regression Model)。如果對於不同的截面或不同的時間序列,模型的截距不同,則可以採用在模型中添加虛擬變量的方法估計回歸參數。一種是隨機效應模型(Random Effects Regression Model)。如果固定效應模型中的截距項包括了截面隨機誤差項和時間隨機誤差項的平均效應,並且這兩個隨機誤差項都服從正態分布,則固定效應模型就變成了隨機效應模型。

在面板數據模型形式的選擇方法上,我們經常採用F檢驗決定選用混合模型還是固定效應模型,然後用Hausman檢驗確定應該建立隨機效應模型還是固定效應模型。

檢驗完畢後,我們也就知道該選用哪種模型了,然後我們就開始回歸:

在回歸的時候,權數可以選擇按截面加權(cross-section weights)的方式,對於橫截面個數大於時序個數的情況更應如此,表示允許不同的截面存在異方差現象。估計方法採用PCSE(Panel Corrected Standard Errors,面板校正標準誤)方法。Beck和Katz(1995)引入的PCSE估計方法是面板數據模型估計方法的一個創新,可以有效的處理複雜的面板誤差結構,如同步相關,異方差,序列相關等,在樣本量不夠大時尤為有用。

【遇見·愛】經管世界公益交友平臺-人工智慧匹配

相關焦點

  • 如何進行面板數據分析?
    導讀 面板數據也被稱作時間序列與截面混合數據。是截面上個體在不同時點重複觀測數據。面板數據分析就是根據面板數據進行分析得出相應對於時間以及重複概率的結論。
  • 面板數據(Panel Data)匯總
    單位根檢驗方法的文獻綜述:在非平穩的面板數據漸進過程中,Levin andLin(1993) 很早就發現這些估計量的極限分布是高斯分布,這些結果也被應用在有異方差的面板數據中,並建立了對面板單位根進行檢驗的早期版本。後來經過Levin et al. (2002)的改進,提出了檢驗面板單位根的LLC 法。
  • 【Stata教程】如何用Stata分析面板數據
    在計量研究中,用於實證分析的數據主要有時間序列數據、橫截面數據以及面板數據。
  • 面板數據聚類, 因子分析和主成分分析咋做?
    凡是搞計量經濟的,都關注這個號了所有計量經濟圈方法論叢的程序文件,微觀資料庫和各種軟體都放在社群裡.歡迎到計量經濟圈社群交流訪問.感謝群友 @軟軟草 供稿以下這篇文章是講多指標的面板數據聚類問題,即咱們需要在考慮很多指標的基礎上對各個個體進行聚類。文章的做法是這樣的,先得到按照時間對各個體所對應的指標數據求均值,這樣就可以構建一個某個時間點該指標所對應的均值,比如2019年A指標的均值,2020年A指標.....
  • SEM優化常用的幾種數據分析方法
    這裡分享一則常用的分析思路,例如:為何分析→需要什麼數據→搜集整理這些數據→得到具有參考意義的思路SEM數據分析的常用方法,主要四種:一、趨勢分析法這是一種體現出整體趨勢的簡略分析法,趨勢分析法的別名又叫比較分析方法,或水平分析方法,通過對同一個指標或比率的連續定基對比或環比對比,得出變動方向、數額和幅度,以便進一步展示出整體趨勢。
  • suest - 支持面板數據的似無相關檢驗
    ,一種常用的方法是基於似無相關估計的 su-test,在 Stata 中可以用 suest 命令快捷地實現。但 suest 不支持 xtreg 命令,因此無法直接將該方法直接應用於面板數據模型,如 FE 或 RE。
  • 大數據分析主要分析什麼內容
    歡迎各位閱讀本篇,數據分析是指用適當的統計方法對收集來的大量第一手資料和第二手資料進行分析
  • 數據審核的流程、方法和主要內容
    技術組3.指標分析組各地在數據審核時,應根據自身人員力量合理組建團隊,分工合作,提升數據審核工作的效率。從數據審核,到數據修正,再到數據匯總,是一個反覆循環的過程。數據審核的基本方法隨著時代發展,統計數據的利用率不斷提高,對數據質量提出了更高的要求,數據審核的方法也在不斷改進。在具體工作實踐中,常用到以下幾種方法來開展數據審核。
  • Stata: 面板數據模型-一文讀懂
    本文主要就普通靜態面板數據模型進行介紹,包括模型形式設定、模型分類與選擇及 Stata 程序實現等。在截面分析中往往會引起遺漏變量的問題。面板數據模型的主要用途之一就在於處理這些不可觀測的個體效應或時間效應。當對所有的 i,
  • 這個Excel新功能這麼好用,一鍵匯總數據 可視化分析,你還不會?
    又到年底,又是全年數據統計分析時。公司的、部門的、領導的、客戶的、投資方的、關於人的、關於錢的、關於項目的……,總之,是一波接著一波。表親們,疲於應對,忙的是焦頭爛額的。話說,統計分析,還真不是人幹的活,表親們,要是沒兩把刷子,那也只能是疲於應對,忙得是焦頭爛額,加班加點,甩開膀子拼命幹了。這裡,我就教大家一個很簡單的小招式,小白也能輕鬆學會,應對那些小型的統計分析報告,足矣。它就是「快速分析」,不管是數據條、色階、圖標集、匯總、迷你圖、圖表等數據可視化,統統一鍵搞定。
  • 介紹一個用Excel做調查表的新方法,也可以自動匯總數據
    今天我給介紹一個Excel中收集數據的新方法!在傳統上,Excel在數據處理方面比較欠缺的就是收集數據了。比如,我們要進行滿意度調查,需要在Excel中製作調查表,然後把調查表發給所有人,填寫完成後,通過郵件發送回來,然後需要將這些返回的調查表匯總分析。問題是,在Excel中,這個匯總的步驟有點困難。我們開發過一個通用的匯總工具,但是只能用於正常結構的數據表格。對於調查問卷這樣的非標準表格,而且又有很強的個性化色彩,必須專門開發相應的匯總工具。
  • dplyr包-匯總數據的方法
    前三篇文章如下:1 dplyr包-列選擇的方法2 dplyr包-列變換的方法3 dplyr包-行選擇的方法前三篇文章,我們已經從數據的行與列角度,總結了dplyr包有效而高效地進行行與列的操作和處理,靈活使用dplyr包的函數集,便利我們對數據的整理工作。
  • 論文常用數據分析方法分類總結-2
    上篇文章我們總結了基本描述統計、信度分析、效度分析、差異關係、影響關係五種常見分析方法,下面繼續我們的總結。6. 相關分析匯總相關分析用於研究X和Y的關係情況,X、Y都為定量數據。如果是研究兩組變量之間的整體相關性,可用典型相關分析。7. 線性回歸匯總線性回歸用於研究X對於Y的影響,前提是因變量Y為定量數據。
  • SPSSAU數據分析思維培養系列2:分析方法
    在完成數據準備和清理工作後,就要進入到正式分析階段,而選擇什麼樣的數據分析方法進行分析是關鍵。想要進行科學和系統化的數據分析,分析方法的思維是必備項。本文為SPSSAU數據分析思維培養的第2篇文章,將分別從數據類型談起,剖析數據應該如何分析,包括數據的基礎描述,數據質量的判斷。
  • 面板數據門限回歸模型
    進行回歸分析,一般需要研究係數的估計值是否穩定。很多經濟變量都存在結構突變問題,使用普通回歸的做法就是確定結構突變點,進行分段回歸。這就像我們高中學習的分段函數。但是對於大樣本、面板數據如何尋找結構突變點。所以本文在此講解面板門限回歸的問題,門限回歸也適用於時間序列(文章後面將介紹stata15.0新命令進行時間序列的門限回歸)。
  • 大數據分析處理方法有哪些
    具體的大數據處理方法確實有很多,根據長時間的實踐,總結了一個普遍適用的大數據處理流程,並且這個流程應該能夠對大家理順大數據的處理有所幫助。整個處理流程可以概括為四步,分別是採集、導入和預處理、統計和分析,最後是數據挖掘。
  • 實驗數據分析常用到的統計知識匯總
    比如很多人都喜歡用平均數去分析一個事物的結果,但是這往往是粗糙的,不準確的。如果學了統計學,那麼我們就能以更多更科學的角度看待數據。 大部分的數據分析,都會用到統計方面的以下知識,可以重點學習:通過基本的統計量,你可以進行更多元化的可視化,以實現更加精細化的數據分析。
  • 盧濤:大量數據匯總查詢的優化方法
    >在全國第二次經濟普查的單位清查數據管理工作中,經常接到統計業務人員關於快速查詢基於大量數據的匯總的問題。但究竟基層表什麼時候發生變化,變化了的部分是否影響匯總結果,並不明確,如果採用保守的估計,每次重新生成臨時表,方法2和方法3就退化為方法1,甚至效率更低於方法1,如果採用樂觀的估計,有可能臨時表的數據是過時的
  • 數據分析方法:OSM模型
    編輯導語:OSM模型,就是把宏大的目標拆解,對應到部門內各個小組具體的、可落地、可度量的行為上,從保證執行計劃沒有偏離大方向;本文作者分享了一個簡單的方法論:OSM模型,我們一起來看一下。「你做數據分析的方法論是什麼?」
  • stata 面板數據攻略
    3、定義面板數據,輸入以下命令:. xtset province year  4、單位根檢驗    面板數據的單位根檢驗方法有很多種,一般我們只選兩種,即相同根單位根檢驗和不同根單位根檢驗。如果數據是平衡的,則可使用LLC檢驗(適用於同根)和IPS檢驗(適用於不同根)。