回歸模型怎麼做 - CSDN

2021-01-15 CSDN技術社區

按照正規程序,面板數據模型在回歸前需檢驗數據的平穩性。

步驟一:分析數據的平穩性(單位根檢驗)

按照正規程序,面板數據模型在回歸前需檢驗數據的平穩性。李子奈曾指出,一些非平穩的經濟時間序列往往表現出共同的變化趨勢,而這些序列間本身不一定有直接的關聯,此時,對這些數據進行回歸,儘管有較高的R平方,但其結果是沒有任何實際意義的。這種情況稱為稱為虛假回歸或偽回歸(spurious regression)。他認為平穩的真正含義是:一個時間序列剔除了不變的均值(可視為截距)和時間趨勢以後,剩餘的序列為零均值,同方差,即白噪聲。因此單位根檢驗時有三種檢驗模式:既有趨勢又有截距、只有截距、以上都無。

因此為了避免偽回歸,確保估計結果的有效性,我們必須對各面板序列的平穩性進行檢驗。而檢驗數據平穩性最常用的辦法就是單位根檢驗。首先,我們可以先對面板序列繪製時序圖,以粗略觀測時序圖中由各個觀測值描出代表變量的折線是否含有趨勢項和(或)截距項,從而為進一步的單位根檢驗的檢驗模式做準備。

單位根檢驗方法的文獻綜述:在非平穩的面板數據漸進過程中,Levin andLin(1993) 很早就發現這些估計量的極限分布是高斯分布,這些結果也被應用在有異方差的面板數據中,並建立了對面板單位根進行檢驗的早期版本。後來經過Levin et al. (2002)的改進,提出了檢驗面板單位根的LLC 法。Levin et al. (2002) 指出,該方法允許不同截距和時間趨勢,異方差和高階序列相關,適合於中等維度(時間序列介於25~250 之間,截面數介於10~250 之間) 的面板單位根檢驗。Im et al. (1997) 還提出了檢驗面板單位根的IPS 法,但Breitung(2000) 發現IPS 法對限定性趨勢的設定極為敏感,並提出了面板單位根檢驗的Breitung 法。Maddala and Wu(1999)又提出了ADF-Fisher和PP-Fisher面板單位根檢驗方法。

由上述綜述可知,可以使用LLC、IPS、Breintung、ADF-Fisher 和PP-Fisher5種方法進行面板單位根檢驗。

其中LLC-T 、BR-T、IPS-W 、ADF-FCS、PP-FCS 、H-Z 分別指Levin, Lin & Chu t* 統計量、Breitung t 統計量、lm Pesaran & Shin W 統計量、ADF- Fisher Chi-square統計量、PP-Fisher Chi-square統計量、Hadri Z統計量,並且Levin, Lin & Chu t* 統計量、Breitung t統計量的原假設為存在普通的單位根過程,lm Pesaran & Shin W 統計量、ADF- Fisher Chi-square統計量、PP-Fisher Chi-square統計量的原假設為存在有效的單位根過程, Hadri Z統計量的檢驗原假設為不存在普通的單位根過程。

有時,為了方便,只採用兩種面板數據單位根檢驗方法,即相同根單位根檢驗LLC(Levin-Lin-Chu)檢驗和不同根單位根檢驗Fisher-ADF檢驗(註:對普通序列(非面板序列)的單位根檢驗方法則常用ADF檢驗),如果在兩種檢驗中均拒絕存在單位根的原假設則我們說此序列是平穩的,反之則不平穩。

如果我們以T(trend)代表序列含趨勢項,以I(intercept)代表序列含截距項,T&I代表兩項都含,N(none)代表兩項都不含,那麼我們可以基於前面時序圖得出的結論,在單位根檢驗中選擇相應檢驗模式。

但基於時序圖得出的結論畢竟是粗略的,嚴格來說,那些檢驗結構均需一一檢驗。具體操作可以參照李子奈的說法:ADF檢驗是通過三個模型來完成,首先從含有截距和趨勢項的模型開始,再檢驗只含截距項的模型,最後檢驗二者都不含的模型。並且認為,只有三個模型的檢驗結果都不能拒絕原假設時,我們才認為時間序列是非平穩的,而只要其中有一個模型的檢驗結果拒絕了零假設,就可認為時間序列是平穩的。

此外,單位根檢驗一般是先從水平(level)序列開始檢驗起,如果存在單位根,則對該序列進行一階差分後繼續檢驗,若仍存在單位根,則進行二階甚至高階差分後檢驗,直至序列平穩為止。我們記I(0)為零階單整,I(1)為一階單整,依次類推,I(N)為N階單整。

步驟二:協整檢驗或模型修正

情況一:如果基於單位根檢驗的結果發現變量之間是同階單整的,那麼我們可以進行協整檢驗。協整檢驗是考察變量間長期均衡關係的方法。所謂的協整是指若兩個或多個非平穩的變量序列,其某個線性組合後的序列呈平穩性。此時我們稱這些變量序列間有協整關係存在。因此協整的要求或前提是同階單整。

但也有如下的寬限說法:如果變量個數多於兩個,即解釋變量個數多於一個,被解釋變量的單整階數不能高於任何一個解釋變量的單整階數。另當解釋變量的單整階數高於被解釋變量的單整階數時,則必須至少有兩個解釋變量的單整階數高於被解釋變量的單整階數。如果只含有兩個解釋變量,則兩個變量的單整階數應該相同。

也就是說,單整階數不同的兩個或以上的非平穩序列如果一起進行協整檢驗,必然有某些低階單整的,即波動相對高階序列的波動甚微弱(有可能波動幅度也不同)的序列,對協整結果的影響不大,因此包不包含的重要性不大。而相對處於最高階序列,由於其波動較大,對回歸殘差的平穩性帶來極大的影響,所以如果協整是包含有某些高階單整序列的話(但如果所有變量都是階數相同的高階,此時也被稱作同階單整,這樣的話另當別論),一定不能將其納入協整檢驗。

協整檢驗方法的文獻綜述:(1)Kao(1999)、Kao and Chiang(2000)利用推廣的DF和ADF檢驗提出了檢驗面板協整的方法,這種方法零假設是沒有協整關係,並且利用靜態面板回歸的殘差來構建統計量。(2)Pedron(1999)在零假設是在動態多元面板回歸中沒有協整關係的條件下給出了七種基於殘差的面板協整檢驗方法。和Kao的方法不同的是,Pedroni的檢驗方法允許異質面板的存在。(3)Larsson et al(2001)發展了基於Johansen(1995)向量自回歸的似然檢驗的面板協整檢驗方法,這種檢驗的方法是檢驗變量存在共同的協整的秩。

主要採用的是Pedroni、Kao、Johansen的方法。

通過了協整檢驗,說明變量之間存在著長期穩定的均衡關係,其方程回歸殘差是平穩的。因此可以在此基礎上直接對原方程進行回歸,此時的回歸結果是較精確的。

這時,我們或許還想進一步對面板數據做格蘭傑因果檢驗(因果檢驗的前提是變量協整)。但如果變量之間不是協整(即非同階單整)的話,是不能進行格蘭傑因果檢驗的,不過此時可以先對數據進行處理。引用張曉峒的原話,「如果y和x不同階,不能做格蘭傑因果檢驗,但可通過差分序列或其他處理得到同階單整序列,並且要看它們此時有無經濟意義。」

下面簡要介紹一下因果檢驗的含義:這裡的因果關係是從統計角度而言的,即是通過概率或者分布函數的角度體現出來的:在所有其它事件的發生情況固定不變的條件下,如果一個事件X的發生與不發生對於另一個事件Y的發生的概率(如果通過事件定義了隨機變量那麼也可以說分布函數)有影響,並且這兩個事件在時間上又有先後順序(A前B後),那麼我們便可以說X是Y的原因。考慮最簡單的形式,Granger檢驗是運用F-統計量來檢驗X的滯後值是否顯著影響Y(在統計的意義下,且已經綜合考慮了Y的滯後值;如果影響不顯著,那麼稱X不是Y的「Granger原因」(Granger cause);如果影響顯著,那麼稱X是Y的「Granger原因」。同樣,這也可以用於檢驗Y是X的「原因」,檢驗Y的滯後值是否影響X(已經考慮了X的滯後對X自身的影響)。

Eviews好像沒有在POOL窗口中提供Granger causality test,而只有unit root test和cointegration test。說明Eviews是無法對面板數據序列做格蘭傑檢驗的,格蘭傑檢驗只能針對序列組做。也就是說格蘭傑因果檢驗在Eviews中是針對普通的序列對(pairwise)而言的。你如果想對面板數據中的某些合成序列做因果檢驗的話,不妨先導出相關序列到一個組中(POOL窗口中的Proc/Make Group),再來試試。

情況二:如果如果基於單位根檢驗的結果發現變量之間是非同階單整的,即面板數據中有些序列平穩而有些序列不平穩,此時不能進行協整檢驗與直接對原序列進行回歸。但此時也不要著急,我們可以在保持變量經濟意義的前提下,對我們前面提出的模型進行修正,以消除數據不平穩對回歸造成的不利影響。如差分某些序列,將基於時間頻度的絕對數據變成時間頻度下的變動數據或增長率數據。此時的研究轉向新的模型,但要保證模型具有經濟意義。因此一般不要對原序列進行二階差分,因為對變動數據或增長率數據再進行差分,我們不好對其冠以經濟解釋。難道你稱其為變動率的變動率?

步驟三:面板模型的選擇與回歸

面板數據模型的選擇通常有三種形式:

一種是混合估計模型(Pooled Regression Model)。如果從時間上看,不同個體之間不存在顯著性差異;從截面上看,不同截面之間也不存在顯著性差異,那麼就可以直接把面板數據混合在一起用普通最小二乘法(OLS)估計參數。一種是固定效應模型(Fixed Effects Regression Model)。如果對於不同的截面或不同的時間序列,模型的截距不同,則可以採用在模型中添加虛擬變量的方法估計回歸參數。一種是隨機效應模型(Random Effects Regression Model)。如果固定效應模型中的截距項包括了截面隨機誤差項和時間隨機誤差項的平均效應,並且這兩個隨機誤差項都服從正態分布,則固定效應模型就變成了隨機效應模型。

在面板數據模型形式的選擇方法上,我們經常採用F檢驗決定選用混合模型還是固定效應模型,然後用Hausman檢驗確定應該建立隨機效應模型還是固定效應模型。

檢驗完畢後,我們也就知道該選用哪種模型了,然後我們就開始回歸:

在回歸的時候,權數可以選擇按截面加權(cross-section weights)的方式,對於橫截面個數大於時序個數的情況更應如此,表示允許不同的截面存在異方差現象。估計方法採用PCSE(Panel Corrected Standard Errors,面板校正標準誤)方法。Beck和Katz(1995)引入的PCSE估計方法是面板數據模型估計方法的一個創新,可以有效的處理複雜的面板誤差結構,如同步相關,異方差,序列相關等,在樣本量不夠大時尤為有用。

相關焦點

  • 回歸模型擬合優度檢驗 - CSDN
    在依賴模型得出結論或預測未來結果之前,我們應儘可能檢查我們假設的模型是否正確指定。也就是說,數據不會與模型所做的假設衝突。對於二元結果,邏輯回歸是最流行的建模方法。在這篇文章中,我們將看一下 Hosmer-Lemeshow邏輯回歸的擬合優度檢驗。
  • 回歸模型eviews專題及常見問題 - CSDN
    來源 | 計量經濟學服務中心綜合整理轉載請聯繫一、Threshold Regression Estimation閾值回歸模型描述了一種簡單的非線性回歸模型。TR規範很受歡迎,因為它們很容易。估計和解釋,並能產生有趣的非線性和豐富的動力學。
  • r語言 多元回歸模型_r語言多元回歸模型殘差分析 - CSDN
    1、多元線性回歸模型1.1多元回歸模型與多元回歸方程設因變量為y,k個自變量分別為,描述因變量y如何依賴於自變量和誤差項ε的方程稱為多元回歸模型。其一般形式可表示為:式中,為模型的參數,ε為隨機誤差項。
  • r中回歸結果怎麼判定模型好壞_lasso回歸 模型好壞 - CSDN
    模型中不同形式的m(X)會幻化為不同的模型體系,一般可以將模型分為兩大類:m(X)可以幻化為數學公式,即公式模型,一般比較成熟的都是公式模型,例如回歸模型的理論與底蘊就比較完善,模型的假定都是可以進行檢驗的;
  • 深度研究:回歸模型評價指標R2_score
    回歸模型的性能的評價指標主要有:RMSE(平方根誤差)、MAE(平均絕對誤差)、MSE(平均平方誤差)、R2_score。但是當量綱不同時,RMSE、MAE、MSE難以衡量模型效果好壞。這就需要用到R2_score,實際使用時,會遇到許多問題,今天我們深度研究一下。預備知識 搞清楚R2_score計算之前,我們還需要了解幾個統計學概念。
  • 值 多元線性回歸模型專題及常見問題 - CSDN
    多元線性回歸模型通常用來研究一個應變量依賴多個自變量的變化關係,如果二者的以來關係可以用線性形式來刻畫,則可以建立多元線性模型來進行分析。1.模型簡介1.1模型的結構多元線性回歸模型通常用來描述變量y和x之間的隨機線性關係,即:
  • 回歸模型中f檢驗公式 - CSDN
    b、探究最小二乘得到的β0、β1,與總體真實的β0、β1接近程度    SE(β0)    SE(β1)c、對標準偏差SE(µ0)的估計是殘差標準誤RSE/√n【意思是模型正確,且β0、β1真實值,但是依然有偏離】。
  • spss多元線性回歸模型專題及常見問題 - CSDN
    多元線性回歸,主要是研究一個因變量與多個自變量之間的相關關係,跟一元回歸原理差不多,區別在於影響因素(自變量)更多些而已,例如:一元線性回歸方程 為:   今天跟大家一起討論一下,SPSS---多元線性回歸的具體操作過程,下面以教程教程數據為例,分析汽車特徵與汽車銷售量之間的關係。通過分析汽車特徵跟汽車銷售量的關係,建立擬合多元線性回歸模型。數據如下圖所示:
  • r語言一元回歸模型專題及常見問題 - CSDN
    一元線性回歸分析首先介紹回歸分析中最基礎的情況:一元線性回歸分析。它規定模型f函數只能是y=k*x+b的形式,即只使用一個變量x(故稱為一元)的線性形式來預測目標變量y。6.1.1引例利用某網站歷次促銷活動中促銷讓利費用和銷售金額的數據(單位是十萬元),將使用該數據集來說明線性回歸分析的應用。
  • barra模型 - CSDN
    模型形式為其中  代表股票 n 的收益率;  代表市場組合的收益率,在實踐中可以用大盤收益率代替;  代表無風險收益率,實踐中可以用國債收益率代替; 代表隨機因素1.2 模型求解顯然,估計式中的  需要回歸,那麼是在時序上回歸還是在截面上回歸呢?
  • f值 mse p值 ssr 線性回歸 - CSDN
    回歸分析--多元回歸介紹一下多元回歸分析中的統計量總觀測值 總自變量 自由度:回歸自由度 ,殘差自由度  SST總平方和                  SSR回歸平方和
  • [PRML]線性分類模型--概率判別模型
    3 邏輯回歸從考慮二分類問題開始處理廣義線性模型。在統計學術語中,這種模型稱為邏輯回歸,但應強調這是一種分類模型,而不是回歸模型。與式13的比較表明,它與線性回歸模型的平方和誤差函數的梯度具有完全相同的形式。
  • 回歸分析spss步驟 - CSDN
    我們的教程中曾詳細講述了SPSS線性回歸分析,儘管線性回歸可以滿足絕大多數的數據分析,但是在現實情況中,並不能適用於所有的數據,當因變量和自變量之間的關係我們無法確定是否為線性或者其他非線性類型的模型關係時候,那麼我們就需要用到曲線回歸,來確定因變量和自變量之間到底最適合什麼樣的模型。
  • 自回歸分析法 - CSDN
    y=a0+b1x1+b2x2+…+bkxk+誤差(方程A) 把方程A叫做(多元)回歸方程或者(多元)回歸模型。a0是y截距,b1,b2,…,bk是回歸係數。當k=l時,只有1個說明變量,叫做一元回歸方程。根據最小平方法求解最小誤差平方和,非求出y截距和回歸係數。若求解回歸方程.分別代入x1,x2,…xk的數值,預測y的值。
  • 單變量回歸分析spss - CSDN
    復相關係數在評價多重線性回歸模型優劣時存在不足,即使向模型中增加的變量沒有統計學意義,R值仍會增大。R值多大合適?不同的學科有不同的判斷標準。社會科學類研究一般要求大於0.4,自然科學一般要求大於0.8。(2)決定係數R2,表示因變量y的總變異可由回歸模型中自變量解釋的部分所佔比例。
  • 多元有序logistic回歸分析 - CSDN
    平行性是有序Logit回歸的前提條件,如果不滿足平行性,SPSSAU建議使用多分類Logit回歸模型。回歸模型分析結果匯總,以及模型預測準確率表。③似然比檢驗表3 似然比檢驗表表3展示模型的似然比檢驗結果,用於分析模型整體有效性。其原假設是模型的回歸係數全部均為0,因此如果P值小於0.05,則說明拒絕原假設,即說明模型有效;反之如果P值大於0.05則說明接受原假設,即說明模型回歸係數全部均應該為0,模型無意義。
  • 回歸方程殘差的方差 - CSDN
    中,假定 之差,用e表示。而引起的誤差。第i個觀察值的殘差為: 的方差都相同,且描述變量x和y之間的回歸模型是合理的,殘差圖中的所有點落在一條水平帶中間。(b)對所有的值,的方差相等的假設(c)表明所選的回歸模型不合理,應考慮曲線回歸或多元回歸模型。3、標準化殘差對於
  • 一元回歸t檢驗與f檢驗_多元回歸模型的r檢驗f檢驗與t檢驗 - CSDN
    y=a0+b1x1+b2x2+…+bkxk+誤差(方程A) 把方程A叫做(多元)回歸方程或者(多元)回歸模型。a0是y截距,b1,b2,…,bk是回歸係數。當k=l時,只有1個說明變量,叫做一元回歸方程。根據最小平方法求解最小誤差平方和,非求出y截距和回歸係數。
  • 回歸方程的顯著性檢驗 - CSDN
    一、σ2 的估計  因為假設檢驗以及構造與回歸模型有關的區間估計都需要σ2的估計量,所以先對σ2作估計。的平方根稱為回歸標準誤差,與響應變量y 具有相同的單位。因為σ2取決於殘差平方和, 所以任何對模型誤差假設的違背或對模型形式的誤設都可能嚴重破壞σ2的估計值
  • 廣義差分模型 - CSDN
    ,18,對於樣本觀測期為 的時間序列數據,可得到總體回歸模型PRF的隨機項為 ,如果自相關形式為 其中 為自相關係數, 為經典誤差項,即 則此式稱為一階自回歸模式,記為 。因為模型中 是 滯後一期的值,因此稱為一階。此式中的 也稱為一階自相關係數。