面板數據中標準誤的估計方法, 你確定用對了嗎? 我們來比較一番!

2020-10-20 計量經濟圈

稿件:econometrics666@126.com

所有計量經濟圈方法論叢的code程序, 宏微觀資料庫和各種軟件都放在社群裡.歡迎到計量經濟圈社群交流訪問.

關於標準誤,可以參看1. 3.

正文

關於下方文字內容,作者吳欣霓,英國牛津大學經濟系通信郵箱xinniwu@outlook.com.

Mitchell A. Petersen, Estimating Standard Errors in Finance Panel Data Sets: Comparing Approaches, The Review of Financial Studies, Volume 22, Issue 1, January 2009, Pages 435–480, https://doi.org/10.1093/rfs/hhn053

In corporate finance and asset pricing empirical work, researchers are often confronted with panel data. In these data sets, the residuals may be correlated across firms or across time, and OLS standard errors can be biased. Historically, researchers in the two literatures have used different solutions to this problem. This paper examines the different methods used in the literature and explains when the different methods yield the same (and correct) standard errors and when they diverge. The intent is to provide intuition as to why the different approaches sometimes give different answers and give researchers guidance for their use.
在公司財務和資產定價的實證工作中,研究人員經常會面臨面板數據(panel data)。眾所周知, 當殘差(residuals)在企業或年份之間相關時,OLS和懷特標準誤差是存在偏差的。Petersen的這篇文章意在比較不同的標準差估算方法,說明不同方法的相對精度顯著取決於數據的結構, 為正確估計標準誤差提供了指導, 且幫助研究人員診斷其模型中的潛在問題。
本文主要討論兩種形式的依賴性:
1.時間序列依賴性/企業效應(firm effect), 指一個特定企業的殘差跨時間相關。2.橫截面依賴性/時間效應(time effect), 指特定一個年份的殘差跨不同企業相關。其中企業效應還分為固定企業效應(fixed firm effect)和不固定企業效應(temporary firm effect)。不固定企業效應的強度會隨著時間增長而變弱。
根據這兩種形式的依賴性,本文模擬了四種數據結構:1. 存在固定企業效應的面板數據;2. 存在時間效應的面板數據; 3.同時存在固定企業效應和時間效應的面板數據;4. 存在不固定企業效應的面板數據。在不同數據結構下,作者比較了聚類標準誤差、Fama-MacBeth (FM)、Newey-West (NW) 以及 OLS、懷特五種估算標準差的方法, 並簡單介紹了GLS 隨機效應模型在增加估計係數效率、減少估算標準誤差問題上的應用。
在本文的最後,作者把以上幾種估計標準誤的技術應用到了兩個不確定數據結構的真實面板數據集上,演示了如何比較不同的估計標準誤差的方法,證實了某些已發表論文所使用的方法可能早造成了偏差較大的標準誤差估計,並概括了從不同的標準誤差估計中初步判斷數據結構的辦法。
1. 存在固定企業效應(fixed firm effect)時的標準誤差估計
1.1 聚類標準誤差估計
模擬的面板數據集裡包含對不同公司(i)跨不同年份(t)的觀察結果。
標準回歸為:

當殘差獨立且均勻分布且其餘OLS假設都被滿足時, OLS標準誤差公式是正確的。
OLS估計的估計為:

OLS係數的漸近方差為:

1.2 通過模擬數據測試比較OLS和聚類標準誤的估計
本文共模擬了五千個包含企業效應面板數據集,每個數據集包含五百家公司,每家公司十年。真實斜率係數為1,自變量的標準誤差為1,慘差項的標準誤差為2。
表1包含了基於企業效應的面版數據集的OLS係數和OLS及聚類標準誤差的估計值:
由公司固定成分引起的X的波動率[Var(μ)/ Var(X)],在表格的各列中從0%(無企業效應)變化到75%。由公司固定成分引起的的波動率[Var(γ)/ Var(ε)],在表的各行中從0%(無企業效應影響)變化到75%。每個像元包含通過OLS估算的平均斜率係數(第一項)和該估算值的標準偏差(第二項)。這是估計係數的真實標準誤差。第三項是OLS估計的平均標準誤差。在方括號中報告了在1%的水平上顯著的OLS t 統計量百分比(| t |> 2.58)。第五項是按公司聚類的平均標準誤(即考慮同家公司在不同年份的觀察值之間可能的相關性)。第六項方括號中報告了在1%的水平上顯著的聚類t統計量的百分比。

根據表1可以看出,如果殘差沒有企業效應(即殘差在各個觀測值之間是獨立的),則OLS估計的標準誤是正確的(表1,第1行)。如果自變量沒有企業效應(即自變量在各個觀察值之間是獨立的),則即使殘差之間高度相關(表1第1列),OLS估計的標準誤也將是無偏的。如果企業效應同時存在於殘差和自變量中,則OLS估計的標準誤較真實的標準誤偏低。舉例說明,當時, OLS估計的標準誤為0.0283 (標綠),低估了近一半的正確的標準誤(標黃,0.0508)。
而當使用聚類標準誤估算係數的標準誤差時, 估計值(每個單元格中的第五個條目)非常接近真實的標準錯誤。舉例說明,當時, 聚類標準誤估計值為0.0508(標紫),和正確的標準誤一致(標黃,0.0508)。這些估計隨著真實標準誤差的增加而增加,這是由企業效應引起的可變性所佔比例增加所致。因此,在有企業效應的情況下, 聚類標準誤差正確地解釋了面板數據集中常見數據的依賴性,並產生了無偏估計。
1.3 Fama-MacBeth (FM) 標準誤差估計
在FM標準誤估計方法中,研究人員進行了T次截面回歸分析。FM係數估計值為T次係數估計的平均值:

FM估計的估計係數方差為:

1.4 通過模擬數據測試Fama-MacBeth標準誤的估計

表2使用了和表1相同的數據集,包含了基於企業效應的面版數據集的係數和標準誤的FM估計值:

每個像元的第一項是基於FM估計的平均斜率係數。第二項是FM估算的係數的標準誤, 即FM係數的真實標準誤差。第三項是FM估算的平均標準誤差(請參見公式(9))。方括號中報告的是在1%的水平上很顯著的FM t 統計量的百分比(| t |> 2.58)。
對比表1,FM的係數和標準誤估計值和OLS是一致的,並且與OLS一樣有效(兩者之間的相關性始終高於0.99)。兩個係數估計的標準偏差也相同(比較表1和2中每個單元格的第二個條目)。這些結果表明,OLS和FM標準誤差均低估了真實標準誤。但是,與OLS標準錯誤相比,FM標準錯誤的偏差更大。例如,當時,OLS標準誤差的偏差為60%(0.595 = 1 − 0.0283 / 0.0698,請參閱表1),而FM標準誤差的偏差為74% (0.738 = 1 − 0.0183 / 0.0699,請參閱表2)。
1.5已發表論文中的標準誤差估計
儘管FM標準誤差存在企業效應的情況下是有偏差的,但它們還是經常在回歸可能存在企業效應的情況下,被用於度量已發表論文的統計顯著性。FM標準誤是被開發用來解釋同一年不同公司的觀測值之間的相關性,而不是考慮同一年不同公司的觀測值之間的相關性的。FM標準誤差確實可以用於說明交叉相關性(cross-correlation)(例如,之間的相關性), 但是不能用於解釋串行相關性(例如,之間的相關性)。這是Fama-MacBeth(和OLS)標準錯誤可能有偏差的數據類型。在本文提及的一些論文裡(Fama and French, 2001;Pastor and Veronesi, 2003; Kemsley and Nissim, 2002; Baker and Wurgler, 2002; Fama and French 2002; and Johnson, 2003), 論文作者都對一種持久性企業特徵對其他持久性企業特徵進行了回歸(即變量的序列相關性很大,並且隨著觀察之間的滯後性的增加而逐漸消失)。
1.6 Newey-West (NW) 標準誤差
NW標準誤是用來解釋單個時間序列中殘差間未知的串聯相關性的。為了能估算單個時間序列中的自相關作用, NW方法假設當觀測值之間的距離達到無窮大時,殘差之間的相關性接近零。另外,由於NW過程最初是為單個時間序列設計的,因此必須使用加權函數才能使該矩陣的估計為正半定。NW將延遲(lag) j(例如)的協方差乘以權重 [1-j /(M +1)],其中M是指的是最大延遲。該權重對於相鄰的觀測值最大,隨著觀測值之間距離的增加而減小,並逐漸增加到接近1。在面板數據中,最大延遲M=T-1。Newey-West標準誤差方差方程的中心矩陣為:

運用和之前相同的存在固定企業效應的面板數據集,當延遲為0, NW標準誤估計值和OLS標準誤估計值相同(同為0.0283)。當延遲從0增加到9(M=T-1=10-1=9), NW標準誤估計值從0.0283增長到0.0328, 但還是低於真實標準誤。由於面板數據集中存在多個時間序列,標準誤方差方程的中心矩陣不需要通過加權函數來實現正半定。因此,當數據中存在固定企業效應時,即使最大延遲M=T-1, 用NW估計的標準誤依舊偏低8%。(NW估計值的偏差比OLS和FM估計值的偏差小。)
2. 存在時間效應(Time Effect)時的標準誤差估計
2.1 聚類標準誤差估計
為了演示不同標準誤估計方法在存在時間效應的情況下的表現,本文生成了僅包含時間效應的數據集(將同一年內不同公司的觀察結果進行了關聯)。這也正是為Fama-MacBeth方法設計的數據結構(請參閱Fama和MacBeth,1973)。
模擬的面板數據結構如下:

本文共模擬了五千個包含時間效應面板數據集,每個數據集包含五百家公司,每家公司十年。真實斜率係數為1,自變量的標準誤差為1,慘差項的標準誤差為2。
表3包含了基於時間效應的面版數據集的OLS係數和標準誤以及聚類標準誤差的估計值:

由表三可得出以下幾個結論:
  1. 當自變量或/和殘差不存時間效應時,OLS標準誤估計是正確的。

  2. 隨著時間效應強度增加,OLS標註誤低估正確標準誤的程度增加。

  3. 對比OLS,聚類標準誤估計值雖然準確很多,但較正確標準誤還是偏低。偏差是由於此模擬數據集中只有10個時間簇(T=10), 遠小於之前企業效應數據中但500個公司簇。為了探索簇數對聚類標準誤估計準確度的影響,本文模擬了五千個觀測值的數據集,其年數(或類集)的範圍為5到100。在所有模擬中,自變量和殘差的25%的變異性都來自時間效應()。聚類標準誤差估計中的偏差隨聚類數目的減少而降低,從T=5的27%降至T=40的3%,降至T=100的1%。

    2.2 Fama-MacBeth (FM) 標準誤差估計
    表4包含了基於時間效應的面版數據集的係數和標準誤的FM估計值:

    由表四可得出以下結論:當只有時間效應時,不同年份的估計斜率係數之間的相關性為零。因此, FM估計的標準誤不存在偏差(請參照公式(12))。
    1. 存在企業效應(Firm Effect)和時間效應(Time Effect)時的標準誤差估計

    根據之前的分析,當數據中僅存在企業效應時,以公司聚類的標準誤是無偏的。當數據中僅存在時間效應時,FM估計的標準誤和以年份聚類的標準誤(在年份數足夠大的前提下)是無偏的。當兩種效應同時存在時,經驗金融研究人員可以通過兩種方法解決相關性問題。
    方法一:通過參數方式估計其中一個維度(例如,通過包含虛擬變量)。由於許多面板數據集的公司數量超過年份數,因此一種通用的方法是在每個時間段都包含虛擬變量(以吸收時間效應),然後按公司進行聚類(Lamont和Polk,2001;Anderson和Reeb,2004;Gross和Souleles,2004;Sapienza,2004;以及Faulkender和Petersen,2006)。如果時間效應是固定的(例如,公式(15)),則時間虛擬變量將完全消除同一時間段內觀測值之間的相關性。在這種情況下,數據中只剩下固定企業效應,因而可以使用以公司聚類的標準誤。而當數據中還存在不固定企業效應時,以公司聚類的標準誤也可能存在偏差。
    方法二:由於研究人員並不總是知道依賴關係的確切形式,另一種解決方案是同時在兩個維度上聚類(例如,公司和時間)。Cameron,Gelbach和Miller(2006)和Thompson(2006)提出了方差-協方差矩陣的以下估計:

    由於公司集群和時間集群方差協方差矩陣都包含方差協方差矩陣的對角線,為了避免重複計算,懷特方差協方差被減去了。為了說明按公司,年份或這兩者進行聚類的標準誤差的性能,本文模擬了具有固定公司和時間效應的9個數據集,其中公司數量和時間段的範圍從10到1000,因此觀察的總數始終為10000(250家公司和40個時間段,請參見圖7)。假定 Var(γ) = Var(δ) = Var(η) and Var(μ) = Var(ζ) = Var(ν),

    圖7:在企業效應,時間效應獨自和同時存在的情況下按公司、時間或同時按兩者進行聚類的t統計量的拒絕率 (| t |> 2.58)

    相較於單獨按公司、時間聚類,二維聚類能產生偏差較少的標準誤差。但是,按公司和時間進行聚類並不總是能產生無偏估計。當有一百家公司一百年時,t統計量的1%大於2.58。隨著聚類數目(公司或年份)的減少,由公司和時間聚類的標準誤差有偏差,儘管偏差的幅度並不大。有關其他結果,請參見Cameron,Gelbach和Miller,2006;Thompson,2006)。當在一維中的聚類數量較少時,通過數量更多的聚類產生的聚類結果幾乎與同時在公司和時間上聚類的結果相同。例如,在使用一千家公司和十年數據的模擬中,無論標準誤是單按公司還是同時按公司和時間進行聚類,大於2.58的t統計量的百分比均為5%(圖7)。
    4.在存在不固定(臨時)企業效應的情況下估計標準誤差
    4.1 數據結構
    本文模擬了既包含固定企業效應又包含臨時企業效應的數據結構, 並假定其為一階自回歸過程
    (AR(1))過程。這使得臨時企業效應以一階自回歸衰減和零之間的比率消失。殘差的非企業性影響部分為( 來自公式(4)):

    φ是之間的一階自相關。通過選擇固定企業效應和一階自相關(φ)的相對大小,可以更改殘差中自相關的模式。

    4.2 隨機效應模型的廣義最小二乘估計(GLS)
    當面板回歸的殘差相關時,不僅OLS標準誤差估計值有偏差,而且係數估計值也無效(估計值不會利用數據中的所有信息)。研究人員可以通過使用GLS方法估算隨機效應模型來提高效率。在本文的調查中, 不到3%的論文使用了這種方法(例如,參見Maksimovic和Phillips,2002;Gentry,Kemsley和Mayer,2003;Almazan等,2004)。當殘差相關時,GLS估計比OLS估計更有效。但是,只有當企業效應是永久性的時,GLS產生的標準誤差才是正確的。當殘差相關但相關性消失時,GLS係數估計仍比OLS估計更有效,但標準誤差不再無偏見。與OLS標準誤差一樣,儘管偏差的幅度較小,但GLS標準誤差也太小。因此,即使使用GLS,也有必要估算由公司聚類的標準誤差。
    4.3 校正後的Fama-MacBeth 標準誤差(Adjusted FM)
    如第1節所示,企業效應導致FM標準誤估計值偏小。建議校正FM標準誤是為了估算年度係數估計值之間的相關性(即Corr [βt,βt-1] =θ),然後將估計的方差乘以(1 +θ)/(1-θ)來解釋 β 之間的序列相關性(Chakravarty, Gulen, Mayhew, 2004;and Fama and French, 2002)。由於平均一階自相關為負,因此校正後的Fama-MacBeth標準誤差比未校正標準誤差有更大的偏差。當殘差中存在自回歸分量時,或當企業效應固定時,校正後的FM標準誤會比沒校正的FM標準誤更準確。當殘差中同時存在固定和非固定企業效應時,校正後的FM標準誤依舊存在偏差,但是偏差顯著小於沒校正的標準誤。當數據中存在足夠多的周期(年份),且非固定企業效應很快隨時間消失時,校正後的FM標準誤性能最好。
    5.實證應用
    本節將幾種用於估計標準誤差的技術應用於兩個實際數據集。首先使用OLS估算回歸,然後使用懷特標準誤差以及按公司,時間和兩者聚類的標準誤差進行報告(表6和7,第I–IV列)。通過使用懷特標準錯誤作為基準,列之間的差異僅歸因於群集內相關性,而不是異方差。如果按公司聚類的標準誤差與懷特標準誤差顯著不同,則數據中會產生顯著的企業效應。然後使用Fama-MacBeth(表6和7,第V列)估算斜率係數和標準誤差,且每個OLS回歸都包含時間虛擬變量。
    5.1 資產定價的實證應用
    (Daniel and Titman, 2006, 「Market Reactions to Tangible and Intangible Information」)
    為了證明股本發行對未來股本回報的影響,Daniel 和Titman 將滯後帳面市價比的年值,帳面和市場價值的歷史變化以及公司股票發行量度的月度回報進行了回歸。該回歸的問題在於變量是基於每個月的數據,而自變量則都是基於每年的數據。因而自變量很有可能跨時間相關。
    表6包含了用不同方法估計的係數極其標準誤。在表6和表7中,I–IV列中的估計值是OLS係數,並且回歸包含時間(月)虛擬值。標準誤差在括號中報告。I:懷特標準誤差; II: 按公司聚類的標準誤;III:按月份聚類的標準誤;IV: 按按企業和月份聚類的標準誤。第五列包含由Fama-MacBeth估算的係數和標準誤差。

    通過檢查標準誤差在按公司或時間進行聚類時的變化方式(即比較I-II列和I-III列, 可以確定殘留在殘差中的依存關係的性質,這可以為研究人員提供如何改進其誤差的指南。按公司和月份進行聚類的標準誤差與僅按月份進行聚類的標準誤差基本相同(比較表6中的IV和III列)。當每月的公司很少或沒有公司影響時,這兩個標準誤差將接近。假設該數據集每月有很多公司(至少1000家),則結果表明該數據沒有明顯的公司效應。懷特標準誤差與公司所涵蓋的標準誤差基本相同,而按月聚類的標準誤差是懷特標準誤差的2至4倍。這意味著即使在包括時間虛擬變量之後,數據中也存在明顯的時間效應。根據前文的分析,當僅存在時間效應時,FM標準誤估計不存在偏差。根據表6的第V欄中報告, FM係數估計與OLS係數相似,並且標準誤差比懷特標準誤差(2.0-3.4倍)大得多,這在存在時間效應的情況下是可以預期的。Fama-MacBeth標準誤差接近於按時間聚類的標準誤差,因為這兩種方法都旨在解決時間維度的依賴性。
    5.2 公司財務的實證應用  
    之所以用資本結構回歸來進行公司財務的實證應用,是因為因為這是包含重大企業效應的數據。
    在構建數據集時,使用了文獻中常見的自變量(公司規模,公司年齡,資產有形性和公司盈利能力)。該樣本包含在1965-2003年間支付股息的紐約證券交易所公司。自變量相對於因變量滯後一年。結果報告在表7中。

    通過比較前四列中的標準誤差,可以發現由按公司和月份進行聚類的標準誤差與僅按公司進行聚類的標準誤差基本相同,而公司聚類的標準誤比懷特標準誤大得多(大3.1–3.5倍)。例如,關於利潤率變量的t統計量基於懷特標準誤差為-3.1,基於公司聚類的標準誤差為-0.9。這說明了在此數據集中,時間效應(包括了時間虛擬變量後)的重要性很小。懷特和FM的t統計量顯著大於公司聚類的t統計量。這證實了上文的結論:在存在固定企業效應的情況下,如在這種資本結構回歸中,懷特和FM標準誤差明顯偏倚。
    1. 結論

    如果數據存在企業效應,則OLS,White,Newey-West(針對面板數據集進行了修改),Fama-MacBeth或由一階自相關校正的Fama-MacBeth進行估計時,標準誤差均存在偏差。儘管如此,當估計的回歸結果具有確定性時,這些方法仍經常在文獻中使用。無論企業效應是永久性的(固定的)還是暫時的(非固定的),由企業聚類的標準誤差都是無偏的,並會產生正確大小的置信區間。固定效應和隨機效應模型也會產生無偏的標準誤差,但前提是企業效應是固定的。
    在有時間效應的情況下,Fama-MacBeth和按時間聚類的方法會產生無偏的標準錯誤和正確大小的置信區間, 但前提是存在足夠數量的聚類。當群集太少時,即使在正確的維度上聚類,聚類的標準誤差也會有偏差。
    當數據中同時存在企業效應和時間效應時,研究人員可以通過參數方式解決一個問題(例如,通過包括時間虛擬變量),然後估算聚集在另一個維度上的標準誤差。或者,研究人員可以在多個維度上進行聚類。當每個維度上都有足夠數量的聚類時,無論多維數據集上的標準誤差是永久影響還是永久影響,都不會偏向於多個維度的標準誤差,並且會產生正確大小的置信區間。
    判斷真實數據集中是否存在企業效應和時間效應的方法如下:當按公司聚類的標準誤差比懷特標準誤差大得多(大3到4倍)時,表明數據中存在企業效應(表7)。當按時間聚類的標準誤差比白色標準誤差大得多(大2到4倍)時,表明數據中存在時間效應(表6)。當按公司和時間進行聚類的標準誤差遠大於僅按一個維度進行聚類的標準誤差時,這可以表明數據中同時存在公司和時間效應。
    References

    Almazan, A., K. Brown, M. Carlson, and D. A. Chapman. 2004. Why Constrain Your Mutual Fund Manager? Journal of Financial Economics 73:289–321.

    Anderson, R., and D. Reeb. 2004. Founding-Family Ownership and Firm Performance: Evidence from the S&P 500. Journal of Finance 58:1301–28.

    Andrews, D. W. K. 1991. Heteroskedasticity and Autocorrelation Consistent Covariance Matrix Estimation. Econometrica 59:817–58.

    Arellano, M. 1987. Computing Robust Standard Errors for Within-Groups Estimators. Oxford Bulletin of Eco- nomics and Statistic 49:431–3.

    Baker, M., J. Stein, and J. Wurgler. 2003. When Does the Market Matter? Stock Prices and the Investment of Equity-Dependent Firms. Quarterly Journal of Economics 118:969–1005.

    Baker, M., and J. Wurgler. 2002. Market Timing and Capital Structure. Journal of Finance 57:1–32.

    Bakshi, G., N. Kapadia, and D. Madan. 2003. Stock Return Characteristics, Skew Laws, and the Differential Pricing of Individual Equity Options. Review of Financial Studies 16:101–43.

    Bertrand, M., E. Duflo, and Sendhil Mullainathan. 2004. How Much Should We Trust Differences-in-Differences Estimates? Quarterly Journal of Economics 119:249–75.

    Bloomfield, R., M. O』Hara, and G. Saar. 2006. The Limits of Noise Trading: An Experimental Analysis. Working Paper, Cornel University.

    Brockman, P., and D. Chung. 2001. Managerial Timing and Corporate Liquidity: Evidence from Actual Share Repurchases. Journal of Financial Economics 61:417–48.

    Cameron, A. C., J. B. Gelbach, and D. L. Miller. 2006. Robust Inference with Multi-Way Clustering. Working paper, University of California-Davis.

    Chakravarty, S., H. Gulen, and S. Mayhew. 2004. Informed Trading in Stock and Option Markets. Journal of Finance 59:1235–57.

    Chen, J., H. Hong, and J. Stein. 2001. Forecasting Crashes: Trading Volume, Past Returns, and Conditional Skewness in Stock Prices. Journal of Financial Economics 61:345–81.

    Cheng, S., V. Nagar, and M. Rajan. 2005. Identifying Control Motives in Managerial Ownership: Evidence from Antitakeover Legislation. Review of Financial Studies 18:637–72.

    Choe, H., B. Kho, and R. M. Stulz. 2005. Do Domestic Investors Have an Edge? The Trading Experience of Foreign Investors in Korea. Review of Financial Studies 18:795–829.

    Christopherson, J., W. Ferson, and D. Glassman. 1998. Conditioning Manager Alphas on Economic Information: Another Look at the Persistence of Performance. Review of Financial Studies 11:111–42.

    Cochrane, J. 2001. Asset Pricing. Princeton, NJ: Princeton University Press.Coval, J., and Tyler Shumway. 2005. Do Behavioral Biases Affect Prices. Journal of Finance 60:1–34.

    Daniel, K., and S. Titman. 2006. Market Reactions to Tangible and Intangible Information. Journal of Finance 61:1605–43.

    Denis, D., D. Denis, and K. Yost. 2002. Global Diversification, Industrial Diversification, and Firm Value. Journal of Finance 57:1951–79.

    Doidge, C. 2004. U.S. Cross-Listings and the Private Benefits of Control: Evidence from Dual-Class Firms. Journal of Financial Economics 72:519–53.

    Donald, S., and K. Lang. 2007. Inference with Difference in Differences and Other Panel Data. Review of Economics and Statistics 89:221–33.

    Efron, B., and R. J. Tibshirani. 1986. Bootstrap Measures For Standard Errors, Confidence Intervals, and Other Measures of Statistical Accuracy. Statistical Science 1:54–77.

    Fama, E., and J. MacBeth. 1973. Risk, Return and Equilibrium: Empirical Tests. Journal of Political Economy, 81:607–36.

    Fama, E., and K. French. 2002. Testing Tradeoff and Pecking Order Predictions about Dividends and Debt. Review of Financial Studies 15:1–33.

    Fama, E., and K. French. 2001. Disappearing Dividends: Changing Firm Characteristics or Lower Propensity to Pay? Journal of Financial Economics 60:3–43.

    Faulkender, M., and M. Petersen. 2006. Does the Source of Capital Affect Capital Structure? Review of Financial Studies 19:45–79.

    Gentry, W., D. Kemsley, and Christopher Mayer. 2003. Dividend Taxes and Share Prices: Evidence from Real Estate Investment Trusts. Journal of Finance 58:261–82.

    Graham, J., M. Lemmon, and J. Schallheim. 1998. Debt, Leases, Taxes and the Endogeneity of Corporate Tax Status. Journal of Finance 53:131–62.

    Greene, W. 2002. Econometric Analysis. Englewood Cliffs, NJ: Prentice-Hall.

    Gross, D., and N. Souleles. 2004. An Empirical Analysis of Personal Bankruptcy and Delinquency. Review of Financial Studies 15:319–47.

    Hansen, C. 2007. Asymptotic Properties of a Robust Variance Matrix Estimator for Panel Data When T Is Large. Journal of Econometrics 141:597–620.

    Hausman, J. 1978. Specification Tests in Econometrics. Econometrica 46:1251–71.Ibragimov, R., and U. Muller. 2007. T-statistic Based Correlation and Heterogeneity Robust Inference. Working

    paper, Harvard University.Jagannathan, R., and Z. Wang. 1998. An Asymptotic Theory for Estimating Beta-Pricing Models Using Cross-

    Sectional Regression. Journal of Finance 53:1285–309.Johnson, S. 2003. Debt Maturity and the Effects of Growth Opportunities and Liquidity Risk on Leverage. Review

    of Financial Studies 16:209–36.Kayhan, A., and S. Titman. 2007. Firms』 Histories and Their Capital Structures. Journal of Financial Economics.

    83:1–32.Kemsley, D., and D. Nissim. 2002. Valuation of the Debt Tax Shield. Journal of Finance. 57:2045–73.

    Kezdi, G. 2004. Robust Standard Error Estimation in Fixed-Effects Panel Models. Hungarian Statistical Review 9:95–116.

    Lakonishok, J., and I. Lee. 2001. Are Insider Trades Informative? Review of Financial Studies 14:79–111. Lamont, O., and C. Polk. 2001. Does Diversification Destroy Value? Evidence from the Industry Shocks. Journal

    of Financial Economics 63:51–77.Liang, K., and Scott Zeger. 1986 Longitudinal Analysis Using Generalized Linear Models. Biometrika. 73:13–22.

    MacKay, P. 2003. Real Flexibility and Financial Structure: An Empirical Analysis. Review of Financial Studies. 16:1131–65.

    Maksimovic, V., and Gordon Phillips. 2002. Do Conglomerate Firms Allocate Resources Inefficiently Across Industries? Theory and Evidence. Journal of Finance 57:721–67.

    Moulton, B. 1986. Random Group Effects and the Precision of Regression Estimates. Journal of Econometrics 32:385–97.

    Moulton, B. 1990. An Illustration of a Pitfall in Estimating the Effects of Aggregate Variables on Micro Units. Review of Economics and Statistics 72:334–8.

    Nagel, S. 2005. Short Sales, Institutional Investors and the Cross-Section of Stock Returns. Journal of Financial Economics. 78:277–309.

    Newey, W., and K. West. 1987. A Simple, Positive Semi-Definite, Heteroscedastic and Autocorrelation Consistent Covariance Matrix. Econometrica 55:703–8.

    Pastor, L., and P. Veronesi. 2003. Stock Valuation and Learning about Profitability. Journal of Finance 58:1749– 89.

    Pesaran, M. H., and R. Smith. 1995. Estimating Long-Run Relationships from Dynamic Heterogeneous Panels. Journal of Econometrics 68:79–113.

    Rogers, W. 1993. Regression Standard Errors in Clustered Samples. Stata Technical Bulletin 13:19–23. Sapienza, P. 2004. The Effects of Government Ownership on Bank Lending. Journal of Financial Economics.

    Schultz, P., and T. Loughran. 2005. Liquidity: Urban versus Rural Firms. Journal of Financial Economics 78:341–74.

    Skoulakis, G. 2006. Panel Data Inference in Finance: Least-Squares vs. Fama-MacBeth. Working paper, Univer- sity of Maryland.

    下面這些短連結文章屬於合集,可以收藏起來閱讀,不然以後都找不到了。

    2.5年,計量經濟圈近1000篇不重類計量文章,

    可直接在公眾號菜單欄搜索任何計量相關問題,

    Econometrics Circle




    數據系列 |  |  |  |  |     |  | 內部數據
    計量系列 |  |  |  |  |  |  |  |  |  |  |  |  | 
    數據處理 |  |  |  |  |
    乾貨系列 |  |  |  |  |  |  |  |  |  | 
    計量經濟圈組織了一個計量社群,有如下特徵:熱情互助最多前沿趨勢最多、社科資料最多、社科數據最多、科研牛人最多、海外名校最多。因此,建議積極進取和有強烈研習激情的中青年學者到社群交流探討,始終堅信優秀是通過感染優秀而互相成就彼此的。

    相關焦點

    • 面板數據主要分析方法匯總
      單位根檢驗方法的文獻綜述:在非平穩的面板數據漸進過程中,Levin andLin(1993) 很早就發現這些估計量的極限分布是高斯分布,這些結果也被應用在有異方差的面板數據中,並建立了對面板單位根進行檢驗的早期版本。後來經過Levin et al. (2002)的改進,提出了檢驗面板單位根的LLC 法。
    • Stata: 面板數據模型-一文讀懂
      你可以看出什麼是 「固定效應」,什麼是 「雙向固定效應模型」,什麼是 「POLS」 v.s. 「FE」 以及二者的差別。所以,面板數據模型其實沒有你想像的那麼複雜!根據個體數N 和時期數 T的大小,通常可以將面板數據分為宏觀面板和微觀面板:宏觀面板一般為 「大T小N」,微觀面板一般為「小T大N」。依據 N、T大小不同,所採用的參數估計方法和分析中關注的重點也不盡相同。二.
    • 面板數據(Panel Data)匯總
      單位根檢驗方法的文獻綜述:在非平穩的面板數據漸進過程中,Levin andLin(1993) 很早就發現這些估計量的極限分布是高斯分布,這些結果也被應用在有異方差的面板數據中,並建立了對面板單位根進行檢驗的早期版本。後來經過Levin et al. (2002)的改進,提出了檢驗面板單位根的LLC 法。
    • xtseqreg:面板模型如何估計不隨時間變化的變量
      問題背景在常見的固定效應靜態面板模型中,非時變的變量由於與個體固定效應完全共線性,無法估計出係數,在 Stata 中會直接匯報 omitted。另一方面,在動態面板模型中,我們一般使用 GMM 估計方法。
    • 面板數據門限回歸模型
      進行回歸分析,一般需要研究係數的估計值是否穩定。很多經濟變量都存在結構突變問題,使用普通回歸的做法就是確定結構突變點,進行分段回歸。這就像我們高中學習的分段函數。但是對於大樣本、面板數據如何尋找結構突變點。所以本文在此講解面板門限回歸的問題,門限回歸也適用於時間序列(文章後面將介紹stata15.0新命令進行時間序列的門限回歸)。
    • Stata實操陷阱:動態面板數據模型
      問題背景關於動態面板數據模型 (dynamic panel data,DPD),我們常常會遇到如下問題:當解釋變量中含有內生變量時,應該如何對模型進行估計;接下來,本文將對上述問題提出對應的解決方案。2.
    • 如何進行面板數據分析?
      是截面上個體在不同時點重複觀測數據。面板數據分析就是根據面板數據進行分析得出相應對於時間以及重複概率的結論。由於觀測值相對增多,可以增加估計量的抽樣精度,對於固定效應回歸模型能得到參數一致估量值,同時面板數據建模比單截面數據建模可以獲得更多的動態信息。因此在很多時候,我們更傾向於使用面板數據分析。那應該如何進行面板數據分析呢?
    • 如何理解統計學中的「估計」,用Excel來幫助你學習
      樣本數據為眾多支持決策的有益分析奠定了基礎。估計涉及使用樣本數據來估計某個未知的母體參數的值,比如母體平均值、母體比例,或母體方差。估計量是指用來估計母體參數的量數,例如,我們使用樣本平均值來估計母體平均值。
    • 【Stata教程】如何用Stata分析面板數據
      其中,面板數據(panel data)是指在時間序列上取多個截面,在這些截面上同時選取樣本觀測值所構成的樣本數據,面板數據能夠幫助我們處理難以觀測的個體效應與時間效應。比如說,我們研究上海市16個區縣洗衣液的消費情況,我們認為洗衣液的價格、居民收入會影響消費情況。但與此同時,民族的風俗習慣、廣告投放也會影響消費。但是對於某一個體而言,民族的風俗習慣不會有大的變化,因此我們能夠控制個體效應。
    • 【stata】面板GMM估計
      reg ldi lofdiestimates store olsxtivreg ldi (lofdi=l.lofdi ldep lexr)estimates store ivhausman iv ols 在面板數據中使用工具變量
    • 標準差還是標準誤?
      下面,我們就來梳理一遍,這兩個到底有什麼區別和聯繫。一,定義掌握新事物,定義是最新需要關注的,因為可以從內涵和外延對事物有個較為清晰的界定。標準差( standard deviation) 作為隨機誤差( 或真差) 的代表,是隨機誤差絕對值的統計均值 。大白話解釋,就是衡量一組數據的離散程度。
    • Java中List的contains方法,你用對了嗎?
      Java語言中的List是我們處理集合時經常會用到的。而List定義了一個contains方法,用以判斷一個集合中是否包含指定的一個對象。大家應該有用到過吧,可是你真的會用,用對了嗎?看看下面的代碼。上圖代碼中,創建了兩個內容相同的String對象:str1和str2,將str1存入了集合list中,。這兩個對象不是同一個對象,所以「str1==str2」輸出的結果是false。但是通過「list.contains(str2)」判斷集合中是否包含str2時,返回的卻是true。是你意料中的嗎?
    • stata 面板數據攻略
      1、將數據在excel 表格中按以下順序排列好。第一列為年份,第二列為省份(省份用1-31個數字表示,字符不行),後面幾列為變量。
    • 【陸銘】面板數據、工具變量選擇和HAUSMAN檢驗的若干問題+雙重差分學習手冊
      面板數據作為計量經濟學中的一個小分支,多數本科學校沒有學過,此課程主要面向研究生及以上,但是面板數據的實證分析在核心刊物上屢屢出現(例子:前天小編去市圖書館,看某經濟類核心期刊,一共有10篇文章,其中3篇用的是面板數據,但不是簡單的面板數據
    • 你真的了解參數估計和假設檢驗嗎?
      它是在對樣本數據進行描述的基礎上,對統計總體的未知數量特徵做出以概率形式表述的推斷。2)為什麼要進行推斷統計?在實際研究中,總體數據的獲取往往是比較困難的,總體參數一般也是未知的。因此,我們就需要利用總體的某個樣本,通過樣本統計量去估計總體參數。基於這個需求,我們就需要學習推斷統計。通過上述敘述,我們給推斷統計做一個說明。
    • 貌合神離的標準差與標準誤
      你到底想不想讓學生看明白?其實標準誤和標準差並不是很難區別,只是不知道為什麼書上總是不喜歡講清楚。儘管統計教科書上也分別介紹了二者的區別,而且還將其作為考試重點,但淨是說些不疼不癢的話,讓人摸不著頭腦。本文主要從理解的角度來介紹一下二者的概念。先說簡單的概念標準差。標準差反映了數據的波動情況,標準差越大,表明數據之間差別越大。
    • Stata:面板分位數模型估計及內生性初探
      結合分位數回歸與面板數據,採用分位數回歸的方法對面板數據變量的參數進行估計,不僅能夠更好的控制個體的異質性,以緩解遺漏變量導致的內生性問題;還夠分析在特定的分位數處自變量對因變量的邊際效應,使我們得以從多個維度進行分析。接下來我們將介紹面板分位數回歸模型的兩種形式,並主要展示固定效應面板分位數回歸模型的估計。
    • CFA一級框架:抽樣估計和假設檢驗都是些什麼?
      今天欣欣老師要帶大家複習一遍抽樣估計和假設檢驗,同學們都來一起快速複習一遍吧!抽樣估計包括抽樣方法、數據形態、中心極限定理、評判標準、區間估計、偏差等概念。假設檢驗包括定義假設、檢驗統計量、顯著性、拒絕域、P值、一類和二類錯誤等概念。戳我查看大圖▼戳我查看大圖▼
    • xtdpdgmm:動態面板數據模型一網打盡
      簡介對於動態面板數據模型 (Dynamic Panel Data, DPD),直接用最小二乘法估計是有偏的,為解決這一問題,Arellano 和 Bond (1991)、 Arellano 和 Bover (1995)、以及 Blundell 和 Bond (1998) 等提出了「一階差分 GMM (FD-GMM)」和「系統 GMM (SYS-GMM
    • 標準誤(Standard Error)
      標準差是單次抽樣得到的,用單次抽樣得到的標準差可以估計多次抽樣才能得到的標準誤差 標準差表示數據離散程度:標準差越大,分布越廣,集中程度越差,均值代表性越差 如下圖,我們用第一組樣本估算真實標準誤,此樣本標準差除以根號n,結果為7.16, 然後把7.16約等為真實的標準誤6.33。