stata 面板數據攻略

2021-02-15 經管聯盟

1、將數據在excel 表格中按以下順序排列好。第一列為年份,第二列為省份(省份用1-31個數字表示,字符不行),後面幾列為變量。

 

 

 

2、將Excel表格另存為CSV格式,在Stata中導入CSV格式的文檔(file-import-第一個選項,然後點Browse,在跳出的「打開」文檔的文件類型選擇CSV,找到自己之前保存好的CSV文檔)。

 

 

3、定義面板數據,輸入以下命令:

. xtset province year

 

 

4、單位根檢驗

    面板數據的單位根檢驗方法有很多種,一般我們只選兩種,即相同根單位根檢驗和不同根單位根檢驗。如果數據是平衡的,則可使用LLC檢驗(適用於同根)和IPS檢驗(適用於不同根)。

一般的stata並沒有自帶這兩個程序需要自己下載安裝,我們可以在命令欄鍵入:searchlevinlin, net和search ipshin, net,然後按照提示逐步安裝。也可直接輸入命令:ssc install levinlin,即自動完成安裝。在開始進行協整檢驗之前,需要將面板數據轉化為時間序列,使用以下命令:tsset province year
單位根檢驗輸入如下命令:

Levinlin 變量名,lags(1)

Ipshin 變量名,lags(1)

如果存在單位根,則需要進行一階差分,並再次進行單位根檢驗,輸入以下命令:

 levinlin D.變量名,lags(1)

註:Users of Stata 11+ should use the official xtunitrootips command。

菜單:Statistics > Longitudinal/panel data> Unit-root tests

    具體操作可以參照李子奈的說法:單位根檢驗是通過三個模型來完成,首先從含有截距和趨勢項的模型開始,再檢驗只含截距項的模型,最後檢驗二者都不含的模型。並且認為,只有三個模型的檢驗結果都不能拒絕原假設時,我們才認為時間序列是非平穩的,而只要其中有一個模型的檢驗結果拒絕了零假設,就可認為時間序列是平穩的。

例:首先檢驗含有截距和趨勢項的模型:

含有截距和趨勢項的模型存在單位根,再檢驗只含截距項的模型:

所以,lnx不存在單位根,數據是平穩的。

 

5、協整檢驗

如果基於單位根檢驗的結果發現變量之間是同階單整的,那麼我們可以進行協整檢驗。但也有如下的寬限說法:如果變量個數多於兩個,即解釋變量個數多於一個,被解釋變量的單整階數不能高於任何一個解釋變量的單整階數。另當解釋變量的單整階數高於被解釋變量的單整階數時,則必須至少有兩個解釋變量的單整階數高於被解釋變量的單整階數。如果只含有兩個解釋變量,則兩個變量的單整階數應該相同。

在Stata中對面板數據進行協整檢驗的命令是xtwest,這個程序也是需要我們自己下載安裝的。

輸入命令:search xtwest,net

然後按提示安裝。也可直接輸入:ssc install xtwest,自動完成安裝。

另外一個協整命令:nharvey,也是需要安裝的。

在開始進行協整檢驗之前,需要將面板數據轉化為時間序列,使用以下命令:

tssetprovince year

協整的命令為:

xtwestdepvar varlist [if exp] [in range] , lags(# [#]) leads(# [#])

lrwindow(#)[constant trend bootstrap(#) westerlund noisily mg]

例:

1、xtwest lntfp lnx,lags(1)

2、xtwest loghex loggdp, constant trend lags(1) leads(1) lrwindow(3)

 

6、進行回歸分析,輸入以下命令:

Xtreg 因變量 自變量

例如:

固定效應模型的回歸:xtreg  lntfp lnx lnxg lnhr lnrd lnfdi,fe

 

本例中F統計量為0.0000,固定效應非常顯著,表明固定效應模型優於混合OLS模型。

下面,檢驗隨機效應模型是否顯著:

Xttest0

先安裝使用命令:findit xttest0

然後用命令:Xttest0

檢驗得到的P值為0.0000,隨機效應模型非常顯著,表明隨機效應模型也優於混合OLS模型。至於固定效應模型和隨機效應模型的選擇,則要使用Hausman檢驗進行判斷。

 

7、Hausman檢驗判斷選擇固定還是隨機效應模型。Hausman檢驗的基本思想是:在固定效應u_i和其他解釋變數不相關的原假設下,用OLS估計的固定效應模型和用GLS估計的隨機效應模型的參數估計都是一致的。反之,OLS是一致的,但GLS則不是。因此,在原假設下,二者的參數估計應該不會有系統的差異,我們可以基於二者參數估計的差異構造統計檢驗量。如果拒絕了原假設,我們就認為選擇固定效應模型是比較合適的。

    具體的命令輸入如下:

1. xtreg deptVar indeptVar1 indeptVar2 ,re

2. estimates store random

3. xtreg deptVar indeptVar1 indeptVar2 ,fe

4. estimates store fixed

      5. hausmanfixed random

例:

1、. xtreg  lntfp lnx lnxg lnhrlnrd lnfdi,re

 

 

 

2、.estimates store random

3、.xtreg  lntfp lnx lnxg lnhr lnrd lnfdi,fe

 

4、.estimates store fixed

5、.hausman fixed random

 

 

此例中P值為0.0048,拒絕原假設,所以應該選擇固定效應模型。

 

8、以下是產生新變量以及刪除變量的命令

 

產生新變量lntfp,將變量tfp轉變為Ln的形式,輸入以下命令:

. gen lntfp=ln(tfp)

 

刪除變量使用以下命令:

drop 變量名

相關焦點

  • 【Stata教程】如何用Stata分析面板數據
    在計量研究中,用於實證分析的數據主要有時間序列數據、橫截面數據以及面板數據。
  • 用Stata搞實證之面板模型入門
    :整個中國2010至2020年的GDP而第三種數據結構便是面板數據,實際上就是橫截面數據和時間序列數據的結合值得注意的是,不同軟體輸入面板數據的格式不一樣,我只推薦Stata來處理這些數據,因為真的對新手很友好面板數據可以在excel整理好,直接粘貼到Stata以北京上海和廣州3個城市2010至2016年的人口,地區生成總值和商品房均價為例,在excel裡的整理如下:可以看到,
  • stata編程初步+三種數據類型​
    面板數據、截面數據、時間序列數據 面板數據含義面板數據(Panel Data)是將「截面數據」和「時間序列數據」綜合起來的一種數據類型。具有「橫截面」和「時間序列」兩個維度,當這類數據按兩個維度進行排列時,數據都排在一個平面上,與排在一條線上的一維數據有著明顯的不同,整個表格像是一個面板,所以稱為面板數據(Panel Data)。它是截面上個體在不同時間點的重複測量數據。
  • 零基礎學Stata 數據分析再不怕
    在學術圈如果是做應用計量(特別是橫截面數據、面板數據),Stata是不二之選,因為不管是管理數據還是跑回歸,實在太太太方便了。現在主流期刊的應用微觀計量文章裡面能用到的模型stata幾乎都有,而且其中的絕大多數都是用stata做的。而且最大的優點是,簡單!
  • 乾貨貼 | STATA與面板回歸模型(一)
    和spss、eviews等可視化軟體相比,stata用起來要方便的多,敲代碼的快樂,真的是體驗後才能知曉!以下是本人在本科畢業論文中使用的代碼,都是從各網站搜索而來,如有不當之處,歡迎留言指正!設定面板:xtset symbol year生成平方項:gen x2=x^2生成滯後項:gen lag_x= L.x生成差分項:gen D_x=D.x(一階差分)gen D2_x=D2
  • Stata: 面板數據模型-一文讀懂
    所以,面板數據模型其實沒有你想像的那麼複雜!常見的數據形式有時間序列數據( Time series data ),截面數據( Cross-sectional data )和面板數據( Panel data )。從維度來看,時間序列數據和截面數據均為一維。面板數據可以看做為時間序列與截面混合數據,因此它是二維數據。
  • 【重發】面板門檻模型-stata命令xthreg介紹
    如果模型的研究對象包含多個個體、多個年度,那麼就是面板門檻模型。    目前,Stata14沒有官方命令可以估計門檻模型或者面板門檻模型,最新的Stata15加入了估計門檻模型的功能,但依然不能估計面板門檻模型。所以,一般我們還是藉助外部命令,在Stata14版本下估計面板門檻模型。一、命令介紹目前面板門限回歸有兩個命令。
  • suest - 支持面板數據的似無相關檢驗
    但 suest 不支持 xtreg 命令,因此無法直接將該方法直接應用於面板數據模型,如 FE 或 RE。可以預先手動去除個體效應,繼而對變換後的數據執行 OLS 估計,步驟如下:*-SUEST test for panel data *-數據概況 webuse "nlswork", clear xtset idcode year xtdes *-對核心變量執行組內去心:去除個體效應
  • 一文收藏stata14&15小抄:常用命令匯總
    圖1.3 stata導入調用數據圖1.7 stata探索性/描述性分析 查看數據結構圖1.9  創建新變量 命令gene2   stata數據轉換 Data Transformation本節主要對stata
  • Stata語言中的常用函數及其用法解釋, 在附上42篇Stata相關學習資料
    高級計量經濟學及Stata應用"和"Stata十八講"配套數據,13.數據管理的Stata程序功夫秘籍,14.非線性面板模型中內生性解決方案以及Stata命令,15.把動態面板命令講清楚了,對Stata的ado詳盡解,16.半參數估計思想和Stata操作示例,17.Stata最有用的points都在這裡,無可替代的材料,18.PSM傾向匹配Stata操作詳細步驟和代碼,乾貨十足,19.隨機前沿分析和包絡數據分析
  • Stata實操陷阱:動態面板數據模型
    動態面板模型估計 Stata 命令動態面板數據模型的估計主要有 4 個 Stata 命令,其中官方命令為 xtabond、xtdpdsys、xtdpd,非官方命令為 xtabond2,具體如下:xtdpd 用於 FD-GMM 和 SYS-GMM 估計;xtabond2 用於 FD-GMM 和 SYS-GMM 估計。
  • 面板數據門限回歸模型
    但是對於大樣本、面板數據如何尋找結構突變點。所以本文在此講解面板門限回歸的問題,門限回歸也適用於時間序列(文章後面將介紹stata15.0新命令進行時間序列的門限回歸)。門限效應,是指當一個經濟參數達到特定的數值後,引起另外一個經濟參數發生突然轉向其它發展形式的現象(結構突變)。
  • 【乾貨分享】PVAR模型的stata操作流程(附操作文件)
    簡單目錄:stata操作界面簡介PVAR的基本操作流程圖第一步輸入數據(以導入Excel數據為例)第二步 調整數據格式第三步 描述性分析第四步 面板單位根檢驗第五步 協整檢驗第六步 確定最優滯後階數第七步 格蘭傑因果檢驗
  • 人生苦短,我學stata
    、門檻回歸、動態面板、數據管理專題、時間序列計量、橫截面計量等專題零基礎入門,循序漸進,系統學習,助你掌握高級計量及Stata應用在學術圈如果是做應用計量(特別是橫截面數據、面板數據),Stata是不二之選,因為不管是管理數據還是跑回歸,實在太太太方便了。
  • Stata:面板分位數模型估計及內生性初探
    ,面板分位數回歸也隨之出現。結合分位數回歸與面板數據,採用分位數回歸的方法對面板數據變量的參數進行估計,不僅能夠更好的控制個體的異質性,以緩解遺漏變量導致的內生性問題;還夠分析在特定的分位數處自變量對因變量的邊際效應,使我們得以從多個維度進行分析。接下來我們將介紹面板分位數回歸模型的兩種形式,並主要展示固定效應面板分位數回歸模型的估計。
  • 面板門檻回歸學習手冊
    但是對於大樣本、面板數據如何尋找結構突變點。所以本文在此講解面板門限回歸的問題,門限回歸也適用於時間序列(文章後面將介紹stata15.0新命令進行時間序列的門限回歸)。門限效應,是指當一個經濟參數達到特定的數值後,引起另外一個經濟參數發生突然轉向其它發展形式的現象(結構突變)。
  • Stata15.0中文版正式發布!又要騙我去學習了
    來源:stata官網,https://www.stata.com/new-in-stata/chinese-interface
  • Python與Stata在數據處理區別
    2、數據輸入/輸出從價值觀構建數據幀通過將數據放在input語句之後並指定列名,可以從指定值構建Stata數據集。pandas 的 DataFrame 可以用許多不同的方式構建,但對於少量的值,通常可以方便地將其指定為Python字典,其中鍵是列名,值是數據。
  • Stata:斷點回歸分析教程
    在學術圈如果是做應用計量(特別是橫截面數據、面板數據),Stata是不二之選,因為不管是管理數據還是跑回歸,實在太太太方便了。」為了幫助小夥伴們快速掌握stata,我們特別推出2021年寒假stata學術提升計劃!  截至目前,計量經濟學服務中心已經在西安、北京、上海、廣州等地成功舉辦了15場stata高級班,並在深圳南方科技大學舉辦了一場stata編程研討班。
  • Stata+R:門檻回歸教程
    但是對於大樣本、面板數據如何尋找結構突變點。所以本文在此講解面板門限回歸的問題,門限回歸也適用於時間序列。門限效應,是指當一個經濟參數達到特定的數值後,引起另外一個經濟參數發生突然轉向其它發展形式的現象(結構突變)。作為原因現象的臨界值稱為門限值。例如,成果和時間存在非線性關係,但是在每個階段是線性關係。有些人將這樣的模型稱為門檻模型,或者門限模型。