▼ ▼ ▼ ▼ ▼ ▼ ▼ ▼ ▼
缺失值問題的處理一般如下:如果樣本量足夠大,可以考慮刪除;在對數據不進行刪除的情況下,缺失值問題的處理方法:
(1) 均值插補。
如果連續兩年缺失的情況可以使用移動平均進行插值(平滑法)。(2) 回歸插補。
(3) 多重插補(Multiple Imputation,MI)。
通常是估計出待插補的值加上噪聲後形成多組可選插補值。
非平衡面板不能直接做,但是可以直接使用xtbalance,該命令專門用於將連續時間非平衡面板處理成平衡面板。xtbalance命令的具體用法:xtbalance, range(numlist) [ miss(varlist) ]
Husman檢驗結果如果為隨機效應模型,說明你的數據更適合建立隨機效應模型,一般如果可以建立固定效應模型的要求高於隨機效應模型,通常來說固定效應模型使用的更多。
面板數據時間固定或地點固定stata程序:
xtset id year
xtreg x1 x2,fe整體效應
xtreg x1 x2 i.year,fe時間效應
xtreg x1 x2 i.id地區效應
如果要繼續分片做,第一種是把要考慮的地區單獨估計,第二種方式是設置虛擬變量估計。
做面板數據一般年份做到8年及以上。
異方差問題可以直接修正標準誤,使用xtreg y x1 x2, fe vce(robust)。
當你面板數據時間維度t比較長的,要做單位根檢驗,避免出現偽回歸問題。
將各種結果存為word、Pdf等格式的命令:
ssc install asdoc, replace
ssc install logout
ssc install outreg2
Ssc install tabout//做表格
差分GMM做面板數據,gen dif=code[5]-code[1]
[n]表示變量code的第n個觀測值。
因果檢驗可以使用格蘭傑因果檢驗方法。
請用(ssc install reghdfe) 並見其說明 (help reghdfe),處理不同國家不同行業的不同數據
https://www.stata.com/support/faqs/statistics/completely-determined-in-logistic-regression/
2SLS中,第一階段回歸是用OLS建立每個內生變量關於工具變量和外生變量的回歸,得到內生變量的估計值;第二階段回歸用估計值代替x進行回歸。
工具變量檢驗方法整理如下:
進行hausman test,檢驗所有變量是否均為外生變量,原假設為所有解釋變量外生;
如果工具變量個數>內生變量,則進行過度識別,利用estat overied進行驗證;sargan test:原假設為工具變量有效;弱工具變量檢驗:
①偏R2
②一階段回歸時看F值
estate firststage,all forcenonrobust(針對方法1和方法2)
③Cragg-Donald Wald F統計量,原假設為存在弱工具變量。
④Kleibergen-Paap rk LM statistic F值很大,P=0拒絕原假設,利用ivreg2
當工具變量個數=內生變量時,無法進行過度識別;
當工具變量個數>內生變量時,進行過度識別檢驗。
do文檔亂碼問題
①把需要轉換的其他版本的do文檔放到Stata的工作路徑中
②輸入命令:使用unicode的命令
unicode encoding set gb18030
unicode analyze *
unicode translate *
時間調整下載sax12包
關於組間差異性檢驗問題:
如果當兩個係數都是顯著的時候,兩個係數的置信區間有重疊的話,其實不太好判斷出來兩者是否有明顯差異,所以還是要做一下檢驗
三種檢驗組間係數差異的方法:主要可以通過三種方法來驗證:Chow 檢驗、基於似無相關模型的檢驗方法 (suest)、費舍爾組合檢驗(Permutation test)
https://www.jianshu.com/p/f27f8716dd2d
PSM方法
ssc install psmatch2 #安裝程序包
.gen tmp = runiform()
.sort tmp #對所有觀測隨機排序
.psmatch2 。。。 #PSM分析
.pstest, both #均衡性檢驗
.psgraph #圖示匹配結果
DID使用規定:
1.前提條件
①存在實驗組和對照組
②面板數據,截面數據不符合
2.模型前提
①平行趨勢假設:在政策幹預之前,處理組和控制組的結果效應的趨勢相同
②SUTVA條件:政策幹預只影響處理組,不對控制組產生影響
③線性形式條件:潛在結果變量同處理變量和時間變量滿足線性條件
Logit求邊際效應
margins命令
dydx(varlist)估計變量的邊際效應;
eyex(varlist)估計變量的彈性;
dyex(varlist)估計變量的半彈性(d(y)/d(lnx));
eydx(varlist)估計變量的半彈性(d(lny)/d(x))。
負二項分布式描述過度分散的計數數據
合併數據問題
keep(varlist) 只保留filename中特定的變量
_merge(newvar) 合併滯後生成新變量,默認名稱為_merge
nolabel不要複製filename中所定義的標籤
updatae 用filename 中的數據代替內存中的缺失值
nokeep刪除資料庫中不能匹配的觀測值
Unique 匹配變量在源文件與合併文件中都是唯一的
Uniqmaster 匹配變量在源文件中必須是唯一的
Uniqusing 匹配變量在合併文件中必須是唯一的
內生性來源:測量誤差、遺漏變量和逆向因果。
1、變量的內生性。
當存在適當的工具變量時可以用Hausman檢驗
2、工具變量的外生性。
當存在多各工具變量時,可以檢驗是否有不是外生的,「過度識別」問題
3、工具變量的相關性。
檢驗可以通過一階段的F值。
4、估計方法
stata中的2sls smal、liml、gmm
適用情況:small適合小樣本;liml適合弱工具變量;gmm適合異方差。
檢驗:
estata firststage ,all forcenonrobust \\\查看第一階段F值
estat overid \\\過度識別
estat endogenous \\\異方差
regress 2sls rent pcturban hsngval
est store m1
ivregress 2sls rent pcturban (hsngval = faminc iregion)
est store m2
hausman m1 m2 \\\內生檢驗
工具變量選擇
① IV是外生的
② 將內生變量X作為被解釋變量,IV和其他解釋變量作為解釋變量進行回歸,查看工具變量是否顯著。如果有多個IV變量,用F檢驗看是否都不顯著。
③ 做IV回歸後用husman檢驗,若P<0.1或0.05,說明IV回歸與原回歸顯著不同,原方程存在內生性問題導致的估計偏誤。
④ IV本身不能影響Y。
test [y1=y2](對y1的回歸和對y2的回歸係數相等)
test [y1=y2]: x1 x2 x3, mtest(對y1和y2的回歸中,分別測試x1、x2、x3的係數是否相等,若沒有mtest這個命令,則測試他們的聯和統計)
test [y1=y2=y3](三個回歸的係數是否相等,可加mtest以分別測試)
test [y1=y2=y3]: x1 x2 (測試三個回歸中的x1、x2是否相等,可加mtest)
stata學習手冊
http://www.360doc.com/content/19/0419/08/3405550_829816798.shtml
視頻教學:計量原理+Stata實操+經典案例論文全解讀
配套資料:課件練習答案+數據do文件+獨家Stata程序
增值服務:學術助手社群答疑
由南開大學數量經濟研究所所長王群勇教授及其學術團隊主辦,旨在定期與大家分享計量經濟學的相關理論及軟體使用技巧,覆蓋經濟學、管理學、社會學等學科,為廣大學友提供優質學術內容。