Stata:多元 Logit 模型詳解 (mlogit)

2021-02-12 君泉計量

目錄

1. 應用背景

2. 多元 Logit 模型

3. 應用實例

3.1 數據結構描述

3.2 模型估計

3.3 假設檢驗

3.4 預測概率值與概率值的圖形顯示

3.5 擬合優度

3.6 其他思考

參考文獻

1. 應用背景

在實證研究中,我們會遇到被解釋變量為類別變量的情形。在部分情境下,被解釋變量為非此即彼的二元選擇變量 (如是否考取大學、是否結婚等),即我們熟知的0-1變量,此時應採用二元 Logit 模型進行估計;但在很多情形中,被解釋變量涉及 3 種以上的類別變量。

例如:

人們的職業選擇可能受到父母職業及其受教育水平的影響。我們可以探究一個個體的職業選擇與父親職業選擇的相關關係,其中被解釋變量職業選擇包括了多種職業類別。進入高中後學生可以自由選擇綜合課程、職業課程和學術課程。他們的選擇可能受其寫作成績和社會經濟地位的影響。

在這些情境下,我們需要採用多元 Logit 模型進行估計。

2. 多元 Logit 模型

多元 Logit 模型實質上可視為二元 Logit 模型的拓展,具體二元 Logit 模型的使用可參考閱讀 Stata 連享會 推文 : Logit 模型簡介。兩者的差異在於,二元 Logit 模型的被解釋變量只有 0 和 1 兩個取值,而多元 Logit 模型涉及了被解釋變量有多個取值的情形。

2.1 模型設定

多元 Logit 模型可視為對被解釋變量中各類選擇行為兩兩配對後構成的多個二元 Logit 模型實施聯合估計 ( simultaneously estimation )。模型設定具體如下:

其中,為選定的基準組,設定為類別變量包含的種類總數,則。當時,等式左側為,則。即某種選擇相對自己的 log-odds 始終為 0,致使該組別對應的任何解釋變量係數也必然為0。

通過求解這個方程,可以得到每種選擇的預測概率:

2.2 模型係數解讀2.2.1 基於勝算比 (odds) 角度的解讀

在因變量含有個組別並有個解釋變量 (包含常數項) 的多元 Logit 模型中,我們共有個參數,這使得模型的解讀更為複雜。首先,Logit 模型估計的關鍵在於選定基準組 ( base group ),所有係數均是相對於基準組進行估計;其次,我們通常從概率的角度出發對 Logit 模型進行解讀。與二元 Logit 模型相似,基於勝算比 (odds) 對模型參數進行解釋能夠使模型更加簡明易懂。

我們假設選定的基準組 ( base group ) 為第 1 組,那麼第個組別相對於基準組的勝算比 (odds) 可以表示為:

那麼第個解釋變量的變化對該勝算比的影響 ( factor change ) 可表示為:

其中,為第組別係數向量中的第個元素。該表達式表明,保持其他解釋變量不變,每增加一個單位,即時,選擇第組別相對於基準組的勝算比變化為 ( factor change )。由此可見,若且唯若時,第組別相對於基準組的勝算比大於 1,並且的增加能夠提升選擇第組別相對於基準組的勝算比。

我們可以進一步將等式一般化得到第組別相對於第組別的勝算比:

個解釋變量的變化會引起第第組別相對於第組別的勝算比發生的比率變化 ( factor change )。若且唯若時,的增加能夠提高選擇組別相對於選擇組別的概率。

以上衡量的是第組別勝算比在發生變化後相對於原勝算比的比率變化 ( factor change ),若我們想要衡量第組別相對於基準組勝算比在發生變化前後的相對變化,則可以得到以下表達式:

增加一個單位,即時,第組別相對於基準組勝算比的相對變化幅度為,當很小時,,此時係數具有更為直觀的含義。

2.2.2 基於概率的解讀

以上主要從勝算比 (odds) 的角度對 Logit 模型進行解讀。勝算比 (odds) 反映了不同組別發生概率的比值,但我們更為關注各組別發生概率本身的變化,而非其相對水平的變化。

當第個解釋變量發生個單位的變化時,我們可以將各組別發生概率的變化表示為:

我們不難看出,引起的組別發生概率的變化方向不一定與其係數保持一致,總體而言的符號是模糊的。

需要注意的是,所有組別發生概率之和為 1,因此各組別發生概率的變化呈現出此消彼長的規律,而某一組別的概率變化也可以由其他個組別決定,由此我們可以得到:

對於連續型解釋變量而言,我們可以直接通過求導得到該變量變化對某一組別發生概率產生的邊際效應:

由以上兩個表達式可以看出第個解釋變量變化對第組別發生概率產生的邊際效應不僅取決於,同時還受到其他組別估計係數的影響,因此的符號也是不確定的。但解釋變量對各組別發生概率的邊際效應存在以下規律:

在實證研究中,我們常用最大似然法對多元 Logit 模型進行估計。在模型解讀中,我們通常採用平均邊際效應 ( average marginal probability effects ) 來衡量解釋變量對各組別發生概率產生的影響:

一方面,我們通過計算平均預測概率及其標準差、或最大預測概率和最小預測概率對模型進行解讀。另一方面,我們也可以通過繪製某一解釋變量在不同取值下對應的預測概率的線形圖 (其他解釋變量取均值) 以描述該變量對發生概率的影響。

3. 應用實例

我們通過高中生進行課程選擇的案例介紹多元 Logit 模型的應用。

3.1 數據結構描述

在本案例中,被解釋變量prog是高中生樣本個體選擇參加的課程項目:「prog:1 綜合項目 (general);2  學術項目 (academic);3 職業項目 (vocation)」;解釋變量包括被觀測樣本的社會經濟地位 ses (類別變量:1 低等;2 中等;3 高等) 以及寫作成績 write (連續變量)。

我們分別通過tab命令和table命令對變量進行描述性統計,對解釋變量與被解釋變量之間的相關關係進行初步判斷。卡方檢驗表明 progses 兩個變量存在相關關係;此外,選擇參加學術課程項目的高中生平均寫作成績最高,而選擇參加職業課程項目的高中生平均寫作成績最低。

use https://stats.idre.ucla.edu/stat/data/hsbdemo, clear

tab prog ses, chi2

type of | ses
program | low middle high | Total
-+---+
general | 16 20 9 | 45
academic | 19 44 42 | 105
vocation | 12 31 7 | 50
-+---+
Total | 47 95 58 | 200

Pearson chi2(4) = 16.6044 Pr = 0.002


table prog, con(mean write sd write)

-
type of |
program | mean(write) sd(write)
+
general | 51.33333 9.397776
academic | 56.25714 7.943343
vocation | 46.76 9.318754
-

3.2 模型估計

我們採用mlogit命令估計多元回歸模型。ses 變量前的i.標識表明該變量為類別變量,base選項幫助我們選定模型估計的基準組,此處我們將「學術課程項目」( ses=2 ) 作為基準組。

mlogit prog i.ses write, base(2)

Iteration 0: log likelihood = -204.09667
Iteration 1: log likelihood = -180.80105
Iteration 2: log likelihood = -179.98724
Iteration 3: log likelihood = -179.98173
Iteration 4: log likelihood = -179.98173

Multinomial logistic regression Number of obs = 200
LR chi2(6) = 48.23
Prob > chi2 = 0.0000
Log likelihood = -179.98173 Pseudo R2 = 0.1182

---
prog | Coef. Std. Err. z P>|z| [95% Conf. Interval]
---+----
general |
ses |
middle | -.533291 .4437321 -1.20 0.229 -1.40299 .336408
high | -1.162832 .5142195 -2.26 0.024 -2.170684 -.1549804
|
write | -.0579284 .0214109 -2.71 0.007 -.0998931 -.0159637
_cons | 2.852186 1.166439 2.45 0.014 .5660075 5.138365
---+----
academic | (base outcome)
---+----
vocation |
ses |
middle | .2913931 .4763737 0.61 0.541 -.6422822 1.225068
high | -.9826703 .5955669 -1.65 0.099 -2.14996 .1846195
|
write | -.1136026 .0222199 -5.11 0.000 -.1571528 -.0700524
_cons | 5.2182 1.163549 4.48 0.000 2.937686 7.498714
---

在輸出結果中,iteration log顯示了多元 logit 模型的收斂速度,經過4次迭代後我們得到 MLE 估計量。輸出結果中的對數似然值 (Log likelihood = -179.98173) 可用於嵌套模型的比較。這裡計算出的似然比統計量 LR chi2(6) = 48.23是評估模型擬合程度的指標,檢驗了除常數項外所有變量的聯合顯著性,Prob > chi2 = 0.0000 表明與僅包含常數項的模型相比,該模型從整體而言具有更好的擬合優度。模型估計的輸出結果主要包括 generalvocation 兩部分 ( academic 是基準組) 。實質上,多元 logit 模型可視為 prog 變量中的 3 種選擇行為兩兩配對後構成的 2 個二元 logit 模型實施聯合估計 ( simultaneously estimation ),它們分別對應以下兩個方程:

其中是輸出結果的估計係數,具體解讀如下:

變量 write 每增加一個單位,個體選擇參加綜合課程相對於學術課程的勝算比對數 ( log odds ) 將減少 0.058。變量 write 每增加一個單位,個體選擇參加職業課程相對於學術課程的勝算比對數 ( log odds ) 將減少 0.1136。與社會經濟地位最低 ( ses=1 ) 的高中生個體相較,社會經濟地位最高( ses=3 )的個體選擇參加職業課程相對於學術課程的勝算比對數 ( log odds ) 將減少 1.163 。

使用 mlogit 模型只能獲得各組類別相對於基準組 ( academic ) 的估計係數 ( log odds ),該估計係數的經濟含義解釋顯然不夠直觀。在實踐中,我們更常用到的指標是勝算比 ( odds ),即選擇某一類課程的概率與選擇基準組 academic 的概率的比值,這一指標也被稱為相對風險 ( relative risk ),可以通過對估計係數取冪得到。相對風險係數的經濟含義是解釋變量變化一個單位所引起的某類選擇相對於基準組選擇勝算比的變化。若附加rrr選項,「Stata」的輸出結果則會列示出所有係數估計值對應的勝算比,即e^b( odds ratio ) 。

mlogit, rrr

Multinomial logistic regression Number of obs = 200
LR chi2(6) = 48.23
Prob > chi2 = 0.0000
Log likelihood = -179.98173 Pseudo R2 = 0.1182

---
prog | RRR Std. Err. z P>|z| [95% Conf. Interval]
---+----
general |
ses |
middle | .586671 .2603248 -1.20 0.229 .2458607 1.39991
high | .3125996 .1607448 -2.26 0.024 .1140996 .856432
|
write | .9437175 .0202059 -2.71 0.007 .9049342 .984163
_cons | 17.32562 20.20928 2.45 0.014 1.761221 170.4369
---+----
academic | (base outcome)
---+----
vocation |
ses |
middle | 1.338291 .6375264 0.61 0.541 .5260904 3.404399
high | .3743103 .2229268 -1.65 0.099 .1164888 1.202761
|
write | .8926126 .0198338 -5.11 0.000 .8545734 .9323449
_cons | 184.6016 214.793 4.48 0.000 18.87213 1805.719
---

3.3 假設檢驗3.3.1 檢驗係數的顯著性

由於多元 Logit 模型具有聯立方程的特徵,因此需要進行一些以組別為基礎的檢驗。要檢驗某個變量是否顯著,需要聯合檢驗 J-1 ( J 表示組別個數 ) 個係數是否同時不為 0。在本案例中,若檢驗個體社會經濟地位 ( ses ) 對課程類型選擇 ( prog ) 是否產生顯著影響,則需要分別檢驗 ses = 2ses = 3 兩個虛擬變量在 generalvocation 2 個組別中的估計係數是否顯著異於 0 。

我們可以通過 LR 檢驗估計係數的顯著性。由於 LR 檢驗需要估計限制性與非限制性兩個模型,因此當模型較為複雜或樣本數較大時,該檢驗會非常耗時,甚至無法執行,此時應進行 Wald 檢驗。以下採取lrtest命令檢驗 ses 是否對個體課程選擇 prog 產生顯著影響,結果同樣表明變量 ses 對個體課程選擇 prog 的影響是顯著的。

qui mlogit prog i.ses write, base(2)
est store mFull
qui mlogit prog write, base(2)
est store m0
lrtest mFull m0

Likelihood-ratio test LR chi2(4) = 11.06
(Assumption: m0 nested in mFull) Prob > chi2 = 0.0259

我們也可以採用 test 命令執行 Wald 檢驗,在 Wald 檢驗下我們只需估計無限制模型即可。從以下檢驗結果可以看出變量 ses 對個體課程選擇 prog 的影響是顯著的。

 test 2.ses 3.ses

( 1) [general]2.ses = 0
( 2) [academic]2o.ses = 0
( 3) [vocation]2.ses = 0
( 4) [general]3.ses = 0
( 5) [academic]3o.ses = 0
( 6) [vocation]3.ses = 0
Constraint 2 dropped
Constraint 5 dropped

chi2( 4) = 10.82
Prob > chi2 = 0.0287

3.3.2 組間無差異檢驗

在某些情況下,解釋變量對兩個甚至多個組別的影響具有相近的效果。此時,需要進行「無差異檢驗」。同樣地,這一檢驗可以通過 Wald 檢驗和 LR 檢驗實現。

在本案例中,我們試圖檢驗虛擬變量 ses = 3 對於 general 組別和 vocation 組別的影響差異。Wald檢驗的結果顯示,ses = 3 對於 general 組別和 vocation 組別的影響是相近的。

test [general]3.ses = [vocation]3.ses

( 1) [general]3.ses - [vocation]3.ses = 0

chi2( 1) = 0.08
Prob > chi2 = 0.7811

3.4 預測概率值與概率值的圖形顯示

我們可以通過預測個體在特定條件下的概率以幫助我們更好地解讀模型。我們通過執行margins命令獲得樣本內的預測概率。在本案例中,我們利用atmeans將除 ses 以外的其他變量設定為樣本均值,分別比較不同社會經濟地位 ses 對高中生選擇不同課程 prog 的預測概率。我們需要重複三次使用margins命令以得到 prog 中不同組別 ( general, median, vocation ) 層級分別對應的預測概率。此處省略輸出結果。

在呈現結果時,利用圖表來呈現會更加方便明了,因此我們採用marginsplot命令繪製了 ses 對不同 prog 類別的預測概率。其中marginsplot命令繪製的散點圖是基於前面執行的margins命令,如下圖所示。在繪製的同時我們對每一張圖表命名以便於後續的圖表合併,最終我們採用graph combine命令將三張圖表合併在一起,ycommon選項的添加能夠使三張圖表的 y 軸顯示範圍保持一致,從而使圖表更加美觀。

margins ses, atmeans predict(outcome(1))
marginsplot, name(general)
margins ses, atmeans predict(outcome(2))
marginsplot, name(academic)
margins ses, atmeans predict(outcome(3))
marginsplot, name(vocational)
graph combine general academic vocational, ycommon

下文我們進一步考察連續變量 write 在不同取值情況下對應的平均預測概率,平均預測概率為不同 ses 層級對應的預測概率的平均值。主要輸出結果如下所示:

margins, at(write = (30(10) 70)) predict(outcome(1)) vsquish

Predictive margins Number of obs = 200
Model VCE : OIM

Expression : Pr(prog==general), predict(outcome(1))
1._at : write = 30
2._at : write = 40
3._at : write = 50
4._at : write = 60
5._at : write = 70

---
| Delta-method
| Margin Std. Err. z P>|z| [95% Conf. Interval]
---+----
_at |
1 | .2130954 .0774327 2.75 0.006 .0613302 .3648606
2 | .2569932 .0529761 4.85 0.000 .1531619 .3608245
3 | .2543008 .0336297 7.56 0.000 .1883878 .3202138
4 | .2057855 .0371536 5.54 0.000 .1329658 .2786052
5 | .1423089 .0481683 2.95 0.003 .0479007 .2367172
---

margins, at(write = (30(10) 70)) predict(outcome(2)) vsquish

Predictive margins Number of obs = 200
Model VCE : OIM

Expression : Pr(prog==academic), predict(outcome(2))
1._at : write = 30
2._at : write = 40
3._at : write = 50
4._at : write = 60
5._at : write = 70

---
| Delta-method
| Margin Std. Err. z P>|z| [95% Conf. Interval]
---+----
_at |
1 | .1348408 .0525979 2.56 0.010 .0317507 .2379308
2 | .2808143 .0553213 5.08 0.000 .1723867 .389242
3 | .4773283 .0397591 12.01 0.000 .399402 .5552547
4 | .6680752 .0434689 15.37 0.000 .5828776 .7532727
5 | .8075124 .0545504 14.80 0.000 .7005956 .9144291
---

margins, at(write = (30(10) 70)) predict(outcome(3)) vsquish

Predictive margins Number of obs = 200
Model VCE : OIM

Expression : Pr(prog==vocation), predict(outcome(3))
1._at : write = 30
2._at : write = 40
3._at : write = 50
4._at : write = 60
5._at : write = 70

---
| Delta-method
| Margin Std. Err. z P>|z| [95% Conf. Interval]
---+----
_at |
1 | .6520638 .0944041 6.91 0.000 .4670353 .8370924
2 | .4621925 .0614388 7.52 0.000 .3417747 .5826102
3 | .2683708 .0342932 7.83 0.000 .2011575 .3355842
4 | .1261393 .03019 4.18 0.000 .0669679 .1853107
5 | .0501787 .0216863 2.31 0.021 .0076744 .092683
---

我們也可以通過圖形的方式更為清晰明了地顯示預測概率的結果。以下我們通過twoway命令繪製不同寫作水平 write 對應的各 ses 層級下的平均預測概率,具體輸出圖表如下所示。

predict p1 p2 p3
sort write
twoway (line p1 write if ses ==1) (line p1 write if ses==2) (line p1 write if ses ==3), ///
legend(order(1 "ses = 1" 2 "ses = 2" 3 "ses = 3") ring(0) position(7) row(1))
twoway (line p2 write if ses ==1) (line p2 write if ses==2) (line p2 write if ses ==3), ///
legend(order(1 "ses = 1" 2 "ses = 2" 3 "ses = 3") ring(0) position(7) row(1))
twoway (line p3 write if ses ==1) (line p3 write if ses==2) (line p3 write if ses ==3), ///
legend(order(1 "ses = 1" 2 "ses = 2" 3 "ses = 3") ring(0) position(7) row(1))

3.5 擬合優度

對於 Logit 模型,我們採用 Pseudo-R2 評估線性模型的擬合優度,通常包括 McFadden’s R2、Maximum likelihood R2、Cragg & Uhler’s R2、Efron’s R2、AIC 和 BIC。mlogit命令的默認輸出結果為 McFadden’s R2。McFadden’s R2 也稱為似然比指數,其檢驗基本思想在於比較僅包含常數項的模型和包含所有解釋變量的模型之間的對數似然值的相對大小。該值越大表明模型的擬合程度越高。我們也可以採用fitstat命令列示其他衡量模型擬合優度的統計量。

fitstat

Measures of Fit for mlogit of prog

Log-Lik Intercept Only: -204.097 Log-Lik Full Model: -179.982
D(185): 359.963 LR(6): 48.230
Prob > LR: 0.000
McFadden's R2: 0.118 McFadden's Adj R2: 0.045
Maximum Likelihood R2: 0.214 Cragg & Uhler's R2: 0.246
Count R2: 0.545 Adj Count R2: 0.042
AIC: 1.950 AIC*n: 389.963
BIC: -620.225 BIC': -16.440

3.6 其他思考需要注意的是,多元 Logistic 模型採用最大似然法進行估計,並且具有聯立方程的特徵,因此與二元 Logistic 模型相較其對大樣本的要求更高。在某些情況下,雖然樣本容量足夠大,但卻無法收斂或得到的估計結果與理論預期嚴重偏離。這往往是因為數據還沒有很好的「淨化」。比如,變量的構造可能存在問題、部分離群值沒有得到很好的處理。此外,變量單位的選擇也是一個主要的原因:最大的標準差與最小的標準差之間的比值越大,問題就會越嚴重。參考文獻UCLA Institute for Digital Research & Education : MULTINOMIAL LOGISTIC REGRESSION | STATA DATA ANALYSIS EXAMPLES鍾經樊,連玉君,計量分析與 STATA 應用第十五章 Logistic 模型,版本 2.0,2010.6Rainer Winkelmann, Stefan Boes. Analysis of Microdata, Springer-Verlag Berlin Heidelberg, 2006.

相關焦點

  • reg2logit:用OLS估計Logit模型參數
    LDM 模型來源於 LPM 和 logit 模型的轉換。首先,LDM 可以轉換為一個 logit 模型,其次,線性概率模型 (LPM) 的參數估計能夠轉換為「第一步轉換後的 Logit 模型」參數的極大似然估計。
  • 互助問答第366期:logit模型在stata操作中出現的問題
    logit模型在stata操作中出現的問題在進行logit模型回歸,在stata中輸入的命令是logit y x i.year i.industry, cluster(id),然而發現控制行業後出現下圖的情況,回歸時部分樣本被刪除
  • 隨機係數Logit模型及Stata實現
    其中Berry,Levinsohn&Pakes(1995)建立的隨機係數離散選擇模型(現通常稱為BLP模型)結合了隨機係數和Logit模型,允許價格的內生性,所以是當前需求估計建模理論和應用的熱點。
  • 零基礎的同學如何用stata做多元線性回歸模型?
    上一期,我們分享了如何用stata做一元線性回歸模型,不知道同學們學的怎麼樣呢?有沒有自己動手操作一遍呢?這一期:我們將學習如何用stata做多元線性回歸模型!這些是小王(邀請者)最近學習計量時的一些心得和體會,希望能與大家一起分享。
  • 多元離散選擇模型
    本節將對多元選擇模型作簡單的介紹。4.3.1社會經濟生活中的多元選擇問題在實際社會經濟生活中,經常遇到多元選擇問題。接下來首先著重討論描述一般多元選擇問題的模型方法,然後簡單介紹描述嵌套選擇和排序選擇問題的模型方法。4.3.2一般多元離散選擇Logit模型需要首先指出的是,在多元離散選擇模型中,應用最多的是Logit模型。不同的教科書從不同的角度對此有不同的解釋。
  • 基礎方法 | Logit回歸和Probit回歸有區別嗎?
    因變量的類型決定了回歸模型的使用! 1、使用場景的一致性都是針對二分類變量,也都發展出序次logit/probit回歸和多分類logit/probit回歸,並且在Stata中,命令長的也基本一樣。針對二分類變量:logit y xprobit y x針對定序變量:ologit y xoprobit y x針對多分類變量:mlogit y xmprobit y x2、本質上的一致性
  • Stata15.0中文版正式發布!又要騙我去學習了
    來源:stata官網,https://www.stata.com/new-in-stata/chinese-interface
  • suest:跨模型比較與廣義豪斯曼檢驗
    我們考慮這樣一個簡單的情形:數據集中前一半的觀測值用 logit 模型,後一半用 OLS 模型,並且前一半和後一半之間存在一對一的聚類。 2. suest 實例2.1 係數差異檢驗 (不同模型)logit 模型和 probit 模型的係數有可比性嗎?我們用 suest 命令來一探究竟。
  • Maxdiff系列(六)MaxDiff的數據分析(用Excel進行logit分析)
    為什麼要使用logit model,這是因為Maxdiff記錄的是消費者在面對不同對象集合時的選擇(Choice)。從模型的角度看,消費者的選擇是因變量Y,他所面對的對象集合是自變量X。而消費者的選擇(Y)是一個離散型變量(要麼選中,要麼不選中),而非連續型數據(偏好打分)。
  • Stata: 為何使用 Logit 模型?Logit 模型評價
    在最近的一篇 博文 中,Paul von Hippel 對他之前關於線性概率模型的論點進行了擴展,他認為:在很多情況下,線性概率模型(通過普通最小二乘估計)比 Logit 回歸模型更可取。並且在他發表的兩篇文章中,von Hippel 提出了以下三個要點:在 0.20 到 0.80 的預測概率區間內,線性概率模型與 Logit 模型非常相近。
  • Stata 16 正式發布:新增16+項主要功能特徵詳細介紹
    1Importing of SAS and SPSS dataset從SAS與SPSS中導入數據從各個軟體之間相互可以導入數據,互相兼容已經成為計量經濟學軟體的一個趨勢,小編發現spss24.0版本已經可以實現從spss中導入stata以及sas格式的數據,並且從spss中導入stata格式的數據,各方面的數據結構類型都還可以
  • 零基礎的同學如何用Stata做廣義估計模型(GEE)?
    什麼是廣義估計模型?廣義估計方程的打開方式又是怎樣的?在Stata中如何選取合適的變量、合適的代碼進而做出廣義估計模型(GEE)?今天,我們將學習如何在stata軟體中進行廣義估計模型(GEE)的操作,希望大家都能有所收穫。
  • 二元Logit模型的理解推導(一)
    二元logit離散選擇是出行行為研究中非常重要的一種。
  • STATA學習總結(4):回歸及釋義
    回歸及釋義模型選擇
  • 用Stata搞實證之面板模型入門
    ,但是一般只會教到基本的多元OLS模型就戛然而止了誠然,這對於本科生來說夠用了,但是基本的多元OLS模型本身並不好處理。如果你的城市是以數值如1,2,3,4來命名的,則可以省略這一步緊接著,可以用xtset來聲明面板模型的截面和時間在stata裡,x代表個體或截面(在計量中和paper裡,個體一般用n或i來表示,面板的模型的公式角標一般是it或者nt),t代表時間,set便是設置的意思。
  • Stata:隨機森林算法簡介與實現
    信用卡違約案例4.1 模型訓練和參數調整4.2 最終模型和結果解釋4.3 與邏輯回歸比較5. 結語6. 參考資料7.因此,查找可能產生低 OOB 誤差的參數通常是模型選擇和參數調整需要考慮的關鍵性因素。
  • 玩轉Stata | 傾向得分配對(PSM)內生性檢驗利器
    本文在此就不介紹相關理論了,因為小編的理論也不是特別的好,如果想學習的可以參閱連玉君老師的相關視頻(重點推介),大概有5個課時;同時也可以參考陳強老師的《高級計量經濟學及stata應用》中的第28章處理效應。在此小編僅僅介紹stata的相關操作。
  • Stata 函數大全
    lngamma(x) 返回.gamma函數的自然對數log10(x) 以10為底對數函數logit(x) 返回logit函數值 logit(x)= ln{x/(1-x)}max(x1,x2,...>•   yw(Y, W)     從年,星期得到一個stata日期值,表示距1960年1月1日有多少個星期•    ym(Y, M)    從年,月得到一個stata日期值,表示距1960年1月1日有多少個月•    yq(Y, Q)     從年,季度得到一個stata日期值,表示距1960年1
  • Stata語言中的常用函數及其用法解釋, 在附上42篇Stata相關學習資料
    ,41.使用Stata做結構方程模型GSEM的操作指南,42.疫情期計量課程免費開放!面板數據, 因果推斷, 時間序列分析與Stata應用Stata系統是一個統計分析系統,stata語言是實現stata系統功能的基礎,因此它其中包括了各種各樣的函數。在stata系統中,函數的自變量可以是一個常數,可以是一個變量,或者是一連串的變量。
  • 簡單計量經濟學:Stata實驗
    。普通最小二乘法原理: % stata線性回歸模型reg yvarvar1 var2…  %時間序列加:tssetyear,面板數據加:tssetid year 【異方差】 定義:違反同方差性假定(3)模型的預測失效。