同學們在做統計研究時,時常聽到身邊的朋友會提及一個詞:logistic回歸。聽的次數久了,同學們多半會思考:什麼是logistic回歸?如何在Stata中做logistic回歸呢?前面兩期我們已經分享了一元線性回歸模型、多元線性回歸模型的操作方法,今天我們將分享logistic回歸的學習心得,希望大家都能有所收穫哦。
什麼是logistic回歸?
logistic回歸:指的是一種廣義的線性回歸,在一定程度上和多重線性回歸分析有著相似的地方。例如:模型的形式基本上相同,都有待求參數。兩者的關係是:logistic回歸分類模型的預測函數是通過線性回歸模型的預測值的結果進一步接近真實標記的對數機率!從而能夠使線性回歸的預測值和分類任務的真實標記兩者關聯在一起!簡而言之,logistic回歸模型中,因變量是二分類變量或者是多分類變量,而自變量既可以是分類變量,也可以是連續變量。二分類的logistic回歸用途也較為廣泛。
做logistic回歸時應注意什麼?
在做logistic回歸之前,一定要對數據變量進行檢查,要滿足相應的條件。
第一個條件:Y是二分類的分類變量。
第二個條件:Y的發生率要要小於15%。
當然,也要滿足相應的7項假設。
在stata中如何做logistic回歸?logistic回歸的操作步驟是什麼?
導入數據,然後查看結局事件的發生率,可在命令欄內輸入:Tab進行查看。如果結局事件(1)的發生率(percent)小於15%,就可以用logistic回歸。反之,則需要做Log_binomial模型進行相應的分析。
輸入logistic回歸指令:logistic Y X1 X2 X3 X4等等。如果X1是多分類變量,加i.,提及即可。這一點,與多元線性回歸的操作步驟還是很相像的。同學們記不住的話,還可以在窗口菜單進行操作:點擊statistics、Binary outcomes、logistic regression,reporting odds ratios(分享者的版本Stata14)。然後,在Dependent Variables中選擇Y,在Independent Variables中選擇X變量,如果是多分類變量,則須在……中分別進行添加。最後,提交即可。
以上就是小程(分享者)關於logistic回歸的學習心得。總的來說,logistic回歸是一種廣義的、線性的回歸分析,多用於因素的分析。同學們在學習logistic回歸的過程中,有沒有什麼想要討論的呢?一起交流下吧?