零基礎的同學如何用Stata做logistic回歸?

2020-12-17 教育孩子有方法

同學們在做統計研究時,時常聽到身邊的朋友會提及一個詞:logistic回歸。聽的次數久了,同學們多半會思考:什麼是logistic回歸?如何在Stata中做logistic回歸呢?前面兩期我們已經分享了一元線性回歸模型、多元線性回歸模型的操作方法,今天我們將分享logistic回歸的學習心得,希望大家都能有所收穫哦。

什麼是logistic回歸

什麼是logistic回歸?

logistic回歸:指的是一種廣義的線性回歸,在一定程度上和多重線性回歸分析有著相似的地方。例如:模型的形式基本上相同,都有待求參數。兩者的關係是:logistic回歸分類模型的預測函數是通過線性回歸模型的預測值的結果進一步接近真實標記的對數機率!從而能夠使線性回歸的預測值和分類任務的真實標記兩者關聯在一起!簡而言之,logistic回歸模型中,因變量是二分類變量或者是多分類變量,而自變量既可以是分類變量,也可以是連續變量。二分類的logistic回歸用途也較為廣泛。

做logistic回歸時應注意什麼?

在做logistic回歸之前,一定要對數據變量進行檢查,要滿足相應的條件。

第一個條件:Y是二分類的分類變量。

第二個條件:Y的發生率要要小於15%。

當然,也要滿足相應的7項假設。

logistic回歸的兩個條件

在stata中如何做logistic回歸?logistic回歸的操作步驟是什麼?

導入數據,然後查看結局事件的發生率,可在命令欄內輸入:Tab進行查看。如果結局事件(1)的發生率(percent)小於15%,就可以用logistic回歸。反之,則需要做Log_binomial模型進行相應的分析。

輸入logistic回歸指令:logistic Y X1 X2 X3 X4等等。如果X1是多分類變量,加i.,提及即可。這一點,與多元線性回歸的操作步驟還是很相像的。同學們記不住的話,還可以在窗口菜單進行操作:點擊statistics、Binary outcomes、logistic regression,reporting odds ratios(分享者的版本Stata14)。然後,在Dependent Variables中選擇Y,在Independent Variables中選擇X變量,如果是多分類變量,則須在……中分別進行添加。最後,提交即可。

Stata中logistic回歸的操作步驟

以上就是小程(分享者)關於logistic回歸的學習心得。總的來說,logistic回歸是一種廣義的、線性的回歸分析,多用於因素的分析。同學們在學習logistic回歸的過程中,有沒有什麼想要討論的呢?一起交流下吧?

相關焦點

  • 零基礎的同學如何用stata做一元線性回歸模型?
    stata軟體越來越受研究生的喜歡,很多研究生在做統計研究、學術分析的時候,也多選用此軟體。網上有關stata的教程有很多,但對於沒有基礎的同學來說,學起來稍微就有些吃力了。那麼,零基礎的同學應該如何學習呢?如何用stata做出滿意的一元線性回歸模型呢 ?
  • 零基礎的同學如何用stata做多元線性回歸模型?
    上一期,我們分享了如何用stata做一元線性回歸模型,不知道同學們學的怎麼樣呢?有沒有自己動手操作一遍呢?這一期:我們將學習如何用stata做多元線性回歸模型!這些是小王(邀請者)最近學習計量時的一些心得和體會,希望能與大家一起分享。
  • 零基礎的同學如何用Stata做廣義估計模型(GEE)?
    在縱向數據中如何進行統計分析?如何得出一個正確的估計值?什麼是廣義估計模型?廣義估計方程的打開方式又是怎樣的?在Stata中如何選取合適的變量、合適的代碼進而做出廣義估計模型(GEE)?今天,我們將學習如何在stata軟體中進行廣義估計模型(GEE)的操作,希望大家都能有所收穫。
  • STATA學習總結(4):回歸及釋義
    Gen agesq = age^² 對收入進行對數轉換,gen lgincome=ln(income+1) 特異質如何判斷特異值?在回歸之後,生成學生殘差(studentized residuals)考察每個觀測值的學生殘差,2-3之間就需要注意,>3一般認為是特異值。
  • Logistic回歸—多重共線性
    多重共線性作為常見問題,存在於線性或者廣義線性模型估計中,包括logistic回歸和Cox回歸。當預測變量間存在高度相關時會出現多重共線性,導致回歸係數估計值不穩定和不可靠。文獻1:利用方差膨脹因子(VIF≥5)檢驗是否存在多重共線性,另外這篇文獻有三個地方值得學習:①多因素logistic回歸分析時,建立了多個model用來調整協變量; ②發現某個變量與結局變量存在U型關係時,是否進一步分析做了介紹,文中採用亞組分析替代交互作用分析;③
  • Logistic回歸分析之二元Logistic回歸
    Logistic回歸分析用於研究X對Y的影響,並且對X的數據類型沒有要求,X可以為定類數據,也可以為定量數據,但要求Y必須為定類數據,並且根據Y的選項數,使用相應的數據分析方法。本次內容將針對二元logistic(logit)回歸進行說明,後續兩篇文章將分別講解有序logistic(logit)和多分類logistic(logit)回歸。
  • Stata:斷點回歸分析教程
    在學術圈如果是做應用計量(特別是橫截面數據、面板數據),Stata是不二之選,因為不管是管理數據還是跑回歸,實在太太太方便了。現在主流期刊的應用微觀計量文章裡面能用到的模型stata幾乎都有,而且其中的絕大多數都是用stata做的。而且最大的優點是,簡單! Stata 與 SPSS、SAS 並稱為當今三大統計軟體。與後者相比,Stata 體積小巧、簡單易懂且功能強大。
  • 如何用Matlab/Python/Stata做簡單回歸分析
    這並不是重點,其實就可以簡單理解為現在有一個橫截面數據:y是unaid,x包括dur、ncb、rank、year這四個變量,我們現在關心的就是y跑在四個解釋變量的多元回歸模型。,其實是直接用它的轉置再乘自身。
  • Logistic 回歸101
    Logistc 回歸    今天,我們首先聊一聊最簡單的分類問題——二分類問題。二分類問題並不是要看看誰比較「二」, 純粹只是把數據分為兩類。    既然我們上個系列詳細地聊了聊線性回歸模型,我們首先來聊一聊最重要的線性二分類器之一—— logistic 回歸模型。
  • 統計·logistic回歸
    logistic回歸的類型因變量:一定是分類變量二分類:比如某種疾病患病與否,治療結果是有效還是無效等。據研究設計的類型分為:非條件logistic回歸:也稱為logistic回歸。用於非配對資料的分析,也就是直接隨機抽樣的資料。條件logistic回歸:用於配對資料的分析。
  • 一文掌握多分類logistic回歸
    Logistic回歸分析(logit回歸)一般可分為3類,分別是二元Logistic回歸分析、多分類Logistic回歸分析和有序Logistic回歸分析。logistic回歸分析類型如下所示。1、多分類logistic回歸分析基本說明只要是logistic回歸,都是研究X對於Y的影響,區別在於因變量Y上,logistic回歸時,因變量Y是看成定類數據的,如果為二元(即選項只有2個),那麼就是二元logistic回歸; 如果Y是多個類別且類別之間無法進行對比程度或者大小,則為多分類logistic回歸;如果Y是多個類別且類別之間可以對比程度大小(也稱為定量數據,
  • Logistic回歸—初步了解10個問題
    依據因變量類型(水平數量),又可分為二分類logistic回歸模型和多分類logistic回歸模型;二分類logistic回歸也稱二元logistic回歸、二項logistic回歸。
  • 零基礎學Stata 數據分析再不怕
    也正因為如此,很多學生在修完了一個學年的計量經濟學課程後,仍然不知道該如何完成OLS估計。在學術圈如果是做應用計量(特別是橫截面數據、面板數據),Stata是不二之選,因為不管是管理數據還是跑回歸,實在太太太方便了。現在主流期刊的應用微觀計量文章裡面能用到的模型stata幾乎都有,而且其中的絕大多數都是用stata做的。而且最大的優點是,簡單!
  • Logistic和Softmax回歸實戰(附代碼)
    通過上面的理論學習,我們基本上明白logistic的工作原理,但是究竟該如何用呢?實戰以及決策邊界這裡我們用眾所周知的iris數據集來進行算法的實戰。上面我們用的數據集是有三個類別,然而我們的logistic卻只能處理二分類的問題,對多分類情況,logistic該如何處理呢?Softmax回歸在機器學習尤其是深度學習中,softmax是個非常常用而且比較重要的函數,尤其在多分類的場景中使用廣泛。他把一些輸入映射為0-1之間的實數,並且歸一化保證和為1,因此多分類的概率之和也剛好為1。
  • 從頭開始:用Python實現帶隨機梯度下降的Logistic回歸
    logistic 回歸是一種著名的二元分類問題的線性分類算法。它容易實現、易於理解,並在各類問題上有不錯的效果,即使該方法的原假設與數據有違背時。在本教程中,你將了解如何在 Python 中實現隨機梯度下降的 logistic 回歸算法。
  • R語言實現logistic回歸
    引言:前面我們已經掌握了logistic回歸的知識點,今天就來看看如何用R語言實現logistic回歸。今天用到的數據來源於機器學習倉庫,基於患者的一些信息以判定該患者是否患有心臟病(heart disease, hd),連結如下:http://archive.ics.uci.edu/ml/datasets/Heart+Disease1.
  • 人生苦短,我學stata
    應用在學術圈如果是做應用計量(特別是橫截面數據、面板數據),Stata是不二之選,因為不管是管理數據還是跑回歸,實在太太太方便了。現在主流期刊的應用微觀計量文章裡面能用到的模型Stata幾乎都有,而且其中的絕大多數都是用Stata做的!Stata 與 SPSS、SAS 並稱為當今三大統計軟體。與後者相比,Stata 體積小巧、簡單易懂且功能強大。
  • 一文讀懂條件Logistic回歸
    病歷對照研究或者傾向得分匹配研究(一種將研究數據處理成『隨機對照實驗數據』的方法)中常使用條件Logistic回歸進行分析。其與普通的二元logistic回歸區別在於,多出配對ID,即將配對組納入考慮範疇。
  • logistic函數和softmax函數
    邏輯斯諦回歸(Logistic Regression,簡稱LR)作為一種對數線性模型(log-linear model)被廣泛地應用於分類和回歸場景中。此外,logistic函數也是神經網絡最為常用的激活函數,即sigmoid函數。
  • Stata+R:門檻回歸教程
    進行回歸分析,一般需要研究係數的估計值是否穩定。很多經濟變量都存在結構突變問題,使用普通回歸的做法就是確定結構突變點,進行分段回歸。這就像我們高中學習的分段函數。但是對於大樣本、面板數據如何尋找結構突變點。所以本文在此講解面板門限回歸的問題,門限回歸也適用於時間序列。