廣義線性模型|二分類廣義線性模型—因變量是二分類變量

2021-01-18 青果統計學堂

  【例】用苯氰對小白鼠腹腔注射進行毒性實驗,試分析苯氰的劑量和小白鼠死亡率之間的關係,實驗結果如下表所示。(本例引用自陳希孺.廣義線性模型(一)[J].數理統計與管理, 2002,21(5):54-61)

表1 小白鼠腹腔注射苯氰的毒性實驗結果


 

圖1 原始數據輸入結果



圖2 廣義線性模型的命令調用


  首先因本例小白鼠死亡與否是二分類數據,服從二項分布,可用probit回歸分析,因而在模型類型對話框中選擇「二元概率」。

圖3 模型類型選項


  不同類型、不同分布的數據所使用的廣義線性模型大不相同。如二分類logistic回歸模型,在模型類型上選擇「二元Logistic」;等級資料的logistic回歸模型,則應選擇「有序Logistic」。


  在響應對話框中,因變量選擇死亡數,試驗變量為實驗動物。

圖4 響應的選項


  預測變量的選項框中將「劑量」放入協變量中。

圖5 預測變量的選項


  模型選項框中,選擇劑量作為主效應。

圖6 模型效應的選項


圖7 廣義線性模型估算的選項


圖8 廣義線性模型統計的選項


  首先輸出的結果為模型中的分類變量和連續變量的描述信息和擬合優度情況。


  系統根據數據建立的模型,似然比卡方值為97.371,P值小於0.001,模型成立。


  模型效應的檢驗中,變量劑量的P值小於0.001,說明其對因變量有影響。


  從參數估計的結果來看,變量劑量的β估計值為0.01,P值小於0.001,因而保留在模型中。Probit模型為:Probit(p)=-3.70+0.01x。


  研究表明,苯氰的劑量和小白鼠的死亡存在關係,其廣義線性模型表達為:死亡數=-3.70+0.01劑量(p<0.001)。

微信編輯:湯蝶

原創人員:何少平

相關焦點

  • 廣義線性模型學習
    LassoThe Lasso 是估計稀疏係數的線性模型。 它在一些情況下是有用的,因為它傾向於使用具有較少參數值的情況,有效地減少給定解決方案所依賴變量的數量。 因此,Lasso 及其變體是壓縮感知領域的基礎。
  • [PRML]線性分類模型--概率判別模型
    3 邏輯回歸從考慮二分類問題開始處理廣義線性模型。在統計學術語中,這種模型稱為邏輯回歸,但應強調這是一種分類模型,而不是回歸模型。與式13的比較表明,它與線性回歸模型的平方和誤差函數的梯度具有完全相同的形式。
  • 廣義可加模型GAM是什麼?如何在常用軟體上實現?
    之前,我們引薦了①非參數, 半參數, 廣義可加, 偏線性, 單指數模型代碼公開,②廣義線性回歸模型估計:所有線性回歸的大倉庫,③廣義線性回歸模型估計:所有線性回歸的大倉庫(2)。今天,我們繼續引薦廣義可加模型(generalized additive model)及其程序。
  • 回歸or分類?線性or邏輯?一文掌握模型的不同之處
    全文共7366字,預計學習時長30分鐘或更長回歸 VS 分類為確定使用回歸還是分類模型,首先要問的問題是:目標變量是一個量,一個二進位分類的概率,還是一個標籤?因此,邏輯模型通常被用來分析二進位目標變量。此種情況下,目標變量值為0或1,或者目標變量是二進位變量的概率。正如前面提到,此等式防止出現非邏輯預測,得出的概率低於0或高於1。視覺化呈現:線性回歸 vs. 邏輯回歸兩種標準模型均可被調整,以更好擬合數據。主要方法是包含懲罰參數。
  • 二分類Logistic回歸:SPSS詳細操作及模型預測
    :因變量即結局是二分類變量。  後3個假設則依賴於二分類Logistic回歸是否適用於數據。  假設5: 連續的自變量與因變量的對數間存在線性關係。  在本例中,要求連續的自變量即年齡(age)、體重(weight)、最大攝氧量(VO2max)與因變量即心臟病的logit轉換值之間存在線性關係。
  • 廣義線性模型介紹
    打開APP 廣義線性模型介紹 發表於 2019-11-22 15:10:30
  • 廣義差分模型 - CSDN
    ,原因5模型設定偏誤,14,例如,應該用兩個解釋變量,即 而建立模型時,模型設定為 則 對 的影響便歸入隨機誤差項 中,由於 在不同觀測點上是相關的,這就造成了 在不同觀測點是相關的,呈現出系統模式,此時 是自相關的。,15,模型形式設定偏誤也會導致自相關現象。如將成本曲線設定為線性成本曲線,則必定會導致自相關。由設定偏誤產生的自相關是一種虛假自相關,可通過改變模型設定予以消除。
  • 回歸分析兩個因變量 - CSDN
    當陽性結果出現概率較小時(一般小於0.05)或者較大時(大於0.95),OR=(P1/(1-P1))/(P2/(1-P2))≈P1/P2=RR【2】二分類資料的logistic回歸SPSS操作示例適用條件:①因變量為二分類變量,自變量可以是連續變量也可以是分類變量;②各觀測間相互獨立;③自變量與因變量logit(P)之間存在線性關係;④自變量間不存在多重共線;⑤儘量避免異常值
  • 廣義線性模型在生命表死亡率修勻中的應用
    關鍵詞:死亡率 廣義線性模型 負二項回歸 泊松回歸 B-樣條修勻  死亡率揭示了人類面臨的死亡風險,而生命表則是用來描述某人口群體死亡規律的概率分布表。本文將在系統介紹廣義線性模型(Generalized Linear Models,GLM)的基礎上研究GLM在我國國民生命表死亡率修勻中的應用,這些研究將為我國經驗生命表的編制工作提供指導,也為我國保監會的死亡率經驗分析工作提供理論支持和實踐參考,以更加有利於我國壽險費率市場化和壽險業的科學經營。
  • 數據建模中分類與預測模型
    分類主要是預測分類標號(離散屬性),通俗點而言就像在基本面分析中判定哪些是未來影響價格的因素,比如產量、季節因素、下遊產品價格等,這些因素除了其自身屬性的不同外還應該具備在同級影響因素中具備較低的相關性,也就是最終分類的因素都會對價格進行影響,但是彼此之間的影響相對較小。而預測主要就是建立連續值函數模型,預測給定自變量對應的因變量的值。
  • spss線性回歸自變量因變量專題及常見問題 - CSDN
    轉載自公眾號:青年智囊SPSS多元線性回歸在回歸分析中,如果有兩個或兩個以上的自變量,就稱為多元回歸。事實上,一種現象常常是與多個因素相聯繫的,由多個自變量的最優組合共同來預測或估計因變量,比只用一個自變量進行預測或估計更有效,更符合實際,因此多元線性回歸被廣泛運用。今天大家一起來學習吧!
  • 因變量Y,自變量A,協變量X都在變?用G-Estimation
    它通常只有結局變量(Y={Y1,Y2,Y3})在變,而處理因素(A)(分組)往往是不變的,如下圖,經過質量控制等科學手段,我們儘可能讓各組的受試者在各個時間點都接受同樣的處理,如果因變量Y為連續型變量,這樣我們可以使用重複測量資料的方差分析進行分析(假設滿足方差分析的前提條件)。現實情況往往都比較複雜。
  • spss多變量回歸分析 - CSDN
    它是「不發聲」的過程變量,通過設置啞變量,可將多分類變量進行二值化的處理,從而結局多分類特別是無需多分類變量無法納入回歸分析模型的尷尬局面。一般情況下,啞變量個數是原變量分類數的n-1個,比如種族變量是3分類變量,則一個種族變量產生了2個二分類(變量值為0、1)啞變量。
  • 線性混合模型在重複測量資料中的應用
    同樣我們還可以採用混合線性模型去進行分析,本次咱們就討論一下混合線性模型在重複測量方差分析中的應用。混合線性模型是20世紀80年代初針對統計資料的內部相關而發展起來的一種統計方法。一般意義上,變異的來源主要包括固定效應、隨機效應和混合效應,所謂的固定效應是指分析的內容僅是目前的分組,不作外推的打算。比如ABC三組的比較,分析的目的僅僅是這三組間的差異,而不是超越這三組以外的差異。
  • [PRML]線性回歸模型--線性基函數模型
    這通常稱為線性回歸(linear regression)。,這個暗示了模型的限制。參數的線性化會簡化這類模型的計算,但也會導致一些限制。『tanh』函數的線性組合。在監督學習中如回歸和分類,我們不是尋找輸入變量的分布模型。
  • 如何用線性回歸模型做數據分析?
    ;對於模型而言,自變量是輸入值,因變量是模型基於自變量的輸出值,適用於x和y滿足線性關係的數據類型的應用場景。 線性回歸應用於數據分析的場景主要有兩種: 驅動力分析:某個因變量指標受多個因素所影響,分析不同因素對因變量驅動力的強弱(驅動力指相關性,不是因果性); 預測:自變量與因變量呈線性關係的預測; 模型數學形式:=0+11+22+ +
  • 看不懂Logistic模型?別慌,先來了解它和線性回歸模型的區別!
    #計量經濟學#Logistic回歸在統計學領域也是一種非常常見的線性回歸模型。作為回歸模型的一種,其實它和簡單線性回歸模型分析有著非常相似的地方,它們的模型方程形式是一致的,右邊都可以寫成b1x+c的方程形式,並且b1和c都是未知的係數參數。
  • 多元線性回歸與模型診斷
    二、模型診斷1.自變量選擇偏差的權衡(1)丟失重要變量(2)加入無關變量變量係數的估計偏差(大樣本,無關變量會收斂於0)增加了模型參數估計的不確定性增加了R方的值,但是使得調整的R方減小(3)兩種合理估計線性回歸係數的方法①一般情況模型變量的選擇方法a.
  • 簡單線性回歸(二)
    線性回歸相關知識:簡單線性回歸(一)線性回歸步驟線性回歸需滿足的條件①因變量Y與自變量X呈線性關係②每個個體觀察值之間互相獨立③在一定範圍內,任意給定X值,其對應的隨機變量Y均服從正態分布④在一定範圍內,不同X值所對應的隨機變量Y的方差相等某研究者測量了16名成年男子的體重(Kg)和臀圍(cm)數據,欲探求成年男子的體重與臀圍是否可以建立線性回歸模型。
  • SPSS如何使用一般線性模型中的單變量進行分析?
    s p s s 線性模型中的單變量主要是用來檢測數據的,下面讓我們來看一下如何檢測吧。1.首先打開s p s s 軟體,要檢測年齡性別與睡眠關係的這個數據有效性。2.點擊分析選項卡,彈出下拉菜單中找到單變量選項。3.我們將因變量設置為睡眠時間。