一文讀懂R語言如何實現逐步回歸分析 ——【生物和醫學統計】

2021-02-19 杏花開醫學

逐步回歸分析是以AIC信息統計量為準則,通過選擇最小的AIC信息統計量,來達到刪除或增加變量的目的。R語言中用於逐步回歸分析的函數step(),drop1(),add1()。

#1.載入數據 首先對數據進行多元線性回歸分析

tdata<-data.frame(

x1=c( 7, 1,11,11, 7,11, 3, 1, 2,21, 1,11,10),

x2=c(26,29,56,31,52,55,71,31,54,47,40,66,68),

x3=c( 6,15, 8, 8, 6, 9,17,22,18, 4,23, 9, 8),

x4=c(60,52,20,47,33,22, 6,44,22,26,34,12,12),

Y =c(78.5,74.3,104.3,87.6,95.9,109.2,102.7,72.5,

93.1,115.9,83.8,113.3,109.4)

)

tlm<-lm(Y~x1+x2+x3+x4,data=tdata)

summary(tlm)

多元線性回歸結果分析

從上面結果可以看出,回歸方程的係數都沒有通過顯著性檢驗

#2.逐步回歸分析

tstep<-step(tlm)

summary(tstep)

結果分析:

當用x1 x2 x3 x4作為回歸方程的係數時,AIC的值為26.94;去掉x3 回歸方程的AIC值為24.974;去掉x4 回歸方程的AIC值為25.011。由於去x3可以使得AIC達到最小值,因此R會自動去掉x3;去掉x3之後 AIC的值都增加,逐步回歸分析終止,得到當前最優的回歸方程

回歸係數的顯著性水平有所提高但是x2 x4的顯著性水平仍然不理想

#3.逐步回歸分析的優化

drop1(tstep)

結果分析

如果去掉x4 AIC的值從24.974增加到25.420 是三個變量中增加最小的

#4.進一步進行多元回歸分析

tlm<-lm(Y~x1+x2,data=tdata)

summary(tlm)

結果分析

所有的檢驗均為顯著,因此所得回歸方程為y=52.57735+ 1.46831x1+ 0.66225x2.

相關焦點

  • 醫學統計與R語言:百分條圖與雷達圖
    微信公眾號:醫學統計與R語言如果你覺得對你有幫助,歡迎轉發百分條圖-輸入1: library(ggplot2)library(ggthemes)library(ggsci)library(rio)percentbar <- import("percentbar.xlsx
  • R語言實戰:基本統計分析
    本文內容來自《R 語言實戰》(R in Action, 2nd),有部分修改描述性統計分析mtcars 數據集中的三個連續變量
  • 綜述:《為實現預防醫學的大數據分析》
    這主要是由於新疾病變種、生物恐怖主義威脅的增加,以及數據採集和計算技術最新的進展而促成的。醫療數據量的激增,促進了為疾病預防開發高效、敏感和成本效益高的解決方案的需求。傳統的預防措施主要側重於促進醫療福利,卻缺乏處理海量數據的方法。利用信息技術提高醫療質量,可以改善健康促進和疾病預防。這是真正的跨學科挑戰,需要不同研究領域的大量專業知識和真正的大數據。
  • 寒招 | 生物醫學工程
    未來 10 年中國學科發展戰略·生物醫學工程. 國家自然科學基金委員會生命科學部編. 北京. 科學出版社, 20122. 圖片來源圖1:https://t.cj.sina.com.cn/articles/view/2003926263/77717cf700100naf1?
  • spss操作入門(三):回歸分析
    ——王國維詞《蝶戀花》    回歸分析是一種處理變量的統計相關關係的一種數理統計方法。回歸分析的基本思想是: 雖然自變量和因變量之間沒有嚴格的、確定性的函數關係, 但可以設法找出最能代表它們之間關係的數學表達形式。
  • 醫學翻譯書籍:《醫學英語實用翻譯教程》
    今天推薦一本醫學英語和翻譯的書籍,書名:《醫學英語實用翻譯教程》,作者:白永叔,華仲樂。
  • 統計|用R語言做協方差分析
    We're not so terribly interested in the relationship between weight and gas mileage. We just want to get it out of the mix, so that we can see a "purer" relationship between cylinders and gas mileage.
  • 統計基礎:【24】統計圖表
    早在16世紀,概率論基礎、微積分、對數等統計數學理論就已經被發現並應用於實際,但直到1750-1800年,人們才發明了統計圖表來展示統計數據。1786,威廉·普萊費爾(William Playfair)在其出版的《商業和政治圖解》一書中,引入了圖表來顯示經濟數據。我們今天還在廣泛使用的很多基礎圖表,如條形圖、折線圖、餅圖等都是他發明的。
  • 統計基礎:統計圖表
    早在16世紀,概率論基礎、微積分、對數等統計數學理論就已經被發現並應用於實際,但直到1750-1800年,人們才發明了統計圖表來展示統計數據。
  • 數據科學28 |回歸模型-單因素協方差分析和回歸診斷
    單因素協方差分析(ANCOVA)例:swiss數據集library
  • 一文讀懂:腹膜後惡性腫瘤如何鑑別診斷
    通過以上數據可以分析腹膜後腫瘤為良性或惡性。一般情況下,腹膜後惡性腫瘤需要與常見的腹膜後良性、惡性病變來鑑別,需要鑑別的疾病較多,如多囊腎、腎積水、腎上腺瘤、胰腺腫瘤、假性胰腺囊腫、肝腫瘤、肝囊腫及膿腫、腹膜後副脾、腹主動脈瘤、髂動脈動脈瘤、腹腔或腹膜後的炎症性病變等可以發生在腹部的病變。
  • 震驚:可攜式納米孔測序儀登場,智慧型手機就可數據分析
    到目前為止,原始數據的分析仍需要高端的計算設備才能實現。為此,澳大利亞加文醫學研究所與斯裡蘭卡佩拉德尼亞大學的研究人員合作開發出 Genopo 智慧型手機應用程式,讓基因組分析可在偏遠地區實現,也可在醫院診所內完成。現在,人們不到半小時就能在智慧型手機上完成新冠病毒的基因組分析。這項成果發表在《Communications Biology》雜誌上。
  • 鵾遠基因和Med Data Quest聯合舉辦第二屆國際精準醫療研討會
    生物製藥、基因測序以及風險投資研究領域的專家齊聚一堂,對醫療生物技術領域進行了熱烈的討論。會議圍繞基因測序,醫學大數據分析,新藥研發及相關風險投資等多個主題,內容涵蓋了如何在中國進行生物醫藥投資,如何研發抗抑鬱新藥,單細胞分析的生物信息學挑戰,基於自然元語言處理方法的電子病歷分析,基於二代測序技術的癌症診斷,表觀遺傳學和基因組醫學等系列生物醫學的前沿熱點。
  • ACS Nano:用於生物醫學領域的可降解多功能微型機器人
    微支架((Microscaffolds))在生物醫學領域有著巨大的應用潛力。它具有較大的比表面和多孔的結構,能高效地將治療劑輸送至體內,或作為培養細胞的基質。通過設計,賦予微支架基於多種能源((超聲波、磁場、電能、光能等))的運動能力,就得到了微型機器人((Microrobot))。
  • 一文讀懂哈希和一致性哈希算法
    •效率高 在處理比較大的原生值時, 也能能快速的計算出哈希值•無規律 原始輸入信息修改一點信息, 得到的哈希值也是大不相同的哈希算法的實現有很多, 常見的有 MD5, SHA-1, 還有像 C#, Java 一些語言都有直接的 GetHashCode(), hashCode() 函數可以直接來用。
  • 我因為用錯統計方法,被拒稿了……
    文章發表時,用對統計方法,至關重要。文章拒稿的一個重要原因,就是統計分析的問題,無論是對使用的統計方法描述不清,還是描述和使用錯誤都可能會導致拒稿。但對於本就臨床工作很重的醫學研究者而言,完全自己搞懂統計,是非常難的事兒,最理想的狀態是自己會做基礎統計,比較難又拿不準的問題要諮詢統計專家,可是這僅僅是理想情況,現實中不一定能找到統計專家諮詢。公眾號:劉老師醫學統計,不僅有大量免費的統計學教程,做統計時可以直接參考使用,非常方便。
  • 分析:iKON和WINNER的回歸成果對YG娛樂很重要
    (圖片來源:韓國《每日經濟》)韓亞金融投資於1月18日分析稱,對於YG娛樂公司而言,第一季度回歸的iKON和WINNER
  • 統計&編程|用R語言做中介效應
    0.2875657 0.6397209 1.0000000R does not give significance information with its correlation matrices (annoying), but reference to a handy table will show that the critical value of Pearson's r
  • 深度對比:Python和R之爭
    從工具上來看,按由業務到工程的順序,這個兩條是:EXCEL >> R >> Python >> Scala在實際工作中,對於小數據集的簡單分析來說,使用EXCEL絕對是最佳選擇。當我們需要更多複雜的統計分析和數據處理時,我們就需要轉移到 Python 和 R 上。
  • 初學者:如何學好C語言?
    所有初學者面臨的第一個問題便是:如何選擇教材。好的開始是成功的一半,選擇一本優秀的教材是事半功倍的關鍵因素。不幸的是,學校通常會幫你指定一本很差勁的C語言課本;而幸運的是,你還可以再次選擇。大名鼎鼎的譚浩強教授出了一本《C語言程序設計》,據說發行量有超過400萬,據我所知,很多學校都會推薦這本書作為C語言課本。雖然本人的名字(譚浩宇)跟教授僅僅一字之差,但我是無比堅定地黑他這本書的。