【R語言教程】線性回歸決定係數R方的計算方法及具體意義 ——【醫學和生物統計】

2021-02-21 杏花開醫學

決定係數(coefficient ofdetermination),有的書上翻譯為判定係數,也稱為擬合優度。

決定係數反應了y的波動有多少百分比能被x的波動所描述,即表徵依變數Y的變異中有多少百分比,可由控制的自變數X來解釋.

表達式:R2=SSR/SST=1-SSE/SST

其中:SST=SSR+SSE,SST(total sum of squares)為總平方和,SSR(regression sum of squares)為回歸平方和,SSE(error sum of squares) 為殘差平方和。

回歸平方和:SSR(Sum of Squares forregression) = ESS (explained sum of squares)

殘差平方和:SSE(Sum of Squares for Error) = RSS(residual sum of squares)

總離差平方和:SST(Sum of Squares fortotal) = TSS(total sum of squares)

SSE+SSR=SST RSS+ESS=TSS

意義:擬合優度越大,自變量對因變量的解釋程度越高,自變量引起的變動佔總變動的百分比高。觀察點在回歸直線附近越密集。取值範圍:0-1.

舉例:

假設有10個點,如下圖:

用R來實現如何求線性方程和R2:

# 線性回歸的方程

mylr = function(x,y){

plot(x,y)

x_mean = mean(x)

y_mean = mean(y)

xy_mean = mean(x*y)

xx_mean = mean(x*x)

yy_mean = mean(y*y)

m = (x_mean*y_mean - xy_mean)/(x_mean^2 - xx_mean)

b = y_mean - m*x_mean

f = m*x+b# 線性回歸方程

lines(x,f)

sst = sum((y-y_mean)^2)

sse = sum((y-f)^2)

ssr = sum((f-y_mean)^2)

result = c(m,b,sst,sse,ssr)

names(result) = c('m','b','sst','sse','ssr')

return(result)

}

x = c(60,34,12,34,71,28,96,34,42,37)

y = c(301,169,47,178,365,126,491,157,202,184)

f = mylr(x,y)

f['m']

f['b']

f['sse']+f['ssr']

f['sst']

R2= f['ssr']/f['sst']

最後方程為:f(x)=5.3x-15.5

R2為99.8,說明x對y的解釋程度非常高。

相關焦點

  • 醫學統計與R語言:GiViTI Calibration Belt
    醫學統計與R語言:對數正態分布與卡方分布醫學統計與R語言:qvalue醫學統計與R語言:Meta 回歸作圖(Meta regression Plot)醫學統計與R語言:aggregate.plot了解一下醫學統計與R語言:有序Probit回歸(Ordered Probit Model)
  • 統計諮詢:決定係數(R方)是否越大越好?
    問題:尊敬的老師您好,想問一下決定係數R2越大越好,但是有沒有說具體的範圍?大於多少就是有意義的?謝謝老師。
  • R語言——交叉驗證法計算線性回歸模型擬合優度的第三種R方
    本來打算這周繼續更新一篇LaTex的小短文,但是貌似我已經很久沒有寫R語言相關的東西了。想來想去,今天就寫一篇和R語言有關的,畢竟不能忘記初心呀!凡是學過計量的同學,哪怕只記得一點點皮毛,對於R方和調整R方也應該是再熟悉不過了。R方和調整R方是判斷回歸模型擬合度的最為方便簡單的指標,一般來說,數值越大代表模型的擬合度越好。
  • R語言從入門到精通:Day12--R語言統計--回歸分析
    回歸作為一個廣義的概念,涵蓋了許多變種,R語言中也為其提供了強大而豐富的函數和選項(但顯然選項越多,對初學者越不友好),早在2005年,R中就有200多種關於回歸分析的函數 (https://cran.r-project.org/doc/contrib/Ricci-refcard-regression.pdf,這個文檔提供了部分回歸分析函數列表,供大家參考)。
  • r語言卡方檢驗和似然比檢驗_r語言似然比檢驗代碼 - CSDN
    A根據B調整,B依據A調整,A:B交互項同時根據A和B調整類型3(邊界型)每個效應根據模型其他各效應做相應調整。A根據B和A:B做調整,A:B交互項根據A和B調整。 R默認調用類型1方法,其他軟體(比如SAS或SPSS)默認調用類型3方法。
  • r語言的p值檢驗 - CSDN
    醫學統計與R語言:對數正態分布與卡方分布醫學統計與R語言:qvalue醫學統計與R語言:Meta 回歸作圖(Meta regression Plot)醫學統計與R語言:aggregate.plot了解一下醫學統計與R語言:有序Probit回歸(Ordered Probit Model)醫學統計與R語言:Probit回歸模型及邊際效應
  • 的方法 線性回歸方程檢驗專題及常見問題 - CSDN
    利用回歸平方和與總離差平方和的比值來說明X與Y的相關性,稱為決定係數,即有:決定係數的開方被稱為相關係數,前面介紹過相關係數r(Excel數據分析工具:協方差與相關係數),計算公式為:兩者的計算結果是完全一致的。相關係數與決定係數都能表示變量之間的線性相關程度,但是相關係數計算更簡便且能表示相關關係的方向。
  • 回歸係數顯著性t檢驗 - CSDN
    這樣,總平方和SST 中,能夠由自變量解釋的部分為SSR,不能由自變量解釋的部分為SSE,從而,回歸平方和SSR越大,回歸的效果就越好,可以據此構造F 檢驗統計量為越大,線性回歸越好,所以定義樣本決定係數r2: 回歸平方和與總離差平方和之比。
  • R語言從入門到精通:Day10-R語言統計入門代碼大全
    接下來的幾次教程內容就是為了解決這些問題,我們會逐步學習R語言中的一些統計方法,希望大家在學習新內容的同事,也可以回顧一下自己之前學過的統計學課程。本次教程將主要關注R語言中生成基本的描述性統計量和推斷統計量的R函數。  寫在開篇的話,本篇教程內容較多,請務必靜下心來學習。
  • 醫學統計與R語言:Kendall是誰?樣本量是自變量的10倍?
    醫學統計與R語言:你知道nomogram的points和total points怎麼算嗎?醫學統計與R語言:Cleveland dot plot醫學統計與R語言:交互作用模型中分組效應及標準誤的計算醫學統計與R語言:多條ROC曲線的AUC多重比較醫學統計與R語言:來,今天學個散點圖!
  • R教程:如何通過cox回歸模型計算RD(危險差)和NNT?
    與相對效應值相比,絕對效應值更具有臨床意義。(詳見:總結:那些可以評價幹預措施效果的指標們) 舉例來說,某種新藥的隨機對照試驗得到該藥與安慰劑相比HR為0.5,顯示出該藥可以顯著降低結局事件的發生率。但是,當結局事件在安慰劑組的發生率為1%和50%時,HR等於0.5對於臨床實踐而言意義卻完全不一樣。
  • 醫學統計與R語言:Cronbach's α Coefficient
    微信公眾號:醫學統計與R語言簡介Cronbach's alpha  is a function
  • SPSS-線性相關與多重線性回歸
    對服從正態分布的定量資料,我們探討線性相關,對計數和等級資料,我們探討秩相關,今天的內容,便是定量資料的相關與回歸。1 簡單線性相關與回歸:例:探討身高與前臂長的相關性① 繪製散點圖(直觀的反應兩者關係):② 求相關係數(兩變量相關關係的方向及密切程度):
  • 一元線性回歸顯著性檢驗專題及常見問題 - CSDN
    這樣,總平方和SST 中,能夠由自變量解釋的部分為SSR,不能由自變量解釋的部分為SSE,從而,回歸平方和SSR越大,回歸的效果就越好,可以據此構造F 檢驗統計量為越大,線性回歸越好,所以定義樣本決定係數r2: 回歸平方和與總離差平方和之比。
  • r語言一元回歸模型專題及常見問題 - CSDN
    一元線性回歸分析首先介紹回歸分析中最基礎的情況:一元線性回歸分析。它規定模型f函數只能是y=k*x+b的形式,即只使用一個變量x(故稱為一元)的線性形式來預測目標變量y。6.1.1引例利用某網站歷次促銷活動中促銷讓利費用和銷售金額的數據(單位是十萬元),將使用該數據集來說明線性回歸分析的應用。
  • r語言多元線性回歸相關性_多元線性回歸調整相關性 - CSDN
    多元線性回歸多元線性回歸的核心問題:應該選擇哪些變量???RSS(殘差平方和)與R2  (相關係數的平方)選擇法:遍歷所有可能的組合,選出使RSS最小,R2  最大的模型。
  • spss 非線性回歸 - CSDN
    GraphPad Prism繪製ROC曲線具體操作步驟· SPSS進行連續型數據的正態分布檢驗· SPSS有序Logistic回歸的具體操作· SPSS生存分析在生物醫藥統計中的應用之COX風險比例回歸· SPSS
  • 第四十四講 R-非線性回歸
    在非線性回歸模型中,選擇最適合擬合模型的精準度與線性模型一樣(第四十一講 R-判斷回歸模型性能的指標),使用均方根方差(root mean square deviation, RMSE)和R平方(R2)。
  • 【R語言】相關性分析、相關係數的顯著性檢驗及可視化
    本篇文章介紹基於R語言的相關性分析、相關係數的顯著性檢驗及可視化,該教程為個人筆記,大家也可參考學習,不足之處也歡迎大家批評指正!相關性分析用於評估兩個或多個變量之間的關聯,能通過定量指標描述變量之間的強弱、直接或間接聯繫。
  • 【獨家】手把手教線性回歸分析(附R語言實例)
    本文長度為8619字,建議閱讀15分鐘