統計諮詢:決定係數(R方)是否越大越好?

2021-02-20 一起學統計工具

問題:尊敬的老師您好,想問一下決定係數R2越大越好,但是有沒有說具體的範圍?大於多少就是有意義的?謝謝老師。

回復:決定係數(coefficient of determination,R2)是反映模型擬合優度的重要的統計量,為回歸平方和與總平方和之比。R2取值在0到1之間,且無單位,其數值大小反映了回歸貢獻的相對程度,即在因變量Y的總變異中回歸關系所能解釋的百分比。R2是最常用於評價回歸模型優劣程度的指標,R2越大(接近於1),所擬合的回歸方程越優,如下表,指數曲線的R2為0.9926,最接近1,表明在5個回歸方程中,指數曲線(log(y) =1.9656-0.2199x)為最優方程。


雖然R2可以用來評價回歸方程的優劣,但隨著自變量個數的增加,R2將不斷增大,若對兩個具有不同個數自變量的回歸方程進行比較時,不能簡單地用R2作為評價回歸方程的標準,還必須考慮方程所包含的自變量個數的影響,此時應用校正的決定係數(R2-adjusted):Rc2,所謂「最優」回歸方程是指Rc2最大者。因此在討論多重回歸的結果時,通常使用Rc2。

至於R2大於多少才有意義呢?這時我們可以看另外一個指標:復相關係數(Multiple correlation coefficient)R,R是決定係數R2的平方根,可用來度量因變量Y與多個自變量間的線性相關程度,即觀察值Y與估計值之間的相關程度。我們可以參考《女朋友在化妝品上花錢越多,買衣服的費用越多》一文:

相關係數要在0.7~0.5才有意義,因此,R2應大於0.5*0.5=0.25,所以有種觀點認為,在直線回歸中應R2大於0.3才有意義。

如需更多R2的學習資料請回復「R2」、「R平方」、「R方」、「決定係數」決等關鍵詞。如需諮詢請回復「統計諮詢

本回復摘自本公眾號編著《MedCalc常用統計分析教程》書稿。

本訂閱號已實現智能檢索功能,回復任意關鍵詞可檢索相關文章。

回復關鍵詞可能有驚喜

數據|問卷星|百度雲|號內搜 |視頻

電子書|epidata|epiinfo| minitab |SPSS

pair|MedCalc|Prism| 臨床試驗 |gpower

OpenEpi|SPSS24|minitab17| empower 

文獻|SPSS12|minitab14| 統計諮詢 |統計方法

本公眾號長期從事各類統計軟體應用研究及統計分析工作,主編或參編SPSS、MINITAB、STATISTICA多個統計軟體教材共8本。代表作:《SPSS常用統計分析教程(SPSS 22.0中英文版)(第4版)》、《Minitab 統計分析方法及應用(第2 版)》及《PASW/SPSS Statistics中文版統計分析教程(第3版)》。

相關焦點

  • 回歸係數顯著性t檢驗 - CSDN
    r的絕對值小於等於1:|r| ≤ 1  根據相關係數的檢驗表,通常當|r| 大於表中α=0.05相應的值時,認為 x 與 y 有顯著的線性關係。  4.樣本決定係數  由公式(10)可知,越大,線性回歸越好,所以定義樣本決定係數r2: 回歸平方和與總離差平方和之比。
  • 汽車電瓶的內阻值越大越好還是越小越好?原因是什麼?
    當然是內阻越小越好了,汽車電瓶可以等視為一個電壓源,電壓源追求的是負載變化時候輸出電壓相對恆定,內阻越小,內部損耗越小,電動勢會越接近於輸出電壓,帶負載的能力會越強,而內阻大了,當然會直接在內部產生壓降,引起輸出電壓下降,請關注:容濟點火器
  • 【R語言教程】線性回歸決定係數R方的計算方法及具體意義 ——【醫學和生物統計】
    決定係數(coefficient ofdetermination),有的書上翻譯為判定係數,也稱為擬合優度。
  • 汽車風阻係數真的越低越好?恐怕你錯了
    風阻係數真的像廠家說的越低越好?什麼是風阻係數?風阻係數的大小將直接影響車輛的外觀造型,通常情況下風阻係數越小,車身越具有流線感。風阻係數與空氣動力學有著緊密的聯繫,空氣動力學不僅能反映出風阻,一定程度上還制約著動力、油耗、風燥和穩定性等,所以這門學科在交通工具中比較常用。民航客機的平均速度多為800km/h,是汽車的數倍,若要飛機在空中穿梭自如,造型顯得非常重要,飛機的風阻係數達到了0.08cd,而普通轎車為0.28-0.4cd。所以,風阻係數是評定一輛車設計的重要參數。
  • 【從零開始學統計】2.可決係數真的決定一切麼?
    anova裡的可決係數的問題。它就是可決係數(coefficient of determination),也被稱為擬合優度。說到擬合優度一般理解為回歸直線與觀測值的一個擬合程度,請看圖:如果樣本回歸線對樣本觀測值擬合程度越好,各樣本觀測點與回歸線靠得越近,由樣本回歸做出解釋的離差平方和與總離差平方和越相近;反之,擬合程度越差,相差越大。
  • 【R語言】相關性分析、相關係數的顯著性檢驗及可視化
    本篇文章介紹基於R語言的相關性分析、相關係數的顯著性檢驗及可視化,該教程為個人筆記,大家也可參考學習,不足之處也歡迎大家批評指正!相關性分析用於評估兩個或多個變量之間的關聯,能通過定量指標描述變量之間的強弱、直接或間接聯繫。
  • r語言卡方檢驗和似然比檢驗_r語言似然比檢驗代碼 - CSDN
    樣本大小越不平衡,效應項的順序對結果的影響越大。一般來說,越基礎性的效應越需要放在表達式前面。具體來講,首先是協變量,然後是主效應,接著是雙因素的交互項,再接著是三因素的交互項,以此類推。對於主效應,越基礎性的變量越應放在表達式前面,比如性別要放在處理方式之前。
  • 回歸分析解釋之——決定係數(R^2)
    CFA複習day4:決定係數(the coefficient of determination )能夠由自變量解釋的變異程度佔總的變異程度的比例。考綱要求:會計算並解釋。:(The coefficient of determination does exactly this: It measures the fraction of the total variation in the dependent variable that is explained by the independent variable. )怎麼理解決定係數
  • 【技術問答】介電係數是否等同導電係數?板材介電係數是否等於導電係數?越高的話導電性越好嗎?相對阻抗會越低嗎?一般阻抗有最高值嗎?
    實務問答1-10:更多精彩內容,請參考TPCA專書【2015電路板技術實務問答】【問】介電係數是否等同導電係數?在材料兩面平行導體間提供偏壓,就會產生蓄電現象,這種現象就是電容。當電容愈高,用這種材料製作的電路板,訊號輸送速度就愈低,這對高速訊號產品不利。因此要適當控制訊號速度,必須選用適當介電質係數材料。至於導電性則是電阻倒數,代表的意義是導體在傳輸電流時呈現的流動阻力,電阻高低與介電質係數並不相同。
  • 回歸分析中R方和調整R方的區別
    目錄殘差平方和了解R方統計量關於R方統計量的問題調整R方統計量殘差平方和為了清楚地理解這些概念,我們將討論一個簡單的回歸問題。殘差圖告訴我們回歸模型是否適合數據。殘差的平方實際上是回歸模型優化的目標函數。利用殘差值,我們可以確定殘差的平方和,也稱為殘差平方和或RSS。。RSS值越低,模型預測值越好。或者我們可以這樣說——如果回歸線使RSS值最小化,那麼回歸線就是最佳擬合線。
  • 容積率怎麼算的 容積率越大越好還是越小越好
    容積率越大越好還是越小越好?下面我們來了解一下相關的知識吧。容積率怎麼算的容積率=地上建築總面積÷規劃用地面積,舉例說明:1000平米的院子,改了一個7米高的雙層樓,每層都是300平米。容積率=300x2/1000=0.6。
  • 鈑金折彎R角由什麼決定?
    鈑金折彎R角是影響折彎係數的關鍵因素,如:鈑金折彎大圓角就要減很多的折彎係數,折彎尖角就可以減很小的折彎係數。今天我們分析一下折彎圓角由什麼決定?我們知道,板材越厚,折彎壓力越大,折彎下模槽口越大,是什麼可影響折彎r角的因素呢?2.鈑金材料:不同板材的,同樣厚度折彎係數不一樣,有輕微差別,證明材料特性影響折彎圓角。材料有一種性能是抵抗彎曲的能力,可能直接影響折彎半徑。材料對摺彎半徑有影響,但對我們實際使用影響不大。我們可以定製不同材料的折彎係數表。
  • 管理心理學之統計(25)獨立性卡方檢驗的效應假設限定與特殊應用
    測量獨立性卡方檢驗的效應大小對於兩個二元變量,即卡方檢驗形成的2x2矩陣,我們可以計算相關φ,計算公式如下:φ係數的值完全由2x2數據矩陣的比例決定,與頻數大小的絕對值完全無關。對φ的解釋與評估相關的標準相同:0.10是小效應,0.30是中效應,0.50是大效應。
  • 交叉口設計 | 路口轉彎半徑越小越好?
    以前,行業中轉彎半徑的推薦值是10-20米;但是最近幾年,應該是慢行優先理念的驅動,轉彎半徑一度被呼籲要求降低,甚至出現「轉彎半徑越小越好」的認識,最近審核的一些設計項目也是用了很小的轉彎半徑值,甚至到了6米以下……
  • 統計學最常用的「數據分析方法」清單(一)|信度|卡方|施測|統計量|...
    這種關係既包括兩個數據之間的單一相關關係——如年齡與個人領域空間之間的關係,也包括多個數據之間的多重相關關係——如年齡、抑鬱症發生率、個人領域空間之間的關係;既包括A大B就大(小),A小B就小(大)的直線相關關係,也可以是複雜相關關係(A=Y-B*X);既可以是A、B變量同時增大這種正相關關係,也可以是A變量增大時B變量減小這種負相關,還包括兩變量共同變化的緊密程度——即相關係數。
  • 【乾貨】統計學×數據分析|信度|卡方|施測|統計量|正態分布_網易...
    這種關係既包括兩個數據之間的單一相關關係——如年齡與個人領域空間之間的關係,也包括多個數據之間的多重相關關係——如年齡、抑鬱症發生率、個人領域空間之間的關係; 既包括A大B就大(小),A小B就小(大)的直線相關關係,也可以是複雜相關關係(A=Y-B*X); 既可以是A、B變量同時增大這種正相關關係,也可以是A變量增大時B變量減小這種負相關,還包括兩變量共同變化的緊密程度——即相關係數。
  • 協方差(covariance)與相關係數(2)
    散點不完全在同一直線上,沿直線分布越集中,相關係數越接近1,預測準確性逐漸增加。相反,沿直線分布越分散,相關係數越接近0,預測的準確性逐漸減弱。散點無相關性時,即x與y不相關時,相關係數為0,不能基於x預測y,也不能基於y預測x。