問題:尊敬的老師您好,想問一下決定係數R2越大越好,但是有沒有說具體的範圍?大於多少就是有意義的?謝謝老師。
回復:決定係數(coefficient of determination,R2)是反映模型擬合優度的重要的統計量,為回歸平方和與總平方和之比。R2取值在0到1之間,且無單位,其數值大小反映了回歸貢獻的相對程度,即在因變量Y的總變異中回歸關系所能解釋的百分比。R2是最常用於評價回歸模型優劣程度的指標,R2越大(接近於1),所擬合的回歸方程越優,如下表,指數曲線的R2為0.9926,最接近1,表明在5個回歸方程中,指數曲線(log(y) =1.9656-0.2199x)為最優方程。
雖然R2可以用來評價回歸方程的優劣,但隨著自變量個數的增加,R2將不斷增大,若對兩個具有不同個數自變量的回歸方程進行比較時,不能簡單地用R2作為評價回歸方程的標準,還必須考慮方程所包含的自變量個數的影響,此時應用校正的決定係數(R2-adjusted):Rc2,所謂「最優」回歸方程是指Rc2最大者。因此在討論多重回歸的結果時,通常使用Rc2。
至於R2大於多少才有意義呢?這時我們可以看另外一個指標:復相關係數(Multiple correlation coefficient)R,R是決定係數R2的平方根,可用來度量因變量Y與多個自變量間的線性相關程度,即觀察值Y與估計值之間的相關程度。我們可以參考《女朋友在化妝品上花錢越多,買衣服的費用越多》一文:
相關係數要在0.7~0.5才有意義,因此,R2應大於0.5*0.5=0.25,所以有種觀點認為,在直線回歸中應R2大於0.3才有意義。
如需更多R2的學習資料請回復「R2」、「R平方」、「R方」、「決定係數」決等關鍵詞。如需諮詢請回復「統計諮詢」
本回復摘自本公眾號編著《MedCalc常用統計分析教程》書稿。
本訂閱號已實現智能檢索功能,回復任意關鍵詞可檢索相關文章。
回復關鍵詞可能有驚喜
數據|問卷星|百度雲|號內搜 |視頻
電子書|epidata|epiinfo| minitab |SPSS
pair|MedCalc|Prism| 臨床試驗 |gpower
OpenEpi|SPSS24|minitab17| empower
文獻|SPSS12|minitab14| 統計諮詢 |統計方法
本公眾號長期從事各類統計軟體應用研究及統計分析工作,主編或參編SPSS、MINITAB、STATISTICA多個統計軟體教材共8本。代表作:《SPSS常用統計分析教程(SPSS 22.0中英文版)(第4版)》、《Minitab 統計分析方法及應用(第2 版)》及《PASW/SPSS Statistics中文版統計分析教程(第3版)》。