線性回歸相關知識:簡單線性回歸(一)
線性回歸步驟
線性回歸需滿足的條件
①因變量Y與自變量X呈線性關係
②每個個體觀察值之間互相獨立
③在一定範圍內,任意給定X值,其對應的隨機變量Y均服從正態分布
④在一定範圍內,不同X值所對應的隨機變量Y的方差相等
某研究者測量了16名成年男子的體重(Kg)和臀圍(cm)數據,欲探求成年男子的體重與臀圍是否可以建立線性回歸模型。
數據視圖
條件①:通過散點圖來判斷兩變量是否有線性關係
(一)單擊「圖形」,如圖所示
(二)放好相應的變量
(三)所有觀測點大致在一條直線上,結果挺好
條件② ③ ④需通過下面的操作來判斷
(一)「分析」「回歸」「線性」
(二)「臀圍」放入因變量,「體重」放入自變量
(三)單擊「Statistics」,勾選相應框
(四)將"ZRESID"放入Y框,「ZPRED」放入X框,並勾選標準化殘差圖「直方圖」和「正態概率圖」,繼續
(一)R表示擬合優度,衡量估計的模型對觀測值的擬合程度。一般地,R值越接近1,擬合程度越好。調整後的R平方更準確一些,本例為0.884,相對來說,擬合程度還是可以接受的。
Durbin-Watson(U),即模型殘差獨立性檢驗,其值在0~4之間,等於2時,則獨立性最好。本例中,DW=2.484,殘差獨立,滿足條件②。
(二)結果顯示,F=114.902,Sig=0.000 <0.05,即成年男性體重與臀圍回歸模型有統計學意義。
(三)該結果給出了回歸方程中的常數項,回歸係數估計值等。
通過觀察P值,發現常量與斜率均有統計學意義,常量為53.102,斜率為0.648;
因此,可以試著寫出回歸方程:Y=53.102+0.646 X
(四)通過觀察直方圖或P-P圖,直方圖可能不是很符合正態分布;P-P中,有部分點不在直線上,如果條件允許的話,可以認為 回歸標準化殘差近似正態分布。(實際數據中,很少有較好地符合正態分布)滿足條件③
(五)通過觀察,發現大部分回歸標準化殘差散點 大多數在(-1~1),各散點越集中,說明其方差越相近。因此,可以認為等方差性,滿足條件④
計算「臀圍」預測值和95%置信區間
(一)「分析」「一般線性模型」「單變量」
(二)「臀圍」放入因變量,「體重」放入協變量
(三)單擊「粘貼」,出現如下情形
(四)輸入「/LMATRIX=ALL 1 60; ALL 1 70; ALL 1 80」
(五)單擊「運行」,「全部」
體重為60Kg時,臀圍為91.9cm;95%置信區間為(90.5~93.3)
體重為70Kg時,臀圍為98.4cm;95%置信區間為(96.5~100)
體重為80Kg時,臀圍為104.9cm;95%置信區間為(101.9~107.9)
通過線性回歸模型分析了成年男性體重(Kg)對臀圍(cm)的影響,得出了回歸模型方程 臀圍=53.102+0.646 x 體重。體重每增加1Kg,臀圍增加0.646cm。
歡迎大家的批評與指教!!!