本期:相關與回歸
日常工作中,我們不僅關心2變量之間的差異,也關注2變量之間的聯繫,比如年齡與血壓,血壓濃度與時間等。 對服從正態分布的定量資料,我們探討線性相關,對計數和等級資料,我們探討秩相關,今天的內容,便是定量資料的相關與回歸。
1 簡單線性相關與回歸:
例:探討身高與前臂長的相關性
① 繪製散點圖(直觀的反應兩者關係):
② 求相關係數(兩變量相關關係的方向及密切程度):
③ 建立回歸方程:
一般形式:
方程的意義:用自變量X預測因變量Y,在我們實際生活中,得以應用(如2-10歲兒童的體重計算公式y=年齡*2+8)
原理:
最小二乘法(點到直線的縱向距離之和最小,就是「合理地」找到一條能最好地代表數據點分布趨勢的直線)
2 多重線性回歸
例:探討嬰兒體重與B超檢測內容(多項指標)的相關性
當我們的自變量y只有一個,自變量x有多個:例如嬰兒體重y與孕齡、頭徑、胸徑、腹徑、股骨長的回歸。
多重線性回歸的一般形式:
SPSS操作過程:
SPSS結果與解釋:
這裡我用的後退法
據例題,我們選擇第三個模型,得到回歸方程後,我們可以計算估計體重:
同時對真實數據與我們估計的出生體重做簡單相關:
發現,我們模型擬合所得r=0.93,r方=0.865,表示根據孕齡、頭徑、胸徑我們所構建的嬰兒出生體重預測的方程:
能夠解釋嬰兒出生體重的86.5%,擬合效果好。
本期編輯:統計君
覺得不錯就為我們充電吧!