簡單線性回歸(二)

2021-01-14 spss學習樂園




線性回歸相關知識:簡單線性回歸(一)


線性回歸步驟


線性回歸需滿足的條件

①因變量Y與自變量X呈線性關係

②每個個體觀察值之間互相獨立

③在一定範圍內,任意給定X值,其對應的隨機變量Y均服從正態分布

④在一定範圍內,不同X值所對應的隨機變量Y的方差相等



某研究者測量了16名成年男子的體重(Kg)和臀圍(cm)數據,欲探求成年男子的體重與臀圍是否可以建立線性回歸模型。


數據視圖




條件①:通過散點圖來判斷兩變量是否有線性關係

(一)單擊「圖形」,如圖所示



(二)放好相應的變量



(三)所有觀測點大致在一條直線上,結果挺好


條件② ③ ④需通過下面的操作來判斷


(一)「分析」「回歸」「線性」


 

(二)「臀圍」放入因變量,「體重」放入自變量


 

(三)單擊「Statistics」,勾選相應框



(四)將"ZRESID"放入Y框,「ZPRED」放入X框,並勾選標準化殘差圖「直方圖」和「正態概率圖」,繼續




(一)R表示擬合優度,衡量估計的模型對觀測值的擬合程度。一般地,R值越接近1,擬合程度越好。調整後的R平方更準確一些,本例為0.884,相對來說,擬合程度還是可以接受的。

Durbin-Watson(U),即模型殘差獨立性檢驗,其值在0~4之間,等於2時,則獨立性最好。本例中,DW=2.484,殘差獨立,滿足條件②。


(二)結果顯示,F=114.902,Sig=0.000 <0.05,即成年男性體重與臀圍回歸模型有統計學意義。

(三)該結果給出了回歸方程中的常數項,回歸係數估計值等。

通過觀察P值,發現常量與斜率均有統計學意義,常量為53.102,斜率為0.648;

因此,可以試著寫出回歸方程:Y=53.102+0.646 X

(四)通過觀察直方圖或P-P圖,直方圖可能不是很符合正態分布;P-P中,有部分點不在直線上,如果條件允許的話,可以認為 回歸標準化殘差近似正態分布。(實際數據中,很少有較好地符合正態分布)滿足條件③



(五)通過觀察,發現大部分回歸標準化殘差散點 大多數在(-1~1),各散點越集中,說明其方差越相近。因此,可以認為等方差性,滿足條件④



計算「臀圍」預測值和95%置信區間


(一)「分析」「一般線性模型」「單變量」



(二)「臀圍」放入因變量,「體重」放入協變量


(三)單擊「粘貼」,出現如下情形



(四)輸入「/LMATRIX=ALL 1 60; ALL 1 70; ALL 1 80」



(五)單擊「運行」,「全部」


體重為60Kg時,臀圍為91.9cm;95%置信區間為(90.5~93.3)

體重為70Kg時,臀圍為98.4cm;95%置信區間為(96.5~100)

體重為80Kg時,臀圍為104.9cm;95%置信區間為(101.9~107.9)



通過線性回歸模型分析了成年男性體重(Kg)對臀圍(cm)的影響,得出了回歸模型方程  臀圍=53.102+0.646 x 體重。體重每增加1Kg,臀圍增加0.646cm。


歡迎大家的批評與指教!!!

相關焦點

  • 簡單線性回歸(一)
    回歸分析(regression analysis )是研究一個變量如何隨另一些變量變化的方法。例如,學習成績會受努力的時間,方法,個人的智慧,教育資源等因素影響;疾病的發生與生活環境,方式,遺傳因素,自身體質等影響。常見的回歸分析有 線性回歸、非線性回歸、多重線性回歸、Logistic回歸等等。
  • 簡單線性回歸模型
    2 基礎回顧回歸的概念來源於實際問題,那麼現在我們所說的線性回歸分析問題具體指的是什麼呢?3 求解線性回歸模型函數3.1 極大似然法最小二乘法和極大似然法都可以用來求解線性回歸模型,我們在往期文章中討論過最小二乘法,這裡對似然法進行簡單介紹。
  • 線性回歸:簡單線性回歸詳解
    【導讀】本文是一篇專門介紹線性回歸的技術文章,討論了機器學習中線性回歸的技術細節。線性回歸核心思想是獲得最能夠擬合數據的直線。
  • 簡單線性回歸分析
    我們還是採用之前的數據,介紹SPSS進行線性回歸分析的具體步驟。為0.995,調整R2為0.995,進行線性回歸過程中R2的值在0-1之間,R2越大,表明納入方程的自變量對因變量的解釋程度越高,建立的數學模型也就越魯棒(Robust)。
  • SPSS|簡單線性回歸(一)
    即,本研究中簡單線性回歸的觀測值具有相互獨立性,滿足假設4。但不得不說,Durbin-Watson檢驗不是萬能的。它僅適用於對鄰近觀測值相關性的檢驗(1st-order autocorrelation)。舉例來說,我們一般按照調查順序錄入數據,將第一位受試者錄入到第一行,再將第二位受試者錄入到第二行。
  • 7種執行簡單的線性回歸的分析與討論!
    由於scikit-learn是一種免費的機器學習庫,它具有回歸、分類、聚類、模型選擇和降維等功能,所以常用的方法是從該庫調用線性模型類並擬合數據。雖然這可以為應用機器學習的其他流水線特性(例如數據規範化,模型係數正則化,將線性模型提供給另一個下遊模型)提供額外的優勢,但這通常不是確定回歸係數(和一些基本的相關統計)最快或最乾淨、簡單的方法。
  • Python環境下的8種簡單線性回歸算法
    選自Medium作者:Tirthajyoti Sarkar機器之心編譯參與:晏奇、劉曉坤本文中,作者討論了 8 種在 Python 環境下進行簡單線性回歸計算的算法,不過沒有討論其性能的好壞,而是對比了其相對計算複雜度的度量。
  • 8 種進行簡單線性回歸的方法分析與討論
    8 種進行簡單線性回歸的方法分析與討論 Tirthajyoti Sarkar 發表於 2018-01-05 08:18:57 本文中,作者討論了 8 種在 Python 環境下進行簡單線性回歸計算的算法,不過沒有討論其性能的好壞
  • 線性回歸分析思路總結!簡單易懂又全面!
    線性回歸是一種研究影響關係的方法,在實際研究裡非常常見。本文就來梳理下線性回歸分析的分析流程,閒話少說,我們開始吧!線性回歸回歸分析實質上就是研究一個或多個自變量X對一個因變量Y(定量數據)的影響關係情況。
  • 回歸系列(四)|一個完整的線性回歸是怎樣做的
    回顧:多重線性回歸多重線性回歸,一般是指有多個自變量X,只有一個因變量Y。前面我們主要是以簡單線性回歸為例在介紹,兩者的差距主要在於自變量X的數量,在只有一個X時,就稱簡單線性回歸。在實際應用中,我們當然很少只納入一個自變量。
  • 入門機器學習之線性回歸
    回歸分析是研究相關關係的是一種數學工具,是用一個變量取得的值去估計另一個變量所取得的值。回歸分析按照涉及的變量的多少,分為一元回歸和多元回歸分析;按照因變量的多少,可分為簡單回歸分析和多重回歸分析;按照自變量和因變量之間的關係類型,可分為線性回歸分析和非線性回歸分析。
  • SPSS操作:簡單線性回歸(史上最詳盡的手把手教程)
    假設6:等方差性假設7:回歸殘差近似正態分布那麼,進行簡單線性回歸分析時,如何考慮和處理這7項假設呢?在簡單線性回歸中,異常值是指觀測值與預測值相差較大的數據。這些數據不僅影響回歸統計,還對殘差的變異度和預測值的準確性有負面作用,並阻礙模型的最佳擬合。因此,我們必須充分重視回歸的異常值。
  • R筆記:多重線性回歸(二)_適用條件考察
    並對模型參數進行了估計,但建立回歸方程實際上是整個回歸分析裡面最簡單的一部分,數據適不適合採用線性回歸,回歸模型對數據的擬合性如何還需要更進一步的考察驗證。線性回歸基本適用條件:獨立、線性、正態和方差齊同,本次筆記在上次筆記建立多重回歸模型lmfit後考察這幾個適用條件。線性回歸適用條件和模型的診斷多涉及殘差分析。
  • SPSS-線性相關與多重線性回歸
    對服從正態分布的定量資料,我們探討線性相關,對計數和等級資料,我們探討秩相關,今天的內容,便是定量資料的相關與回歸。1 簡單線性相關與回歸:例:探討身高與前臂長的相關性① 繪製散點圖(直觀的反應兩者關係):② 求相關係數(兩變量相關關係的方向及密切程度):
  • 回歸系列(五)|線性回歸分析做完後,還應考慮什麼?
    前面我們主要是以簡單線性回歸為例在介紹,兩者的差距主要在於自變量X的數量,在只有一個X時,就稱簡單線性回歸。因為,回歸的使用僅能說明數據之前存在關聯,但這種關聯是否真正代表了兩者的內在聯繫還需要更深入的研究。
  • 線性回歸的幾何與概率視角
    Content線性回歸-幾何視角線性回歸-概率視角Pseudo-inverse偽逆的介紹局部加權線性回歸多個output的線性回歸情況線性回歸的幾何角度這也和現實裡面的情況相符,比方說我們認為某個時刻的股價受周圍幾天的股價影響較大,而更遠的股價對這個時刻的股價影響較小。借用一個知乎上給出一個例子,我們可以看到局部加權回歸相較於OLS線性回歸的強大之處。這是我們要擬合的一個data,顯然如果使用OLS會是一個欠擬合的結果。
  • python模擬簡單線性回歸
    return sum([(x - mean) ** 2 for x in values]) #計算協方差def convariance(x, mean_x, y, mean_y): convar = 0.0 for i in range(len(x)): convar += (x[i] - mean_x) * (y[i] - mean_y) return convar #計算回歸係數函數
  • Python數據科學:線性回歸
    本次介紹:線性回歸:多個連續變量與一個連續變量間的關係。其中線性回歸分為簡單線性回歸和多元線性回歸。/ 01 / 數據分析與數據挖掘資料庫:一個存儲數據的工具。/ 02 / 回歸方程01 簡單線性回歸簡單線性回歸只有一個自變量與一個因變量。含有的參數有「回歸係數」「截距」「擾動項」。其中「擾動項」又稱「隨機誤差」,服從均值為0的正態分布。線性回歸的因變量實際值與預測值之差稱為「殘差」。
  • 【線性回歸】多變量分析:多元回歸分析
    實際上大部分學習統計分析和市場研究的人的都會用回歸分析,操作也是比較簡單的,但能夠知道多元回歸分析的適用條件或是如何將回歸應用於實踐,可能還要真正領會回歸分析的基本思想和一些實際應用手法!下面我們就來談談多元回歸分析,這張圖是利用多元線性回歸製作的策略分析圖,你可以理解X軸是重要性,Y軸是表現;首先,多元回歸分析應該強調是多元線性回歸分析!
  • 範例分析:多元線性回歸分析
    基礎回顧簡單線性和多元線性回歸理論基礎請回顧:相關與回歸分析基礎;一元(簡單線性)相關分析與回歸分析