簡單線性回歸(一)

2021-02-20 spss學習樂園

    回歸分析(regression analysis )是研究一個變量如何隨另一些變量變化的方法。例如,學習成績會受努力的時間,方法,個人的智慧,教育資源等因素影響;疾病的發生與生活環境,方式,遺傳因素,自身體質等影響。常見的回歸分析有 線性回歸、非線性回歸、多重線性回歸、Logistic回歸等等。

    本節主要講解簡單線性回歸,即研究變量Y隨變量X變化的分析,不考慮多自變量對結果變量情況。

回歸分析與相關分析的區別與聯繫

線性回歸(linear regression )是分析兩個定量變量間的線性關係。一般地,某一變量(稱為Y變量)隨另一變量(X變量)變化而變化,且這種變化趨勢呈直線趨勢。

線性回歸方程: Y'=a+bX,

Y'為X對應的實測值Y的總體均數的估計值,X為橫坐標(),a為截距,b為斜率

通過個體觀測值(X、Y)找到最「合理的」一條直線,儘可能地讓所有的散點與它的距離「最近」,得出直線的方程Y'=a+bX 。只要給出一個自變量X的值,就能計算出相應的預測值Y'。

 

(一)因變量Y與自變量X呈線性關係

通過繪製(X、Y)的散點圖,觀察散點的分布是否具有線性趨勢,來判斷線性關係是否成立。如果不成立,則可以通過非線性回歸分析方法。

(二)每個個體觀察值之間互相獨立

即任意兩個個體的觀察值之間不應該有關聯性,否則會導致回歸分析的估計值不夠準確和精確。

(三)在一定範圍內,任意給定X值,其對應的隨機變量Y均服從正態分布

利用專業知識來判斷,也可通過殘差的散點圖,或者通過預實驗測定任意給定X值對應一系列Y值,再檢驗Y值的正態性來判斷。如果不滿足正態性,首先應該考慮通過數據變換,使其滿足正態性。

(四)在一定範圍內,不同X值所對應的隨機變量Y的方差相等

通常利用(X、Y)的散點圖或殘差的散點圖來判斷方差是否齊性。如果數據不滿足等方差條件,可用變量變換使其方差齊性,或者採用加權回歸法。

通俗地講, 通過樣本數據(X、Y)的散點圖,儘可能地讓所有的散點與某條直線的距離「最近」,來擬合出最好的一條直線。

理解圖;

本次內容到此為止,下期再見。

感謝大家的支持,歡迎批評與指教!!!

相關焦點

  • SPSS|簡單線性回歸(一)
    即,本研究中簡單線性回歸的觀測值具有相互獨立性,滿足假設4。但不得不說,Durbin-Watson檢驗不是萬能的。它僅適用於對鄰近觀測值相關性的檢驗(1st-order autocorrelation)。舉例來說,我們一般按照調查順序錄入數據,將第一位受試者錄入到第一行,再將第二位受試者錄入到第二行。
  • 簡單線性回歸模型
    2 基礎回顧回歸的概念來源於實際問題,那麼現在我們所說的線性回歸分析問題具體指的是什麼呢?3 求解線性回歸模型函數3.1 極大似然法最小二乘法和極大似然法都可以用來求解線性回歸模型,我們在往期文章中討論過最小二乘法,這裡對似然法進行簡單介紹。
  • 線性回歸:簡單線性回歸詳解
    【導讀】本文是一篇專門介紹線性回歸的技術文章,討論了機器學習中線性回歸的技術細節。線性回歸核心思想是獲得最能夠擬合數據的直線。
  • 簡單線性回歸(二)
    線性回歸相關知識:簡單線性回歸(一)線性回歸步驟線性回歸需滿足的條件①因變量Y與自變量X呈線性關係②每個個體觀察值之間互相獨立③在一定範圍內,任意給定X值,其對應的隨機變量Y均服從正態分布④在一定範圍內,不同X值所對應的隨機變量Y的方差相等某研究者測量了16名成年男子的體重(Kg)和臀圍(cm)數據,欲探求成年男子的體重與臀圍是否可以建立線性回歸模型。
  • 簡單線性回歸分析
    上一節我們對67例居民身高和體重的相關性分析發現,居民的體重與身高變化密切相關,即隨著身高的增加,體重逐漸上升。我們還是採用之前的數據,介紹SPSS進行線性回歸分析的具體步驟。為0.995,調整R2為0.995,進行線性回歸過程中R2的值在0-1之間,R2越大,表明納入方程的自變量對因變量的解釋程度越高,建立的數學模型也就越魯棒(Robust)。
  • 7種執行簡單的線性回歸的分析與討論!
    由於scikit-learn是一種免費的機器學習庫,它具有回歸、分類、聚類、模型選擇和降維等功能,所以常用的方法是從該庫調用線性模型類並擬合數據。雖然這可以為應用機器學習的其他流水線特性(例如數據規範化,模型係數正則化,將線性模型提供給另一個下遊模型)提供額外的優勢,但這通常不是確定回歸係數(和一些基本的相關統計)最快或最乾淨、簡單的方法。
  • Python環境下的8種簡單線性回歸算法
    GitHub 地址:對於大多數數據科學家而言,線性回歸方法是他們進行統計學建模和預測分析任務的起點。但我們不可誇大線性模型(快速且準確地)擬合大型數據集的重要性。如本文所示,在線性回歸模型中,「線性」一詞指的是回歸係數,而不是特徵的 degree。
  • 8 種進行簡單線性回歸的方法分析與討論
    8 種進行簡單線性回歸的方法分析與討論 Tirthajyoti Sarkar 發表於 2018-01-05 08:18:57 本文中,作者討論了 8 種在 Python 環境下進行簡單線性回歸計算的算法,不過沒有討論其性能的好壞
  • 線性回歸分析思路總結!簡單易懂又全面!
    線性回歸是一種研究影響關係的方法,在實際研究裡非常常見。本文就來梳理下線性回歸分析的分析流程,閒話少說,我們開始吧!線性回歸回歸分析實質上就是研究一個或多個自變量X對一個因變量Y(定量數據)的影響關係情況。
  • 回歸系列(一)|怎樣正確地理解線性回歸
    作者:丁點helper 來源:丁點幫你線性回歸,可能是統計學上運用最廣泛的一類方法了,之所以說它是一類方法,是因為它包括了我們熟知的各種模型:簡單線性回歸、多重線性回歸、Logistic回歸等等。線性回歸運用這麼廣泛很大程度在於它的內在邏輯十分簡單。
  • SPSS統計分析案例:一元線性回歸
    微信號後臺有非常之多的關於回歸分析的留言,作為最常見的統計分析方法,在工作生活中的應用需求量巨大,這兩天已經為大家選好了案例數據,先從一元線性回歸分析開始。一元線性回歸,顧名思義,僅有一個自變量的回歸模型,研究的是一個因素對結果的影響,可以用於預測,也經常被稱之為簡單線性回歸分析。
  • SPSS操作:簡單線性回歸(史上最詳盡的手把手教程)
    假設6:等方差性假設7:回歸殘差近似正態分布那麼,進行簡單線性回歸分析時,如何考慮和處理這7項假設呢?在簡單線性回歸中,異常值是指觀測值與預測值相差較大的數據。這些數據不僅影響回歸統計,還對殘差的變異度和預測值的準確性有負面作用,並阻礙模型的最佳擬合。因此,我們必須充分重視回歸的異常值。
  • 一文教你全面掌握用Python實現線性回歸
    事實上,許多更高級的方法可被視為線性回歸的延伸。因此,理解好這一簡單模型將為將來更複雜的學習打下良好基礎。線性回歸可以很好地回答以下問題:· 兩個變量間有關係嗎?· 關係有多強?· 哪一個變量的影響最大?
  • SPSS-線性相關與多重線性回歸
    對服從正態分布的定量資料,我們探討線性相關,對計數和等級資料,我們探討秩相關,今天的內容,便是定量資料的相關與回歸。1 簡單線性相關與回歸:例:探討身高與前臂長的相關性① 繪製散點圖(直觀的反應兩者關係):② 求相關係數(兩變量相關關係的方向及密切程度):
  • Python數據科學:線性回歸
    本次介紹:線性回歸:多個連續變量與一個連續變量間的關係。其中線性回歸分為簡單線性回歸和多元線性回歸。/ 01 / 數據分析與數據挖掘資料庫:一個存儲數據的工具。/ 02 / 回歸方程01 簡單線性回歸簡單線性回歸只有一個自變量與一個因變量。含有的參數有「回歸係數」「截距」「擾動項」。其中「擾動項」又稱「隨機誤差」,服從均值為0的正態分布。線性回歸的因變量實際值與預測值之差稱為「殘差」。
  • 範例分析:多元線性回歸分析
    基礎回顧簡單線性和多元線性回歸理論基礎請回顧:相關與回歸分析基礎;一元(簡單線性)相關分析與回歸分析
  • 入門機器學習之線性回歸
    回歸分析是研究相關關係的是一種數學工具,是用一個變量取得的值去估計另一個變量所取得的值。回歸分析按照涉及的變量的多少,分為一元回歸和多元回歸分析;按照因變量的多少,可分為簡單回歸分析和多重回歸分析;按照自變量和因變量之間的關係類型,可分為線性回歸分析和非線性回歸分析。
  • python模擬簡單線性回歸
    return sum([(x - mean) ** 2 for x in values]) #計算協方差def convariance(x, mean_x, y, mean_y): convar = 0.0 for i in range(len(x)): convar += (x[i] - mean_x) * (y[i] - mean_y) return convar #計算回歸係數函數
  • 線性回歸中+t值的含義_線性回歸 y截距p值的計算 - CSDN
    線性回歸模型的基本特性就是:模型是參數的線性函數。最簡單的線性回歸模型當然是模型是參數的線性函數的同時,也是輸入變量的線性函數,或者叫做線性組合。這種模型,由於它是參數的線性函數,所以其數學分析相對較為簡單,同時可以是輸入變量的非線性函數。
  • 一文輕鬆看懂線性回歸分析的交互作用!
    如果想要研究兩個自變量如X1和X2的交互作用,通常的做法就是將兩個變量相乘,即X1*X2,然後把乘積項納入到回歸方程。操作起來很簡單,但交互項的納入對於回歸係數的解讀卻帶來了新的問題。以一個很經典的例子來說明。