SPSSAU教程05:相關回歸分析指標解讀

2020-12-13 SPSSAU

高中政治課上,大家一定都聽過,唯物辯證法中講,萬事萬物都處於普遍的聯繫之中。從數據分析的角度看,所有事物之間存在著兩種關係:函數關係和統計關係。

函數關係是指兩事物之間存在著一種一一對應的關係,當一個X確定,對應的變量Y也可以隨之完全確定(即有唯一值)。比如乘車計費,裡程數和費用之間,當行駛的裡程確定,也可以得到唯一確定的收費數。

然而現實生活中,事物之間並不全都是一一對應的關係,因此另一種統計關係也普遍存在。統計關係就是這種非一一對應的關係。這些事物之間存在著某種非確定關係,變量關係研究就是為了分析確認事物之間的關係情況。

針對變量關係研究方法,包括了相關關係研究以及影響關係研究,大致將常用分析方法歸納為:相關分析,線性回歸分析,Logistic回歸分析,SEM結構方程

分析方法

1 相關分析

(1)指標解讀

結果表格

從相關分析方法角度看,其並不區分X和Y,但從實際意義上看,通常是研究X和Y的相關關係。

指標說明

(2)分析步驟

分析步驟

① 在相關分析之前,建議可使用散點圖直觀查看數據之間的關係情況。

② 判斷是否有關係(有*號則表示有關係,否則表示無關係);

③ 接著判斷關係為正相關或者負相關(相關係數大於0為正相關,反之為負相關);

④ 最後判斷關係緊密程度(通常相關係數大於0.4則表示關係緊密)

2 回歸分析

線性回歸分析是一種研究X對於Y的影響關係的分析方法。問卷研究中最為常見,多數情況下可以使用線性回歸分析進行假設驗證。

(1)指標解讀

結果表格
指標解讀

(2)分析步驟

分析步驟

① 首先分析模型擬合情況,即通過R平方值分析模型擬合情況,以及可對VIF值進行分析,判斷模型是否存在共線性問題【共線性問題可使用嶺回歸或者逐步回歸進行解決】;

② 寫出模型公式(可選);

③ 分析X的顯著性;如果呈現出顯著性(P值小於0.05或0.01);則說明X對Y有影響關係,接著具體分析影響關係方向;

④ 結合回歸係數B值,對比分析X對Y的影響程度(可選);

⑤ 對分析進行總結。

3 Logistic回歸

Logistic回歸分析也用於研究影響關係,即X對於Y的影響情況,此處涉及的Y值是定類數據。其與線性回歸分析區別在於,線性回歸分析的因變量Y屬於定量數據,而Logistic回歸分析的因變量Y屬於分類數據。

(1)Logistic回歸分類

結合Y值的具體情況,Logistic回歸分析共分為三種,分別是二元Logistic回歸分析,多元無序Logistic回歸分析和多元有序Logistic回歸分析。分類情況如下表所示。

Logistic回歸分類

在問卷研究中,二元Logistic回歸分析的使用頻率最高,該方法簡單易懂,多元無序Logistic回歸分析,或者多元有序Logistic回歸分析相對較為複雜,並且在具體分析時較難描述和理解。本部分僅對二元Logistic回歸分析進行說明。

(2)指標解讀1

結果表格
指標說明

分析步驟:

第一:首先對P值進行分析,如果該值小於0.05,則說明模型有效;反之則說明模型無效;

第二:AIC和BIC值用於多次分析時的對比;此兩值越低越好;如果多次進行分析,可對比此兩個值的變化情況,綜合說明模型構建的優化過程;

第三:其餘指標為中間計算過程值,基本無意義。

指標解讀2

結果表格
指標說明

這個表格用於研究X對於Y的影響關係情況,表格中有意義的指標信息包括:P值,回歸係數,OR值和R Pseudo R。其它指標包括標準誤,Z值,95%CI值意義相對較小。

二元Logit分析的步驟:

第一:對模型整體情況進行說明,比如對R方值進行描述,以及列出模型公式;

第二:逐一分析X對於Y的影響情況;如果X對應的P值小於0.05則說明X會對Y產生影響關係,此時可結合OR值進一步分析影響幅度。

第三:總結分析結果。

(3)其他說明

Y對應的數字一定只能為0和1;如果不是,可以使用『數據編碼』功能設置;如果模型預測準確率較低,需要多次進行分析對比,找出最優的模型結果;如果X是定類數據,此時需要對X進行虛擬(啞)變量設置。如果X的個數非常多(比如超過10個),此時需要進行甄別選擇出有意義的X(比如使用方差分析或者卡方分析,選出X與Y有顯著差異的X放入二元logit回歸模型中)。

更詳細的方法說明以及具體原理介紹,可查看SPSSAU官網,以及可使用SPSSAU上面的案例數據,進行實際的操作分析。

相關焦點

  • SPSSAU教程:全流程總結卡方檢驗,幫你理清分析思路
    如現狀調查類問卷,以及一般調查問卷中,常使用卡方檢驗對樣本背景信息題(性別、年齡等指標)與核心題項進行交叉分析,來說明樣本背景這類指標對核心變量是否存在影響。除了上述研究場景外,卡方檢驗還可用於研究配對數據的差異性,比如對同一組患者用兩種方法診斷癌症,看兩種方法的診斷結果是否有差異,則要使用配對卡方檢驗。
  • SPSSAU教程07:中介調節效應分析解讀
    中介效應和調節效應是一對比較容易混淆的概念,他們都與回歸分析有關,相比自變量因變量,中介變量和調節變量都屬於第三變量。研究者需要結合不同的數據分析方法對兩種關係進行分析。(3)Sobel檢驗Sobel檢驗是中介檢驗步驟中可能涉及到的一種檢驗,研究人員需要自行計算或者利用相關網站直接進行Sobel檢驗。
  • SPSSAU數據分析入門教學03:信效度分析指標
    另外兩者的研究對象不同:信度對象:答卷人 效度對象:題項3 指標解讀信度分析(1)指標解讀指標描述(1)校正的項總計相關性,也稱CITC值,比如某維度對應5個題項,那麼此5個題項之間的相關關係情況則使用此指標進行表示,通常此值大於0.4即說明某題項與另外的題項間有著較高的相關性
  • SPSS:相關係數在遊戲分析中的應用
    下圖是對相關係數的一個解讀。  憑藉著科技的力量進入了大數據時代,收集數據的能力也大大提高,分析師每天與這些「大」數據打交道。在遊戲行業,我們擁有成熟的AARRR模型,從獲客、活躍、流失和留存、收入到用戶傳播建立一個完美的閉環。除了常規指標,在分析過程中我們還會建立很多臨時指標來輔助分析。
  • SPSS教程11:相關分析與效度
    相關分析是回歸分析的前提條件,在具體的研究中,只有變量之間相關顯著,才有可能做進一步的回歸分析,這在中介作用檢驗中是必須的前提步驟。效度即是指數據測量的準確性。即測量結果的和所需要考察的內容的吻合度。一般在做研究時,要報告自己數據的信效度以確定接下來一系列研究是否可信可行。在統計學中,有很多種測量效度的標準和方法,比如效標效度、聚合(收斂)和區分效度、結構效度。
  • 值得一看:因子分析實例分析_SPSSAU實用教程
    信息濃縮:將多個分析項濃縮成幾個關鍵概括性指標。比如將多個問卷題濃縮成幾個指標。如果偏重信息濃縮且關注指標與分析項對應關係,使用因子分析更為適合。權重計算:利用方差解釋率值計算各概括性指標的權重。大於0.6說明適合進行因子分析,反之,說明不適合進行分析。同時Bartlett檢驗對應P值小於0.05也說明適合進行因子分析。根據上表可知,KMO為0.748,大於0.6,滿足因子分析的前提要求,意味著數據可用於因子分析研究。以及數據通過Bartlett 球形度檢驗(P<0.05),說明研究數據適合進行因子分析。
  • 第二十二章 相關回歸分析
    第二十二章 相關回歸分析   提要 相關回歸的意義,原理;小樣本的直線相關和回歸分析;相關係數和回歸係數的意義及假設檢驗;應用直線相關和回歸分析時的注意事項。   在醫學上,許多現象之間都存在著相互聯繫,例如身高與體重,體溫與脈搏,年齡與血壓,釘螺與血吸蟲感染等。
  • 回歸模型中,定類數據如何正確分析?
    在進行回歸分析時,常常會遇到因變量除了受到定量數據的影響外,同時也受到定類數據的影響。例如,性別、職業、婚姻狀況等,這些定類數據無法直接被度量,但又必須要考慮這些變量對模型的影響。分析時,要注意少放入一個虛擬變量。如果分為兩類就放入一個虛擬變量,三類就放入兩個,沒有放入的作為參考項用於對比分析。如何分析構建線性回歸模型的任務之一就是分析自變量對因變量的影響程度, 一般是通過自變量的回歸係數來解釋影響程度。
  • 相關分析在遊戲中的應用
    除了常規指標,在分析過程中我們還會建立很多臨時指標來輔助分析,面對這麼多統計的數據,我們會好奇這些指標或者變量之間是否存在某種相關性,以及相關程度如何,這就用到我們今天要分享的內容——相關分析。在統計學上,用相關係數來描述變量之間的關係,相關係數的符號(+/-)表明關係的方向(正相關/負相關),其值的大小表示關係的強弱程度。下圖是對相關係數的一個解讀。
  • 方差分析常見問題匯總,你想知道的都在這裡
    本文以SPSSAU系統為例,針對方差分析的常見問題進行匯總說明。關於方差分析的分析思路及相關操作可閱讀連結文章:SPSSAU:全流程總結方差分析,只看這篇就夠了。①問題一:t檢驗與方差分析的區別?方差齊是方差分析的前提,方差分析前一般需要對數據進行方差齊性檢驗。當方差齊檢驗沒有呈現出顯著性(即P>0.05),可使用方差分析。當方差齊檢驗呈現出顯著性,即說明不同組別的數據波動不一致,方差不齊。
  • 範例分析:一元(簡單線性)相關與回歸分析
    基礎準備前面以兩變量的簡單線性相關與回歸分析為例,分篇幅介紹了以下內容:相關與回歸分析基礎;一元
  • TalkingData:相關分析在遊戲中的應用
    除了常規指標, 在分析過程中我們還會建立很多臨時指標來輔助分析。面對這麼多統計的數據, 我們會好奇這些指標或者變量之間是否存在某種相關性,以及相關程度如何,這 就用到我們今天要分享的內容——相關分析。在統計學上,用相關係數來描述變量之間的關係,相關係數的符號(+/-)表 明關係的方向(正相關/負相關),其值的大小表示關係的強弱程度。下圖是對相關 係數的一個解讀。
  • SPSSAU描述性分析指標如何選擇?
    對於定量數據,比如量表評分(非常不滿意,不滿意,非常滿意等)或者身高體重的值,可以通過描述性分析,計算數據的集中性特徵和波動性特徵等。在數據分析的時候,一般首先要對數據進行描述性分析,再選擇進一步分析的分析方法。
  • 【小工具教程】NMR回歸分析
    用途將計算的核磁(NMR)數據與實驗數據做回歸分析,判斷化合物結構或相對構型。
  • SPSS案例實踐:多重線性回歸分析
    因變量犯罪率連續數值變量,有多個自變量,從研究目標和數據類型來看,可選用多重線性回歸分析。線性關係初步判斷線性回歸要求每個自變量和因變量之間存在線性關係,可以依靠相關分析和散點圖來初步判斷。除因變量外其他因素兩兩間相關係數均在0.7以下,因素間沒有強相關關係存在,初步提示共線性問題較弱。以上分析表明,並不是所有因素都有犯罪率存在明顯線性關係,如果我們構建多重線性回歸,這可能涉及到自變量篩選的問題,可優先選擇逐步回歸的方法。
  • 相關和回歸—SPSS多重線性回歸
    定義模型(確定研究問題、定義變量)⇒適用條件檢驗假設⇒自變量篩選⇒模型和偏回歸係數假設檢驗⇒殘差分析⇒強影響點、高槓桿值和離群點判斷⇒多重共線診斷⇒結論,具體可以查看下面兩個教程,講的比較仔細。如果自變量和因變量不滿足線性關係,可對變量進行線性轉換(曲線直線化)或者採用非線性回歸。我們首先驗證了自變量、因變量知否存在線性關係,至於多重線性回歸模型其他適用條件,在後續SPSS建模中逐步驗證,SPSS建立多重線性回歸模型步驟如下:第一步:分析⇒回歸⇒線性
  • ——相關分析教你關鍵秘訣
    (顯著性的表達:相關係數的右上角有1個*號表示變量在0.05水平下顯著,2個*號表示變量在0.01水平下顯著)相關分析是回歸分析的前提條件,首先需要保證有相關關係,接著才能進行回歸影響關係研究。因為如果都顯示沒有相關關係,是不可能有影響關係的。
  • 你知道回歸分析的本質是什麼嗎?別稀裡糊塗做回歸分析了!
    這就是統計分析的本質,從表面看,它在探討差異性,在研究相關性,實際上它就是在探討變異的來源,解釋為什麼發生了變異,當探明變異來原因某一個變量,那麼這個變量就結局變量存在著相關,這個變量的不同組別之間在結局指標上存在著統計學差異。t、F、卡方、秩和、相關分析無不在探討變異的來源,回歸分析更是如此。
  • spss線性回歸自變量因變量專題及常見問題 - CSDN
    前2個假設可根據試驗設計直接判斷;假設(3)的檢驗在之前的教程中已有呈現,點擊「檢驗方法」即可查看。關於假設(4)的檢驗方法如下:1. 點擊 分析 → 回歸 → 線性。2.將pH等自變量選入自變量框,將產量選入因變量框,點擊統計。3.在統計窗口選擇共線性診斷,點擊繼續,然後再主頁面點擊確定即可。
  • 線性回歸分析思路總結!簡單易懂又全面!
    Step4:散點圖和相關分析一般來說,回歸分析之前需要做相關分析,原因在於相關分析可以先了解是否有關係,回歸分析是研究有沒有影響關係,有相關關係但並不一定有回歸影響關係。當然回歸分析之前也可以使用散點圖直觀查看數據關係情況等。