SPSS中的「相關」分析

2021-02-13 一起學統計工具

本文摘自電子工業出版社《SPSS常用統計分析教程(SPSS 22.0中英文版)(第4版)》。

SPSS中有多個模塊中的多個指標反映變量間相關或關聯程度,現簡單介紹如下:

一、相關分析有關統計量及意義

(一)兩個計量資料的相關分析

1、Pearson 相關係數

最常用的相關係數,又稱積差相關係數,該係數的計算和檢驗為參數方法。r介於-1與1之間,r的正負值表示兩變量之間線性關係的方向,即r>0為正相關、r<0為負相關、r=0為零相關。r的絕對值大小則表示兩變量之間線性相關的密切程度,|r|越接近0,說明密切程度越低。r=0時,也可能會存在非線性關係,可通過散點圖來確定。Pearson相關係數不適合描述兩變量的非線性關係。適用條件如下:

(1)兩變量呈直線相關關係,如果是曲線相關可能不準確。

(2)極端值會對結果造成較大的影響。

(3)兩變量符合雙變量聯合正態分布。

2、Spearman 等級相關係數

可用於描述兩個等級變量間關聯程度與方向,其相關係數用rs表示。這類方法對原變量的分布不作要求,屬於非參數統計方法,可用於不服從正態分布或不知道總體分布類型的連續性數據、結果不能用具體數字表示、半定量數據或等級資料的相關分析。檢驗效能較 Pearson 係數低。Spearman等級相關係數rs,rs介於-1與1之間,即rs>0為正相關、rs<0為負相關、rs=0為零相關。

4、偏相關

偏相關係數(partialcorrelation coefficient)在控制一個或多個附加變量的效應後,描述兩變量間線性關係(linear relationship)。

3、距離相關

測量兩個連續變量間的相似性(數值越大表示距離越近)或相異性(數值越大表示距離越遠)。

4、各種相關矩陣

在SPSS的多個模塊中都可以計算各種相關矩陣,如因子分析中,可計算相關矩陣行列式及逆矩陣、包含反影像的再生相關矩陣等。

二)有序分類(雙向有序)資料的相關

兩個變量均為有序變量的情況,即雙向有序資料。有序分類變量的相關性又稱為一致性,即行變量等級高的列變量等級也高,如果行變量等級高而列變量等級低,則稱為不一致,均為非參數相關。

1、Kendall相關係數τb

係數符號表示關聯方向,絕對值表示關聯強度,絕對值越大則表示關聯程度越強。係數值介於-1至1之間,但係數值-1和1隻能在正方表(square table)中獲得。

1、Kendall相關係數τc

係數符號表示關聯方向,絕對值表示關聯強度,絕對值越大則表示關聯程度越強,係數值介於-1至1之間,但係數值-1和1隻能在正方表中獲得。

3、γ係數

γ法是兩個有序變量的相聯度量,γ係數G介於-1至1之間,G的絕對值越接近1時,表示兩個變量間的關聯程度越大,其絕對值越接近0,兩變量間的關聯程度越小。對於2維交叉表計算零階γ係數(zero-order Gamma),3維或高維交叉表則計算條件γ係數(conditional gamma)。

4、Somers d統計量

兩個有序變量間的相聯度量,介於-1至1之間,絕對值接近1時,表示兩個變量之間存在緊密的關係,接近0時表示關係很弱或沒有關係。

(三)名義(雙向無序)資料的相關

對於行變量和列變量均為名義數據(nominal data)(無內在順序,如工人、農民等)的情況,即雙向無序資料,

1、列聯繫數

屬於獨立性卡方檢驗,可用於描述兩個分類變量之間的關聯程度,係數值介於0至1之間,係數值越接近0,說明兩個分類變量幾乎沒有關係,越接近1,說明關係越密切。

2、Φ係數和Cramer V係數

Φ係數和Cramer V係數均屬於獨立性卡方檢驗,可用於描述兩個分類變量之間的關聯程度,係數值越接近0,說明兩個分類變量幾乎沒有關係,越接近1,說明關係越密切。Φ係數只適用於四格表資料,對於多行多列資料,只能採用Cramer V係數和列聯繫數。

3、Lambda(λ統計量)

反映用自變量值預測因變量值時誤差成比例降低程度的相聯度量,1表示自變量能完全地預測因變量,0表示自變量對於預測因變量沒有幫助。

4、不確定係數

表示用一個變量值預測其他變量值時,誤差成比例降低程度的相聯度量,可計算對稱或不對稱不確定係數。如不確定係數為0.83表示如果知道一個變量值,那麼在預測其他變量值時會將誤差降低83%。

5、優勢比和相對危險度

OR、RR 也是衡量兩變量之間的相關程度的指標。

(四)名義資料與計量資料(單向有序)的相關

1、η係數

介於0至1之間的相聯度量,0表示行變量(rowvariable)和列變量(columnvariable)間無關聯性,接近1表示高度關聯。係數適用於因變量為間隔尺度(interval scale)資料(等距資料),如收入等,自變量為有限數字的分類資料(如性別)。

(五)配對二分變量或等級資料的相關

1、Cohen κ係數

內部一致性係數,用於描述同一批研究對象兩次定性觀測結果的一致性,κ值考慮了機遇因素對一致性的影響。κ值僅可用正方表(m×m)資料,即兩個變量具有相同分類值及分類數。κ介於-1至+1之間,一般認為,κ≤0.4,一致性較差;0.4<κ<0.75,一致性較好;κ≥0.75,一致性好,係數值最好接近0.90;κ<0時,一致性比偶然預期的還要弱,不過這種情況很少發生。

2、McNemar檢驗

二值變量(binary variable)的配對卡方檢驗。可用於對照組和處理組或實驗幹預前後的頻數或比率是否有差異。配對資料變量的分類分為兩類,如「是」或「否」,「陽性」或「陰性」,「有反應」或「無反應」。對於大正方表(R×R表,R≥2)將進行對稱性McNemar-Bowker檢驗(McNemar-Bowker test of symmetry)。

(六)多個變量間的相關

1、Kendall W檢驗

該方法屬於協調分析,W統計量又稱協調係數(coefficientof concordance),表示多個指標間相互關聯的程度,常用於評價不同評分者評分的一致性程度。每個個案是一名裁判員或評分者,每個變量是被裁判的一個指標或一個人。Kendall W統計量的範圍介於0(完全不一致)到1(完全一致)之間。

2、Cochran Q檢驗

該方法與Friedman檢驗相同,是McNemar檢驗向多樣本情況的延伸,用於檢驗完全隨機區組設計的二分變量是否具有相同平均值的假設,Cochran's Q統計量是近似卡方分布的。

(七)兩組變量(多個變量與多個變量)間的典型相關

典型相關分析(CanonicalCorrelation Analysis)又稱正則相關分析或典則分析,是研究兩組指標(變量)間的一種多變量統計分析方法,其目的是尋找一組指標的線性組合與另一組指標的線性組合,使兩者之間的相關達到最大(即兩組典型變量的相關達最大值)。這兩組指標多半是相同研究對象有關係的兩組不同指標。這兩組典型變量彼此之間的最大相關就是第1個典型相關,而線性組合的係數稱為典型相關係數。接著典型相關分析將繼續尋找第2組典型變量(與第1組無關聯),以生成第2高的相關。典型相關分析會如此重複迭代尋找典型變量,直到配對的典型變量數等於兩組原始變量中個數較少的那一個數時才停止。

還有還有,就是時間序列分析中自相關和交叉相關,還有很多很多……,就不再贅述了。

二、SPSS常用操作

1、交叉表分析



2、雙變量相關



3、偏相關



4、距離相關



5、兩相關樣本非參數檢驗



6、多個相關樣本的非參數檢驗


7、典型相關分析

【「一起學SPSS」傾情整理統計學習資源包】

內含《SPSS常用統計分析教程(SPSS 22.0中英文版)(第4版)》配套免費電子書及數據文件;各種統計及數據管理免費軟體;「一起學SPSS」歷史文章打包下載;各種統計學習素材。(不定期更新)

註:資源包提供部分免費工具和試用版軟體下載,但不提供盜版軟體。見諒!

【資源包下載方法】

1、分享本文至朋友圈。

2、把分享截圖發給微信訂閱號「一起學SPSS」。

3、回復關鍵詞SPSS即可獲取下載地址。

回復「key」可獲取訂閱號文章目錄。

郵箱:mchgz@163.com



《SPSS常用統計分析教程(SPSS 22.0中英文版)(第4版)》介紹請點擊「閱讀原文」。

↓↓↓

相關焦點

  • 基本數據統計分析--spss
    在數據分析工作中,描述性統計分析是我們日常使用率最高的,主要的基本統計分析維度包括但不限於均值、 中位數、眾數、方差、百分位、頻數、峰度、偏度、探索分析、交叉聯列表分析、多選項分析、基本統計報表製作等。而這些功能操作在spss中是可以直接使用的。當然我們也需要理解相關定義。
  • spss怎麼分析因子?spss因子分析法詳細步驟
    spss不僅可以分析主成分 ,還可以分析因子哦,但是很多朋友不知道spss怎麼分析因子?小編下面有一個spss因子分析法詳細步驟哦,只要大家按照spss因子分析法詳細步驟一步步操作就知道spss怎麼分析因子了哦,下面就和小編一起來看看吧!
  • 數據分析之主成分分析,spss主成分分析實例
    主成分分析方法能夠解決以上問題,主成分分析法是一種降維的統計方法,是考察多個變量間相關性一種多元統計方法。二、spss主成分分析操作流程導入數據。將已有數據整理後導入spss導入數據主成分分析操作流程。點擊分析—降維—因子分析
  • 數據分析基礎相關性分析,SPSS實操
    一般根據研究的目的不同、或變量的類型不同,採用不同的相關分析方法。 常用的相關分析方法:二元定距變量的相關分析、二元定序變量的相關分析、偏相關分析和距離相關分析等。spss相關性分析操作流程三、總結相關分析即是用適當的統計指標來衡量事物之間,以及變量之間線性相關程度的強弱。
  • spss主成分怎麼進行分析?spss主成分分析法步驟
    spss 這款軟體功能非常多哦,還可以分析主成分哦,但是很多朋友不知道spss主成分怎麼進行分析?小編下面準備了spss主成分分析法詳細步驟,大家安裝 詳細步驟一步步操作就知道spss主成分怎麼進行分析?
  • SPSS因子分析案例
    【二、簡單實例】現在有 12 個地區的 5 個經濟指標調查數據(總人口、學校校齡、總僱員、專業服務、中等房價),為對這 12 個地區進行綜合評價,請確定出這 12 個地區的綜合評價指標。【三、解決方案】1、spss因子分析同一指標在不同地區是不同的,用單一某一個指標難以對12個地區進行準確的評價,單一指標智能反映地區的某一方面。
  • spss是什麼軟體?spss軟體是用來做什麼的?
    很多人看到有人在用spss,好奇spss是什麼軟體?spss是用來做什麼的? spss是一個非常好用的統計分析軟體, spss用於統計學分析運算、數據挖掘、預測分析和決策支持任務的軟體產品及相關服務軟體哦,下面小編就來詳細介紹一下吧!
  • 學會spss就能找到數據分析工作嗎
    現在真正需要用到spss進行分析了,我卻看不懂老闆給的數據和分析要求,難道這就是理論與實際的脫節嗎?不敢去問我的上司,具體要怎麼操作,我怕給他留下一個不靠譜的印象,我只好去問一個辦公室的師姐。她比我早兩年入職,儼然已經是辦公室裡的熟練工,幸好還有同校同專業的她在。
  • 「spss數據分析系列」t檢驗
    一、t統計量及t檢驗本人介紹spss數據分析中的t檢驗,我們平時分析數據時經常對比均值,其中兩分類的均值對比採用的t檢驗,這裡強調一下的是兩分類的對比,其他還有獨立樣本t檢驗,配對t檢驗,我們在下面spss軟體部分再做說明
  • 關於SPSS因子分析的幾點總結
    一、因子分析與主成分分析的區別關於這個問題,見諸各大論壇、博客,還有百度知道等欄目,這裡引用期刊論文中的文字加以說明。1、主成分分析:是研究如何通過少數幾個主成分來解釋多變量的方差一協方差結構的分析方法,也就是求出少數幾個主成分(變量),使它們儘可能多地保留原始變量的信息,且彼此不相關。
  • spss聚類分析步驟
    spss是一個非常好用的統計分析軟體,spss有一個聚類分析的功能哦,但是很多人不知道spss聚類分析功能怎麼使用?spss聚類分析是一個將case分析的數據的功能哦 spss聚類分析使用步驟教程: 1、依次點擊:analyse--classify--hierarchical cluster,打開分層聚類對話框。如圖1所示
  • spss聚類分析功能怎麼使用?spss聚類分析教程
    spss 是一個非常好用的統計分析軟體,spss有一個聚類分析的功能哦,但是很多人不知道spss聚類分析功能怎麼使用?spss聚類分析是一個將case分析的數據的功能哦,下面小編就來告訴大家spss聚類分析使用教程吧!
  • 主成分回歸分析在SPSS中的實現
    今晚講「主成分回歸在SPSS中的應用」,準備好喔,要放大招了~ 分析—描述統計—描述,將需要進行標準化處理自變量選入變量框,如果要作回歸分析,則也需要將因變量選入變量框。經過處理的數據符合標準正態分布,即均值為0,標準差為1,也是spss中最常用的標準化方法。
  • SPSS方差分析方法與實例演練
    在數據分析過程中,為了進行兩組以上均數的比較,往往可以使用方差分析方法。那麼我們一起了解一下方差分析基本概念、 單因素方差分析、 多因素方差分析及協方差分析;同時在spss中的操作演練。在spss中經常使用方差齊性檢驗(都是levene檢驗),一般情況下,只要sig值大於0.05就可以認為方差齊性的假設成立,因此方差分析的結果應該值得信賴;如果sig值小於或等於0.05,方差齊性的假設就值得懷疑,導致方差分析的結果也值得懷疑。
  • 「spss數據分析系列」卡方檢驗-2x2
    前面的t檢驗都是對均值的分析,這類分析主要是針對於連續性變量,比如身高,溫度,降雨量等,但是如果針對於分類變量的差異分析怎麼分析呢,這裡就用到了我們所說的卡方檢驗,但是卡方檢驗對應的情況有很多種,這裡我將第一種,就是2x2的表格,2x2意思就是兩個變量都是2分類的變量。
  • SPSS:相關係數在遊戲分析中的應用
    下圖是對相關係數的一個解讀。  憑藉著科技的力量進入了大數據時代,收集數據的能力也大大提高,分析師每天與這些「大」數據打交道。在遊戲行業,我們擁有成熟的AARRR模型,從獲客、活躍、流失和留存、收入到用戶傳播建立一個完美的閉環。除了常規指標,在分析過程中我們還會建立很多臨時指標來輔助分析。
  • SPSS數據分析心得小結分享
    文章來源:經管之家(ID:jgjgedu)作者:徐定德學習數據分析之spss分析工具,可真的不是一般的功夫,真的要很認真和很細心才能做得好spss。下面我來和大家分享一下關於SPSS數據分析心得小結,希望大家從這數據分析心得分享中能得到一些啟示和指導。拿到一份數據,或者在看到國內外某個學者的文章有想法而自己手裡的數據剛好符合這個想法可以做時,在整理好數據後不要急於建模。一定要對數據做缺失值處理、異常值處理。
  • 數據分析難?教你spss使用的正確姿勢
    軟體不會用,各種數據傻傻搞不清楚,尤其是怎麼分析數據更是暈頭轉向,當然跟著靠譜的老師學習,一邊看實操一邊自己做,這樣肯定事半功倍。本次我們整理出了spss的數據分析教程,都是有實操的,只要跟著做,絕對沒問題!
  • spss代做風口不再,stata代做才是未來?
    ,相關分析,回歸分析,穩健性檢驗等 軟體 STATAT1901397量化選股和擇時 (望能對口量化方向)軟體要求:RT1901398據描述性統計,相關分析,回歸分析,穩健性檢驗等 軟體 STATAT1901397量化選股和擇時 (
  • SPSS:Kendall相關分析
    11.1.2 Kendall相關分析〖例11-2〗現有一些環狀化合物的分子量與用藥後大白鼠24 小時膽汁排洩量資料,見表11-1,試問分子量數值(value)與膽汁排洩量(excrete)有無相關關係?