SPSS統計分析案例:相關分析之kendall係數

2021-03-06 SPSS統計訓練營

SPSS統計訓練營是一個自學平臺,以詳實統計案例教程為基礎,配套練習使用的原始數據,方便讀者自己實踐,致力於讓數據科學學習簡單有趣高效。發起人數據小兵,資深數據分析師,SPSS套件愛好者,願與科研工作者、行業數據分析者學習交流,歡迎訂閱。

相關分析中最為常用的是pearson相關係數,嚴格來說它有自己的適用性,數據最好是正態分布且為連續型的數值,比如一個班級男生的身高數據和體重數據。

在現實中,並不是所有的分析數據都能滿足這樣的條件,對於一些分類型的數據,或者明顯不是正態分布的數據,pearson相關係數是不合適的。此時有另外兩個係數可用,它們分別是spearman和kendall相關係數。

今天的案例是學習一下kendall相關。

現在有一組銀行職員的調查數據,我們想考察一下職員們的工資(salary)和受教育程度(educ)、職務等級(jabcat)之間的關係。其中educ和jabcat均為有序分類變量。

我們在數據文件的數據視圖下,依次打開【分析】→【相關】→【雙變量】菜單。

將工資、職務等級、教育程度三個變量從變量列表中移入右側的變量框內。勾選肯德爾tau-b係數,勾選標記顯著性。點擊【確定】按鈕,軟體即開始執行相關分析過程。

來看結果:

kendall相關係數表如上。工資與教育程度、職務等級的kendall係數分別為0.554和0.53(中等相關的一個水平),不相關的概率幾乎為0(通過顯著性檢驗),說明工資與教育程度和職務等級有關。

那麼工資與教育程度,工資與職務等級各分類水平的走勢如何呢?我們可以通過一個簡單的線形態可以看出來。

可以看到,接受教育年限多的職工相對來說有比較高的工資,工資內部職務等級尤其是在manager這個級別,工資明顯高於其他較低職位。

還有另外一個相關關係,受教育程度與企業職務等級是不是有關係呢?它們是兩個有序分類的變量,kendall係數0.415,不相關的概率也是幾乎為零,從這個角度說明二者也存在相關的關係。

文=數據小兵

案例數據=選自《SPSS for win統計分析》

閱讀原文了解本號課程

相關焦點

  • SPSS:Kendall相關分析
    1)建立數據文件kendall1.sav,變量名為value(分子量數值)、excrete(排洩量佔投藥量%)。2)選擇【Analyze】→【Correlate】→【Bivariate...】,可打開Bivariate Correlations(雙變量相關分析)主對話框。Variables(變量)為value(分子量數值)、excrete(排洩量佔投藥量%)。
  • 用SPSS進行相關分析的典型案例
    相關分析,兩個變量之間密切程度的一種常見統計分析方法,能夠簡單有效說明兩變量間存在什麼關係,這些關係的常見描述語句有:線性相關、正相關、負相關等
  • 相關係數計算(Spearman,Pearson,Kendall)
    Spearman相關係數又稱秩相關係數,是利用兩變量的秩次大小作線性相關分析,對原始變量的分布不作要求,屬於非參數統計方法,適用範圍要廣些。斯皮爾曼等級相關是根據等級資料研究兩個變量間相關關係的方法。它是依據兩列成對等級的各對等級數之差來進行計算的,所以又稱為「等級差數法」斯皮爾曼等級相關對數據條件的要求沒有積差相關係數嚴格,只要兩個變量的觀測值是成對的等級評定資料,或者是由連續變量觀測資料轉化得到的等級資料,不論兩個變量的總體分布形態、樣本容量的大小如何,都可以用斯皮爾曼等級相關來進行研究
  • SPSS因子分析案例
    所以,有必要確定綜合評價指標,便於對比。因子分析是一個不錯的選擇,5 個指標即為我們分析的對象,我們希望從這5個可觀測指標中尋找出潛在的因素,用這些具有綜合信息的因素對各地區進行評價。下圖是spss因子分析的操作界面,主要包括5方面的選項,變量區只能選擇數值型變量,分類型變量不能進入該模型。
  • 如何選用Pearson、Spearman、Kendall三大相關係數
    說到相關分析,很多人會馬上拿出皮爾遜Pearson相關係數,從不論數據是不是符合適用條件,甚至完全不了解Pearson相關係數還有假設條件這回事。常見的相關係數有三種,它們分別是Pearson、Spearman、Kendall係數,世人兼知pearson係數,冷淡了另外兩個。
  • 相關性分析在SPSS中的具體操作,一文讀懂相關係數的含義及使用——【醫學和生物統計】
    相關性分析介紹生物和醫學統計中,相關分析屬於流程前端的探索性分析,研究變量間關係及性質
  • SPSS分析技術:Pearson相關、Spearman相關及Kendall相關
    根據數據種類的不同(定距、定序和定類),它們又有不同的分析方法。可以通過下面的思維導圖幫助記憶:常用的相關性分析包括:皮爾遜(Pearson)相關、斯皮爾曼(Spearman)相關、肯德爾(Kendall)相關和偏相關。下面介紹前三種相關分析技術,並用實際案例說明如何用SPSS使用這三種相關性分析技術。
  • SPSS:相關係數在遊戲分析中的應用
    面對這麼多統計的數據,我們會好奇這些指標或者變量之間是否存在某種相關性,以及相關程度如何,這就用到我們今天要分享的內容——相關分析。  在統計學上,用相關係數來描述變量之間的關係,相關係數的符號(+/-)表明關係的方向(正相關/負相關),其值的大小表示關係的強弱程度。下圖是對相關係數的一個解讀。
  • 數據分析之主成分分析,spss主成分分析實例
    主成分分析方法能夠解決以上問題,主成分分析法是一種降維的統計方法,是考察多個變量間相關性一種多元統計方法。二、spss主成分分析操作流程導入數據。將已有數據整理後導入spss導入數據主成分分析操作流程。
  • 數據分析基礎相關性分析,SPSS實操
    pearson簡單相關係數二元定距變量的相關分析---pearson簡單相關係數---t統計量服從n-2個自由度的t分布。距離相關分析可用於同一變量內部各個取值間,以考察其相互接近程度;也可用於變量間,以考察預測值對實際值的擬合優度。距離相關分析根據統計量不同,分為以下兩種。 不相似性測量:通過計算樣本之間或變量之間的距離來表示。 相似性測量:通過計算Pearson相關係數或Cosine相關來表示。
  • 基本數據統計分析--spss
    在數據分析工作中,描述性統計分析是我們日常使用率最高的,主要的基本統計分析維度包括但不限於均值、 中位數、眾數、方差、百分位、頻數、峰度、偏度、探索分析、交叉聯列表分析、多選項分析、基本統計報表製作等。而這些功能操作在spss中是可以直接使用的。當然我們也需要理解相關定義。
  • [空間分析]玖·地理統計 相關分析
    終於結束了統計基礎知識一系列的內容,今天從相關分析開始,從今天起就涉及 R 和 Python 實戰和可視化,不管分析結果怎麼樣,起碼圖必須得看的順眼對吧。今天談相關分析中的三大基本相關:Pearson、Spearman、Kendall 相關分析和偏相關。字數有點多。了解的同學可以直接到代碼實現和可視化。
  • Pearson、Spearman、Kendall、Polychoric、Polyserial相關係數簡介及R計算
    首先簡介常見的用於描述變量間相關性的係數,包括Pearson、Spearman、Kendall、Polychoric、Tetrachoric、Polyserial、(Point-)Biserial等。  Pearson相關係數(皮爾森相關)是使用最廣泛的相關性統計量,用於測量兩組連續變量之間的線性關聯程度。
  • 五大相關係數簡介及R計算:Pearson、Spearman、Kendall、Polychoric、Polyserial
    首先簡介常見的用於描述變量間相關性的係數,包括Pearson、Spearman、Kendall、Polychoric、Tetrachoric、Polyserial、(Point-)Biserial等。  Pearson相關係數(皮爾森相關)是使用最廣泛的相關性統計量,用於測量兩組連續變量之間的線性關聯程度。
  • SPSS統計分析案例:一元線性回歸
    微信號後臺有非常之多的關於回歸分析的留言,作為最常見的統計分析方法,在工作生活中的應用需求量巨大,這兩天已經為大家選好了案例數據,先從一元線性回歸分析開始。一元線性回歸,顧名思義,僅有一個自變量的回歸模型,研究的是一個因素對結果的影響,可以用於預測,也經常被稱之為簡單線性回歸分析。
  • R語言 | Pearson、Spearman、Kendall、Polychoric、Polyserial相關係數簡介及R計算
    首先簡介常見的用於描述變量間相關性的係數,包括Pearson、Spearman、Kendall、Polychoric、Tetrachoric、Polyserial、(Point-)Biserial等。  Pearson相關係數(皮爾森相關)是使用最廣泛的相關性統計量,用於測量兩組連續變量之間的線性關聯程度。
  • SPSS統計分析案例:對應分析
    兩個分類變量間的關係,無法直接使用常見的皮爾遜相關係數來表述,多採用頻數統計、交叉表卡方檢驗等過程進行處理,當分類變量的取值較多時,列聯表頻數的形式就變得更為複雜
  • SPSS統計分析案例:多項logistic回歸分析
    小兵博客幾年前分享的二項logistic回歸分析案例非常受歡迎,在實際應用中,可能還會碰到因變量是多個分類的情況,並且不包含排序信息。比如視力分為輕度、中度、重度三個水平,此時如果想考察影響視力評價的指標,常用的二項logistic回歸已經無法勝任。幸好,SPSS軟體為我們提供了多項logistic回歸。
  • SPSS統計:單因素方差分析與單變量方差分析
    在spss統計分析中,方差分析在比較均值菜單和一般線性模型菜單中都可以做,單因素方差分析一般稱為單因素
  • SPSS: Pearson相關分析
    ☆Variables(變量)列表,選擇2個及以上進行雙變量相關分析變量,本例為x1(髂前上棘間徑)、x2(髂脊間徑)、x3(恥骶外徑)、x4(坐骨節間徑)。☆Correlation Coefficients(相關係數)。□Pearson(Pearson相關係數),又稱積矩相關係數,適用於連續分布或正態分布變量,本例選擇此項。