SPSS統計訓練營是一個自學平臺,以詳實統計案例教程為基礎,配套練習使用的原始數據,方便讀者自己實踐,致力於讓數據科學學習簡單有趣高效。發起人數據小兵,資深數據分析師,SPSS套件愛好者,願與科研工作者、行業數據分析者學習交流,歡迎訂閱。
相關分析中最為常用的是pearson相關係數,嚴格來說它有自己的適用性,數據最好是正態分布且為連續型的數值,比如一個班級男生的身高數據和體重數據。
在現實中,並不是所有的分析數據都能滿足這樣的條件,對於一些分類型的數據,或者明顯不是正態分布的數據,pearson相關係數是不合適的。此時有另外兩個係數可用,它們分別是spearman和kendall相關係數。
今天的案例是學習一下kendall相關。
現在有一組銀行職員的調查數據,我們想考察一下職員們的工資(salary)和受教育程度(educ)、職務等級(jabcat)之間的關係。其中educ和jabcat均為有序分類變量。
我們在數據文件的數據視圖下,依次打開【分析】→【相關】→【雙變量】菜單。
將工資、職務等級、教育程度三個變量從變量列表中移入右側的變量框內。勾選肯德爾tau-b係數,勾選標記顯著性。點擊【確定】按鈕,軟體即開始執行相關分析過程。
來看結果:
kendall相關係數表如上。工資與教育程度、職務等級的kendall係數分別為0.554和0.53(中等相關的一個水平),不相關的概率幾乎為0(通過顯著性檢驗),說明工資與教育程度和職務等級有關。
那麼工資與教育程度,工資與職務等級各分類水平的走勢如何呢?我們可以通過一個簡單的線形態可以看出來。
可以看到,接受教育年限多的職工相對來說有比較高的工資,工資內部職務等級尤其是在manager這個級別,工資明顯高於其他較低職位。
還有另外一個相關關係,受教育程度與企業職務等級是不是有關係呢?它們是兩個有序分類的變量,kendall係數0.415,不相關的概率也是幾乎為零,從這個角度說明二者也存在相關的關係。
文=數據小兵
案例數據=選自《SPSS for win統計分析》
閱讀原文了解本號課程