上周SPSSAU做了一個小調查,結果讓我們十分意外。得到最多的反饋是大家對於常見分析方法,不知道如何選擇,如何分析。
雖說越實用的方法,往往也越簡單。但剛開始接觸數據分析時,確實就是會因為一些奇奇怪怪的術語不理解,讓大家產生很難懂學不會的挫敗感。
為了幫大家快速度過新手期, 我們整理了一份常見分析方法的流程總結。
其中包括每種分析方法的分析流程,以及每個環節中可能出現的問題及應對方法。不會分析的同學可以按照圖中的流程一步步操作,就能得到準確可靠的結果。
本文將介紹的是相關分析的分析流程,即SPSSAU通用方法中的「相關」。
為了便於理解,我們先簡單介紹下相關分析,然後按照分析流程順序,對每一步可能會涉及的問題進行簡要說明。
相關分析
我們使用相關分析,通常是在研究兩個變量的相關性情況,包括是否有關係,以及關係緊密程度等。比如聽課質量和學習成績的關係;員工敬業度與薪資的相關性等。
1. 數據類型
相關分析的適用範圍很廣,理論上講,凡是考察變量間相關性的,都可以叫做相關分析。
但依據習慣,我們通常說的相關分析,多指的是兩個定量數據之間的簡單相關分析,這就要求兩個變量都是定量數據,即選項數字大小要可比較,且有實際意義。
如果兩個數據均為定類數據時,則不可以直接用相關分析,而應該使用卡方分析測量相關性(準確說應該是差異分析)。
如果一個是定類數據,一個是定量數據,則應該使用方差分析。
這種誤用常見於分析背景信息題與核心研究題項的相關情況。
2. 正態性
相關分析要求數據服從正態分布,因此分析前需要檢驗數據的正態性。
正態性有多種檢驗方法,常見方法如:正態圖、正態性檢驗、P-P圖/Q-Q圖等。正態性的判斷標準可以查看之前的推送:多種判斷正態性的方法詳細說明
由於相關分析對正態性要求比較寬鬆,即使違反計算結果也比較穩健,只要數據基本滿足正態即可。如果數據完全不正態,則可以用Spearman相關係數。
3. 查看線性趨勢
當兩個定量數據在散點圖上的散點呈現直線趨勢時,就可以認為兩者存在直線相關趨勢,這也是相關分析的一個基本前提。
例如上圖,當X增大時,可以比較明顯地看出Y會隨著增大,說明X和Y之間有著正向相關關係。如果是負相關,散點圖會呈現隨著一個變量值的增加,另一個變量值降低的趨勢。
非線性關係
如果數據呈現非線性的趨勢,可以選擇對變量進行數據轉換(如對數轉換),或是使用Spearman相關係數進行分析。
4. 檢驗異常值
相關分析對極端值較為敏感,異常值會影響分析結果。需要在分析前查看是否存在異常值,保證結果的可靠性,此步可以和上一步一起通過散點圖查看。
存在異常值
如果存在異常值,需要在分析前進行剔除。使用方法:SPSSAU數據處理->異常值。
這是上一步中得到的散點圖,有一個明顯的離群值,研究者需要根據情況選擇保留或刪除。建議按照SPSSAU異常值幫助手冊的說明,對異常值進行處理。
5. 相關係數類型
當完成以上步驟且滿足相關分析的分析條件後,即可進行相關分析。
點擊『通用方法』-『相關』。
這時又出現一個問題。SPSSAU提供了三種相關係數,分別是Pearson、Spearman,Kendall相關係數,該選哪一種呢?
多數情況下,SPSSAU建議使用pearson相關係數。如果數據不滿足正態性或不滿足線性關係的情況下,可以考慮使用Spearman相關係數。
Kendall相關係數用於判斷兩個變量的等級相關性,是否具有一致性,比如評委打分,數據排名等。
關於三種相關係數的比較具體可以查看相關分析幫助手冊。
6. SPSSAU操作
終於到了分析這一步了。相對於其他分析軟體,SPSSAU的操作相對簡單,將變量從左側拖拽到分析項處,點擊『開始相關分析』即可。
分析項X可選
需要特別強調的一點是,相關分析通常不會特別區分哪個變量是X,哪個變量是Y。因此分析時,常常是直接把分析項都放入「分析項Y(定量)」裡即可。
如果有明確的X、Y可以分開放置,兩种放置方法只在表格的展示格式上有區別,結果是一樣的。
指標解讀
分析步驟可參考SPSSAU輸出結果中的「分析建議」及「智能分析」。
需要注意的是相關係數代表變量之間的相關程度,相關係數越大,說明相關程度越緊密。
P值用於判斷相關係數是否有統計學意義,P<0.05即說明變量間有相關關係,P值並不代表相關關係的強弱。
A1、A2交叉處的數字代表相關係數,而星號代表P值。一個星號代表P<0.05,兩個星號代表P<0.01。如果沒有星號,則說明P值>0.05。
7. 後續分析
相關分析的結果並不能代替回歸分析,而相關分析通常是作為回歸分析的基礎,保證在有相關性的前提下,才可能有回歸影響關係。
因此後續可以通過回歸分析,進一步得到影響關係和具體的函數表達式。
最後
以上就是相關分析的分析流程梳理。理論上都應該按照上述步驟進行分析,但在實際過程中,即使忽略其中的步驟,也能得到穩定的結果。
因此即使不按照步驟分析,也沒有很大問題,而對於沒有分析經驗的研究者,SPSSAU建議按所提供的步驟按部就班進行分析,才是最保險的做法。