比較對照是進行數據探索與分析的基本手段之一。對於數值型(定量)的數據,進行比較對照時可以用均數檢驗、方差分析等方法。而對於分類(定性)統計數據,比較對照時需要用交叉分類進行統計描述,交叉分類所得的表格稱為「列聯表」,統計推斷(檢驗)則要使用卡方檢驗。卡方檢驗是用來研究兩個定類變量間是否獨立即是否存在某種關聯性的最常用的方法。
假設我們擁有如下的分類數據,我們想知道員工的滿意度情況對其績效表現有沒有顯著影響:
需要說明的是,EXCEL也可以用CHITEST函數做卡方檢驗,不過需要實現計算期望頻次表,不懂其中原理和計算方法的人操作起來會有困難。而一些專業工具如SPSS、minitab、jmp等則操作流程相對簡單一些。因此我們這裡採用SPSS來進行檢驗。
打開SPSS,讀入以上數據,然後選擇「分析」——「描述統計」——「交叉表」:
然後把滿意度變量放入行對話框,把考核成績放入列對話框,並在右邊的選項中點擊」統計」,選擇「卡方「。
點擊「確定「後,我們就得到了如下的這組數據交叉表的簡要統計結果:
在以上這個結果中,我們主要查看的是皮爾遜卡方的數據,最後的sig值(漸進顯著性)大於0.05,因此我們可以初步判定員工不同層次的滿意度水平對績效表現(考核成績)沒有顯著的影響。
大家可能注意到了,在以上的檢驗設定過程中還有很多參數我們並沒有去勾選。它們各自都有不同的用途,用來適應不同的信息輸出要求、檢驗目的和數據屬性。對於操作者的數理統計背景知識的要求還是很高的。
應用交叉表對分類數據進行卡方檢驗時,還應該注意以下幾個問題:
• 交叉表各單元格中頻數大小的問題:不應有大量期望頻數小於5的單元格
• 樣本量大小的問題:不同的樣本量大小可能會得出不同的結論,需要對皮爾遜卡方值進行相應的修正,以消除樣本量大小的影響。
• 變量的不同分組分類規則也會影響到最終的結論,需要我們針對實驗目的科學進行數據類別劃分。
CAME體驗雲研究院
【凝練管理精髓 創造極致體驗】
歡迎轉載 轉載請註明出處
聯繫合作:sunqing@egoonet.com