作者:丁點helper
來源:丁點幫你
今天,我們講等級變量的假設檢驗。首先,回顧一下,什麼叫等級變量,也稱有序變量。
一般而言,等級變量屬於分類變量(如上)的一種,與之相對的就是無序變量。大家生活中經常碰到的「滿意程度」就是一個等級變量。
當我們比較兩組人群,比如男女,對某項服務的滿意程度時,就會用到秩和檢驗。這其中的緣由是什麼呢?
我們先把「等級變量」好好研究一番。
假設有8名顧客對某個餐廳的服務用「非常滿意」、「滿意」、「不滿意」和「非常不滿意」進行評分,一般來講,我們會把這些結果分別用「1」到「4」的數字進行編碼。
比如,這8名顧客的打分結果為「1、2、2、3、1、4、3、2」。單從數字上看,大部分人應該比較「滿意(2)」或「非常滿意(1)」。
可是,如何衡量平均的服務滿意程度?很顯然,可以算個平均數。上述8個數計算出來:平均數是「2.6」。
仔細想想,這裡的2.6到底代表什麼,是「比較滿意」還是「比較不滿意」?好像都說得通,但仍然很含糊。
所以,在對等級變量求均數時,難以避免出現小數,而一旦出現小數,就會難以解釋。
這時,採用秩和檢驗,使用秩代替原始數據,通過比較總體分布的形態來進行統計推斷,就避免了等級變量不同級別的均值無法解釋的困境。
而我們之前所講的t檢驗、方差分析等,叫做「依賴參數」進行的統計檢驗,即參數檢驗。
比如用總體均數這個參數,通過樣本數據構造統計量,最後結論的專業解釋或含義,也常常通過樣本均數的大小進行闡述。
下面,我們通過一個案例來具體看看如何用SPSS進行相關檢驗的操作。
某研究團隊2007年7月至11月對西藏拉薩市和山南地區大骨節病進行流行病學調查,獲得了兩個地區受檢人群大骨節病不同臨床分度的數據,見下表。現比較兩個地區的大骨節病臨床分度是否具有統計學差異?
上表中的「臨床分度」就是一個等級變量,本例想要比較的就是兩個地區(拉薩和山南)大骨節病患者的臨床分度是否有差異,屬於兩獨立兩本的非參數檢驗。
上表同時給出了秩和檢驗求秩和的具體步驟,感興趣的同學可以對照表格每列前面的序號了解一下。
不過我們現在主要採用軟體檢驗,所以也可以不用完全搞明白背後的數學邏輯。
SPSS的操作步驟截圖如下:
兩獨立樣本非參數檢驗
默認選用Mann-Whitney U 檢驗
檢驗結果
根據上表檢驗的P值(Asmp.Sig.)來看,P=0.883>0.05,差異無統計學意義。α=0.05水準不拒絕H0,尚不能認為拉薩和山南地區的大骨節病臨床分度的差異有統計學意義。