在統計分析過程中,選擇合適的統計學方法,已經是成功了一半。那麼面對得到數據,我們該如何去選擇合適的統計方法呢?
區分數據屬性
最簡單而重要的方法,首先是對數據的屬性進行判斷,是計量資料(年齡多少歲,血壓多少帕斯卡,白介素6濃度多少pg/ml);還是計數資料(有多少個人,多少個國家,多少個民族)。
A 計量資料
對於計量資料,是採用非參數檢驗還是參數檢驗呢?如果數據不滿足正態性、方差齊性等,可以用非參數檢驗;當不在乎數據是否符合正態分布,也可以直接利用非參數檢驗,只是非參數檢驗的效能相比於參數檢驗低,犯I類錯誤的概率可能會高。當計量資料為單獨一組時,採用單樣本t檢驗或單樣本秩和檢驗(Wilcoxon);當兩組樣本為獨立樣本進行比較時,採用兩組獨立樣本t檢驗或兩組獨立樣本秩和檢驗(Mann-Whitney);當兩組樣本為相關樣本時,採用配對樣本t檢驗或配對樣本秩和檢驗(Wilcoxon);當計量資料超過2組(3組或3組以上),採用方差分析或多組獨立樣本秩和檢驗(Kruskal-Wallis)。
B 計數資料
計數資料主要以列聯表形式存在,所以對計數資料的分析,首要任務是對行、列變量屬性的判斷。當行變量、列變量均為無序變量時,採用卡方檢驗;當行變量或列變量為有序變量時,採用秩和檢驗;當行變量、列變量均為有序變量時,可採用Spearman相關性分析量變量之間的秩相關;若是評判兩種方法或處理手段的一致性,可採用Kappa分析。將上面的長篇廢話轉化成圖表,思路是不是更清晰了呢?