感謝大家稀稀拉拉的掌聲,我又來了~
最近比較隨心隨性,讓大家久等啦。
先填一口知識糧:
什麼是t檢驗?
數據統計分析的一種基本方法。
t檢驗能做什麼?
常用於兩組定量資料均值比較,以推斷總體均值差異是否有統計學意義。如比較兩個班級學生的身高差異是否有統計學意義,如比較某公司兩個地區的管理成本差異是否有統計學意義等。再嚴謹一點說應該是比較兩組均值是否來自同一總體。
t檢驗常見分類有哪些?
單樣本t檢驗,兩獨立樣本t檢驗,配對t檢驗。
t檢驗如何實現?
可用公式計算統計量再查表,也可以用SAS、SPSS、Excel、JMP、R等具有統計分析功能的軟體實現。
言歸正傳。
近期給北京市某單位培訓統計分析課程,發現不同單位甚至不同科室的工作人員常用的統計學分析軟體也不一樣。不過軟體只是個工具,無論黑貓白貓能抓到老鼠的就是好貓。此文,以t檢驗(最常用的兩獨立樣本t檢驗)為例,介紹並比較四種最常用的統計分析軟體實現過程及結果解讀。
例:某醫生測量了18名糖尿病病人及20名正常人的血清總膽固醇含量,欲比較兩組人群的血清總膽固醇含量是否有統計學差異。(例題摘自:馮國雙,《醫學案例統計分析與SAS應用》P45)
數據原始模樣:
一、整理數據
四種統計軟體需要的數據模樣:
1)SAS、SPSS、JMP: 2)Excel:
二、方法適用條件的審查
t檢驗有三個最重要的適用條件。獨立性、正態性、方差齊性。獨立性一般通過專業素養來判斷,方差齊性一般伴隨著分析過程通過結果判斷。所以開始分析前最重要的是需要先檢驗正態性。所謂正態性,是指數據符合正態分布,可以簡單通過直方圖或正態曲線圖判斷,也可以通過統計指標更準確的判斷。
正態性檢驗:
1)SAS:
(除了簡短作圖外,可通過調用proc univariate 過程進行正態性檢驗。提供K-S、S-W等四種正態性檢驗的統計指標)
2)SPSS:
(除了簡短作圖外,可通過分析——描述統計——探索。提供K-S和S-W正態性檢驗的統計指標)
3)JMP:
(分析——分布,可給出多種圖形以供判斷)
4)Excel:
(可通過插入簡單的散點圖或直方圖判斷)
三、t檢驗
1)SAS:
2)SPSS:
3)JMP:
4)Excel:
四、結果解讀
四種軟體結果一致,數據符合獨立性、正態性、方差齊性。p值小於0.01,可認為兩組總體均值差異有統計學意義。即正常人群和糖尿病人群血清膽固醇含量差異有統計學意義。
但是實際操作起來四種統計軟體還是大不相同。各人感覺如下:
SAS:優點是語句簡單,以前的程序拿來略作修改即可用;缺點是結果展示不是最美觀,且普遍反映入門難。
SPSS:優點是頁面比較有親和力,操作直觀,結果解讀簡單;缺點是中規中矩,正態性檢驗需要點開另外的菜單,齊性檢驗需要單獨勾選。
JMP:優點是頁面有親和力,功能強大;缺點是需要有一定的統計功底,如本文中的t檢驗本質是一個簡單線性回歸,所以通過擬合線性回歸得出結果。
Excel:優點是大眾化,不懂統計可能也能得出結果;缺點是結果過於簡單。不過可以利用做兩樣本方差分析來彌補。有時間的童鞋可以自己照著百度試一下。