系列17-21我們已經介紹了單變量定量數據的假設檢驗方法及其SAS實現,今天開始介紹定性數據的假設檢驗方法及其SAS實現。
圖9-56 定性數據假設檢驗方法選擇
*===樣本率與總體率的比較:u檢驗的SAS實現;DATA RATE; INPUT PAI PAI0 N; U=ABS(PAI-PAI0)/SQRT(PAI*(1-PAI)/N); P=2*(1-PROBNORM(U)); DATALINES;0.2 0.3158 304;PROC PRINT; VAR PAI PAI0 N U P;RUN;圖9-57 樣本率與總體率比較u檢驗結果
*===樣本率與總體率的比較:χ2檢驗的SAS實現;DATA RATE; INPUT A1 A0 N PAI0; T1=N*PAI0; T0=N-T1; CHI=(A1-T1)**2/T1+(A0-T0)**2/T0; P=1-PROBCHI(CHI,1); DATALINES;96 208 304 0.2;PROC PRINT; VAR PAI0 CHI P;RUN;圖9-58 樣本率與總體率比較χ2檢驗結結果
圖9-57和圖58的結果一致,還不能認為樣本所來自的總體率與已知總體率相同。
2.四格表資料的假設檢驗
2.1一般四格表資料的假設檢驗
*===四格表資料卡方檢驗;DATA F; DO R=1 TO 2; DO C=1 TO 2; INPUT FREQ @@; OUTPUT; END; END; DATALINES;52 19 39 3;PROC FREQ DATA=F; TABLE R*C/CHISQ; WEIGHT FREQ;RUN;圖9-59 一般四格表資料統計描述結果
圖9-60 一般四格表資料χ2檢驗結果
圖9-61 一般四格表資料Fisher確切概率法結果
圖9-59是創建的二維表格,每個單元格中包括頻數、點總數的百分比、佔行合計的百分比以及佔列合計的百分比。本資料的N>40,且T>5(結果中未提示T<5),圖9-60是χ2檢驗結果顯示χ2=6.4777,P=0109,按檢驗水準α=0.05,還不能認為兩組大白鼠感染率相同。 配對定性資料作比較的目的是通過單一樣本數據推斷兩種處理的結果有無差別。常用於比較兩種檢驗方法、兩種提取方法、兩種培養方法乖的差別。其特點是對同一樣本的每一檢品分別用兩種方法處理,觀察其陽性或陰性結果。
*===配對四格表資料卡方檢驗;DATA MC; DO R=1 TO 2; DO C=1 TO 2; INPUT FREQ @@; OUTPUT; END; END; DATALINES;36 34 0 135;PROC FREQ DATA=F; TABLE R*C/AGREE; WEIGHT FREQ;RUN;圖9-62 配對四格表資料統計描述結果
圖9-63 配對四格表資料χ2檢驗結果
圖9-63是創建的二維表格,內容同一般四格表的內容。本資料的b+c>40,圖9-60是McNemarχ2檢驗結果顯示:χ2=6.8966,P=0086,按檢驗水準α=0.05,還不能認為兩種培養基的結果相同。
整理不易,歡迎點亮再看哦!
參考文獻:
[1] Marfio F. Triola. ElementaryStatistics[M]. New York: Christine Stavrou, 2010.
[2] 夏莊坤, 徐唯 , 潘紅蓮, 等. 深入解析SAS——數據處理、分析優化與商業應用[M].
[3] 高惠璇. SAS系統Base SAS軟體使用手冊[M]. 北京:中國統計出版社,1997.