這是2020年最後1個月,這期也是統計說說今年的最後一期。請各位學員認真學習,總結之前的知識,為今年的醫學科研學習劃上圓滿的句號。
所謂等級資料是將觀察單位按某個指標量的大小分成等級或按某種屬性的不同程度分成等級後分組計數,分類匯總各組觀察單位數後而得到的資料。其變量值具有半定量性質,表現為等級大小或屬性程度(圖1紅框)。
圖1 統計資料的類型
例1:某防疫站為了解不同季節居民體內核黃素營養狀況,於某年夏、冬季分別對成年居民口服5mg核黃素後收集4小時的負荷尿,測定核黃素含量,結果見表1所示。試比較兩個季度間核黃素營養狀況差異有無統計學意義?(核黃素營養狀況評價標準:缺乏為<400μg,不足為400~1000μg,適宜為>1000μg)。案例分析思考:
1.研究目的:分析不同季節(夏季、冬季)的核黃素營養狀況有無差異;2.研究設計類型:獨立樣本兩組比較(夏季、冬季),樣本量不等; 3.反應變量:結果變量核黃素營養狀況屬於等級資料(三分類有程度上差別:缺乏、不足、適宜);分組變量屬於計數資料(二分類:夏季、冬季)(無序,即沒有程度上差別),形成的交叉表也稱2*3表(表1紅框)(R=2,C=3);4.反應變量是等級資料,採用非參數檢驗(秩和檢驗)。具體操作:
1.數據格式 6行3列(頻數變量:居民人數;分組變量:季節1=夏季,2=冬季;反應變量:核黃素1=缺乏,2=不足,3=適宜)(圖2)由於本例是列聯表資料,所以要先對變量「居民人數」進行頻數變量定義。分析(A)→非參數檢驗(N)→舊對話框(L) →2個獨立樣本►檢驗變量列表(T):選入反應變量,本例為「核黃素營養狀況」。þ 曼-惠特尼U(M):與威爾科克森秩和檢驗等價(系統默認)。本例選此項。
點擊「定義組(D)」按鈕,彈出「雙獨立樣本:定義組」對話框(圖4)。圖4 雙獨立樣本:定義組對話框
(1)例1的獨立樣本等級頻數表資料的秩基本統計量表(表2)
表2給出了例1的秩基本統計量:夏季的樣本量為20,秩和為514.00及秩平均值為25.70;冬季的樣本量為22,秩和為389.00及秩平均值為17.68。
表3給出了例1的秩和檢驗結果。結論:曼-惠特尼U =136.000,威爾科克森 W =389.000,Z=-2.260,P=0.024,差異有統計學意義,可以認為夏季的核黃素營養狀況高於冬季。
1.研究目的:分析不同治療方法(1.綜合治療、2.電子治療儀、3.清音丸)的療效有無差異;
2.研究設計類型:獨立樣本三組比較(1.綜合治療、2.電子治療儀、3.清音丸),樣本量不等;
3.反應變量:結果變量療效等級屬於等級資料(四分類有程度上差別:治癒、顯效、好轉、無效);分組變量屬於計數資料(三分類:1.綜合治療、2.電子治療儀、3.清音丸)(無序,即沒有程度上差別),形成的交叉表也稱3*4表(表4紅框)(R=3,C=4);
4.反應變量是等級資料,採用非參數檢驗(秩和檢驗)。
1.數據格式 12行3列(頻數變量:治療例數;檢驗變量:療效等級 1=治癒,2=顯效,3=好轉,4=無效;分組變量:治療方法1=綜合治療,2=電子儀,3=清音丸)(圖5)。分析(A)→非參數檢驗(N)→舊對話框(L) →K個獨立樣本►檢驗變量列表(T):選入反應變量,本例為「療效等級」。►分組變量(G):選入分組變量,本例為「治療方法」。þ 克魯斯卡爾-沃利斯H(K):多組秩和檢驗。系統默認。本例選此項。點擊「定義範圍(D)」按鈕,彈出「多個獨立樣本:定義範圍」對話框(圖7)。
圖7 多個獨立樣本:定義範圍對話框
3.主要輸出結果及分析
(1)例2的多個獨立樣本克魯斯卡爾-沃利斯檢驗的秩基本統計量表(表5)表5給出了例2的秩基本統計量:綜合治療的樣本量為308,秩平均值為208.93;電子治療儀的樣本量為92,秩平均值為282.59;清音丸的樣本量為78,秩平均值為309.40。 表6給出了例2的克魯斯卡爾-沃利斯秩和檢驗結果, H統計量服從χ2分布,故以χ2值表示檢驗統計量。結論:卡方=51.388,P=0.000,故可認為3種療法差異有統計學意義。可以進一步兩兩比較,方法如下。(1)定義變量類型:點擊數據錄入窗口左下角的「變量視圖」,在單元格第二列「類型」中,單擊「分組*類型」單元格,單擊「…」 按鈕,彈出「變量類型」對話框(圖8)。將分組變量的變量類型顯示的「數字(N)」改成「字符串(R)」。圖8 變量類型對話框
彈出「非參數檢驗:兩個或兩個以上的獨立樣本」對話框(圖9)。圖9 非參數檢驗:兩個或兩個以上的獨立樣本對話框
►檢驗欄位(T):選入反應變量,本例為「療效等級」。(1)例2的多個獨立樣本克魯斯卡爾-沃利斯假設檢驗摘要(圖10)圖10 假設檢驗摘要
圖10給出了例2的假設檢驗結果。結論:P=0.000,差異有統計學意義,此結果與表6的結論一致。(2)兩兩比較:雙擊結果查看器中圖10的「假設檢驗摘要」(圖11)。圖11 獨立樣本克魯斯卡爾-沃利斯檢驗
★查看(V):獨立樣本檢驗視圖(成對比較)(圖12)。圖12 兩兩比較結果圖
圖12給出了例2的兩兩比較的結果。結論:綜合治療(1.00)與電子治療儀(2.00)比較,調整後的P=0.000,差異有統計學意義;綜合治療(1.00)與清音丸(3.00)比較,調整後的P=0.000,差異有統計學意義;電子治療儀(2.00)與清音丸(3.00)比較,調整後的P=0.519,差異無統計學意義。綜合治療、電子治療儀和清音丸治療慢性喉炎的療效(治癒/顯效/好轉/無效)分別為186/72/26/24、32/24/16/20和22/14/22/20,三組比較採用克魯斯卡爾-沃利斯秩和檢驗,差異有統計學意義(c2=51.388,P=0.000),故可認為3種療法差異有統計學意義。進一步兩兩比較:綜合治療的療效優於電子治療儀和清音丸(P=0.000,P=0.000),差異有統計學意義;而電子治療儀與清音丸的療效差異無統計學意義(P=0.519)。1. 對於採用非參數檢驗的列聯表R*C表的形式:主要是反應變量是多項有序分類變量(即等級資料),而分組變量為無序分類變量(表7),(此處一定注意的是:行變量為分組變量或自變量,列變量為反應變量或因變量。在呈現數據時行列可交換,但表達的意思是不變的)。
(點擊看大圖)
2.不是所有的列聯表資料都能做卡方檢驗,當反應變量為等級資料時,比較各處理組的效應有無差別應該採用秩和檢驗(圖13藍框),不宜採用c2檢驗。而c2檢驗與分類變量的各分類順序無關。
圖13 R*C表統計分析方法選擇
3.列聯表表資料是由行變量的個分類與列變量的個分類交叉組合後清點計數得到的頻數,無論行變量還是列變量,各個分類是彼此互斥、相互獨立的。
4.多個獨立樣本等級頻數表資料比較的秩和檢驗,若在整體上P>0.05,即差異無統計學意義,就無需兩兩比較了;若整體上的P<0.05,即差異有統計學意義,則需進一步兩兩比較。
★下面給個思考題,大家練一練:
大家做完習題後有什麼疑問可以留言提出來,我們會請劉嶺教授解答,並在下期公布。
撰稿:劉嶺
約稿編輯:劉芹
排版:畢麗
審核:王東
在此,本刊編輯部向劉嶺教授表示誠摯的感謝!!!
醫護職稱制度變化有多大?詳解《關於深化衛生專業技術人員職稱制度改革的指導意見(徵求意見稿)》
醫學科研課堂丨統計說說(七):基於分類變量的卡方檢驗(二)
營養與康復專題丨沈生榮—腫瘤與營養
營養與康復專題丨陳文雯—糖尿病的醫學營養治療
OSID丨李雯—阻塞性睡眠呼吸暫停低通氣症候群合併擴張性心肌病1例報導
OSID丨蔣丹—二甲雙胍治療妊娠期糖尿病可行性的meta分析
醫學科研課堂丨統計說說(六):基於分類變量的卡方檢驗(一)
醫學科研課堂丨統計說說(五):常用基本統計學方法之選擇
上面精彩內容不過癮?
歡迎掃碼關注「現代醫藥衛生」微信公眾號,獲取更多精彩內容