一、 兩組或多組計量資料的比較
1.兩組資料:
1)大樣本資料或服從正態分布的小樣本資料
(1)若方差齊性,則作成組t檢驗
(2)若方差不齊,則作t』檢驗或用成組的Wilcoxon秩和檢驗
2)小樣本偏態分布資料,則用成組的Wilcoxon秩和檢驗
2.多組資料:
1)若大樣本資料或服從正態分布,並且方差齊性,則作完全隨機的方差分析。如果方差分析的統計檢驗為有統計學意義,則進一步作統計分析:選擇合適的方法(如:LSD檢驗,Bonferroni檢驗等)進行兩兩比較。
2)如果小樣本的偏態分布資料或方差不齊,則作Kruskal Wallis的統計檢驗。如果Kruskal Wallis的統計檢驗為有統計學意義,則進一步作統計分析:選擇合適的方法(如:用成組的Wilcoxon秩和檢驗,但用Bonferroni方法校正P值等)進行兩兩比較。
二、 分類資料的統計分析
1.單樣本資料與總體比較
1)二分類資料:
(1)小樣本時:用二項分布進行確切概率法檢驗;
(2)大樣本時:用U檢驗。
2)多分類資料:用Pearson c2檢驗(又稱擬合優度檢驗)。
2. 四格表資料
1)n>40並且所以理論數大於5,則用Pearson c2
2)n>40並且所以理論數大於1並且至少存在一個理論數<5,則用校正 c2或用Fisher’s 確切概率法檢驗
3)n£40或存在理論數<1,則用Fisher’s 檢驗
3. 2×C表資料的統計分析
1)列變量為效應指標,並且為有序多分類變量,行變量為分組變量,則行評分的CMH c2或成組的Wilcoxon秩和檢驗
2)列變量為效應指標並且為二分類,列變量為有序多分類變量,則用趨勢c2檢驗
3)行變量和列變量均為無序分類變量
(1)n>40並且理論數小於5的格子數<行列表中格子總數的25%,則用Pearson c2
(2)n£40或理論數小於5的格子數>行列表中格子總數的25%,則用Fisher’s 確切概率法檢驗
4. R×C表資料的統計分析
1)列變量為效應指標,並且為有序多分類變量,行變量為分組變量,則CMH c2或Kruskal Wallis的秩和檢驗
2)列變量為效應指標,並且為無序多分類變量,行變量為有序多分類變量,作none zero correlation analysis的CMH c2
3)列變量和行變量均為有序多分類變量,可以作Spearman相關分析
4)列變量和行變量均為無序多分類變量,
(1)n>40並且理論數小於5的格子數<行列表中格子總數的25%,則用Pearson c2
(2)n£40或理論數小於5的格子數>行列表中格子總數的25%,則用Fisher’s 確切概率法檢驗
三、 Poisson分布資料
1.單樣本資料與總體比較:
1)觀察值較小時:用確切概率法進行檢驗。
2)觀察值較大時:用正態近似的U檢驗。
2.兩個樣本比較:用正態近似的U檢驗。
配對設計或隨機區組設計
四、 兩組或多組計量資料的比較
1.兩組資料:
1)大樣本資料或配對差值服從正態分布的小樣本資料,作配對t檢驗
2)小樣本並且差值呈偏態分布資料,則用Wilcoxon的符號配對秩檢驗
2.多組資料:
1)若大樣本資料或殘差服從正態分布,並且方差齊性,則作隨機區組的方差分析。如果方差分析的統計檢驗為有統計學意義,則進一步作統計分析:選擇合適的方法(如:LSD檢驗,Bonferroni檢驗等)進行兩兩比較。
2)如果小樣本時,差值呈偏態分布資料或方差不齊,則作Fredman的統計檢驗。如果Fredman的統計檢驗為有統計學意義,則進一步作統計分析:選擇合適的方法(如:用Wilcoxon的符號配對秩檢驗,但用Bonferroni方法校正P值等)進行兩兩比較。
五、 分類資料的統計分析
1.四格表資料
1)b+c>40,則用McNemar配對 c2檢驗或配對邊際c2檢驗
2)b+c£40,則用二項分布確切概率法檢驗
2.C×C表資料:
1)配對比較:用McNemar配對 c2檢驗或配對邊際c2檢驗
2)一致性問題(Agreement):用Kap檢驗
變量之間的關聯性分析
六、 兩個變量之間的關聯性分析
1.兩個變量均為連續型變量
1)小樣本並且兩個變量服從雙正態分布,則用Pearson相關係數做統計分析
2)大樣本或兩個變量不服從雙正態分布,則用Spearman相關係數進行統計分析
2.兩個變量均為有序分類變量,可以用Spearman相關係數進行統計分析
3.一個變量為有序分類變量,另一個變量為連續型變量,可以用Spearman相關係數進行統計分析
七、 回歸分析
1.直線回歸:如果回歸分析中的殘差服從正態分布(大樣本時無需正態性),殘差與自變量無趨勢變化,則直線回歸(單個自變量的線性回歸,稱為簡單回歸),否則應作適當的變換,使其滿足上述條件。
2.多重線性回歸:應變量(Y)為連續型變量(即計量資料),自變量(X1,X2,…,Xp)可以為連續型變量、有序分類變量或二分類變量。如果回歸分析中的殘差服從正態分布(大樣本時無需正態性),殘差與自變量無趨勢變化,可以作多重線性回歸。
1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素
2)實驗性研究:在保持主要研究因素變量(幹預變量)外,可以適當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用
3.二分類的Logistic回歸:應變量為二分類變量,自變量(X1,X2,…,Xp)可以為連續型變量、有序分類變量或二分類變量。
1)非配對的情況:用非條件Logistic回歸
(1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素
(2)實驗性研究:在保持主要研究因素變量(幹預變量)外,可以適當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用
2)配對的情況:用條件Logistic回歸
(1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素
(2)實驗性研究:在保持主要研究因素變量(幹預變量)外,可以適當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用
4.有序多分類有序的Logistic回歸:應變量為有序多分類變量,自變量(X1,X2,…,Xp)可以為連續型變量、有序分類變量或二分類變量。
1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素
2)實驗性研究:在保持主要研究因素變量(幹預變量)外,可以適當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用
5.無序多分類有序的Logistic回歸:應變量為無序多分類變量,自變量(X1,X2,…,Xp)可以為連續型變量、有序分類變量或二分類變量。
1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素
2)實驗性研究:在保持主要研究因素變量(幹預變量)外,可以適當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用
八、 生存分析資:要求資料記錄結局和結局發生的時間(如;死亡和死亡發生的時間)
1.用Kaplan-Meier方法估計生存曲線
2.大樣本時,可以壽命表方法估計
3.單因素可以用Log-rank比較兩條或多條生存曲線
4.多個因素時,可以作多重的Cox回歸
1)觀察性研究:可以用逐步線性回歸尋找(擬)主要的影響因素
2)實驗性研究:在保持主要研究因素變量(幹預變量)外,可以適當地引入一些其它可能的混雜因素變量,以校正這些混雜因素對結果的混雜作用
歡迎關注薛丁格醫學統計工作室,我們團隊由專業醫學統計分析人員組成,為您解決臨床科研中的醫學數據分析,詳情請諮詢QQ:2926692716 郵箱xuedinge001@qq.com
(回復任意數字查看往期內容)