顯著性檢驗的計算 - CSDN

2021-01-11 CSDN技術社區

轉自個人微信公眾號【Memo_Cleon】的統計學習筆記:R筆記:兩配對樣本的顯著性檢驗。

跟兩獨立樣本相對應的是兩配對樣本,生物醫學中常見的案例是治療前後的比較,兩種檢測方法的比較(同一樣本接受不同的檢驗方法)、配對的對象接受不同的處理。根據不同適用條件,常用的統計方法有:兩配對樣本的t檢驗、兩配對樣本的非參數檢驗(如Wilcoxon符號秩檢驗)、配對卡方檢驗(McNemar)。

【1】兩配對樣本的t檢驗

其本質是兩配對樣本的差值與0的比較。跟兩獨立樣本的t檢驗一樣,兩配對樣本的t檢驗用到的函數也是t.test {stats}。t.test {stats}默認的是兩獨立樣本的t檢驗,在進行兩配對樣本的t檢驗時,只需要將默認的paired = FALSE修改為paired = TRUE即可。

t.test {stats}:Student's t-Test,Performs one and two sample t-tests on vectors of data.

t.test(x, y = NULL,alternative = c("two.sided", "less", "greater"),mu = 0, paired = FALSE, var.equal = FALSE,conf.level = 0.95, ...)

配對t檢驗也要求正態分布,但與兩獨立樣本的t檢驗不同,配對樣本的t檢驗要求的兩配對樣本的差值呈正態分布。

李斌,賀佳等.醫學統計學(第6版).北京:人民衛生出版社,2013.

①數據導入

library(openxlsx)

pttest<-read.xlsx("D:/Temp/pddata.xlsx",1)

②正態性檢驗

d=pttest$before-pttest$after

shapiro.test(d)

③配對t檢驗

t.test(pttest$before,pttest$after,paired = TRUE)

t.test(pttest[1:12,2],pttest[1:12,3],paired =TRUE)

Shapiro-Wilk檢驗表明,差值呈正態分布(W=0.88,P=0.08>0.05),可以採用配對t檢驗進行差異性檢驗;配對t檢驗結果顯示:t=3.74,P=0.003<0.05,可以認為飲用咖啡前後運動者的心肌血流量存在差異。

【2】兩配對樣本的非參數檢驗:Wilcoxon符號秩檢驗

當配對樣本的差值不滿足正態分布時,需要改用非參數檢驗。差值正態的數據也可以使用非參,只是檢驗效率低一點而已。跟兩獨立樣本的非參數檢驗一樣,兩相關樣本的非參數檢驗常用的函數也是wilcox.test {stats}.,但需要將默認的paired = FALSE修改為paired = TRUE。

wilcox.test {stats}:Wilcoxon Rank Sum and Signed Rank Tests,Performs one- and two-sample Wilcoxon tests on vectors of data; the latter is also known as 『Mann-Whitney』 test.

wilcox.test(x, y = NULL,alternative = c("two.sided", "less", "greater"), mu = 0, paired = FALSE, exact = NULL, correct = TRUE,http://conf.int = FALSE, conf.level = 0.95, ...)

顏虹等.醫學統計學(第2版).北京:人民衛生出版社,2010.8.

①數據導入

library(openxlsx)

nptest<-read.xlsx("D:/Temp/pddata.xlsx",2)

②正態性檢驗

d=nptest$before-nptest$after

shapiro.test(d)

③Wilcoxon符號秩檢驗

wilcox.test(nptest$before,nptest$after,paired = TRUE)

wilcox.test(nptest[1:12,2],nptest[1:12,3],paired =TRUE)

Shapiro-Wilk檢驗表明,差值不呈正態分布(W=0.82,P=0.026<0.05),採用配對t檢驗是不合適的,需要採用兩相關樣本的非參數檢驗,結果顯示P=0.0041<0.05,可以認為溶脲脲原體會影響到家兔精子的密度。警示信息的出現主要是由於數據中有重複數據(打結現象)。

【3】配對四表格設計的卡方分析

配對卡方檢驗我們用的McNemar's Chi-squared Test,使用函數mcnemar.test {stats}:Performs McNemar's chi-squared test for symmetry of rows and columns in a two-dimensional contingency table.

mcnemar.test(x, y = NULL, correct = TRUE)

x:either a two-dimensional contingency table in matrix form, or a factor object. y:a factor object; ignored if x is a matrix. correct:a logical indicating whether to apply continuity correction when computing the test statistic.

顏虹等.醫學統計學(第2版).北京:人民衛生出版社,2010.8.

①數據導入

library(openxlsx)

mctest<-read.xlsx("D:/Temp/pddata.xlsx",3)

②生成配對四表格矩陣

pd<-matrix(c(mctest$頻數),nrow = 2,dimnames = list("甲法" = c("陽性", "陰性"),"乙法" = c("陽性", "陰性")))

③McNemar's Chi-squared Test

mcnemar.test(pd)

結果顯示chi2=0.196,P=0.658>0.05,尚不能拒絕兩種檢測方法的檢出率沒有差異的假設。

轉自個人微信公眾號【Memo_Cleon】的統計學習筆記:R筆記:兩配對樣本的顯著性檢驗。

END

相關焦點

  • 回歸方程的顯著性檢驗 - CSDN
    回歸方程的顯著性檢驗  t 檢驗(回歸係數的檢驗)  F 檢驗(回歸方程的檢驗)  相關係數的顯著性檢驗  樣本決定係數  三種檢驗的關係 二、回歸方程的顯著性檢驗  目的:檢驗 (方便檢驗計算)t 檢驗  用t 檢驗來檢驗回歸係數的顯著性。
  • 回歸係數顯著性t檢驗 - CSDN
    回歸方程的顯著性檢驗  t 檢驗(回歸係數的檢驗)  F 檢驗(回歸方程的檢驗)  相關係數的顯著性檢驗  樣本決定係數  三種檢驗的關係 二、回歸方程的顯著性檢驗  目的:檢驗 (方便檢驗計算)t 檢驗  用t 檢驗來檢驗回歸係數的顯著性。
  • 檢驗回歸係數的顯著性excel_excel相關係數顯著性檢驗 - CSDN
    我們研究銷售額Y和推廣費用X1之間的關係,數據如下:首先我們用數據分析—相關係數分析計算一下自變量和因變量之間的相關係數為 四、線性回歸方程的檢驗 4、  第二張表,方差分析表,df是自由度,SS是平方和,MS是均方,F是F統計量,Significance F是回歸方程總體的顯著性檢驗,其中我們主要關注F檢驗的結果,即Significance F值,F檢驗主要是檢驗因變量與自變量之間的線性關係是否顯著,用線性模型來描述他們之間的關係是否恰當
  • 【方法】相關係數的計算與顯著性檢驗
    相關係數的計算和顯著性檢驗是一個很輕鬆的工作——通常情況下,研究者會使用SPSS計算SPSS中各變量的相關,SPSS也直接提供了對相關係數的顯著性檢驗,研究者需要做的就是點點滑鼠,然後將結果抄寫在論文中。但是,很多研究者忽略了一個問題——當相關變量存在缺失時,SPSS默認會採用配對刪除法對無效個案進行剔除,結果就導致了相關矩陣中每一個相關係數所基於的樣本量可能是不同的。
  • 一元線性回歸顯著性檢驗專題及常見問題 - CSDN
    回歸方程的顯著性檢驗  t 檢驗(回歸係數的檢驗)  F 檢驗(回歸方程的檢驗)  相關係數的顯著性檢驗  樣本決定係數  三種檢驗的關係 二、回歸方程的顯著性檢驗  目的:檢驗 (方便檢驗計算)t 檢驗  用t 檢驗來檢驗回歸係數的顯著性。
  • 顯著性水平怎麼算 - CSDN
    Question:1.什麼是顯著性檢驗? 2.為什麼要做顯著性檢驗? 3.怎麼做顯著性檢驗?(閱讀本回答預計用時9分鐘)後文將對該三個問題作出解釋,最後推薦一個CrashCourse的統計學掃盲課程一.什麼是顯著性檢驗?
  • 檢驗k的方法 - CSDN
    '作單尾檢驗model:'approx'(默認),使用檢驗統計量的精確分布的近視值,'asymp':使用檢驗統計量的漸進分布輸出結果中第一個為統計量,第二個為P值(註:統計量越接近0就越表明數據和標準正態分布擬合的越好,如果P值大於顯著性水平,通常是0.05,接受原假設,則判斷樣本的總體服從正態分布)
  • matlab t檢驗_matlab t檢驗p值 - CSDN
    2012建模的題目是要求對葡萄酒品質進行評價,第一問是兩組葡萄酒的評價有沒有顯著性差異,用的是統計學中的假設T檢驗。xlsread('2012A_T1_processed.xls', 'T2_red_grape', 'D3:M272');X3=xlsread('2012A_T1_processed.xls', 'T1_white_grape', 'D3:M282');X4=xlsread('2012A_T1_processed.xls', 'T2_white_grape', 'D3:M282');%% 紅葡萄酒T檢驗計算過程
  • 線性回歸方程的顯著性驗證,總體驗證的F檢驗與個體驗證的t檢驗
    【顯著性驗證百科定義】顯著性驗證,是事先對總體(隨機變量)的參數或總體分布形式做出一個假設,然後利用樣本信息來判斷這個假設是否合理,即判斷總體的真實情況與原假設是否有顯著性差異。顯著性驗證的方法一般有兩種,一是測算回歸方程總體顯著性的F檢驗,二是測算變量解釋係數(即回歸係數)個體顯著性的t檢驗。
  • excel假設檢驗 - CSDN
    假設檢驗顯著性水平的兩種理解:1. 顯著性水平:通過小概率準則來理解,在假設檢驗時先確定一個小概率標準----顯著性水平;用 1) 當H0採用等號,而H1採用不等號,雙尾檢驗2)當H0是有方向性的,單尾檢驗P值當原假設為真時,比所得到的樣本觀察,結果更極端的結果會出現的概率。如果P值很小,我們拒絕原假設的理由越充分。P的意義不表示兩組差別大小,p反映兩組差別有無統計學意義,顯著性檢驗只是統計結論,判斷差別還需要專業知識。
  • 常見的A/B測試誤區分析:重複檢驗顯著性
    避免重複檢驗顯著性錯誤的最好方式就是不去重複地檢驗顯著性。一、一種常見的A/B測試誤區如果網頁正在運行A/B測試的時候,你時不時地去查看試驗結果的顯著性,你就會陷入誤區。統計學上,重複檢驗顯著性是錯誤的行為。
  • matlab t檢驗值_matlab t檢驗p值 - CSDN
    2012建模的題目是要求對葡萄酒品質進行評價,第一問是兩組葡萄酒的評價有沒有顯著性差異,用的是統計學中的假設T檢驗。xlsread('2012A_T1_processed.xls', 'T2_red_grape', 'D3:M272');X3=xlsread('2012A_T1_processed.xls', 'T1_white_grape', 'D3:M282');X4=xlsread('2012A_T1_processed.xls', 'T2_white_grape', 'D3:M282');%% 紅葡萄酒T檢驗計算過程
  • 假設檢驗的區別 - CSDN
    我們不需要計算兩個不同的值,比如臨界值和測試分數。使用p值的另一個好處是,我們可以通過直接將其與顯著性水平進行比較,在任何期望的顯著性水平上進行測試。這樣我們就不需要計算每個顯著性水平的考試分數和臨界值。我們可以得到p值,並直接與顯著性水平進行比較。定向假設在定向假設中,如果測試分數太大(右尾的測試分數太小,左尾的測試分數太小),則會拒絕零假設。
  • 顯著性檢驗與作用大小
    在定量研究方法的教學中,我發現學生比較難理解假設檢驗的邏輯和含義。這並不是他們在水平上有不足。
  • t檢驗的目的_單樣本t檢驗的目的 - CSDN
    它主要用於:均數差別的顯著性檢驗、分離各有關因素並估計其對總變異的作用、分析因素間的交互作用、方差齊性(Equality of Variances)檢驗等情況。發生第一類錯誤的概率被稱作顯著性水平,一般用α表示,在進行假設檢驗時,是通過事先給定顯著性水平α的值而來控制第一類錯誤發生的概率。
  • t檢驗 機器學習_機器學習 t 檢驗 - CSDN
    顯著性值的選擇是個經驗值:一般和樣本量有關,樣本量越大,顯著性值越大,一般幾百左右的樣本量P值一般選擇0.05,樣本量在兩千左右時P值一般選擇0.001,樣本量再大,P值就沒有作用了,所以做假設檢驗時樣本量一般不會超過5千,樣本量超過5千時P值就沒什麼意義了。收集證據:用手頭的數據去驗證第一步定義的假設。這一步就是對樣本進行統計計算等操作。
  • 卡方檢驗中的p值計算 - CSDN
    卡方檢驗作為一種常見的假設檢驗,在統計學中的地位是顯而易見的,如果你還不太清楚可以參看這篇博文:卡方檢驗用於特徵選擇,寫的非常的淺顯易懂,如果你還想再擴展點卡方檢驗方面的知識,可以參看這篇博文卡方檢驗基礎,寫的也很有意思。
  • python 顯著性水平專題及常見問題 - CSDN
    顯著性檢驗利用了T分布的概率密度函數*probability density function (pdf),pdf描述了兩個連續隨機變量的相關性。這個隨機變量的累計密度函數cumulative density function (cdf)小於或等於某一個點。自由度degrees of freedom (df) 描述的是觀測樣本的數量(一般將其設置為樣本數-2)。
  • r語言兩樣本檢驗 - CSDN
    =σ2^2時,可以用以下統計量近似t統計量:1.5 步驟(1)檢驗觀測是否來自正態總體(2)檢驗方差是否相等(3)如果(1)、(2)都滿足,則計算t統計量和p值。(4)看t檢驗的p值,判斷兩樣本均值有無顯著差異(是否接收原假設)。
  • spss做顯著性檢驗_spss對回歸估計值和回歸方程進行顯著性檢驗...
    T檢驗,亦稱student t檢驗(Student's t test),主要用於樣本含量較小(例如n < 30),總體標準差σ未知的正態分布。 T檢驗是用t分布理論來推論差異發生的概率,從而比較兩個平均數的差異是否顯著。它與f檢驗、卡方檢驗並列。