f分布的檢驗 r語言 - CSDN

2021-01-17 CSDN技術社區

統計學中的t檢驗法和F檢驗法的應用條件是樣本都來自正態總體或近似正態總體,只有符合這個條件,才能用它們來檢驗各樣本所屬的總體參數的差異顯著性。


一、非參數檢驗

1、Kolmogorov-Smirnov正態性檢驗(單樣本)

檢驗單一樣本是否來自某一特定分布。比如檢驗一組數據是否為正態分布。它的檢驗方法是以樣本數據的累積頻數分布與特定理論分布比較,若兩者間的差距很小,則推論該樣本取自某特定分布族。即對於假設檢驗問題:

H0:樣本所來自的總體分布服從某特定分布

H1:樣本所來自的總體分布不服從某特定分布


Fn(X)表示一組隨機樣本的累計概率函數,F0(X)表示分布的分布函數。

當原假設為真時,D的值應較小,若過大,則懷疑原假設,從而,拒絕域為      

對於給定的又,

R實現:

1.1 ks.test()

> x <- rnorm(3000)> ks.test(x,"pnorm") One-sample Kolmogorov-Smirnov testdata: xD = 0.0077, p-value = 0.9943alternative hypothesis: two-sided

若不是正態分布函數的檢驗,只需要將"pnorm"改成相應地分布函數

當已知分布函數時,如:

> ks.test(x,"pnorm",mean(x),sd(x)) One-sample Kolmogorov-Smirnov testdata: xD = 0.0087, p-value = 0.9768alternative hypothesis: two-sided

若出現錯誤或警報,可能是由於:

Warning message:

In ks.test(X, "pnorm", 2.488715,3.012176) :

 ties should not be present for the Kolmogorov-Smirnov test

#若已知可能的分布函數

#樣本數據中存在有相同的值,單樣本K-S檢驗要求檢驗分布是連續的,而連續分布出現相同值的概率為0.如果是出現相同的,則連續分布的假設不成立,則該方法無法使用

1.2 nortest包裡的lillie.test()可以實行更精確的Kolmogorov-Smirnov檢驗

> library(nortest)> lillie.test(x) Lilliefors (Kolmogorov-Smirnov) normality testdata: xD = 0.0087, p-value = 0.8408

可以發現此方法的結果和ks.test的第二種方法的結果是一樣的

1.3 fBasics包裡的normaltest()和ksnormtest()

> ksnormTest(x)Title: One-sample Kolmogorov-Smirnov testTest Results: STATISTIC: D: 0.0077 P VALUE: Alternative Two-Sided: 0.9943 Alternative Less: 0.7946 Alternative Greater: 0.7012 Description: Tue Jan 13 21:24:19 2015 by user:



#建議:大樣本、已知總體均數和標準差,選擇非參數檢驗-單樣本KS檢驗號。。但對於樣本大小,有說大於50、500、5000的,各有所不同的理解。


2、Shapiro-Wilk(W檢驗)

統計量為:


當原假設為真時,W的值應接近於1,若值過小,則懷疑原假設,從而拒絕域為R:W<c

在給定的水平下P{w<c}=a

R實現:

2.1 shapiro.test()實現

> shapiro.test(x) Shapiro-Wilk normality testdata: xW = 0.9997, p-value = 0.9494

在R中,shpiro.test()函數限制為3-5000個樣本之間
2.2 fBasics包裡的shapiroTest()

> shapiroTest(x)Title: Shapiro - Wilk Normality TestTest Results: STATISTIC: W: 0.9997 P VALUE: 0.9494



二、圖示法

Q-Q圖:以樣本的分位數作為橫坐標,以按照正態分布計算的相應分位點作為縱坐標,把樣本表現為直角坐標系的散點。如果數據服從正態分布,則樣本點應圍繞第一象限的對角線分布。

w <- c(75.0, 64.0, 47.4, 66.9, 62.2, 62.2, 58.7, 63.5,
       66.6, 64.0, 57.0, 69.0, 56.9, 50.0, 72.0)
qqnorm(w); qqline(w)


可以發現:基本上呈正態分布。



相關焦點

  • f檢驗 matlab專題及常見問題 - CSDN
    Mann-Kendall顯著性檢驗工具:1、MATLAB2、DPS3、示例數據(數據採用的是魏鳳英老師《現代氣候統計診斷預測技術》中的1900-1990年上海市的年平均氣溫數據)Mann-Kendall原理可詳細參考https://wenku.baidu.com
  • r語言tseries - CSDN
    tsdiag(m1) #對估計進行診斷,判斷殘差是否為白噪聲summary(m1)r=m1$residuals #用r來保存殘差Box.test(r,type=」Ljung-Box」,lag=6, fitdf=1)#對殘差進行純隨機性檢驗,fitdf表示殘差減少的自由度AutocorTest(m1$resid) #加載FinTS包
  • r語言檢驗序列相關 - CSDN
    ,則進行模式識別畫自相關圖和非自相關圖,根據兩圖的結尾性和拖尾性進行AR、MA、ARMA的模式識別對識別後模式中的位置參數進行參數估計arima()模型檢驗分為:①殘差的白噪聲檢驗;②過度擬合檢驗pt()模型檢驗通過則進行模型優化,否則重新進行模式識別模型優化中得到AIC和BIC值,進行模型的優化然後進行預測與控制2.
  • r語言一元回歸模型專題及常見問題 - CSDN
    本文力求用簡化的語言,來介紹一元線性回歸的知識,同時配合R語言的實現。假定c是符合均值為0方差為σ^2的正態分布 ,記作c~N(0,σ^2)對於上面的公式,稱函數f(X) = a + b * X 為一元線性回歸函數,a為回歸常數,b為回歸係數,統稱回歸參數。X 為回歸自變量或回歸因子,Y 為回歸因變量或響應變量。
  • r語言中test - CSDN
    在學習R語言的過程中,經常會遇到前面學習過的函數但到後面再次看到忘記了用法,在kaggle實踐中也會遇到,我以前的做法是打開書本,評印象查找,但是效率極低,現在,我通過有道雲筆記 將《R語言實戰》中的所有函數按照書本出現的順序編輯成一篇文章,然後通過檢索一鍵定位。具體做法如下:1、複製下面的函數。
  • python時間序列平穩性檢驗專題及常見問題 - CSDN
    因為實際應用中我們很難獲得隨機序列的分布函數,所以嚴平穩用得極少,主要是使用寬平穩時間序列。在了解了平穩性的基本概念之後,我們再來說一下平穩時間序列的意義。平穩時間序列的分析也遵循數理統計學的基本原理,都是利用樣本信息來推測總體信息。
  • R語言做生存分析:繪製 Kaplan-Meirer生存曲線和實現Log-rank檢驗
    劉老師總結的統計教程合集,可以節省你不少時間一般生存分析文章的統計部分通常會這麼寫:採用Kaplan-Meier法計算生存率和中位生存期,採用log-rank檢驗生存率差異,Cox回歸法進行多因素分析。檢驗水準α= 0.05。我們首先看看什麼是生存分析?
  • kappa一致性檢驗教程 - CSDN
    Cohen於1960年提出Kappa分析,Kappa係數是一個用於一致性檢驗的指標,在考慮了機遇因素對診斷結果一致性的影響。二、軟體操作數據準備下面我們通過一組模擬數據來進行演示。某醫生用a、b兩種方法診斷結石,想檢驗這兩種方法的診斷結果是否一致,此時需要用Kappa一致性檢驗。
  • python test檢驗 - CSDN
    /data.txt')# f = open('./test.txt')f = open(sys.argv[1])try:sample1_text = f.readline()sample2_text = f.readline()finally:f.close()if (verbose):print("sample1 text: ", sample1
  • 參數檢驗 - CSDN
    參數檢驗:若樣本所來自的總體為分布已知的數學形式(如正態分布),對其總體參數進行假設檢驗,則稱為參數檢驗。對總體分布不做嚴格假定,也不對總體參數進行統計推斷,而是直接對總體分布的位置進行假設檢驗。
  • 的方法 線性回歸方程檢驗專題及常見問題 - CSDN
    因此,對相關程度進行檢驗也是重要的,相關程度的檢驗方法主要有三種:相關係數的檢驗回歸方程的檢驗回歸係數的檢驗相關係數的檢驗變差關係先來一張圖:如上圖所示:當給定X0時,Y的實際值與均值的差值就是Y值隨X值的全部變化,稱之為總變差。
  • graphpad 分布 - CSDN
    T檢驗T檢驗是假設檢驗的一種,又叫student t檢驗(Student’s t test),主要用於樣本含量較小(例如n<30),總體標準差σ未知的正態分布資料。 T檢驗用於檢驗兩個總體的均值差異是否顯著。
  • t檢驗中t值的意義 - CSDN
    顯著性檢驗(significance test)就是事先對總體(隨機變量)的參數或總體分布形式做出一個假設,然後利用樣本信息來判斷這個假設(備擇假設)是否合理,即判斷總體的真實情況與原假設是否有顯著性差異。或者說,顯著性檢驗要判斷樣本與我們對總體所做的假設之間的差異是純屬機會變異,還是由我們所做的假設與總體真實情況之間不一致所引起的。
  • t檢驗回歸方程專題及常見問題 - CSDN
    關於 t 分布與正態分布的關係,可參考文獻[1] t分布收斂於標準正態分布的幾種證明方法。注3:關於t分布與t檢驗相關的更多知識,可參考文獻[2] 我懶得找了。2.3 拒絕域的構造然而,t 統計量多大算大呢?多大我們才應該拒絕原假設呢?
  • 《聖劍傳說3重製版》佛爾瑟納寶箱位置分布 鼬鼠怪高原任務攻略
    不同關卡中會有寶箱分布,為了便於大家順利的探索和體驗,這裡給大家帶來了聖劍傳說3重製版佛爾瑟納寶箱位置分布,一起來看下吧。;display:inline;background:transparent;color:#737e91;cursor:pointer;text-align:left;text-indent:5px;} .t2c_r_f{width:311px;height:27px;line-height:31px;overflow:hidden;} .t2c_r_f a{margin:0 5px
  • F=3.4括號裡面的數字什麼意思?方差分析F檢驗結果如何解讀?
    我們在閱讀論文時,經常看到(方差分析)F檢驗的結果,比如F(3,19)=3.4,這是什麼意思?我們自己對照描述統計結果時,如何根據SPSS輸出的方差分析表,寫出F括號中的兩個數字? 這是本篇文章要解決的問題。
  • 方差檢驗專題及常見問題 - CSDN
    假設檢驗的步驟(1)建立統計假設;(2)收集樣本數據;(3)選定檢驗方法;(4)計算檢驗統計量值;(5)確定P值,給出推斷結論。二、t檢驗t檢驗是應用t分布的特徵,將t作為檢驗的統計量來進行的檢驗。對於兩組服從正態分布的定量數據的平均數差異的檢驗均可以採用t檢驗,常見的t檢驗有單樣本t檢驗、獨立樣本t檢驗和配對樣本t檢驗。1.單樣本T檢驗單樣本t檢驗是指對樣本平均數與總體平均數的差異進行的顯著性檢驗。即檢驗單個變量的均值是否與給定的常數之間存在差異。
  • Go 語言之 defer 的前世今生 - CSDN
    作者 | 歐長坤來源 | 碼農桃花源延遲語句 defer 在最早期的 Go 語言設計中並不存在,後來才單獨增加了這一特性,由 Robert Griesemer 完成語言規範的編寫 [Griesemer, 2009], 並由 Ken Thompson 完成最早期的實現 [Thompson, 2009],兩人合作完成這一語言特性。
  • R語言典型相關分析:NBA球員身體素質與統計數據關聯性
    到這裡我們典型相關分析還沒做完,我們還得對三組的典型相關係數做顯著性檢驗,來確定最終選擇哪一組典型變量作為兩組的相關關係的代表。    編寫顯著性檢驗函數:corcoef.test<-function(r, n, p, q, alpha=0.1){ m<-length(r); Q<-rep(0, m); lambda <- 1 for (k in m:1){ lambda<-lambda*(1-r[k]^2); Q[k]&
  • 多元線性回歸係數檢驗 - CSDN
    1.t檢驗t檢驗是對單個變量係數的顯著性檢驗,一般看p值; 如果p值小於0.05表示該自變量對因變量解釋性很強。2.F檢驗F檢驗是對整體回歸方程顯著性的檢驗,即所有變量對被解釋變量的顯著性檢驗