假設檢驗、Z檢驗與T檢驗

2020-12-22 人工智慧遇見磐創

概述

假設檢驗是統計學、分析學和數據科學中的一個關鍵概念了解假設檢驗的工作原理、Z檢驗和t檢驗之間的區別以及其他統計概念介紹

冠狀病毒大流行使我們大家都成了一個統計學家。我們不斷地核對數字,對大流行將如何發展做出自己的假設,並對何時出現「高峰」提出假設。

不僅是我們在進行假設構建,媒體也在這方面蓬勃發展。

幾天前,我讀到一篇新聞文章,其中提到這次疫情「可能是季節性的」,在溫暖的環境下會有所緩解:

所以我開始想,關於冠狀病毒,我們還能假設什麼呢?

成人是否更容易受到冠狀病毒爆發的影響?相對溼度如何影響病毒的傳播?有什麼證據支持這些說法,我們如何檢驗這些假設呢?

作為一個統計愛好者,所有這些問題都挖掘了我對假設檢驗基本原理的舊知識。本文將討論假設檢驗的概念以及Z檢驗與t檢驗的區別。

然後,我們將使用COVID-19案例研究總結我們的假設檢驗學習。

目錄

假設檢驗基礎基本概念-零假設、替代假設、類型1錯誤、類型2錯誤和顯著性水平進行假設檢驗的步驟定向假設非定向假設檢驗什麼是Z檢驗?單樣本Z檢驗雙樣本Z檢驗什麼是t檢驗?單樣本t檢驗雙樣本t檢驗Z檢驗和t檢驗的決定案例研究:Python冠狀病毒的假設檢驗假設檢驗基礎

讓我們舉一個例子來理解假設檢驗的概念。

一個人因刑事犯罪正在接受審判,法官需要對他的案件作出判決。現在,在這種情況下有四種可能的組合:

第一種情況:此人是無辜的,法官認定此人是無辜的第二種情況:此人無罪,法官認定此人有罪第三種情況:此人有罪,法官認定此人無罪第四種情況:此人有罪,法官認定此人有罪

正如你可以清楚地看到的,在判決中有兩種類型的錯誤。

第一種錯誤:當判決是針對無辜的人時第二種錯誤:當判決是有利於有罪的人時根據無罪推定,該人在被證明有罪之前被視為無罪。這意味著法官必須找到使他「毫無疑問」的證據。

這種「毫無疑問」的現象可以理解為概率(法官判定有罪|人無罪)應該很小。

假設檢驗的基本概念實際上相當類似於這種情況。

我們認為零假設是正確的,直到我們找到有力的證據反對它。那麼。我們接受另一種假設。

我們還確定了顯著性水平(),這可以理解為(法官判定有罪|人是無罪的)在前面的例子中的概率。

因此,如果較小,則需要更多的證據來拒絕零假設。別擔心,我們稍後會用一個案例來討論所有這些。

進行假設檢驗的步驟

進行假設檢驗有四個步驟:

設定假設設定決策的重要程度和標準計算測試統計做決策

步驟1到步驟3是非常不言而喻的,但是我們可以根據什麼在步驟4中做出決定?這個p值表示什麼?

我們可以把這個p值理解為衡量辯護律師論點的標準。如果p值小於,則拒絕零假設;如果p值大於,則不拒絕零假設。

臨界值,p值

讓我們用正態分布的圖形表示來理解假設檢驗的邏輯。

通常,我們將顯著性水平設置為10%、5%或1%。

如果我們的測試分數在可接受範圍內,我們就不能拒絕零假設。如果我們的測試分數在臨界區,我們拒絕零假設,接受替代假設。臨界值是驗收區和拒收區之間的截止值。我們將我們的測試分數與臨界值進行比較,如果測試分數大於臨界值,則意味著我們的測試分數位於拒絕區域,我們拒絕零假設。另一方面,如果測試分數小於臨界值,則意味著測試分數位於接受區,我們無法拒絕零假設。

但是,當我們可以根據測試分數和臨界值拒絕/接受假設時,為什麼我們需要p值?

p值的好處是我們只需要一個值就可以對假設做出決定。我們不需要計算兩個不同的值,比如臨界值和測試分數。

使用p值的另一個好處是,我們可以通過直接將其與顯著性水平進行比較,在任何期望的顯著性水平上進行測試。

這樣我們就不需要計算每個顯著性水平的考試分數和臨界值。我們可以得到p值,並直接與顯著性水平進行比較。

定向假設

在定向假設中,如果測試分數太大(右尾的測試分數太小,左尾的測試分數太小),則會拒絕零假設。因此,這種測試的拒絕區域由一個部分組成。

非定向假設

在非定向假設檢驗中,如果檢驗分數太小或太大,則拒絕零假設。因此,這種測試的拒絕區域由兩部分組成:一部分在左側,一部分在右側。

什麼是Z檢驗?

Z檢驗是檢驗假設的統計方法,當:

我們知道人口的變化,或者我們不知道總體方差,但我們的樣本量很大n≥30如果樣本量小於30且不知道總體方差,則必須使用t檢驗。

單樣本Z檢驗

當我們想比較樣本均值和總體均值時,我們執行單樣本Z檢驗。

下面是一個了解單樣本Z檢驗的示例

假設我們需要確定女生在考試中的平均分是否高於600分。

我們得到的信息是女生成績的標準差是100。因此,我們採用隨機抽樣的方法收集了20名女生的數據,並記錄她們的成績。最後,我們還將值(顯著性水平)設置為0.05。

在本例中:

女生的平均分是641分樣本的大小是20平均是600標準差為100

由於P值小於0.05,我們可以拒絕零假設,並根據我們的結果得出結論,女孩平均得分高於600。

雙樣本Z檢驗

當我們想要比較兩個樣本的平均值時,我們執行兩個樣本的Z檢驗。

下面是一個了解雙樣本Z檢驗的示例

這裡,假設我們想知道女生的平均分是否比男生高出10分。

我們得到的信息是,女生成績的標準差是100,男生成績的標準差是90。然後採用隨機抽樣的方法收集20名女生和20名男生的數據,記錄她們的成績。最後,我們還將值(顯著性水平)設置為0.05。

在本例中:

女孩的平均分(樣本平均值)是641男孩的平均分(樣本平均值)為613.3女生標準差為100男生標準差是90男女樣本量均為20平均分差異是10

因此,我們可以根據P值得出結論,我們不能拒絕零假設。我們沒有足夠的證據得出這樣的結論:女生的平均分比男生高出10分。很簡單,對吧?

什麼是t檢驗?

t檢驗是檢驗假設的一種統計方法,當:

我們不知道總體方差我們的樣本量很小,n < 30一個樣本的t檢驗

當我們想要比較樣本均值和總體均值時,我們執行一個單樣本t檢驗。與Z檢驗的不同之處在於,我們這裡沒有關於總體方差的信息。

在這種情況下,我們使用樣本標準差代替總體標準差。

下面是一個了解單樣本t檢驗的示例

假設我們想確定女生平均考試成績是否超過600分。我們沒有與女孩分數的方差(或標準差)相關的信息。為了進行t檢驗

我們隨機收集了10名有分數的女孩的數據選擇我們的值(顯著性水平)為0.05進行假設檢驗。

在本例中:

女生的平均分是606.8分樣本大小是10平均分是600樣本的標準差為13.14

我們的P值大於0.05,因此我們無法拒絕零假設,也沒有足夠的證據來支持這樣的假設:平均來說,女孩在考試中的得分超過600分。

雙樣本t檢驗

當我們想要比較兩個樣本的平均值時,我們執行雙樣本t檢驗。

下面是一個理解雙樣本t檢驗的例子

這裡,假設我們想確定,在考試中,男生的平均分數是否比女生高出15分。我們沒有與女孩或男孩分數的方差(或標準差)相關的信息。為了進行t檢驗

我們隨機收集了10名男女學生的成績數據我們選擇值(顯著性水平)為0.05作為假設檢驗的標準

在本例中:

男生的平均分是630.1女生的平均分是606.8分平均相差15分男生成績的標準差是13.42女生成績的標準差為13.14

因此,P值小於0.05,因此我們可以拒絕零假設,並得出結論:在考試中,男孩平均比女孩多15分。

Z檢驗和T檢驗的決定

那麼我們什麼時候應該做Z檢驗,什麼時候應該做t檢驗呢?如果我們想掌握統計學,這是我們需要回答的一個關鍵問題。

如果樣本量足夠大,那麼Z檢驗和t檢驗將得出相同的結果。對於大樣本,樣本方差是對總體方差的較好估計,因此即使總體方差未知,我們也可以使用樣本方差的Z檢驗。

同樣,對於大樣本,我們有很高的自由度。由於t分布接近正態分布,z分和t分之間的差異可以忽略不計。

案例研究:用Python對冠狀病毒進行假設檢驗

現在讓我們為冠狀病毒數據集實現兩個樣本Z測試。讓我們把理論知識付諸實踐,看看能不能做好。你可以在這裡下載數據集。

https://drive.google.com/file/d/1SJHiTq9QH3GX4CHKtODY3pcmmtxx0bB9/view?usp=sharing

這個數據集取自John Hopkin的存儲庫,你可以在這裡找到它的連結。

https://github.com/CSSEGISandData/COVID-19/tree/master/csse_covid_19_data/csse_covid_19_daily_reports

此數據集具有以下特徵:

Province/StateCountry/RegionLast UpdateConfirmedDeathsRecoveredLattitudeLongitude我們還使用Python的Weather API-Pyweatherbit添加了緯度和經度的溫度和溼度特性。

關於COVID-19的一個普遍看法是,溫暖的氣候對日冕爆發更有抵抗力,我們需要通過假設檢驗來驗證這一點。那麼,我們的零假設和替代假設是什麼呢?

零假設:溫度不影響COV-19的爆發替代假設:溫度確實影響COV-19的爆發註:在我們的數據集中,溫度低於24表示寒冷氣候,高於24表示炎熱氣候。

import pandas as pdimport numpy as npcorona = pd.read_csv('Corona_Updated.csv')corona['Temp_Cat'] = corona['Temprature'].apply(lambda x : 0 if x < 24 else 1)corona_t = corona[['Confirmed', 'Temp_Cat']]def TwoSampZ(X1, X2, sigma1, sigma2, N1, N2): from numpy import sqrt, abs, round from scipy.stats import norm ovr_sigma = sqrt(sigma1**2/N1 + sigma2**2/N2) z = (X1 - X2)/ovr_sigma pval = 2*(1 - norm.cdf(abs(z))) return z, pvald1 = corona_t[(corona_t['Temp_Cat']==1)]['Confirmed']d2 = corona_t[(corona_t['Temp_Cat']==0)]['Confirmed']m1, m2 = d1.mean(), d2.mean()sd1, sd2 = d1.std(), d2.std()n1, n2 = d1.shape[0], d2.shape[0]z, p = TwoSampZ(m1, m2, sd1, sd2, n1, n2)z_score = np.round(z,8)p_val = np.round(p,6)if (p_val<0.05): Hypothesis_Status = 'Reject Null Hypothesis : Significant'else: Hypothesis_Status = 'Do not reject Null Hypothesis : Not Significant'print (p_val)print (Hypothesis_Status)0.180286Do not reject Null Hypothesis : Not Significant因此。我們沒有證據否定我們的零假設,即溫度不影響COV-19的爆發。

雖然我們無法找到溫度對COV-19的影響,但這個問題只是作為我們在本文中所學的概念性理解。COVID-19數據集的Z檢驗有一定的局限性:

樣本數據可能不能很好地代表人口數據樣本方差可能不是總體方差的好估計量一個州應對這種流行病的能力的變化社會經濟原因某些地方的早期突破一些國家可能出於地緣政治原因而隱瞞這些數據因此,我們需要更加謹慎,進行更多的研究,以確定這種流行病的模式。

結尾

本文採用逐步回歸的方法,對假設檢驗、1型誤差、2型誤差、顯著性水平、臨界值、p值、非定向假設、定向假設、Z檢驗和t檢驗的基本原理進行了研究,並對一個冠狀病毒病例進行了兩樣本Z檢驗。

原文連結:https://www.analyticsvidhya.com/blog/2020/06/statistics-analytics-hypothesis-testing-z-test-t-test/

相關焦點

  • 參數檢驗 - CSDN
    一、參數檢驗1、基本思想4、檢驗的p值在一個假設檢驗問題中, 拒絕原假設H0的最小顯著性水平稱為檢驗的p值.7、成對數據的t檢驗所謂成對數據, 是指兩個樣本的樣本容量相等, 且兩個樣本之間除均值之外沒有另的差異.
  • 線性回歸假設檢驗 - CSDN
    2.5 假設檢驗除了置信區間外,還可以使用假設檢驗來得到更有把握的結果。具體來說,我們剛剛得到了 a 的估計值,但是我們不知道 a 的真實值是多少。那麼我們可以做一個假設,比如我們假設 a = 0 。  換個角度來看,使用剛剛定義的置信區間,我們得到 0 並沒有在置信區間內,根據這個我們也可以拒絕 a = 0  這樣的一個假設。總結一下:1. 對於單個參數的假設檢驗與置信區間比較類似,二者相通。2. 也可以對多個參數做組合的假設檢驗。3.
  • adf檢驗模型 - CSDN
    ADF檢驗全稱是 Augmented Dickey-Fuller test,顧名思義,ADF是 Dickey-Fuller檢驗的增廣形式。DF檢驗只能應用於一階情況,當序列存在高階的滯後相關時,可以使用ADF檢驗,所以說ADF是對DF檢驗的擴展。單位根(unit root)在做ADF檢驗,也就是單位根檢驗時,需要先明白一個概念,也就是要檢驗的對象——單位根。
  • 精益六西格瑪管理-威爾科克森符號秩檢驗-高精度非參檢驗方法
    對於單個總體均值的檢驗問題,我們在前面的參數檢驗做了介紹,當標準差已知時,我們可以用Z檢驗;當標準差未知時,可以用t檢驗。當然,這兩種檢驗法都必須要求總體分布為正態。如果分布非正態,我們可以用符號檢驗的方法。
  • 的方法 線性回歸方程檢驗專題及常見問題 - CSDN
    可以證明r的t統計量服從自由度為n-2的t分布:範例分析某市欲對貨運總量與工業總產值的數量關係進行研究,以便通過工業總產值預測貨運總量。現將1991-2000年的數據,列入下表中,根據這些數據對回歸方程相關係數r在顯著水平0.05做雙側檢驗。
  • 使用非參數統計檢驗進行分析的指南
    問題是沒有人告訴你如何進行像假設檢驗這樣的分析。統計檢驗用於制定決策。為了使用中位數進行分析,我們需要使用非參數檢驗。非參數測試是分布獨立的檢驗,而參數檢驗假設數據是正態分布的。說參數檢驗比非參數檢驗更加的臭名昭著是沒有錯的,但是前者沒有考慮中位數,而後者則使用中位數來進行分析。接下來我們就進入非參數檢驗的內容。
  • 卡方相關性檢驗 - CSDN
    卡方 自由度 P 值Pearson 11.788 4 0.019似然比 11.816 4 0.019Pearson 卡方和似然比卡方Minitab 執行 Pearson 卡方檢驗和似然比卡方檢驗。
  • 多元線性回歸的模型解釋、假設檢驗、特徵選擇
    最後,我們將深入學習線性回歸,學習共線性、假設檢驗、特徵選擇等內容。現在有人可能會想,我們也可以用簡單的線性回歸來分別研究我們對所有自變量的輸出。為什麼需要線性回歸從多個輸入變量預測結果。但是,真的是這樣嗎?
  • 回歸方程的擬合優度檢驗 - CSDN
    分類數據的擬合優度檢驗卡方檢驗主要是測試樣本分類數據的分布是否符合預期分布。相信大家如果學過高中生物,都知道孟德爾——遺傳學之父,當時他根據顏色和形狀把豌豆分為四類:黃圓、綠圓、黃皺和綠皺.孟德爾根據遺傳學原理判斷這四類的比例應為9:3:3:1.為做驗證,孟德爾分別統計了這四類豌豆的個數,正是利用檢驗證明了這令人激動的結論在處理分類數據時,這些類別值本身對統計檢驗沒有多大用處,比如像「男性」、「女性」和「其他」這樣的類別數據沒有任何數學意義。
  • 精益六西格瑪管理-非參檢驗-大樣本量時的符號檢驗如何處理?
    前面我們說明了小樣本時符號檢驗的實例;下面我們繼續了解大樣本時,符號檢驗時如何實施的;當樣本容量n>30,則「+」號個數的抽樣分布可以用正態概率分布來近似。當p=0的原假設成立時,+號個數的抽樣分布可以用下面正態近似。
  • 抽樣檢驗方法、原理及應用(一)
    當今世界幾乎可以說每個涉及產品檢驗的公司都在運用各種各樣的抽樣技術對產品質量進行抽樣檢驗。所以抽樣技術是全球最流行,運用最廣泛的質量工具。當採用某個接收質量水準比如AQL1.5連續抽檢n批產品都合格,則下一步開始用放寬的抽樣標準開始檢驗。當放寬的抽樣標準檢驗有一批不合格,則馬上回到正常檢驗。如果正常檢驗質量狀況不好,則進入加嚴抽樣標準。
  • 廣義相對論中等效原理的實驗檢驗
    如果這個假設正確,則所有的自由落體都具有相同的加速度。這個假設在現代物理上被稱為弱等效原理,在引力理論中起著重要的作用。弱等效原理的違背或者牛頓反平方定律的偏離都可能第五種基本力的出現,尋找第五種力仍然是探測弱等效原理違背實驗的一個目標。到目前為止,對弱等效原理的檢驗,在地面上的實驗精度可達到10^-15,美國宇航局進行的太空實驗能將精度提高到10^-18。
  • arma python 檢驗專題及常見問題 - CSDN
    (4)檢驗模型的有效性。如果模型不通過檢驗,轉向步驟(2),重新選擇模型再擬合。(5)模型優化。如果擬合模型通過檢驗,仍然轉向不走(2),充分考慮各種情況,建立多個擬合模型,從所有通過檢驗的擬合模型中選擇最優模型。(6)利用擬合模型,預測序列的將來走勢。
  • python平穩性檢驗專題及常見問題 - CSDN
    (4)檢驗模型的有效性。如果模型不通過檢驗,轉向步驟(2),重新選擇模型再擬合。(5)模型優化。如果擬合模型通過檢驗,仍然轉向不走(2),充分考慮各種情況,建立多個擬合模型,從所有通過檢驗的擬合模型中選擇最優模型。(6)利用擬合模型,預測序列的將來走勢。
  • 醫學檢驗技術前途怎麼樣?
    目前醫學檢驗技術專業已確認獲批的首批國家級和省級一流本科專業建設點包括(按首字母拼音排序):國家級一流本科專業建設點北華大學醫學檢驗技術專業蚌埠醫學院醫學檢驗技術專業重慶醫科大學醫學檢驗技術專業大連醫科大學檢驗醫學院醫學檢驗技術專業
  • 創新海船法定檢驗工作方法,福建省首家國有船舶檢驗公司成立!
    2020年12月31日,福建省港設船舶檢驗有限公司掛牌成立,該公司是福建省首家國有船舶檢驗公司。成立後,該公司將承擔全省海船法定檢驗和圖紙審核的工作任務。我們所熟悉的船舶檢驗公司是船級社,而各個港航局都有船檢處或船檢科,這一次,為為進一步提升船檢服務能力和水平,福建省港航中心、福建省港航勘察設計院有限公司積極探索創新海船法定檢驗工作機制,推行船舶檢驗業務與證書核發「檢管分離」改革。據統計,近年來,隨著福建省海船檢驗資質回歸,海船檢驗業務從零起步,實現了快速增長,2020年檢驗海船548艘次、209萬載重噸。
  • 別良峰:檢驗人的工匠精神
    為臨床診斷提供準確、及時、可信的檢驗結果,是檢驗人的責任與義務。 很多人對檢驗科有刻板的印象,以為檢驗樣本的工作就是重複且制式,別良峰並不贊同,作為一個專業學習檢驗醫學,且有著近30年工作經驗的檢驗科醫生來說,即使檢驗的過程是枯燥且乏味的,但千差萬別的結果,才是真正考驗檢驗人「功夫」的。
  • 「鑽天進洞」般檢驗出成果!江蘇省特檢院對金陵石化大修現場檢驗...
    從11月26日開始,為配合金陵石化Ⅲ連續重整裝置的停車大檢修,江蘇省特檢院的檢驗人員經歷這樣「鑽天進洞」般的檢驗已有21天。江蘇省特檢院直屬分院副院長宋高峰介紹,從2006年開始,江蘇省特檢院先後共參與了金陵石化十餘套裝置的檢驗工作,採用RBI(基於風險的檢測)等先進的檢驗檢測技術,通過有效檢驗降低裝置安全風險,為企業解決了多項技術難題,為裝置長周期安全運行提供技術支撐。
  • 亞太國際區域檢驗中心整合實驗室落戶羅湖
    深圳新聞網訊(見圳客戶端、深圳新聞網記者 彭桂紅 通訊員 羅醫宣)11月14日下午,亞太國際區域檢驗中心整合實驗室——「羅氏卓越示範中心」在深圳市羅湖醫院集團醫學檢驗中心揭牌。經此一「疫」,社會各界對檢驗醫學的價值有了更加深刻的認識,也對臨床檢驗工作提出了更高的期許。作為深圳市首家區域檢驗中心,羅湖醫院集團醫學檢驗中心所面臨的檢測任務龐大,如何持續提升其在短時間內對大批量、高技術要求的項目進行統一檢測的能力是醫學檢驗中心建設發展的重點。深圳市羅湖醫院集團院長孫喜琢表示:「在此後疫情時代,羅湖醫院集團將持續加速構建國際一流的智慧醫療服務體系,穩固疫情防線、惠及更多患者。
  • 進口糖果檢驗程序(一)
    1、現場檢驗檢疫 檢驗人員應及時赴現場,對申報貨物運輸工具、貨物等實施檢驗監督。 (4)抽/採樣憑證:檢驗監督工作人員攜帶樣品離開車站、倉庫、碼頭、機場、工廠(場)等抽/採樣地時,應當規範填寫《抽/採樣憑證》、《樣品退還告知書》,並註明樣品名稱、樣品數量、採樣日期,無抽/採樣的註明無抽/採樣, 報檢 人和至少兩名檢驗監督工作人員雙方籤字。第一聯交 報檢 人,第二聯為內部存根。