統計學知識系列:一篇搞懂假設檢驗

2021-02-15 Python數據科學

前言:對於數據分析師來說,統計學是必不可少的基礎知識。不僅工作中會經常運用其概念,且也幾乎是數據分析師工作的面試必考題(尤其是校招以及轉行的朋友,當實戰經驗少的時侯會更關注基礎功底是否紮實)。所以我準備開始以較簡練的語言,輔以簡單易懂案例,總結一些統計學核心的知識點。我們常用的ab實驗,其背後的原理就是統計學中的假設檢驗,今天我們來詳細說說假設檢驗。
什麼是假設檢驗:假設就是對從總體參數(均值、比例等)的具體數值所作的陳述,比如,我認為配方一比配方二的效果要好。而假設檢驗就是先對總體的參數提出某種假設,然後利用樣本的信息判斷假設是否成立的過程,比如上面的假設信息我該接受還是拒絕。
什麼是顯著性水平:顯著性水平是一個概率值,原假設為真時,拒絕原假設的概率,表示為α,常取值為0.05、0.01、0.10。一個公司招聘,本來準備招聘100個人,公司希望只有5%的人是混水摸魚招聘進來,所以可能會有5個人混進來,所謂顯著性水平α,就是你允許有多少比例混水摸魚的能通過測試。原假設與備擇假設:待檢驗的假設又叫原假設(零假設),一般表示為H0,原假設一般表示兩者沒有顯著性差異。與原假設進行對比的叫備擇假設,表示為H1。一般在比較的時候,主要有等於、大於、小於。檢驗統計量:即計算檢驗的統計量。根據給定的顯著性水平,查表得出相應的臨界值。再將檢驗統計量的值與該顯著性水平的臨界值進行比較,得出是否拒絕原假設的結論。P值:是一個概率值,如果原假設為真,p值是抽樣分布中大於或小於樣本統計量的概率。左檢驗時,p值為曲線上方小於等於檢驗統計量部分的面積。右檢驗時,p值為曲線上方大於等於檢驗統計量部分的面積。假設檢驗的兩種錯誤:類型 I 錯誤(棄真),如原假設為真,但否定它,則會犯類型 I 錯誤。犯類型 I 錯誤的概率為 α(即您為假設檢驗設置的顯著性水平)。α 為 0.05 表明,當您否定原假設時,您願意接受 5% 的犯錯概率。為了降低此風險,必須使用較低的 α 值。但是,使用的α值越小,在差值確實存在時檢測到實際差值的可能性也越小。類型 II 錯誤(採偽),如原假設為假,但無法否定它,則會犯類型 II 錯誤。犯類型 II 錯誤的概率為 β,β 依賴檢驗功效。可以通過確保檢驗具有足夠大的功效來降低犯類型 II 錯誤所帶來的風險。方法是確保樣本數量足夠大,以便在差值確實存在時檢測到實際差值。單雙測檢驗:當假設關鍵詞有不得少於/低於的時候用左側檢驗,比如燈泡的使用壽命不得少於/低於700小時時;當假設關鍵詞有不得多於/高於的時候用右側檢驗,比如次品率不得多於/高於5%時。雙側檢驗指按分布兩端計算顯著性水平概率的檢驗,應用於理論上不能確定兩個總體一個一定比另一個大或小的假設檢驗。一般假設檢驗寫作H0:μ1=μ2。檢驗結果:單側,若p值>α,不拒絕H0,若p值<α,拒絕H0;雙側,若p值>1/2α,不拒絕H0,若p值<1/2α,拒絕H0
假設檢驗方法:z檢驗,t檢驗,卡方檢驗(卡方本篇不詳述,應用較少)
Z檢驗原理:當總體標準差已知,樣本量較大時用標準正態分布的理論來推斷差異發生的概率,從而比較兩個平均數的差異是否顯著。如果檢驗一個樣本平均數與一個已知的總體平均數的差異是否顯著,其Z值計算公式為:如果檢驗來自兩個的兩組樣本平均數的差異性,從而判斷它們各自代表的總體的差異是否顯著,其Z值計算公式為:研究正常人與高血壓患者膽固醇含量,比較兩組血清膽固醇含量有無顯著差異。正常人組數據:n1=506(樣本量) μ1=180.6(樣本均值) s1=34.2(標準差)高血壓組數據:n2=142  μ2=223.6  s2=45.8α=0.05,樣本量較大,且檢驗來自兩組樣本平均數的差異性,故選擇z檢驗統計量α=0.05,雙側故 α/2=0.025,1-α=0.975 查表,確認臨界值為1.9610.4(z值)>1.96(臨界值),故p<0.05,按α=0.05水準拒絕H0,接受H1,可以認為正常人和高血壓患者的血清膽固醇含量有差異。t檢驗:分為單樣本的t檢驗、配對樣本均數t檢驗(本篇不詳細說)、兩獨立樣本均數t檢驗。t檢驗應用於兩組計量資料小樣本比較,樣本對總體有較好代表性,對比組間有較好組間均衡性,即隨機抽樣和隨機分組。且樣本來自正態分布總體。單個樣本t檢驗適用於樣本均數與已知總體均數μ0的比較,目的是檢驗樣本均數所代表的總體均數μ是否與已知總體均數μ0有差別。應用於總體標準α未知的小樣本資料,且服從正態分布。某地新生兒出生體重為3.3kg,從該地難產兒中隨機抽取35名嬰兒,平均體重為3.42kg,標準差為0.4kg,問該地難產兒出生體重與新生兒體重是否不同?α=0.05 ,樣本均數與已知總體均數μ0的比較,所以選擇單樣本t檢驗n=35  μ0=3.3  μ=3.42  s=0.4自由度=n-1=34,α=0.05,雙側故 α/2=0.025,1-α=0.975,自由度34,查表得出臨界值為2.032因為1.77(z值)<2.032(臨界值),故p>0.05,按α=0.05水平,差別無統計學意義,不拒絕h0,不能認為該地難產兒與新生兒體重有差異。兩獨立樣本t檢驗(ab實驗背後原理):適用於完全隨機設計的兩樣本均數的比較,其目的是檢驗兩樣本所來自總體的均數是否相等。兩獨立樣本t檢驗要求兩樣本所代表的總體服從正態分布N(μ1,σ^2)和N(μ2,σ^2),且兩總體方差σ1^2、σ2^2相等,即方差齊性。若兩總體方差不等需要先進行變換。兩獨立樣本t檢驗的檢驗假設是兩總體均數相等,即H0:μ1=μ2,統計量計算公式為:25例糖尿病患者隨機分成兩組,甲單純藥物治療,乙採用藥物合併飲食治療,二月後測空腹血糖如下,問兩種療法血糖值是否相同?數據:n1=12  s1=182.5  n2=13  s2=141自由度=n1+n2-2=23  α=0.05,雙側故 α/2=0.025,1-α=0.975,查表得臨界值為 t=2.069因為2.639(t值)>2.069(臨界值) ,故 p<0.05 , 在0.05水準下,拒絕H0,接受H1,存在顯著性差異,故認為兩種療法效果不同。以上,希望對大家有所幫助。大家如果對假設檢驗部分有困惑的點,歡迎隨時與我交流。

我是東哥,最後給大家免費分享入門Python的最強三件套:《ThinkPython》、《簡明Python教程》、《Python進階》的PDF電子版。如果你是剛入門的小白,不用想了,這是最好的學習教材。

現在免費分享出來,有需要的讀者可以下載學習,在下面的公眾號GitHuboy裡回復關鍵字:Python,就行。

🧐分享、點讚、在看,給個三連擊唄!👇

相關焦點

  • 統計學的假設檢驗
    總第159篇/張俊紅上次寫了統計學裡面的置信度與置信區間以後,文章反響還不錯,這次再來試著寫寫統計學裡面的假設檢驗。點擊查看:聊聊置信度與置信區間假設檢驗的核心其實就是反證法。我們把上面這個過程就叫做假設檢驗。了解完假設檢驗的思想以後,我們來看一下具體步驟:step1:提出零假設和備擇假設;零假設(H0)一般是我們要推翻的論點,備擇假設(H1)則是我們要證明的論點。拿上面的女士品茶例子來講。H0:把茶加到奶裡和把奶加到茶裡面得到的『奶茶』是一樣的。
  • 學好統計學與計量經濟學假設檢驗縱貫線
    統計學中客觀事物平均水平的假設檢驗為雙側、左側或右側檢驗;統計學中客觀事物離散水平的假設檢驗通常為右側檢驗。計量經濟學中係數的顯著性檢驗通常為雙側檢驗;計量經濟學中服從卡方分布、F分布的假設檢驗通常為右側檢驗。
  • 搞定統計學必知:P值、T檢驗、卡方檢驗、假設檢驗……
    即假設總體中任意變量間均無關聯。我們重複類似實驗,會發現約20個實驗中有一個實驗,我們所研究的變量關聯將等於或強於我們的實驗結果。(這並不是說如果變量間存在關聯,我們可得到5%或95%次數的相同結果,當總體中的變量存在關聯,重複研究和發現關聯的可能性與設計的統計學效力有關。)
  • 統計學中的假設檢驗
    假設檢驗的特點就是採用邏輯上的反證法和依據統計上 的小概率原理。小概率事件在單獨一次的試驗中基本上不會發生,可以不予考慮。在假設檢驗中,我們做出判斷時所依據的邏輯是:如果在原假設正確的前提下,檢驗統計量的樣本觀測值的出現屬於小概率事件,那麼可以認為原假設不可信,從而否定它,轉而接受備擇假設。
  • 假設檢驗的前世今生
    其實,「前世今生」系列的文章我已經看到過好幾篇了,比如「正太分布的前世今生」、「Meta分析的前世今生」。不知為何,我個人也很喜歡「前世今生」這個詞。今天呢,就聊一聊我知道的一點「假設檢驗的前世今生」吧。 假設檢驗是統計學裡最重要、最基礎的的概念,即便是不知道,不了解這個術語,與統計學毫不相干的人,在日常生活中,也不知不覺地應用了假設檢驗。
  • 數據分析必備統計學(二):假設檢驗
    講完概率分布,再來講講統計學的最後一個知識點——假設檢驗。假設檢驗是數理統計學中根據一定假設條件由樣本推斷總體的一種方法。事先對總體參數或分布形式作出某種假設,然後利用樣本信息來判斷原假設是否成立,採用邏輯上的反證法,依據統計上的小概率原理。為了更好的解釋,這裡舉個例子。
  • 顯著性檢驗、假設檢驗和原假設顯著性檢驗
    在Fisher那裡,p值是一次實驗中,從假設總體中獲得觀測樣本或更極端樣本的可能性,越小,越可能懷疑假設的正確性,並且要結合其他先驗知識才能做出最後的決策。NP體系適用於重複抽樣,其所有概念都是基於重複抽樣的頻率定義,不適用於一次實驗。NP體系中α是人為設定好的,通常設定α= 0.05,它表示H0為真的總體中重複100次實驗,會有5次實驗被錯誤拒絕。
  • 假設檢驗、Z檢驗與T檢驗
    概述假設檢驗是統計學、分析學和數據科學中的一個關鍵概念了解假設檢驗的工作原理、Z檢驗和t檢驗之間的區別以及其他統計概念介紹冠狀病毒大流行使我們大家都成了一個統計學家。我們不斷地核對數字,對大流行將如何發展做出自己的假設,並對何時出現「高峰」提出假設。
  • [理論+spss實戰]假設檢驗——單樣本t檢驗
    反證法思想是先提出假設(檢驗假設H0),再用適當的統計方法確定假設成立的可能性大小,如可能性小(即最後計算出P值小於0.05),則認為假設不成立。 假設檢驗其實就是驗證你事先提出的假設是落在了置信區間內部,還是落在了置信區間外部(稱為:拒絕域)。如圖,若落在了拒絕區域內(陰影部分),則拒絕H0,此時P<0.05。
  • 統計學裡的最重要工具之一:假設檢驗
    一杯奶茶,成就了一段浪漫的情緣,也成就了統計學的重要工具----假設檢驗。【案例 2】咖啡新鮮嗎?「咖啡(Coffee)「的名字最早來自衣索比亞的一個名叫卡法(kaffa)的小鎮,是「力量與熱情」的意思。
  • 統計學常用概念|T檢驗、F檢驗、卡方檢驗、P值、自由度
    t檢驗得到如此廣泛的應用,究其原因,不外乎以下幾點:現有的醫學期刊多在統計學方面作出了要求,研究結論需要統計學支持;傳統的醫學統計教學都把t檢驗作為假設檢驗的入門方法進行介紹,使之成為廣大醫學研究人員最熟悉的方法;t檢驗方法簡單,其結果便於解釋。簡單、熟悉加上外界的要求,促成了t檢驗的流行。
  • 統計檢驗假設的P值與檢驗水準α
    本文給大家普及一下檢驗假設中常用到的P值、檢驗水準α以及如何合理解釋。p值是在原假設(零假設)H0正確的前提下,出現觀察結果以及比之觀察結果更極端情形的概率,P值由相應統計模型計算而來,其計算根本不涉及備擇假設。
  • 假設檢驗:使用p值來接受或拒絕你的假設
    介紹檢驗是統計學中最基本的概念之一。不僅在數據科學中,假設檢驗在各個領域都很重要。想知道怎麼做?讓我們舉個例子。現在有一個lifebuoy沐浴露。沐浴露廠商聲稱,它殺死99.9%的細菌。他們怎麼能這麼說呢?必須有一種測試技術來證明這種說法是正確的。所以假設檢驗用來證明一個主張或任何假設。
  • 統計學知識闖關
    通常,許多的科學領域中產生P值的結果≤0.05被認為是統計學意義的邊界線,但是這顯著性水平還包含了相當高的犯錯可能性。結果 0.05≥P>0.01被認為是具有統計學意義,而0.01≥P≥0.001被認為具有高度統計學意義。但要注意這種分類僅僅是研究基礎上非正規的判斷常規。第6關:所有的檢驗統計都是正態分布的嗎?
  • 數據分析必備——統計學入門基礎知識
    ——數據說·夢想季 導讀:要做好數據分析,除了自身技術硬以及數據思維靈活外,還得學會必備的統計學基礎知識!因此,統計學是數據分析必須掌握的基礎知識,即通過搜索、整理、分析、描述數據等手段,以達到推斷所測對象的本質,甚至預測對象未來的一門綜合性科學。
  • 統計學知識大梳理(終極篇)
    既然統計學這麼厲害,這麼牛逼,這麼重要。作為統計學專業的我,我就忍不住要給大家好好梳理下統計學的知識框架,並且帶著大家一點一點的學習下統計學和概率論的知識。在今後的關於統計學的文章中,我努力實現以下幾個小目標。
  • SAS系列23:列聯表資料假設檢驗方法
    系列17-22我們已經介紹了四格表卡方檢驗方法及其SAS實現,今天開始介紹列聯表資料的假設檢驗方法及其SAS實現。
  • 統計學基礎-t檢驗基本原理
    ,即假設樣本均數等於總體均值備擇假設H1:配對樣本t檢驗      配對設計是一種特殊的設計形式,這種設計能夠更好地控制非實驗因素對研究帶來的影響。例如研究某藥物副作用是否對體重有影響。配對樣本t檢驗的步驟如下:1.建立檢驗假設,確定檢驗水準零假設H0:
  • 【入門】數據分析必備——統計學入門基礎知識
    ——數據說·夢想季導讀:要做好數據分析,除了自身技術硬以及數據思維靈活外,還得學會必備的統計學基礎知識!因此,統計學是數據分析必須掌握的基礎知識,即通過搜索、整理、分析、描述數據等手段,以達到推斷所測對象的本質,甚至預測對象未來的一門綜合性科學。
  • 【實例】Excel數據分析之假設檢驗中的t-檢驗應用
    它是統計推斷的一種基本形式,是數理統計學的一個重要分支,分為點估計和區間估計兩部分。在數據分析工具中,假設檢驗也被稱為顯著性檢驗,是統計推斷中的一種重要的數據統計方法。它首先對研究總體的參數做出某種假設,然後從總體中抽取樣本進行觀察,用樣本提供的信息對假設的正確性進行判斷,從而決定是否成立。若觀察結果與理論不符,則假設不成立,若觀察結果與理論相符,則認為沒有充分的證據表明假設錯誤。