數據分析必備統計學(二):假設檢驗

2020-11-29 數據分析不是個事兒

講完概率分布,再來講講統計學的最後一個知識點——假設檢驗。

假設檢驗是數理統計學中根據一定假設條件由樣本推斷總體的一種方法。事先對總體參數或分布形式作出某種假設,然後利用樣本信息來判斷原假設是否成立,採用邏輯上的反證法,依據統計上的小概率原理。

為了更好的解釋,這裡舉個例子。

假設我有一袋豆子,袋子裡有紅豆,也有黑豆,我想知道紅豆和黑豆是不是一樣多。若是一個個去看怕是要瘋了。於是偷個懶,從袋子裡拿了一把豆子,看看這把紅豆多還是黑豆多。用這把豆子作為樣本,去推斷這袋豆子。既然是用樣本推斷總體,就有抽樣誤差的可能性。不管袋子裡紅豆多還是黑豆多,這一把不一定能真實反映這袋豆子,那怎麼辦呢?這就要用到假設檢驗了。

說假設檢驗之前,先要知道小概率事件。統計大牛覺得如果一件事情發生的可能性小於0.05,就可以定義為小概率事件了,也就是說,在一次研究中該事件發生的可能性很小,如果只進行一次研究,可以視為不會發生。

回到豆子的話題。現在是想通過樣本(一把豆子)去推斷總體(一袋豆子)。先做一個假設,一般是我們心裡特別不想承認的那一種可能,也稱無效假設。和無效假設對立的是備擇假設,是無效假設的對立面。

無效假設:袋子裡紅豆和黑豆是一樣多的,如果觀察到紅豆黑豆不一樣多完全是由抽樣造成的。備擇假設:袋子裡紅豆和黑豆的確不一樣多。

假定袋子裡有100個豆子,50個紅豆,50個黑豆。拿的這把豆子有3個紅豆,7個黑豆。在無效假設成立的前提下,也就是說紅豆黑豆一樣多的基礎上,能拿到3個紅豆、7個黑豆的概率為:

這告訴我們,在紅豆和黑豆一樣多的假設下,拿到3個紅豆7個黑豆的可能性為0.11,是很常見的,說明所做的假設是可以成立的,還沒有理由能拒絕無效假設。

假定袋子裡有100個豆子,50個紅豆,50個黑豆。拿的這把豆子有1個紅豆,9個黑豆。

在無效假設成立的前提下,能拿到1個紅豆、9個黑豆的概率為:

這告訴我們,在紅豆和黑豆一樣多的假設下,拿到1個紅豆9個黑豆的可能性為0.007<0.05,為小概率事件,在一次研究中是不應該發生的,而現在發生了,可能是所做的假設有問題,有理由拒絕無效假設。

簡言之,假設檢驗的核心思想是小概率反證法,在假設的前提下,估算某事件發生的可能性,如果該事件是小概率事件,在一次研究中本來是不可能發生的,現在發生了,這時候就可以推翻之前的假設,接受備擇假設。如果該事件不是小概率事件,我們就找不到理由來推翻之前的假設,實際中可引申為接受所做的無效假設。

假設檢驗解決那些問題

網際網路運營分析師與產品經理都很熟悉的方法:ABtest。適用方面:往往新版本或者新功能上線之前,需要驗證新需求的是否有正收益,傳統模式往往就是新版本發布,然後觀察留存率、跳轉率等核心指標,如果觀察表現期內,流量正增長,那麼則認可該版本,如果效果反饋不佳,則快速回滾舊版本。但在移動網際網路時代,千人千面講究用戶差異化的時代,產品經理在面對海量用戶流量,就可以實現ABtest,過程:抽樣小規模流量,進行灰度測試,檢驗新需求是否有正收益,如果觀察周期校驗效果顯著,則大規模上線測試迭代,直至全流量覆蓋。

ABtest其本質核心就是假設檢驗,但是實際操作中,這裡有幾個關鍵:

1、如何設計抽樣,儘量實現對照實驗兩邊公平;

2、如何提高靈敏度,即效果收益穩定性,多組交叉驗證流量平衡;

3、對照組設置,避免引入幹擾因素;

4、收益評價指標,正收益、用戶體驗,當然我們T檢驗也要通過。

實際應用中,我們會發現產品經理的腦洞實在太大,需求太多,能否實現少設置測試流量批次?能否縮短收益評價周期?這裡就牽涉到上面第一個問題:如何抽樣?抽樣才是ABtest關鍵,根本原則是希望控制對照組兩邊客群一樣,儘量公平。抽樣方法也很多:簡單抽樣、分層抽樣、正交抽樣等等。這裡為何提到一個正交抽樣呢?正交抽樣滿足一次測試,多組對照的抽樣方法。關於細節,大家可以關注並評論,後面我給相應解答。

實際上用戶增長運營是件很有挑戰工作,單純數據流量ABtest是用戶體驗辨別方法,如果從運營監控角度去分析,也需要從不同群組去分析客群增長模型,學會從業務中抓取核心關鍵公式或者模型,然後細化至各個維度,交叉對比,隱藏冰山下問題。

假設檢驗實操

假設檢驗常用的方法有u—檢驗法、t檢驗法、χ2檢驗法(卡方檢驗)、F—檢驗法,秩和檢驗等。以t-假設檢驗舉例。

某藥廠研發了一種能夠降低血壓的新藥,現在為了了解該藥的療效,隨機抽取了15名高血壓患者,並得到他麼在使用該藥治療前後的舒張壓數據,如下圖所示,現在需要判斷:該藥是否有效?如果有效,是否能夠讓高血壓患者的舒張壓平均降低6.5mmHg?

根據上面的數據,我們可以使用Excel中的假設檢驗方法來判斷(以前我用手算過,好累呀,有了Excel等工具,很簡單方便,省時省力)。分析工具中的假設檢驗方法有多種,使用不同的方法,觀察值在檢驗前後的關係就不同,所以需要先選擇合適的方案。

由於樣本量較小,且樣本值中的觀察值存在治療前後的配對關係,所以可先使用「t-檢驗:平均值的成對二樣本分析」方法判斷該藥的有效性,我們首先假設該藥無效(一般先否定,然後計算檢驗否定原假設(如果正確的話)),然後進行假設檢驗。

第1步:選擇分析工具(Excel老朋友了)。「數據分析」——「分析工具」——「t-檢驗:平均值的成對二樣本分析」,確定即可。如下圖所示:

第2步:設置相關參數。在「t-檢驗:平均值的成對二樣本分析」對話框中,設置「輸入」組中「變量1的區域」為「$B$2:$B$17」,「變量2的區域」為「$C$2:$C$17」,選擇「標誌」複選框,設置「α」值為「0.05」,在「輸出選項」下單擊「輸出區域」,設置為「$E$2」,最後確定。如下圖所示:

第3步:設置假設平均差。重複上一步驟,其他參數不變,這次設置「假設平均差」為「6.5」,「輸出區域」為「$I$2」。這一步,「假設平均差」為期望中的樣本均值的差值,如果該值設為0,即假設樣本均值相同。

第4步:顯示分析結果。做完之後,我們就可以看到t-檢驗的結果:H列左側為第2步中檢驗該藥是否有效的數據結果,H列右側為第3步中檢驗該藥是否能讓舒張壓降低6.5mmHg的檢驗結果。如下圖所示:

上面的案例中,由於沒有充分的理由判斷該藥治療後的總體均數會大於或小於治療前的舒張壓均值,所以在檢驗過程中,前面的t-檢驗我們採用的是雙側檢驗。

從分析結果看到:H列左側的檢驗結果中,tStat=4.211,P雙尾=0.00087,t雙尾臨界=2.145,當t雙尾臨界時,假設成立,而這個案例中,檢驗結果tStat>t雙尾臨界,說明該結果拒絕原假設,也就是說該藥有效,此外,我們還能看到P雙尾=0.00087<α=0.05,這一比較結果也說明該結果拒絕原假設,同樣說明該藥有效。

由於已經確定該藥有效,那麼再判斷該藥能否將舒張壓平均值降低6.5mmHg,所以,後面的t-檢驗採用的是單側檢驗,這裡我們設置了假設平均差,上圖中紅框內,檢驗結果tStat=0.205<t單尾臨界=1.761,說明該假設成立,即該藥能夠讓高血壓患者的舒張壓平均降低6.5mmhg。結果p單尾=0.42>α=0.05也說明了該假設成立。</t單尾臨界=1.761,說明該假設成立,即該藥能夠讓高血壓患者的舒張壓平均降低6.5mmhg。結果p單尾=0.42>

今天學習一下Excel中如何進行t-檢驗,數據分析更進一步。

相關焦點

  • 數據分析必備——統計學入門基礎知識
    數據之路,與你同行!——數據說·夢想季 導讀:要做好數據分析,除了自身技術硬以及數據思維靈活外,還得學會必備的統計學基礎知識!因此,統計學是數據分析必須掌握的基礎知識,即通過搜索、整理、分析、描述數據等手段,以達到推斷所測對象的本質,甚至預測對象未來的一門綜合性科學。統計學用到了大量的數學及其它學科的專業知識,其應用範圍幾乎覆蓋了社會科學和自然科學的各個領域,而在數據量極大的網際網路領域也不例外,因此紮實的統計學基礎是一個優秀的數據人必備的技能。
  • 數據分析必備——統計學入門基礎知識 - 人人都是產品經理
    編輯導語:不論在什麼崗位,都要懂得本崗位的基礎知識,打牢基礎後面才能穩步發展;數據分析也是如此,數據分析必須要掌握統計學的基礎知識;本文是作者分享的關於統計學入門基礎的知識,我們一起來學習一下吧。要做好數據分析,除了自身技術硬以及數據思維靈活外,還得學會必備的統計學基礎知識!
  • 統計學裡的假設檢驗是什麼?
    hello,小夥伴們,時隔幾個月 《統計從未如此性感》又和大家見面了 要問統計學有多重要? 臨床研究需要、報告分析需要 學術指南也需要…… 就連這次新冠戰「疫」 統計學也作了不少貢獻 快來看看本期又有什麼新知識吧 解鎖下方視頻
  • 數據分析科普系列:2—祭出大招(假設檢驗)
    咳咳,各位搬好小板凳,宗介數據分析專題正式開講了,雖本次為系列第二節課,但是你的焦慮我懂得,所以不再扯淡,直接上乾貨,本次乾貨就是經典統計學大招:假設檢驗。由於涉及一些專業名詞,宗介儘量用通俗去和大家一起探討數據分析應用。
  • 統計學中的假設檢驗
    作者 | CDA數據分析師假設(hypothesis),又稱統計假設,是對總體參數的具體數值所作的陳述。假設檢驗(hypothesis test) 是先對總體參數提出某種假設,然後利用樣本信息判斷假設是否成立的過程。
  • 統計學的重要工具—假設檢驗
    那究竟可有性為多少我們才可以拒絕「Bristol的選擇是隨機的」這樣的假設?Fisher認為,基於零假設為真的前提,卻依舊觀測到這種結果的概率如果不到就可以拒絕零假設了。Bristol猜對的概率是,小於這個值,所以我們可以大膽地認為Bristol對奶茶有自己獨到犀利的味覺。一杯奶茶,成就了一段浪漫的情緣,也成就了統計學的重要工具----假設檢驗。
  • 統計學常用概念|T檢驗、F檢驗、卡方檢驗、P值、自由度
    t檢驗得到如此廣泛的應用,究其原因,不外乎以下幾點:現有的醫學期刊多在統計學方面作出了要求,研究結論需要統計學支持;傳統的醫學統計教學都把t檢驗作為假設檢驗的入門方法進行介紹,使之成為廣大醫學研究人員最熟悉的方法;t檢驗方法簡單,其結果便於解釋。簡單、熟悉加上外界的要求,促成了t檢驗的流行。
  • 合理利用假設檢驗,讓你看清產品數據
    你真的會數據分析嗎?什麼才是數據分析的正確打開方式?文章中舉出了幾種數據分析的常用例子與檢驗方式,一起來學習下。實際上,我後來又重新做了一次分析,平均值和提升比例沒有問題,和原來一樣,但是通過對前後數據的差異性檢驗,發現活動前和活動中的UV數據之間並不存在明顯差異,也就是這種提升並不能明顯到稱其為提升。所以看到結果後也算痛打了我的臉。
  • excel假設檢驗 - CSDN
    ,然後再確定H0,且保證「=」總在H0上3)原H0一般是需要反駁的,而H1是需要支持的4)假設檢驗只提供原假設不利證據即使「假設」設置嚴密,檢驗方法「精確」;假設檢驗始終是建立在一定概率基礎上的,所以我們常會犯兩類錯誤;第一類:原H0是真,卻拒絕原假設;犯
  • 什麼樣的人適合學習數據分析?小白如何自學數據分析?
    圖片來源於百度二、什麼人適合學習數據分析?第一類:想要成為數據分析師,數據分析的技能是必備的。第二類:想要提升工作效率,增強自身數據敏感程度。理論基礎篇:包括統計學還有概率知識兩部分,而這些知識,是支撐我們一切分析過程的理論基礎。比如說數據分析師經常在工作中,需要設計ab實驗,來評估兩個版本的優劣。
  • 統計學裡的最重要工具之一:假設檢驗
    一杯奶茶,成就了一段浪漫的情緣,也成就了統計學的重要工具----假設檢驗。【案例 2】咖啡新鮮嗎?「咖啡(Coffee)「的名字最早來自衣索比亞的一個名叫卡法(kaffa)的小鎮,是「力量與熱情」的意思。
  • 論文中對數據進行統計學處理時需要注意的問題
    進行科研論文寫作,通常需要對取得的數據進行統計學處理。達晉編譯提醒大家,對此需要注意以下的問題。一、對基線資料進行統計學分析。因此,應對樣本的基線資料進行統計學分析,以證明組間的齊同可比性。二、選擇正確的統計檢驗方法。研究目的不同、設計方法不同、資料類型不同,選用的統計檢驗方法則不同。例如:2組計量資料的比較應採用t檢驗;而多組(不小於3組)計量資料的比較應採用方差分析(即F檢驗),如果組間差異有統計學意義,想了解差異存在於哪兩組之間,再進一步做q檢驗或LSD-f檢驗。
  • 等級變量的假設檢驗怎麼做?
    作者:丁點helper 來源:丁點幫你今天,我們講等級變量的假設檢驗。首先,回顧一下,什麼叫等級變量,也稱有序變量。這時,採用秩和檢驗,使用秩代替原始數據,通過比較總體分布的形態來進行統計推斷,就避免了等級變量不同級別的均值無法解釋的困境。而我們之前所講的t檢驗、方差分析等,叫做「依賴參數」進行的統計檢驗,即參數檢驗。
  • 統計:如何用Excel完成雙樣本假設檢驗
    在 Excel中,選擇z-檢驗:從「數據分析」菜單中選擇「雙樣本平均差檢驗」。這一檢驗使用的檢驗統計量,基於標準正態分布。2.母體方差未知並假設相異。從「數據分析」菜單中選擇「t檢驗雙樣本異方差假設」。這種情況下的檢驗統計量具有t分布。3.母體方差未知並假設相等。
  • 假設檢驗、Z檢驗與T檢驗
    概述假設檢驗是統計學、分析學和數據科學中的一個關鍵概念了解假設檢驗的工作原理、Z檢驗和t檢驗之間的區別以及其他統計概念介紹冠狀病毒大流行使我們大家都成了一個統計學家。我們不斷地核對數字,對大流行將如何發展做出自己的假設,並對何時出現「高峰」提出假設。
  • 想從事數據科學?統計學60分怎麼夠!
    統計學簡介統計學是一門與數據收集、分析、解釋和描述有關的數學科學。數據學家和分析師能夠在運用統計學處理現實生活中的複雜問題時,採用多種統計函數、統計原理和算法對原始數據進行分析,建立統計模型,並對結果進行推斷和預測。
  • 大數據下的「應用統計學」與「經濟統計學」,如何抉擇?
    應用統計學是研究現象總體數量關係的方法論科學,是對搜集得到的數據進行分析整理、從而得出所需要的有效信息的數學類學科,是理學門類統計學學科下的一個專業。應用統計學專業研究如何有針對性地收集、整理和分析大量的數據,研究數據變化所涵蓋的真正含義,把大量雜亂無章的數字轉化成圖表等更為直接和一目了然的記錄方式,由此發揮數據真正的價值。
  • 數據產品經理之數據分析與挖掘
    其中,作為數據產品經理必備的專業知識之一的數據分析可以分為廣義的數據分析和狹義的數據分析,廣義的數據分析就包括狹義的數據分析和數據挖掘,人們常常提到的數據分析是指狹義的數據分析,數據挖掘和數據分析都是從數據中提取一些有價值的信息,但互相的側重點又有所不同。
  • 數據分析中常犯的18個統計學錯誤,請務必跳過這些坑
    在數據分析的過程中我們經常會用到很多的統計學知識,但有很多統計學知識經常有人用錯,從而導致分析結果不盡如人意,今天就給大家列舉了18個容易錯的統計學知識點,建議大家收藏留著以後慢慢看:1. 變量之間關係可以分為兩類:函數關係:反映了事物之間某種確定性關係。
  • 提高數據分析的科學性與透明度,用統計學「反轉」中心法則
    而她的研究內容在很多人眼裡或許稍顯枯燥:針對前沿的生物學問題開發新的統計學方法,尤其著重於對大規模基因組和轉錄組數據進行分析方法的開發。 由於高通量實驗技術的發展,生命科學從一個靠觀察實驗為主的學科逐漸變得更加需要定量化,而這些大規模數據的產生也需要算法才能夠進行分析,從而總結出數學規律並用規律來刻畫事物的本質。