大白話系列:分析方法之假設檢驗

2021-01-09 顧先生的數據挖掘

今天我們來講假設檢驗分析方法。

假設檢驗分析方法主要分為三步

提出假設:根據要解決的問題來提出假設

收集證據:收集證明來證明之前的假設

得出結論:不是主觀猜想出來的,是通過收集證據證明才能得出結論

那麼在工作中裡,我們該如何使用假設檢驗呢?

從用戶、產品、競品出發

我們可以從用戶、產品、競品這三個維度提出假設,用戶對應運營部,產品對應產品部門,競品對應市場部門。

那我們可以假設這三個維度的部門出問題了

假設用戶有問題,可以對用戶的渠道、或者畫出用戶使用產品的業務流程來分析原因

假設產品有問題,可以研究這段時間,銷售產品是否符合用戶的需求

假設競品的問題,看競品是否在做促銷活動,導致用戶都去競爭對手那裡

從4P營銷理論出發

我們也可以從4P營銷理論:提出假設[1]

營銷組合有很多的要素,要素可以概括為4類:

產品(公司提供給市場有形/無形的產品,包括產品的實體、品牌、包裝等)

價格用戶購買產品時的價格,包括基本價格、折扣後的價格

渠道(產品從生產到消費者手裡中間經過了哪些銷售途徑,例如經過代理商,還是直接批發給了用戶,線下線上通過了哪些渠道)

促銷公司利用各種方法來刺激用戶消費來買產品,包括買一贈一、廣告、地推、打折等

公司發現銷售額業績下降了,可以通過4P營銷理論出發來提出假設,

從產品出發提出的假設:是銷售下降原因有可能是產品不能滿足用戶需求?

從價格出發提出的假設是:價格和競爭對手比可能沒有優勢?

從渠道出發提出的假設:某個渠道是不是沒有貨了?

從促銷出發提出的假設:活動促銷是不是沒有效果?

從業務流程出發

4P營銷理論是從公司的角度去研究產品的,其實還可以從用戶的角度出發去研究產品,也就是從用戶使用產品的業務流程來提出假設

關於這塊可以看我之前的邏輯樹分析方法,裡面講了如何拆解一個事務的流程來更好地解決問題。

舉個慄子

假設你去面試,面試官拋給你一組數據,是某app一周的活躍率,問了一個一個司空見慣的問題:數據中看到了什麼問題?你覺著背後的原因是什麼?

拿到本類問題要先對數據進行可視化,光從表格上無法看到數據隨時間變化的趨勢。

比如說根據表格繪製成折線圖,這周六數據下降了,根據上篇文章的對比分析法,沒有對比就沒有好壞,這周六的數據跟這周數據比較是下降的,但是有沒有可能這個app本身周六就不活躍呢?

為了更好的進行分析,還要繼續問面試官往前幾周的數據是什麼樣的,才能從整體上看出數據在一個較長範圍內是怎麼變化的,可以看出數據變化的規律。

面試官微微一笑,給了上周的數據。

你一對比,這個APP的規律是每周末的活躍率都有所下降,但是本周六下降的更明顯,可以計算出前幾周的平均日活躍率和這周六的日活躍率進行對比,發現了這周六的日活躍率下降了5%。

那麼問題就變成了為什麼這周六日活躍率會下降?哪些原因造成的下降呢?

我們應用假設檢驗分析方法:

提出假設:用戶、產品、競品這三個角度提出假設

【假設】用戶問題

【證據】按渠道維度拆解用戶,發現渠道B明顯下降

【結論】獲取用戶的渠道B出現了問題,從而導致本周六的日活躍率降低

【假設】產品有問題

【證據】找相關部門了解情況,一起排查問題(是不是新功能上線導致的問題、是不是有大量投訴,投訴的原因是什麼,對用戶對產品滿意度進行調查)

【結論】經查找產品沒問題

【假設】競品問題

【證據】通過調研看競品是否有大的活動,發現競品最近沒有搞大的活動

【結論】沒有競品問題

【最終結論】獲取用戶的渠道B出現了問題,從而導致本周六的日活躍率降低,那麼為什麼渠道B數據下跌了,可以跟團隊的相關人員進行討論,像負責推廣的同事了解情況,最後發現渠道B最近的投放活動在本周六那天剛好結束了,導致APP的新用戶少了,導致了活躍率下降

注意事項

得出的結論不是主觀猜測出來的,而是要依靠第二部找到的證據,去證明結論

假設檢驗這三步是要不斷重複的過程,在得出結論之後,分析還沒有停止,多找到得到結論可能的原因是什麼,然後用數據去驗證可能的原因,不斷的重複假設檢驗的這個過程,直到找出問題的根源

在使用假設檢驗分析方法的過程中,還要用到其他分析方法

在開始分析之前,為理清思路可以先畫個圖,將問題、假設、問題從上至下連起來,讓分析思路更加清楚

[1].4P營銷理論被歸結為四個基本策略的組合,即產品(Product)、價格(Price)、渠道(Place)、宣傳(Promotion),由於這四個詞的英文字頭都是P,再加上策略(Strategy),所以簡稱為「4P’s」

https://baike.baidu.com/item/4P%E8%90%A5%E9%94%80%E7%90%86%E8%AE%BA/5732385?fr=aladdin

相關焦點

  • 大白話系列:分析方法之相關分析方法
    今天我們來講講分析方法的相關係數定義相關分析方法的定義就是利用指標衡量兩種數據間的相關程度。數值正負反映兩種數據的相關方向:-:反方向變化,負相關,一種數據增大,另一種數據隨之減小+:同方向變化,正相關,一種數據增大,另一種數據隨之增大0:不是線性相關應用場景比如說一個APP的日活量下降,經過假設檢驗分析
  • SAS系列22:定性數據假設檢驗
    系列17-21我們已經介紹了單變量定量數據的假設檢驗方法及其SAS實現,今天開始介紹定性數據的假設檢驗方法及其SAS實現。
  • 數據分析必備統計學(二):假設檢驗
    實際上用戶增長運營是件很有挑戰工作,單純數據流量ABtest是用戶體驗辨別方法,如果從運營監控角度去分析,也需要從不同群組去分析客群增長模型,學會從業務中抓取核心關鍵公式或者模型,然後細化至各個維度,交叉對比,隱藏冰山下問題。
  • 【實例】Excel數據分析之假設檢驗中的t-檢驗應用
    這個時候,我們運用假設檢驗方法就能夠排除誤差的影響,區分差別在統計上是否成立,並了解誤差時間發生的概率。統計推斷是由樣本的信息來推測母體性能的一種方法,它又可以分為兩類問題,即參數估計和假設檢驗。在數據分析工具中,假設檢驗也被稱為顯著性檢驗,是統計推斷中的一種重要的數據統計方法。它首先對研究總體的參數做出某種假設,然後從總體中抽取樣本進行觀察,用樣本提供的信息對假設的正確性進行判斷,從而決定是否成立。若觀察結果與理論不符,則假設不成立,若觀察結果與理論相符,則認為沒有充分的證據表明假設錯誤。假設檢驗一般有如下三個步驟:1、建立假設,確定檢驗水平。
  • Excel數據分析:假設檢驗的5個知識點!
    Excel數據分析工具庫中假設檢驗含5個知識點:Z-檢驗:雙樣本均值差檢驗T-檢驗:平均值的成對二樣本檢驗
  • SAS系列23:列聯表資料假設檢驗方法
    系列17-22我們已經介紹了四格表卡方檢驗方法及其SAS實現,今天開始介紹列聯表資料的假設檢驗方法及其SAS實現。
  • 參數估計與假設檢驗(七)-- 獨立雙樣本均值T檢驗
    如果從Q-Q圖中看出數據明顯不服從正態分布,且樣本容量不大時,可以使用非參數檢驗方法比較兩組數據的均值是否存在顯著差異,SAS中的NPAR1WAY過程可以進行該項非參數檢驗。TTEST過程輸出的統計報表如圖10.23所示。圖10.23 例10.4描述統計量報表第一張報表中展示了兩組樣本的描述性統計量及兩組樣本均值之差的標準差和標準誤差。
  • Excel數據分析:假設檢驗的5大知識點!
    -Excel數據分析工具庫中假設檢驗含5個知識點:Z-檢驗:雙樣本均值差檢驗T-檢驗:平均值的成對二樣本檢驗T-檢驗:雙樣本等方差假設T-檢驗:雙樣本異方差假設F檢驗:雙樣本方差檢驗Z檢驗:雙樣本平均差檢驗Z檢驗:雙樣本均值差檢驗概述
  • 顯著性檢驗、假設檢驗和原假設顯著性檢驗
    NP體系是分析哪個檢驗統計量是最優統計量,而最優統計量的定義是固定第一類錯誤α(通常令α= 0.05),使第二類錯誤β最小的統計量或統計功效最大的統計量。不幸的是他們將固定的α值稱為顯著性水平,造成了應用中與Fisher理論中p值的混淆(Hubbard & Bayarri, 2003)。
  • 統計學中的假設檢驗
    (2)臨界值規則假設檢驗中,還有另外一種做出結論的方法:根據所提出的顯著性水平標準(它是概率密度曲線的尾部面積)查表得到相應的檢驗統計量的數值,稱作臨界值,直接用檢驗統計量的觀測值與臨界值作比較,觀測值落在臨界值所劃定的尾部(稱之為拒絕域)內,便拒絕原假設;觀測值落在臨界值所劃定的尾部之外(稱之為不能拒絕域)的範圍內,則認為拒絕原假設的證據不足
  • 假設檢驗的前世今生
    其實,「前世今生」系列的文章我已經看到過好幾篇了,比如「正太分布的前世今生」、「Meta分析的前世今生」。不知為何,我個人也很喜歡「前世今生」這個詞。今天呢,就聊一聊我知道的一點「假設檢驗的前世今生」吧。 假設檢驗是統計學裡最重要、最基礎的的概念,即便是不知道,不了解這個術語,與統計學毫不相干的人,在日常生活中,也不知不覺地應用了假設檢驗。
  • R語言實現統計分析——非參數假設檢驗
    ,且分布情況不明時,用來檢驗數據是否來自同一個總體假設等一類檢驗方法。非參數檢驗通常是將數據轉換成秩(順序的意思)來進行分析的,秩就是該數據按照升冪排列之後,每個觀測值的位置。1 單樣本泊松分布總體的均值檢驗泊松分布適合於描述單位時間內隨機事件發生的次數。
  • 統計檢驗假設的P值與檢驗水準α
    本文給大家普及一下檢驗假設中常用到的P值、檢驗水準α以及如何合理解釋。p值是在原假設(零假設)H0正確的前提下,出現觀察結果以及比之觀察結果更極端情形的概率,P值由相應統計模型計算而來,其計算根本不涉及備擇假設。
  • 網狀Meta分析三個假設檢驗的完成(一)
    分析概率排序分析及作圖),今天繼續我們往下面走,這次分享的是第5步:三個假設的檢驗,就是對同質性、相似性和一致性進行檢驗,因為內容比較多,今天主要分享同質性、相似性的檢驗方法。網狀Meta分析(整合直接比較和間接比較的結果,繪製相關圖形)6. 偏倚風險評估、文獻質量評價、敏感性分析、亞組分析、meta回歸等等網狀Meta分析裡提到的同質性檢驗實際上就是普通Meta分析常說的異質性檢驗。
  • 假設檢驗、Z檢驗與T檢驗
    目錄假設檢驗基礎基本概念-零假設、替代假設、類型1錯誤、類型2錯誤和顯著性水平進行假設檢驗的步驟定向假設非定向假設檢驗什麼是Z檢驗?單樣本Z檢驗雙樣本Z檢驗什麼是t檢驗?什麼是Z檢驗?Z檢驗是檢驗假設的統計方法,當:我們知道人口的變化,或者我們不知道總體方差,但我們的樣本量很大n≥30如果樣本量小於30且不知道總體方差,則必須使用t檢驗。
  • 統計學知識系列:一篇搞懂假設檢驗
    我們常用的ab實驗,其背後的原理就是統計學中的假設檢驗,今天我們來詳細說說假設檢驗。什麼是假設檢驗:假設就是對從總體參數(均值、比例等)的具體數值所作的陳述,比如,我認為配方一比配方二的效果要好。而假設檢驗就是先對總體的參數提出某種假設,然後利用樣本的信息判斷假設是否成立的過程,比如上面的假設信息我該接受還是拒絕。
  • 精益六西格瑪管理-假設檢驗-單因子方差分析
    這類問題可以用方差分析的方法來解決。為了表述方便,這裡先給出在以後實驗設計中經常會遇到的幾個概念因子對指標有影響的因素稱為因子,通常情況下,我們約定用大寫字母來表示因子。單因子方差分析的模型假設在一個實驗中只考察一個因子A,它有r個水平,在每一水平下進行m次重複實驗,其結果用yi1, yi2,……yim(i=1,2,…..r)表示。記第i水平下的數據和為Ti,數據均值為y-bar(i),總的均值為y-bar。此時共有n=rxm個數據。常常把數據列成表格形式。
  • R-統計描述與假設檢驗
    此外,對於醫學中常用的幾種假設檢驗,我們將相關的R語言代碼進行了整理,以供快速查看和使用。2.1 醫學中常用的假設檢驗總結:2.2 正態性檢驗:Shapiro-Wilk正態檢驗方法來檢驗樣本是否符合正態分布:2.3 方差齊性檢驗:① Bartlett檢驗,適用於正態分布數據;數據非正態時則容易導致假陽性
  • [理論+spss實戰]假設檢驗——單樣本t檢驗
    反證法思想是先提出假設(檢驗假設H0),再用適當的統計方法確定假設成立的可能性大小,如可能性小(即最後計算出P值小於0.05),則認為假設不成立。 假設檢驗其實就是驗證你事先提出的假設是落在了置信區間內部,還是落在了置信區間外部(稱為:拒絕域)。如圖,若落在了拒絕區域內(陰影部分),則拒絕H0,此時P<0.05。
  • 假設檢驗的邏輯
    科學研究是去偽存真的過程,假設檢驗則是實現這一過程的基本方法。