你好,感謝打開產品Desginer
今天是2020年2月16日星期日,農曆正月廿三
今天,與你分享的是統計基礎:概率、概率分布與AB測試
什麼是概率?
前置學習:隨機事件
在一個隨機事件裡,我們知道可能的結果是什麼,但是不知道哪一個特定的結果會發生
概率是統計的一個基本概念,它是一個0到1之間的數字,是對隨機事件發生可能性的測量
P(A)=事件A發生的概率可能性(0 ≤ P(A) ≤ 1)
如何理解概率:如我們可以觀察同樣的隨機事件發生無數次,這個隨機事件某一個結果發生的概率,就是這個特定結果在所有結果中所佔的比
大數定律:在隨機事件中的大量重複出現中,往往呈現幾乎必然規律,這個規律就是大數定律
(通俗地說,這個定律就是,在實驗不變的條件下,重複試驗多次,隨機事件某一個結果(擲硬幣正面朝上)發生的頻率近似於它的概率。偶然中包含著某種必然)
頻率是試驗事實的記錄
例如,擲了100次硬幣,正面朝上的有49次。
我們可以說擲這100次硬幣,正面朝上的頻率是49%
條件概率:是指時間A在另外一個事件B已經發生條件下的發生概率
條件概率表示為:P(A丨B),讀作「在B的條件下A的概率」
P(A丨B)= P(AB)/ P(B)
獨立事件:兩個事件的發生有相互影響的,叫相關事件,沒有影響的是獨立事件
定義:事件B發生或不發生對事件A不產生影響,反之亦然,我們就說兩個事件A和B互為獨立事件。
公式表示,基於:
P(A丨B)= P(A)
P(B丨A)= P(B)
P(A丨B)= P(AB)/ P(B)
可以推出對於兩個獨立事件同時發生概率的計算公式:P(A丨B)= P(A)x P(B)
概率分布
樣本空間:是一次隨機實驗中可能出現的所有結果集合
例如:用戶連續兩次嘗試使用共享單車,兩輛單車故障情況的概率分布是?
S = {1故障&2故障,1故障&2正常,1正常&2故障,1正常&2正常}
概率分布:一個「實驗」的「概率分布」列出樣本空間裡的所有可能結果和其發生概率
例如:用戶連續兩次嘗試使用共享單車,這兩輛單車故障情況的概率分布是?
(假設每次使用單車的故障率為25%&兩次的故障率互為獨立事件)
規則:所有可能的結果沒有交集,每一個結果的概率值在0和100%之間,所有結果的概率值和為100%
A/B測試
定義:統計學裡雙樣品假設檢驗的一個應用
簡單說,就是為了一個目標制定兩個方案,讓一部分用戶使用A方案,另一部分用戶使用B方案,記錄下用戶的使用情況,看哪個方案的效果更好。
實驗組和對照組
事件:9158美女直播APP,操作界面更新,老闆覺得公司使用IOS系統的人較多,想把直播作業系統統一改為IOS版本的
實驗組:是指隨機選擇的實驗對象的子集—安卓用戶使用IOS版的9158直播操作界面
對照組:實驗對象中一個被隨機選擇的子集,其中個體沒有特殊待遇—安卓用戶使用安卓版9158直播操作界面
應用場景:網站設計優化、測試新項目、產品優化(新改進)
A/B測試思路
1、原假設成立—>假設9158美女直播安卓端用戶希望使用IOS的作業系統
2、虛擬實驗—>100安卓用戶使用IOS作業系統一周,100安卓用戶使用Android作業系統一周
3、與觀測結果比較—>使用IOS作業系統的100安卓用戶中,有55人表示不適應,不習慣,操作界面垃圾
4、做判斷—>安卓用戶和IOS用戶,各自使用各自的作業系統為最好結果