小孩都看得懂的 p-value

2021-02-08 王的機器



在統計的世界裡經常聽到 p-value,那什麼是 p-value 呢?查查 Wikipedia 得到:


In statistical hypothesis testing, the p-value is the probability that, when the null hypothesis is true, the statistical summary (such as the absolute value of the sample mean difference between two groups) would be greater than or equal to the actual observed results.


Well Done, Wikipedia, 這下連大人都徹底不懂 p-value 了。


但希望下面極簡的講解能讓小孩懂什麼是 p-value。




講背景:丟硬幣



隨機丟硬幣,

看是正面還是反面,

如果硬幣的質量是均勻分布

通常稱為公平的硬幣 (fair coin),

那麼出現正面和反面的概率是 1/2。





丟概念:p-value


現在我來丟一個硬幣若干次,

你根據結果來判斷硬幣是否公平

也就是在下面兩種情況選一個


情況 0 :硬幣公平

情況 1:硬幣不公平


通常情況 0沒有意外情況發生,

情況 1有意外情況發生。


p-value 就是假設

在情況 0 為真時觀測結果發生的概率,

硬幣公平時觀測結果發生的概率。


讀完上面的句子如果不懂,

看完下節來回來讀一遍。


現在,我開始丟硬幣了 。。。





做試驗:p-value


牢記:p-value 就是硬幣公平時觀測結果發生的概率。 



第一次硬幣是反面,p-value 是多少?


你覺得硬幣不公平嗎?


絕壁不會啊!

硬幣公平時

丟 1 次出現反面有 50% 概率呢。



第二次硬幣又是反面, p-value 是多少?


次數
觀測結果p-value1反面50%2反面25%


你覺得硬幣不公平嗎?


額,不會啊

硬幣公平時

丟 2 次出現反面有 25% 概率呢。

(50%)^2 = 25%



第三次硬幣又是反面, p-value 是多少?

次數
觀測結果p-value1反面50%2反面25%3
反面12.5%


你覺得硬幣不公平嗎?


額,我想想。。。

硬幣公平時

丟 3 次出現反面有 12.5% 概率。

(50%)^3 = 12.5%



第四次硬幣又是反面! p-value 是多少?


次數
觀測結果p-value1反面50%2反面25%3
反面12.5%
4
反面6.25%


你覺得硬幣不公平嗎?


額額額(撓撓頭)

你心理開始變化了吧

硬幣公平時

丟 4 次出現反面只有 6.25% 概率。

(50%)^4 = 6.25%



第五次硬幣又是反面!!! p-value 是多少?


次數
觀測結果p-value1反面50%2反面25%3
反面12.5%
4
反面6.25%
5
反面3.125%


你覺得硬幣不公平嗎?


是的!不公平!

你突然開始非常確定了,

硬幣公平時

丟 5 次出現反面只有 3.125% 概率。

(50%)^5 = 3.125%



恭喜你,答對了,我就是用了一個兩邊都是反面的硬幣來做試驗的。






復盤一下


回顧:p-value 就是硬幣公平時觀測結果發生的概率。 


當丟了五次都是反面,

如果硬幣公平

計算出來的 p-value 是 3.125%,

非常不可能在硬幣公平時隨機發生!

因此我們改變原先的假設

認為硬幣公平是不成立,

進而認為硬幣不公平

這很科學!


讓我們產生了改變原假設想法是什麼?

是一個很小 p-value 值。

跟著我捋一捋,

在上面丟硬幣的過程中,

你是不是在某個時點想大叫一聲 WOW,

大概就是連續 5 次看到反面的時候,

你會覺得硬幣公平非常可笑,

因而推翻了它。


要推翻硬幣公平的假設

你還需要一個基準,

統計上叫做顯著性水平

我把它叫做「搞笑閾值

當 p-value 還小於這個搞笑閾值

原假設明顯就搞笑了嘛,

你還像個傻冒一樣不推翻它?





來類比一下


小孩聽得懂的東西
嚴謹統計的東西情況 0
無效假設
情況 1備擇假設搞笑閾值顯著性水平判斷硬幣是否公平
假設檢驗


在現實中,你永遠不可能 100% 的確定假設的真假,因為假設檢驗的總體參數(population parameter),你不可能在總體上做試驗,只可能在樣本上做試驗,計算樣本統計(sample statistics)來判斷假設的真假。


就像丟硬幣試驗一樣,我只要不給你看我的硬幣,你就不可能 100% 確認這是個不公平的硬幣。但是通過做試驗(收集一系列樣本觀測結果),計算 p-value,當小於事先設定好足夠小的「搞笑閾值」的時候,你就有充足信心說硬幣是不公平的,誠然,你有可能(possible)會錯,但不太可能(not probable)會錯。


下帖再來篇


小孩都看得懂的假設檢驗


對你有幫助再讚賞

相關焦點

  • 數據挖掘常見的 p-value 解讀
    p-value,那什麼是 p-value 呢?Well Done, Wikipedia, 這下連大人都徹底不懂 p-value 了。但希望下面極簡的講解能讓小孩懂什麼是 p-value。做試驗:p-value牢記:p-value 就是硬幣公平時觀測結果發生的概率。 第一次硬幣是反面,p-value 是多少?你覺得硬幣不公平嗎?絕壁不會啊!
  • P-Value--機器學習筆記
    按照一般經驗來說,p-value的值小於5%,算是稀奇。P-Value總是由3部分組成,1. 稀奇事兒本身的概率 2. 一樣稀奇其它事兒的概率 3. 更稀奇事兒的概率。再舉一個例子,你認為一朵花,特別稀奇。
  • 對於P_value的理解
    通常有t檢驗(用於樣本含量較小,倆樣本均數以及兩本均數與總體均數的之間的比較)、z檢驗(用於樣本含量較大,兩個平均數的差異是否顯著)、卡方檢驗(用於倆定類變量,實際觀測值和理論推導值的偏離程度)等~     通常,我們會設定原假設為H0,指兩樣本無差異,Ha為H0的補,指兩者有差異,而所謂P值:「p-value is the probability we get this sample or
  • 想不想體驗手動模擬計算p value的快感!
    雖然很多人一入學就有接觸概率統計等課程,但因為課程本身對於數學要求比較高,然後又比較抽象,所以很有可能學完以後很快就拋之腦後(對,說的就是我),大約最後只留下了p值小於
  • 【中津學術講堂】英國帝國理工學院博士吳希昆講述p-value
    主題顯著還是不顯著,這是個問題 - p-value漫談在大數據的時代,海量的信息給各行各業帶來了前所未有的機遇,然而數據收集、存儲、查詢和分析等各個環節也都面臨新的挑戰。例如傳統的統計學方法如果直接應用於大數據的假設檢驗的話,就會得出所有的結果都具有統計顯著性的結論。假設檢驗和基於p-value的差異顯著性判斷長期以來在實踐中被大多數學者視為是統計學中的金科玉律,對p-value的過分依賴和誤解也是一個非常普遍的問題。在統計學內部關於p-value的討論也一直都是熱點。
  • 在追逐 p-value 的道路上狂奔,卻在科學的道路上漸行漸遠~~~
    如此,人們習慣把「p-value 越低」和「因子 A 在解釋超額收益上越有效」等價起來了。這就是為什麼我們都喜歡低的 p-value。但它們倆真的等價嗎?別急,看完本文你自會有答案。低的 p-value 僅僅是某個因子有效的必要條件;但是它遠不是充分條件。
  • R語言可視化學習筆記之添加p-value和顯著性標記
    jco", add = "jitter")#添加p-valuep+stat_compare_means()stat_compare_means(label.y = 50) # Add global p-value
  • 在追逐 p-value 的道路上狂奔,卻在科學的道路上漸行漸遠
    「高風險」意味著學者需要費時費力費金錢以收集和處理數據,且得到的結論不一定顯著(沒有令人稱奇的 p-value)。但是,這樣的研究成果才是最根本的,才是真正能夠推動金融經濟學闊步向前的創造性工作。金融經濟學的科學前景深深的植根於學術界的研究和發表環境中。不可否認,如今學術界的研究質量仍然是很高的。但是本文提出的問題不關乎當下,而是著眼於未來。
  • p.Value越顯著,X變量越重要?
    如果,在回歸分析中,對於我們一個給定的X變量,我們就定義p.Value為其「重要性」,那麼當然p.Value越顯著,X變量越重要。但是,我估計絕大多數朋友不會認可這個定義,呵呵。為了增加銷量(Y),老王在央視(X1),百度(X2),騰訊(X3)三個不同的廣告平臺都投入了廣告費用。不同的廣告平臺帶來了不同的回報,分別記作beta1, beta2, 還有beta3。關於這個故事更加詳細的介紹,請參見《回歸5式第一式:線性回歸》。簡單滴說,這就是一個業務驅動的線性回歸問題。請問,在這個問題中,我們如何判斷三個X變量,哪一個更加「重要」?
  • JavaScript用Math.log1p()求自然對數
    基本概念Math.log1p()方法的作用和Math.log()方法非常相近,它們都是用於計算一個數的自然對數。自然對數就是以自然常數e為底數的對數,在數學上也等價地表示為ln(x)。調用Math.log1p()方法的語法形式如下所示:上面我們說到了Math.log1p()和Math.log()的相同之處,那麼它們又有什麼不同呢?
  • 咖啡攝入和死亡率降低的關係:P for trend看得懂!做得出!
    95%CI為0.85至0.91是0.88的波動範圍,95%CI不包括1表明風險降低是顯著的,因此不需要再列p值。具體調整了哪些因素,在表的注釋中寫清楚了。下面兩個0.82分別表明每天2-3杯咖啡或至少4杯咖啡和不喝咖啡相比總死亡降低18%,同樣也調整了混雜。有學友提問:P for trend 是什麼意思?本表中很多HR可信區間包括1,最後的結論是怎麼得出的?
  • P還是那個P,But美國統計協會到底說了啥?
    What is a p-value?Informally, a p-value is the probability under a specified statistical model that astatistical summary of the data (for example, the sample mean difference between two compared groups) would be
  • 被頂級學術期刊槍斃的p.Value到底是個什麼鬼?
    現在社會,所有人都在喊減肥。尤其是熊大這樣,不惑年齡的保溫杯枸杞中年男,體重永遠都是長勢喜人!如果狗熊製藥能夠研製一種沒有副作用的靈丹妙藥,能夠一個月內,給熊大減10斤贅肉,這得是多麼美好的一件事情?這個藥品的市場得是無窮大。狗熊製藥的股票得800個漲停才能對得起這款偉大的產品。但是,就當狗熊製藥把這款藥品研製成功,並且準備推向北美市場的時候,突然發現了一個問題。
  • 網友:給我P個車開開,P圖大神:這個車還滿意嗎,敞篷還有人推
    這個會不會有點嘲諷人了,不知道大家看不看得懂! 但是沒想到,大神不僅給P了8塊,而且還是兩個8塊都不止,看上去真是太嚇人了!不知道這樣的腹肌,小夥還敢不敢秀呢?
  • 【統計】p值和FDR
    從另一個方向理解,在假設𝐻0成立的前提下,即先假設「兩組沒有差異」,比較兩組的差值,如果差值符合正態分布,p值越小,說明「兩組沒有差異」的概率越小,通常情況下,當p值小於0.05時,認為是小概率事件,即「兩組沒有差異」「幾乎不可能發生。我們接受𝐻1,「兩組有明顯差異」,就是我們經常在論文裡看到的陽性結果。
  • P值不重要!P值不重要!!P值不重要!!!
    本文首發於2016-04-28,朝花夕拾忙碌紛雜的3月和4月即將過去,在最近幾個月當中,聽到最多的一句話是「師兄,畢不了業了,p值>0.05」,「師兄,畢不了業了,結果是陰性的」,「師兄,畢不了業了,結果沒有統計學差異」,而且這些話都是帶哭腔說出來的,做夢半夜都能被嚇醒——我變成了二師兄。
  • 怎樣用HOMER算出的P-value畫出CNS級別的泡泡圖?
    TEAD4(TE…# ... with 5 more variables: X__9 <chr>, `200_mESC` <chr>, X__11 <chr>,#   `50k_mESC` <chr>, X__13 <chr>現在就OK了,那麼這個數據長這樣子,一列是motif,緊跟著一列是p值
  • 北大教授告訴你,被頂級學術期刊槍斃的p.Value到底是個什麼鬼?
    現在社會,所有人都在喊減肥。尤其是熊大這樣,不惑年齡的保溫杯枸杞中年男,體重永遠都是長勢喜人!如果狗熊製藥能夠研製一種沒有副作用的靈丹妙藥,能夠一個月內,給熊大減10斤贅肉,這得是多麼美好的一件事情?這個藥品的市場得是無窮大。狗熊製藥的股票得800個漲停才能對得起這款偉大的產品。
  • 英文閱讀:Squat value?
    新東方網>英語>英語學習>語法詞彙>流行語>正文英文閱讀:Squat value?Here, it means both those teams got little or no value – or squat value – back for trading their superstars.
  • P032 python基礎:內建函數06
    m 是顯示的最小總寬度,n 是小數點後的位數(如果可用的話)下面進行部分演示"""# 16,十,八進位he = 44print("Hex=%x, Dec=%d, Oct=%o" % (he, he, he))# 輸出浮點數p = 3.1415926print("%6.2f" % p) # 欄位寬6,精度(小數位數)2print