硬幣到底是正面還是反面,關於貝葉斯概率的思考

2021-01-11 天一思維

歷史文章回顧:心理經濟學之常見概念說明心理經濟學之二 直覺思維和理性思維行為經濟學中反直覺的概率故事吸菸和禽流感哪個危害更大--被忽略的基礎比率貝葉斯定理,讓你「大吃一驚」的概率

前一篇文章已經介紹了貝葉斯定理的概念,並且舉例說明貝葉斯定理的反直覺之處。那麼貝葉斯定理是否是否就是萬能的呢?世界真的都是反直覺的嗎?(以下為個人觀點,以供大家參考,有不當之處,歡迎各位批評指正)

貝葉斯定理在小概率的場景下才反直覺

貝葉斯定理相對普通的概率分布來說,增加了一個基礎概率(先驗概率)的修正。在一些小概率事件的判斷上,貝葉斯學派往往和概率學派得到不同的結果,因此它有存在的必要性。

請大家注意,這裡並沒有說貝葉斯定理對於概率統計來說就一定是正常的,只是說他提供了一種解決方案,而這種解決方案在一些場景下,是很有指導價值的,貝葉斯定理有一定的用處,所以它有存在的必要性。

貝葉斯定理之所以會給人一種反直覺的印象,原因就在於這件事本身發生的概率就很小,現在哪怕有非常精確的檢測手段,判斷這件事發生了,只要不是100%的確定,那麼其實際的發生概率,必然就不會太高。由於考慮了基礎比率,而基礎比率又非常容易被忽略,所以在一些極端小概率的事件中,貝葉斯定理有非常好的警示作用。

然後如果基礎比率不是非常小,那麼即使通過貝葉斯定理計算出來的概率,可能也會和我們的直覺判斷差距不大。

貝葉斯定理中的後驗概率是計算的,而不是統計的

還有一方面,貝葉斯定理是通過對先驗概率進行修正後得到的後驗概率,這個後驗概率是通過公式計算出來的。

計算說明了什麼,計算說明了,已知有三個統計結果,我不是經過試驗統計或者經驗統計,我根據之前的統計結果,來計算出現在這個事件的可能結果。就像在上一篇提到的愛滋病病毒攜帶者的例子中,檢測的精度就是通過實際的統計結果得到的一個概率,哪怕這個概率多麼高,我都要通過計算,重新修正得到一個新的概率。至於這個概率是否是真的,那就要看你是否相信貝葉斯定理了。畢竟一件事如果只有兩種可能結果,不論兩種結果的概率是怎麼分布,只要不是0%和100%,那麼一次單獨事件得到的只有一個確定的結果。1%和99%的可能性,最終都有可能是同樣的結果。

計算的概率和統計的概率有什麼區別呢?下面我們來設想一個非常簡單的例子來說明一下。

下一次拋出的硬幣是正面還是反面呢?

假如還是玩拋硬幣的遊戲,硬幣拋出之後,只有正反兩面兩種可能性。有過一定數學或者科學素養的人,都知道不管是正面還是反面,其發生的概率都是一樣的。這個結果應該是毋庸置疑的吧。

現在假設你已經拋出了100次硬幣,正面出現了60次,反面出現了40次(這個結果完全是可能發生的)。那麼你準備拋第101次,你覺得會出現正面還是反面呢?或者說正反兩面的概率分別是多少呢?

按照傳統的概率論,正反面兩面依舊是各50%。然而如果按照貝葉斯定理來計算,其結果可能並非如此。

貝葉斯定理需要參考目前的基礎比率,比如要計算這一次拋出正面的概率。那麼就要知道在剛剛的100次中上一次拋出的是正面的時候,下一次也是正面的概率是多少?上一次拋出是反面的時候,下一次是正面的概率是多少?然後結合正面一共出現的概率,和第100次出現是正面還是反面,計算出第101次的概率情況。

看到這裡是否是有些困惑了呢?難道貝葉斯定理是錯的嗎?還是我們對於硬幣正反兩面概率相等的認識錯了呢?

其實二者都沒有錯,我們傳統上認為正面和反面出現概率是相同的,也是理論上的。而且這個是建立在無限次的樣本基礎上,也就是說你一直拋下去,硬幣正面兩面的概率就會無限接近於50%。但是如果樣本數不夠,則其實際的概率並不一樣如此。就像在這100次的遊戲中,正面的實際概率就是60%,而不是50%。

而貝葉斯定理是基於當前場景的,是通過已有的知識和試驗等先驗概率,計算出來可能會發生的概率。所以二者才會出現偏差。

關於貝葉斯定理的一點思考

「盡信書不如無書」,很多理論在我們接觸到的時候,就想當然的認為它是正確的,其實並不一定。每個理論都有其適用範圍;反之,很多理論,也都不會全部是錯的,比如唯心主義,在某些情況下,唯心主義比唯物主義更適合我們的需要。

科學的不一定是真實而正確的絕對真理,科學是建立在假設基礎上,通過一系列的推理得到的一套理論框架。在此理論框架的指導下,我們通過觀察和試驗,進而發展出來實驗科學、臨床科學等。

那麼科學不一定正確,我們就不要相信科學了嗎?這樣的想法同樣不可取,科學雖然是在假設基礎上發展起來的,但是科學是經過我們的實際驗證的,對於我們的生活是有用的。科學不一定真實,但是科學一定有用。而且如果要上升到哲學角度來說,科學可能是目前我們人類,最接近真理的認識。所以因為科學有用,我們就還是要學習和使用科學。

相關焦點

  • 樸素貝葉斯:幫助AI產品經理「小步快跑,快速迭代」
    假設將一枚質地均勻的硬幣拋向空中,理論上,因為硬幣的正反面質地均勻,落地時正面朝上或反面朝上的概率都是50%。這個概率不會隨著拋擲次數的增減而變化,哪怕拋了10次結果都是正面朝上,下一次是正面朝上的概率仍然是50%。但在實際測試中,如果我們拋100次硬幣,正面朝上和反面朝上的次數通常不會恰好都是50次。
  • 條件概率與貝葉斯統計
    貝葉斯統計學家在建立概率模型時會加入額外的信息。他也認為探測器不太可能擲出一對 6,然而,他主張要將探測器說真話的概率與太陽沒有爆炸的先驗概率進行比較。這位貝葉斯統計學家最終認為,太陽沒有爆炸的概率比 97.22% 還要大,並決定賭一把「太陽明天照常升起」。1.條件概率構成貝葉斯推理基礎的核心思想就是條件概率。
  • 全概公式與貝葉斯公式解析
    二.貝葉斯公式先說一下背景,了解一下法國數學家貝葉斯,貝葉斯全名為託馬斯·貝葉斯(Thomas Bayes,1701-1761),是一位與牛頓同時代的牧師,是一位業餘數學家,平時就思考些有關上帝的事情什麼是概率論中的統計學派呢?你先回答擲一枚硬幣為正面的概率為多少?,大部分人第一反應就是50%的機率為正。不好意思,首先這個答案就不正確,只有當材質均勻時硬幣為正面的機率才是50%(所以不要覺得打麻將的時候那個骰子每面的機率是相等的,萬一被做了手腳呢)。好,那現在假設硬幣的材質是均勻的,那麼為什么正面的機率就是50%呢?
  • 投擲硬幣概率可以是90%
    貝葉斯分析中的三要素在不同的問題中通常側重點 , 很多時候我們都是在忽略先驗概率的作用,比如描述一個人很書呆子氣讓你判斷他是大學老師還是銷售員的經典案例(要看先驗大學老師還是銷售員哪個多啊)。投擲硬幣的概率並不是50%事實上,貝葉斯決策很少只涉及A和B, 而是內部包含非常關鍵的隱變量(參數),涉及我們對所研究事物的一些基本預設。比如下面這個特別簡單的例子:拋擲硬幣,一個硬幣被投擲10次9次朝上,那麼根據頻率學派的觀點, 得到第11次投擲的概率不變為0.5 ,如果你回答了0.9, 你經常會被看成一個傻X。 其實不然,天底下哪有一樣的硬幣呢?
  • 就像拋硬幣:概率如何誤導我們認識宇宙?
    舉一個純數學的簡單例子:拋硬幣。假設硬幣質地十分均勻,拋出的結果只有兩種,正面和反面,每面出現的概率為50%。為模擬每一種可能,在腦海中儘可能多地拋出硬幣——假設拋了10億次——記錄下每種會出現的可能。你可以選擇如何劃分這10億次試驗:連續10億次為一組、1000次為一組試驗,做100萬次或者10次為一組,做1億次實驗。
  • 人人都可以當賭神的秘密:用Python學習神奇的貝葉斯統計
    拋硬幣問題拋硬幣是統計學中的一個經典問題,其描述如下:我們隨機拋一枚硬幣,重複一定次數,記錄正面朝上和反面朝上的次數,根據這些數據,我們需要回答諸如這枚硬幣是否公平,以及更進一步這枚硬幣有多不公平等問題。拋硬幣是一個學習貝葉斯統計非常好的例子,一方面是因為幾乎人人都熟悉拋硬幣這一過程,另一方面是因為這個模型很簡單,我們可以很容易計算並解決這個問題。
  • 從貝葉斯定理到概率分布:綜述概率論基本定義
    我們試著進行一些實驗,如果硬幣正面向上記錄 1,如果反面向上記錄 0。重複投擲 1000 次並記錄 0 和 1 的次數。在我們進行了一些繁瑣的時間實驗後,我們得到了這些結果:600 個正面(1)和 400 反面(0)。如果我們計算過去正面和反面的頻率,我們將分別得到 60%和 40%。這些頻率可以被解釋為硬幣出現正面或者反面的概率。這被稱為頻率化的概率。
  • 一枚硬幣,扔了一億次都是正面,那下一次正面朝上的概率是多少?
    今天聽到一個這樣一個問題,一枚硬幣,扔了一億次全部都是正面朝上,那一億零一次正面朝上的概率是多少,很多人下意識的會脫口而出50%,其實從概率學上也沒什麼問題,扔一枚硬幣,它的正反面的概率都是50%,並且和之前扔過多少次都沒有關係,這是理想物理模型,它可以用來思考理論,但是不能應用在複雜現實問題上
  • 面試:6枚正面硬幣,每次必須翻5枚,至少幾次才能全部翻為反面?
    引導語:在職場上,隨著經濟情況越來越好,生活中連硬幣都已經很少見了,如今大多數都是行動支付!最近,有讀者和老羊交流到這樣一個有趣的面試問題:6枚正面朝上的硬幣,每次必須翻5枚,至少幾次才能全部翻為反面?
  • 貝葉斯系統學習之一:我是如何理解先驗概率和後驗概率的
    ,尤其是貝葉斯的應用,在終極算法一書中,提到了一個不可思議的觀點,貝葉斯有可能發展成終極算法,厲害吧。所以關於概率與統計的學習我是覺得越來越重要了,所以我之前在公眾號裡轉發了很多關於這方面的知識,最近也想系統的學習整理一下,在正式介紹貝葉斯相關應用的之前,先從最基本的概念開始吧,本文先介紹兩個你既熟悉,但又不能完全理解明白的概念,先驗概率和後驗概率。
  • 拋硬幣=決定命運? | 劇場中的拋硬幣統計學
    在這部劇中,有個場景令人印象非常深刻,兩位主演無聊至極,用拋硬幣來打發時間,結果……吉爾登斯特恩連拋了92枚,都是有頭的一面,這使得他的一句臺詞「一個弱小的人可能會重新審視自己的信仰,別的不說,至少在概率定律上」變得十分耐人尋味。但是且慢,我們要問的是,連拋92次都為同一面的概率到底有多大,如果硬幣本身沒有問題的話?
  • 傳說中的貝葉斯統計到底有什麼來頭?
    置信區間(CI)不是概率分布,因此它們不提供最可能的值以及其參數。這三個理由足以讓你對於頻率統計的缺陷進行思考,以及對為什麼需要貝葉斯方法進行考慮。有關貝葉斯統計的基礎知識就先了解到這裡。3.貝葉斯統計「貝葉斯統計是將概率運用到統計問題中的數學過程。
  • 貝葉斯機器學習到底是什麼?看完這篇你就懂了
    作者Zygmunt Zając提供了一些基礎概念,編者也嘗試對其中的一些概念進行簡化說明,讓小白們也能容易地理解貝葉斯在機器學習中所起的作用。貝葉斯學派與頻率主義學派簡單說來,貝葉斯學派認為,概率是一個人對於一件事的信念強度,概率是主觀的。但頻率主義學派所持的是不同的觀念:他們認為參數是客觀存在的, 即使是未知的,但都是固定值,不會改變。
  • 決定做一個關於預測的行為實驗
    5、為了體現確實是在嘗試預測,而不是純猜測,每次預測時還是要看看圖、思考或者起碼感覺一番,再下結論。嗯,其實我主要是想實驗的就是「看圖做預測」有沒有任何統計上的意義。6、最終計算兩個數值,一個是預測漲跌的準確率,另一個是預測漲跌幅的偏離程度(偏離絕對值的平均)。
  • 專欄| 貝葉斯學習與未來人工智慧
    捧腹之餘,理工科出身的觀眾不免也想看看 Sheldon 到底在做怎樣的研究,特別是和我們自己相關的工作。果然,在第四季第 2 集中我們看到了下圖中的公式(用紅框標出)——貝葉斯定理!該定理素以其簡單而優雅的形式、深刻而雋永的意義而聞名,在今天的機器學習大潮中,貝葉斯定理仍會扮演重要的角色,而且其作用將日益凸顯。1.
  • 硬幣正反面怎麼區分,國徽是正面還是面值是正面?很多人都搞混了
    硬幣是我們日常生活中經常使用的交易工具,它雖然在大額票值面前並不起眼,卻在很多方面為我們提供了不少便利,而且硬幣一定程度上繼承了中國兩千多年來的貨幣形制,具有顯著的中國風。但是有一點,不知大家在使用過程中是否考慮過硬幣的正反面?
  • 多維宇宙理論或顛覆概率論 時間或成為永恆
    多維宇宙或顛覆概率論 時間將永恆存在物理學家們提出了一種方法來對付這種困境,那就是在時間軸上劃出一道線,圈出一個有限的時間段,對這一時刻之前發生的事件總數進行統計分析,如硬幣的正面和反面,並以此作為統計樣本進行各種逼近運算
  • 條件概率,全概率,貝葉斯公式理解
    貝葉斯理論和貝葉斯概率以託馬斯·貝葉斯(1702-1761)命名,他證明了現在稱為貝葉斯定理的一個特例。術語貝葉斯卻是在1950年左右開始使用,很難說貝葉斯本人是否會支持這個以他命名的概率非常廣義的解釋。拉普拉斯證明了貝葉斯定理的一個更普遍的版本,並將之用於解決天體力學、醫學統計中的問題,在有些情況下,甚至用於法理學。但是拉普拉斯並不認為該定理對於概率論很重要。
  • 為什麼樸素貝葉斯定理會被叫做樸素的?
    樸素貝葉斯算法是一種基於著名貝葉斯定理的分類算法。那麼讓我們先了解一下Bayes定理是怎麼說的,並為樸素貝葉斯算法定理建立自己的理解,它是如何工作的,它為什麼被稱作樸素的?貝葉斯定理在深入研究貝葉斯定理之前,我們需要了解一些術語-獨立事件和從屬事件邊際概率聯合概率條件概率獨立事件和從屬事件考慮兩個事件A和B。