【漫話統計】賭徒謬誤的統計解析

2021-02-28 統計微訊

人類先天就對不確定性事物感到困惑,因其難以把握和預測,往往把隨機結果看成是某種神秘力量的作用。古代先哲執著並擅長於通過邏輯和公理證明來獲取真理,卻沒能概括發展出最基本的概率理論,人們對概率理論的探討直至17世紀中葉才初現端倪,真正將概率理論應用於對大量隨機現象進行系統研究的統計學,是近百年發展起來的學科。儘管隨機性的基本原理產生於日常的邏輯,但其導致的許多後果是違反直覺的,應用不慎就會造成許多判斷失誤、決策失當,概率統計中的「賭徒謬誤」就是典型的一例。

所謂「賭徒謬誤」是指根據某事件近期發生情況,而覺得某個具有確定發生概率的事件,其發生的可能性是增加或減少了。即人們在預測未來時傾向於把過去的表現作為判斷的依據,也就是根據事情最近是否發生過,而認為它應該更可能或更不可能發生。這是人們習慣性地誤解隨機事件的慣常表現。「賭徒謬誤」就是一個簡單例證,指錯誤地相信既然一個硬幣已連續拋出幾次正面,那麼下一次拋出反面的可能性會增大。千萬不要這樣認為,這正是「賭徒謬誤」的表現,即使對方一連擲出8次、10次正面,下次擲出反面的可能性大小(概率)仍為對半(0.5)。

「賭徒謬誤」在現實生活中的表現比比皆是,當你看到鄰居家一連生了4個女孩後是否覺得再生一胎是男孩的可能性會更大?人們總是期待好運氣出現在壞運氣之後,有人在買大樂透彩票時總是盯著歷史上出現次數最少的號碼買,這便是例證。彩民從30個號碼中選取7個的所有方法是2035800種,並且每一種的概率都是相同的,比起選取1、2、3、4、5、6、7或1、5、9、13、17、21、25等看起來有規律的號碼,絕大多數彩民更願意選取看上去更無規律且更隨機的3、6、7、12、19、23、27等彩票,這種現象背後同樣體現著「賭徒謬誤」的影響。

美國著名演講家、幽默作家阿蒂默斯·沃德(Artemus Ward)指出:「令我們身陷困境的不是那些我們不懂的事,而是那些我們自以為理解的事。」「賭徒謬誤」就印證了這一點,從認識論角度看產生「賭徒謬誤」的根源主要來自對概率統計原理的誤解。

1.對獨立事件概率的誤解。在我們周圍的現實世界中每時每刻都在發生著隨機事件,大多數情況下它們之間是沒有任何關聯的獨立事件,即一個事件的發生與否不會影響另一個事件的發生,如連續擲硬幣前後正反面的出現就是相互獨立的事件。概率原理告訴我們,兩個獨立事件發生的概率等於兩者各自發生概率的乘積,這稱為概率的乘法法則。用公式表示為:P(A與B)=P(A) P(B),乘法法則也適應於多個獨立事件。如擲硬幣時(記正面為1反面為0)連續3次出現正面即出現「111」時的概率為0.5×0.5×0.5=0.125,同樣當出現000、001、010、011、100、101、110等特定情況時其概率也均為0.125。

「賭徒謬誤」犯的錯誤在於混淆了一個事件發生兩次(或多次)的概率與一件事再次發生的概率。即使你已經一連9次擲出的硬幣都是正面朝上,下一次擲硬幣也不可能增加出現反面的可能性,出現正反面的可能性還是均等的。

2.對統計大數定律的誤解。所謂大數定律是指當隨機試驗次數足夠多時,某事件出現的頻率將無限接近於該事件發生的概率。這是瑞士數學家雅各布·伯努利(Jokob Bernoulli)利用極限思想來處理概率與隨機事件結果之間關係20年的研究結果,首次以嚴格的數學形式表達了概率的頻率穩定性。以擲硬幣為例,在進行了足夠多的硬幣投擲後,正反面各佔50%的情況就會出現,但在有限的投擲情況下即便是做上千次、上萬次也很難出現正反面正好各佔50%的情況(歷史上的確有人進行過這樣的投擲試驗)。「賭徒謬誤」在利用大數定律時犯的一個錯誤是他們不僅希望擲硬幣正反面等概率的情況能在一個長序列中時常出現,也希望能在一個長序列的局部區域或短序列中出現。如果10次拋擲硬幣人們就會不自覺的期待正反面大體各有5次(當然這也完全符合伯努利二項分布原理),且相對來說正反面要間隔出現,若出現大的偏離人們就會感到不可思議。其實僅通過幾次有限的投擲,結果更可能是不均衡的正反面分配比例,因為現實中不存在小數定律。在此類問題上出人意料的是,絕大多數人並不會意識到,隨機事件有時看起來是出奇的有順序。概率統計的真諦在於隨機事件的單體具有不可預測性,而反映群體的頻率具有統計穩定性。

為說明問題方便,以擲硬幣為例。在擲硬幣賭輸贏的遊戲中,當正面(或反面)連續幾次出現後,人們就會感到無法理解,甚或想到意念、魔法、魔力等根本不存在的東西,並有「他的運氣快到頭了」「該輪到我了」之類的想法,其實在正反面確切值方面硬幣都會表現的非你所願。

由概率原理得知,在一系列擲硬幣結果序列中,我們期待從某給定點開始至少連續出現x個正面(或反面)的概率為0.5x,若對於這樣的序列存在m個可能的起始點,則出現至少連續x次正面的平均串數是m 0.5x 串。例如,若有16個可能的起始點,則可期望出現序列長度至少是4的正面有1串,同樣出現連續反面長度至少是4的也是1串;在連續20次擲硬幣中,對於連續出現4次相同結果的連串有17個可能的起始點,正反面都算在內就會出現平均串數稍大於2串,所以長度為4的串是很可能出現的。一般地我們有如下結論:若連續n次擲硬幣,那麼期望最長串的正面或者反面的長度略大於以2為底n的對數。例如,連續擲32次硬幣,則可期待至少出現5個正面或者反面的序列。如果你有耐心擲上1000次硬幣,那麼在某處連續出現10個正面或者反面,請你不要感到驚訝。

綜上所述,某些非凡的事情可以在沒有非凡的原因時發生,一個過程本身是隨機的,並不同於這個過程產生的結果看起來是隨機的。「賭徒謬誤」的產生除對概率統計原理的誤解外,還與這種誤解影響下的心理認知偏誤有關。隨機事件往往看似非隨機,在解釋世事時必須注意不能把兩者相混淆。當今社會已進入大數據時代,迫切需要我們掌握基本的概率統計知識去順應時代潮流,理性地認識現實世界,更好地實現決策的科學性。(作者:胡順奇/山東棗莊學院)


相關焦點

  • 競彩常見的賭徒謬誤分析 了解產生機制提高勝率
    賭徒謬誤賭徒謬誤亦稱為蒙地卡羅謬論,是一種概率謬誤,認為在隨機序列中由於某事發生了很多次,因此接下來不太可能發生;或者由於某事很久沒發生,因此接下來很可能會發生。賭徒謬誤的思維方式像是如此:拋一枚公平的硬幣,越連續出現多次正面朝上,下次拋出正面的概率就越小,拋出反面的概率就越大。
  • 【乾貨】「賭徒謬誤」,別被自己坑了
    這就是「賭徒謬誤」的來源,按照賭徒謬論的思路,連續出現5次正面後,第6次出現正面的概率就變成了1/2的五次方,即1/32,所以誤認為第6次拋出反面的概率是31/32,反面概率更大。忽略了每次拋硬幣,正反面出現的概率都是1/2,是恆定的。                       在這數學題中,很多人能一眼看出其中的陷阱,但是到玩球中,卻總是會輕易掉入「賭徒謬誤」的坑裡。
  • 熱手效應VS.賭徒謬誤:中國投資者的心理分析
    在輪盤遊戲中,賭徒往往認定其中的紅黑兩色會交替出現,如果之前紅色出現過多,下次更可能出現黑色。可是,直覺未必是靠得住的。有學者認為:「『熱手效應』與『賭徒謬誤』都來自人們心理學上的認知偏差-即認為一系列事件的結果都在某種程度上隱含了自相關的關係」。
  • 統計思維:唯一能決定我們是否該相信上帝的思維方式
    那何為統計思維呢?很簡單,具備利用統計學認識自然現象的習慣就可以說是有了統計思維。那我們要如何訓練統計思維呢?做到以下三點就算合格了。前文也提到了,期望是帕斯卡和費馬提出來的新概念,通過這個概念才解決了賭徒分配金幣的問題。但為很多人所不知的是,這一概念也同時解決了帕斯卡的宗教信仰問題:他是否該相信上帝的存在?帕斯卡認為,儘管上帝存在的概率非常小,但是將其作為信仰所得到的獎賞卻是永恆的歡樂,這一歡樂所帶來的的效用將是無窮大的。
  • 賭徒,原來你是這樣的人!
    在第一部分中,我打算談到可能是有關隨機性的最常見的謬誤——賭徒謬誤。當你打爐石或者其他卡牌遊戲時,你總要依靠一定的運氣,而理解賭徒謬誤可以讓你在每一個隨機時刻看起來完全不一樣。我也會給一些賭徒謬誤的確有效的例子。
  • 2018年概率論與數理統計考研大綱解析
    摘要:2018考研數學大綱於9月15日發布,關注大綱解析,獲取大綱變化,考研幫為你持續關注。   摘要:2018考研數學大綱於9月15日發布,關注大綱解析
  • 綜合分析是將匯總整理的資料及有關數值,填入統計表或繪製統計圖
    綜合分析是將匯總整理的資料及有關數值,填入統計表或繪製統計圖
  • 圖解統計學:簡單易懂的基礎概率&描述性統計
    統計性描述分析是作為統計分析的第一步,在日常的數據分析中其實我們經常使用一些特徵值,尤其是我們做周報或者月報的分析時,這些描述性的統計分析特徵值對於我們有一定的幫助,描述性統計分析是進行正確的統計推斷的先決條件。通過數據的分布類型和特點、集中和離散程度可進行初步分析。
  • 【漫話統計】基於統計學的大數據在實際生活中的應用
    統計以前出現過的所有中獎號碼數據,然後進行計算整理,用統計數據預測的概率值來選擇選號區間及可能中獎號碼。而這些都是和大數據有關,因為各種數字組合是海量的,另外以往開獎次數也達到了幾萬次,中獎號碼數據也是海量的。這些都要使用統計方法對大數據進行處理。 可以畫出所有號碼的曲線走勢圖,來顯示出每個號碼出現頻率的多少,這樣在觀察分析中就有直觀的效果。
  • 解答熱力學與統計物理學三大古老問題,彌補統計物理學局限性
    >內容簡介:本書針對熱力學與統計物理學三大古老問題,提出三層次統計物理模型假設,為廣義能量量子自然凝聚形成無限多樣自然體系,構建了統一的自我凝聚模式.從而為認知無限多樣自然體系內部能量量子之間相互作用力的特性,定量解析物質特性參量,提供了切實可行的操作平臺.
  • 2018讀書情況統計
    勉強打起精神統計了標過的書——純屬個人判斷,不做推薦。2018還剩幾天就過去了,不想去突擊讀書了,反正讀到哪本算哪本。其中有棄讀,有瀏覽,一般記得的會註明,不記得的就算了。邏輯與科學思維方法 如何進行批判--孟子的憤怒與蘇格拉底的 批判性思維與創造力:越思考越會思考 奇談怪論說名家 中國邏輯學趣談 明辨力從哪裡來——批判性思維者的六個習性 知識的錯覺 : 為什麼我們從未獨立思考 邏輯與人生: 語言與謬誤 批評性思維  聰明人的心理學 謬誤
  • 概率論和數理統計:向著「不確定性」進軍的數學學科
    而概率論和數理統計就是研究統計規律性的數學學科。概率論的產生和發展概率論產生於17世紀的保險事業,但也來自賭徒的請求,為數學家們提供了思考概率論的問題。1654年,一個賭徒向數學家帕斯卡提出一個困擾他很久的問題:兩個賭徒相約賭若干局,先贏 m局的人勝出,並獲得全部賭本。
  • 美國生物統計專業解析
    生物統計是近年來的美國留學熱門專業之一。生物統計學就是用統計方法研究分析生物、醫學上的數據,屬於一個跨學科專業,跟生物統計信息,尤其是 data mining等關係密切。統計是一種萬金油學科,只要掌握了方法,在很多地方都能用,目前統計系出來就業情況也很好,特別是生物統計領域。
  • 賭徒的五個有趣的賭博現象
    二、賭徒的謬誤輪盤賭玩家觀看連續出現七個黑色數字這種眾所周知的心理過程被稱為賭徒的謬誤即如果事件反覆發生,那麼即將發生另一件事。實際上,發生任何特定事件的機率是相同的。下注後,賭徒傾向於相信他們的馬比下注之前有更大的獲勝機會。承諾的增加使他們更加充滿希望。
  • 哥倫比亞大學統計系超詳解析
    ,哥大統計系在留學生中具有較大的爭議,關注哥倫比亞大學統計系的學生和家長人數也很多。上策留學這一期將基於哥倫比亞大學官方資料,為您重新解析我們自認為「熟悉」,實際上卻十分陌生的哥倫比亞大學統計學院。請大家謹記:官方網站才是最可靠的資料來源。如有任何留學申請問題,歡迎隨時諮詢上策留學!
  • 統計不重複數據個數的若干公式解析,腦洞大開了……
    我們平時遇到和重複數據有關的問題大致上可以分為兩類,一類是提取不重複數據,另一類就是統計不重複數據的個數。提取不重複數據的公式之前有過詳細的解釋,今天來看看統計不重複數據的個數都有哪些方法,希望通過今天的內容開拓大家解決問題的思路。
  • 概率論和數理統計:必然性的因果關係,遇見多種可能的隨機事件
    這種大量的同類隨機現象所呈現出來的集體規律性,叫做統計規律性。而概率論和數理統計就是研究統計規律性的數學學科。概率論的產生和發展概率論產生於17世紀的保險事業,但也來自賭徒的請求,為數學家們提供了思考概率論的問題。
  • 2021考研大綱:考研數學一概率論與數理統計部分大綱原文解析
    2021考研大綱:考研數學一概率論與數理統計部分大綱原文解析 2021考研大綱是對2021年碩士研究生考試科目的考試範圍、考試要求、考試形式、試卷結構等權威政策指導性考研用書。
  • 你會選擇合適的統計圖嗎
    小學階段我們學到了三種統計圖:條形統計圖、折線統計圖和扇形統計圖。這三種統計圖各有各的特點,所以我們在做數據統計時需要選擇合適的統計圖,下面我們就來梳理一下吧。圖例展示<解析>扇形統計圖反映的是部分數量和整體的(總量的)關係,而繪製折線統計圖需要知道每個季度所生產零件的具體數量,即要先算出具體數量。
  • 統計思想
    此外,由於bootstrap思想的通用性及其簡單的計算實現方式,bootstrap立刻被廣泛用於各種傳統的解析近似方法效果不佳應用,從而產生了巨大的影響。時至今日,充足的計算資源也起到了幫助作用,使得對許多重採樣得到的數據集進行反覆的推理變得十分容易。計算資源的增加也使得其它重採樣和基於模擬的方法流行了起來。