人類先天就對不確定性事物感到困惑,因其難以把握和預測,往往把隨機結果看成是某種神秘力量的作用。古代先哲執著並擅長於通過邏輯和公理證明來獲取真理,卻沒能概括發展出最基本的概率理論,人們對概率理論的探討直至17世紀中葉才初現端倪,真正將概率理論應用於對大量隨機現象進行系統研究的統計學,是近百年發展起來的學科。儘管隨機性的基本原理產生於日常的邏輯,但其導致的許多後果是違反直覺的,應用不慎就會造成許多判斷失誤、決策失當,概率統計中的「賭徒謬誤」就是典型的一例。
所謂「賭徒謬誤」是指根據某事件近期發生情況,而覺得某個具有確定發生概率的事件,其發生的可能性是增加或減少了。即人們在預測未來時傾向於把過去的表現作為判斷的依據,也就是根據事情最近是否發生過,而認為它應該更可能或更不可能發生。這是人們習慣性地誤解隨機事件的慣常表現。「賭徒謬誤」就是一個簡單例證,指錯誤地相信既然一個硬幣已連續拋出幾次正面,那麼下一次拋出反面的可能性會增大。千萬不要這樣認為,這正是「賭徒謬誤」的表現,即使對方一連擲出8次、10次正面,下次擲出反面的可能性大小(概率)仍為對半(0.5)。
「賭徒謬誤」在現實生活中的表現比比皆是,當你看到鄰居家一連生了4個女孩後是否覺得再生一胎是男孩的可能性會更大?人們總是期待好運氣出現在壞運氣之後,有人在買大樂透彩票時總是盯著歷史上出現次數最少的號碼買,這便是例證。彩民從30個號碼中選取7個的所有方法是2035800種,並且每一種的概率都是相同的,比起選取1、2、3、4、5、6、7或1、5、9、13、17、21、25等看起來有規律的號碼,絕大多數彩民更願意選取看上去更無規律且更隨機的3、6、7、12、19、23、27等彩票,這種現象背後同樣體現著「賭徒謬誤」的影響。
美國著名演講家、幽默作家阿蒂默斯·沃德(Artemus Ward)指出:「令我們身陷困境的不是那些我們不懂的事,而是那些我們自以為理解的事。」「賭徒謬誤」就印證了這一點,從認識論角度看產生「賭徒謬誤」的根源主要來自對概率統計原理的誤解。
1.對獨立事件概率的誤解。在我們周圍的現實世界中每時每刻都在發生著隨機事件,大多數情況下它們之間是沒有任何關聯的獨立事件,即一個事件的發生與否不會影響另一個事件的發生,如連續擲硬幣前後正反面的出現就是相互獨立的事件。概率原理告訴我們,兩個獨立事件發生的概率等於兩者各自發生概率的乘積,這稱為概率的乘法法則。用公式表示為:P(A與B)=P(A) P(B),乘法法則也適應於多個獨立事件。如擲硬幣時(記正面為1反面為0)連續3次出現正面即出現「111」時的概率為0.5×0.5×0.5=0.125,同樣當出現000、001、010、011、100、101、110等特定情況時其概率也均為0.125。
「賭徒謬誤」犯的錯誤在於混淆了一個事件發生兩次(或多次)的概率與一件事再次發生的概率。即使你已經一連9次擲出的硬幣都是正面朝上,下一次擲硬幣也不可能增加出現反面的可能性,出現正反面的可能性還是均等的。
2.對統計大數定律的誤解。所謂大數定律是指當隨機試驗次數足夠多時,某事件出現的頻率將無限接近於該事件發生的概率。這是瑞士數學家雅各布·伯努利(Jokob Bernoulli)利用極限思想來處理概率與隨機事件結果之間關係20年的研究結果,首次以嚴格的數學形式表達了概率的頻率穩定性。以擲硬幣為例,在進行了足夠多的硬幣投擲後,正反面各佔50%的情況就會出現,但在有限的投擲情況下即便是做上千次、上萬次也很難出現正反面正好各佔50%的情況(歷史上的確有人進行過這樣的投擲試驗)。「賭徒謬誤」在利用大數定律時犯的一個錯誤是他們不僅希望擲硬幣正反面等概率的情況能在一個長序列中時常出現,也希望能在一個長序列的局部區域或短序列中出現。如果10次拋擲硬幣人們就會不自覺的期待正反面大體各有5次(當然這也完全符合伯努利二項分布原理),且相對來說正反面要間隔出現,若出現大的偏離人們就會感到不可思議。其實僅通過幾次有限的投擲,結果更可能是不均衡的正反面分配比例,因為現實中不存在小數定律。在此類問題上出人意料的是,絕大多數人並不會意識到,隨機事件有時看起來是出奇的有順序。概率統計的真諦在於隨機事件的單體具有不可預測性,而反映群體的頻率具有統計穩定性。
為說明問題方便,以擲硬幣為例。在擲硬幣賭輸贏的遊戲中,當正面(或反面)連續幾次出現後,人們就會感到無法理解,甚或想到意念、魔法、魔力等根本不存在的東西,並有「他的運氣快到頭了」「該輪到我了」之類的想法,其實在正反面確切值方面硬幣都會表現的非你所願。
由概率原理得知,在一系列擲硬幣結果序列中,我們期待從某給定點開始至少連續出現x個正面(或反面)的概率為0.5x,若對於這樣的序列存在m個可能的起始點,則出現至少連續x次正面的平均串數是m 0.5x 串。例如,若有16個可能的起始點,則可期望出現序列長度至少是4的正面有1串,同樣出現連續反面長度至少是4的也是1串;在連續20次擲硬幣中,對於連續出現4次相同結果的連串有17個可能的起始點,正反面都算在內就會出現平均串數稍大於2串,所以長度為4的串是很可能出現的。一般地我們有如下結論:若連續n次擲硬幣,那麼期望最長串的正面或者反面的長度略大於以2為底n的對數。例如,連續擲32次硬幣,則可期待至少出現5個正面或者反面的序列。如果你有耐心擲上1000次硬幣,那麼在某處連續出現10個正面或者反面,請你不要感到驚訝。
綜上所述,某些非凡的事情可以在沒有非凡的原因時發生,一個過程本身是隨機的,並不同於這個過程產生的結果看起來是隨機的。「賭徒謬誤」的產生除對概率統計原理的誤解外,還與這種誤解影響下的心理認知偏誤有關。隨機事件往往看似非隨機,在解釋世事時必須注意不能把兩者相混淆。當今社會已進入大數據時代,迫切需要我們掌握基本的概率統計知識去順應時代潮流,理性地認識現實世界,更好地實現決策的科學性。(作者:胡順奇/山東棗莊學院)