原創 張和持 返樸
導語:三門問題,也被稱為蒙提霍爾問題,是一道著名的概率問題:一個遊戲節目中共三扇門,一扇門後有汽車,另兩門後只有山羊,你選擇了一扇門但不打開,這時主持人會在另兩門中打開一個後面是山羊的門,現在你換不換自己剛才選擇的門?30年前這一問題被美國一知名雜誌刊登後引發了熱議,因為直覺告訴我們換不換都是一樣的,但答題人選擇換。數學愛好者、專業人士紛紛加入討論,進行了一場曠日持久的論戰,還發展出了諸多變種。現在讓我們來回顧一下這道經典問題,來看看直覺到底哪出錯了,信息又是如何影響結果的。
撰文 | 張和持
問題背景
在美國的一檔節目Let's Make a Deal 中,主持人蒙提·霍爾設置了一項小遊戲:
在你的面前有三扇門,其中一扇背後藏有一輛價值不菲的汽車;剩下的兩扇背後則分別是兩頭山羊。你現在有機會選擇一扇門,選好之後先不要打開,這時主持人會在另外兩扇門中,開啟一扇山羊門。現在你有兩個選擇,是應該維持原來的選擇,還是轉而選擇另一扇沒有開啟的門?
三門問題示意圖/圖片來源:維基百科
這看起來似乎是一個沒有深度的問題。可供選擇的兩扇門之間沒有什麼不同。不管選哪個,概率都應當是相同的才對。果真如此嗎?
實際上這個問題有很古老的歷史,可以追溯到法國數學家蘭伯特(Joseph Bertand)的盒子悖論,後來著名的數學科普大師馬丁·加德納(Martin Gardner)也提出過與三門問題相似的囚徒問題。1975年美國統計學家塞爾文(Steve Selvin)根據電視節目改編提出了這一問題,投給了《美國統計學家》,這也是蒙提霍爾問題名稱的由來。而真正引發討論是到了1990年,一位讀者向當時美國知名雜誌《遊行》(Parade)的專欄「交給瑪麗蓮」提出了關於這一問題的詢問。
瑪麗蓮·莎凡特(Marilyn vos Savant)曾被金氏世界紀錄認定為世界上智商最高的人,後來成為這家雜誌社的專欄作者專門回答各類問題。她給出的回答是:應該換門,而且換門後,開出汽車的概率將變為原來的兩倍。
瑪麗蓮的吉尼斯記錄頗受爭議,她給出的這個答案也同樣。人們紛紛向她寫信,質疑她的結論。一時間,社會各界都在談論這詭異的概率。來信表示反對的佔了92%,其中有將近
人拿過博士學位;65%來自大學,特別是數學等院系的信,都反對她的答案。蒙提·霍爾問題,或稱三門問題,一下子成為了關注的焦點。90年代的十年間,40多種學術刊物發表了關於這一問題超過75篇論文。
反對並不是毫無根據。關於問題和答案的表述不甚嚴謹,表面上看,我們也看不出換不換門究竟有什麼決定性的區別。瑪麗蓮為了說服反對者,專程組織了幾次實驗,其結果都證實了她的結論。
筆者聽說這個問題,是在多年以前看的另一檔美國電視節目 MythBusters ,中文譯為 流言終結者 。兩位主持人演示過的諸多實驗令人印象深刻。這一次他們也同樣忠實地再現了三扇門和山羊。最終他們的實驗結果證實了瑪麗蓮的答案:不換門,概率;換門,概率。
流言終結者節目
其實我們不一定非得大張旗鼓地搞些花裡胡哨的東西,用電腦也能模擬,得出的答案沒有不同。
計算機模擬29次的結果/圖片來源:維基百科
那麼這樣看來,瑪麗蓮的答案是對的了。現在的問題是,我們應該如何解釋這樣的結果?是我們的直覺究竟出了問題嗎?接下來我們並不打算解釋誰的觀點為什麼對,誰的觀點又為什麼錯;我們細細來看問題的前因後果,把所有條件和結論整理清楚。
簡單直觀的圖示解答
最不動腦的方法是把所有可能列出來,如下圖所示,當玩家選擇1號門的情況下所有的可能性。
玩家最初選擇1號門時的所有可能/圖片來源:維基百科
但這並不代表我們真正理解了問題所在。為了解答疑惑,我們先一步一步理清思路。首先,三門問題與兩扇門二選一究竟有何不同?或者說,我們剛剛開始選定的這扇門究竟產生了什麼樣的影響?
第一次的選擇,的確是隨機的。如果這時候把門打開,那麼有羊的概率就是。而剩下的兩扇門中,必然有一扇山羊門。所以打開的山羊門不會影響這個。那麼這樣說來,用總的去減,就應該是剩下那扇門開出汽車的概率,。這樣的確說得過去:一開始概率分布是均勻的:
圖片來源:維基百科
打開山羊門之後,的概率被「擠」到另一個門上了:
圖片來源:維基百科
回到一開始的疑問:我們一開始的選擇對結果產生了什麼影響?
用條件概率來直接計算三門問題中所提到的「我們剛開始選的門對剩下那個門的影響」,數學上我們稱之為條件概率,用來表示事件發生的情況下,事件發生的概率。那麼自然(其實這是條件概率定義),條件概率就等於發生的概率除以發生的概率:
其中分子表示兩個事件都發生的概率。在這個問題中,關鍵在於我們要求的是剩下的門開出汽車的概率。那
事件就是剩下那門開出汽車。
是什麼呢?我們最初做的選擇,有兩個結果:一開始就選到車,我們記為;一開始選到山羊,記為。這樣,剩下的門開出汽車的概率,就應該考慮到兩種情況的條件概率,分別乘上兩個先發事件的概率(相當於權重),再加起來這個式子稱為全概率公式,有了它我們可以具體計算。如果一開始就選到了車,那剩下的兩個門裡肯定沒有車。所以,那麼貢獻概率的就只有第二項了。如果一開始選到山羊,那剩下的門就一定是車,所以,這樣算出來也是非常自然的結果。第一次選出山羊的概率全部貢獻到剩下的門開出汽車的概率中了,所以換門概率更高也不足為奇。主持人開山羊門並不能改變一開始選到車的概率,但卻改變了剩下的門開出車的概率:如果不開門,條件概率本應該是(畢竟剩下的兩個門概率均等),而開門後,山羊門不可能有車,所以條件概率變成了。或者用貝葉斯理論的話說:主持人開的那扇山羊門,為我們提供了關於剩下那個門的信息。
用貝葉斯公式來追本溯源
雖然問題就解決了,但還是不知道我們最開始錯誤的直覺來自哪裡。我們來思考一下主持人「提供信息」的問題。一切的改變,都是因為主持人提供給我們的信息:主持人很明顯是知道門背後都是些什麼,才打開山羊門的。那要是主持人根本就不知道汽車在哪裡,只是隨手選擇了一扇門,而這扇門恰好是山羊門的話,主持人豈不是就不能提供任何信息了?
為了驗證這個想法,我們就假定主持人的開門行為完全是隨機的。記他開出山羊門這個事件為,那麼還是使用全概率公式我們想要知道的,就是當事件發生時,事件,也就是最初的門開出汽車的概率。因為主持人自己都不知道汽車在哪,所以如果要做實驗的話,樣本裡肯定存在主持人開出汽車的情況。而我們現在要算的條件概率,描述的就應該是在排出了這些樣本後的實驗結果。接下來我們就來計算看!果不其然,概率是
。第二個等號其實也算是全概率公式。這個結果符合我們的直覺:如果主持人跟我們一樣什麼也不知道,那不管換不換門概率都是一樣的。至此,我們已經完全搞清楚了這個問題。我們看到,一個看似毫無意義的行為,竟然能為決策者提供如此多的信息。那麼在更為複雜的博弈中,找到對手留下的蛛絲馬跡便尤為重要。
下面詳細說一下這個算式。
這整個式子被稱作貝葉斯公式,其中最神奇的地方,莫過於為了計算,竟然用到了。貝葉斯的思想最初不被人接受。貝葉斯公式相當於是在知道了結果的情況下求原因。同時代的數學家們批判它為「玄學」,可在三門問題中,確實派上了用場。
為了理解這種思維,讓我們假想一個工廠,有三臺機器生產同一種零件,事件分別表示一個零件是由某一臺機器生產的,事件表示生產出次品。在生產中,每臺機器產生次品的概率通常是已知的,總的次品率
也是已知的。那麼對於任意一個次品,它更有可能是哪臺機器生產出來的呢?這種情況下,我們就需要計算
,而這用到的也是貝葉斯公式,讀者朋友們感興趣的話自己試試推導,跟我們上面的計算步驟差別不大。
這種由果溯因的思路一般稱為貝葉斯推斷。這種方法最早的特例是託馬斯·貝葉斯證明的,後來拉普拉斯將其推廣,並應用於天體力學、醫療統計學等方面面。在面對未知的自然界時,我們無法知曉其背後的法則,但能觀察到現象,比如天體力學中,就是可觀測天體的大小、數量與過去的軌跡;醫療統計學中,則是患者的症狀、化驗結果、CT數據等,有了這些數據,我們就可以猜測,是否存在一個我們尚未觀測到的天體,或是患者是否得了某種病。猜測自然有可能是錯的,現在我們有了貝葉斯推斷,就能反過來計算我們所作假設成立的概率。
這一方法近幾十年來更多應用於機器學習領域,或者更窄的概念:統計學習。任何包含了模式識別的算法,基本上都能用上貝葉斯推斷,包括人臉識別,自動駕駛,他們會用到更加複雜的概念:當事先不存在假設時,就需要人為設定一項先驗分布。不過總的來說,思想與最經典的貝葉斯公式一脈相承。如今,以此為基礎的統計學仍在飛速發展。
版權說明:歡迎個人轉發,任何形式的媒體或機構未經授權,不得轉載和摘編。轉載授權請在「返樸」微信公眾號內聯繫後臺。
原標題:《三門問題:直覺究竟去了哪裡?》
閱讀原文