今天我們來講博弈論中一個非常經典的模型,叫做囚徒困境。兩個人因盜竊被捕,警方懷疑其有搶劫行為,但未獲得確鑿證據可以判他們犯了搶劫罪,除非有一個人供認或兩個人都供認。即使兩個人都不供認,也可判他們犯盜竊物品的輕罪。犯罪嫌疑人被分離審查,不允許他們之間互通消息,並交代政策如下:如果兩個人都供認,每個人都將因搶劫罪加盜竊罪被判2年監禁;如果兩個人都拒供,則兩個人都將因盜竊罪被判處半年監禁;如果一個人供認而另一個拒供,則供認者被認為有立功表現而免受處罰,拒供者將因搶劫罪,盜竊罪以及抗拒從嚴而被重判5年。
我們用盈利表將兩人面臨的博弈問題表示如下:
從圖中可以發現,如果兩個囚徒都拒供,則每個人判0.5年;如果每個人都供認,則每個人判2年。相比之下兩個囚徒都拒供是一個比較好的結果,但是這個比較好的結果實際上不太容易發生。因為每個囚徒都會發現,如果對方拒供,則自己供認便可立即獲得釋放,而自己拒供則會被判0.5年,因此供認是比較好的選擇;如果對方供認,則自己供認將被判2年,而自己拒供則會被判5年,因此供認是比較好的選擇。
無論對方拒供或供認,自己選擇供認始終是更好的,這就是囚徒困境。由於每個囚徒都發現供認是自己更好的選擇,因此博弈論的穩定結果是兩個囚徒都會選擇供認。我們把這種結果稱為博弈的納什平衡。
囚徒困境通常被看作個人理性衝突和集體理性衝突的典型情形。因為在囚徒困境局勢中,每個人都會根據自己的利益做出決策,但是最後的結果卻是集體遭殃。
我們不難發現,當每個人追求自己的最大利益時,社會和團體不一定會達到它的最大利益,這種情況在現實中有很多相似的例子。
美蘇爭霸的時候,美國和蘇聯如果選擇合作,同時削減核武器的開支,對兩國將是最好的選擇。但是由於不確定對方的選擇,美國和蘇聯同時選擇投入更多經費研究核武器,最後間接導致了蘇聯的解體。
也許有人會問,難道囚徒困境真的是一個走不出的困境嗎?其實也不然,這裡就給大家支招看看能不能走出囚徒困境。假如每一個拒供的囚徒都可以在刑滿釋放後對供認的囚徒實施報復,那麼每個囚徒就可能因擔心未來的報復而在現在選擇拒供,使得拒供成為平衡的結果,合作達成了。不過這種合作是脆弱的,警方可以輕易摧毀此類合作。
由囚徒當事人的報復機制形成的合作雖然脆弱,但是卻提供了一條走出囚徒困境的可行思路。只要對囚徒不合作行為的懲罰是足夠的並且可信的,那麼就可以使囚徒的行動轉到合作的軌道上來。
現實中的確有很多犯罪團夥的成員被捕後拒不坦白,很大程度上與一個由第三方實施的懲罰機制有關。因為在犯罪團夥中如果出賣兄弟,將永遠無法在江湖立足,並且其家人也將受到黑社會的追殺。正是這樣的第三方懲罰機制,使得報復和懲罰是可信的,從而促成了囚徒的合作。