博弈論之囚徒困境

2020-12-04 萬象經驗

今天我們來講博弈論中一個非常經典的模型,叫做囚徒困境。兩個人因盜竊被捕,警方懷疑其有搶劫行為,但未獲得確鑿證據可以判他們犯了搶劫罪,除非有一個人供認或兩個人都供認。即使兩個人都不供認,也可判他們犯盜竊物品的輕罪。犯罪嫌疑人被分離審查,不允許他們之間互通消息,並交代政策如下:如果兩個人都供認,每個人都將因搶劫罪加盜竊罪被判2年監禁;如果兩個人都拒供,則兩個人都將因盜竊罪被判處半年監禁;如果一個人供認而另一個拒供,則供認者被認為有立功表現而免受處罰,拒供者將因搶劫罪,盜竊罪以及抗拒從嚴而被重判5年。

我們用盈利表將兩人面臨的博弈問題表示如下:

從圖中可以發現,如果兩個囚徒都拒供,則每個人判0.5年;如果每個人都供認,則每個人判2年。相比之下兩個囚徒都拒供是一個比較好的結果,但是這個比較好的結果實際上不太容易發生。因為每個囚徒都會發現,如果對方拒供,則自己供認便可立即獲得釋放,而自己拒供則會被判0.5年,因此供認是比較好的選擇;如果對方供認,則自己供認將被判2年,而自己拒供則會被判5年,因此供認是比較好的選擇。

無論對方拒供或供認,自己選擇供認始終是更好的,這就是囚徒困境。由於每個囚徒都發現供認是自己更好的選擇,因此博弈論的穩定結果是兩個囚徒都會選擇供認。我們把這種結果稱為博弈的納什平衡。

囚徒困境通常被看作個人理性衝突和集體理性衝突的典型情形。因為在囚徒困境局勢中,每個人都會根據自己的利益做出決策,但是最後的結果卻是集體遭殃。

我們不難發現,當每個人追求自己的最大利益時,社會和團體不一定會達到它的最大利益,這種情況在現實中有很多相似的例子。

美蘇爭霸的時候,美國和蘇聯如果選擇合作,同時削減核武器的開支,對兩國將是最好的選擇。但是由於不確定對方的選擇,美國和蘇聯同時選擇投入更多經費研究核武器,最後間接導致了蘇聯的解體。

也許有人會問,難道囚徒困境真的是一個走不出的困境嗎?其實也不然,這裡就給大家支招看看能不能走出囚徒困境。假如每一個拒供的囚徒都可以在刑滿釋放後對供認的囚徒實施報復,那麼每個囚徒就可能因擔心未來的報復而在現在選擇拒供,使得拒供成為平衡的結果,合作達成了。不過這種合作是脆弱的,警方可以輕易摧毀此類合作。

由囚徒當事人的報復機制形成的合作雖然脆弱,但是卻提供了一條走出囚徒困境的可行思路。只要對囚徒不合作行為的懲罰是足夠的並且可信的,那麼就可以使囚徒的行動轉到合作的軌道上來。

現實中的確有很多犯罪團夥的成員被捕後拒不坦白,很大程度上與一個由第三方實施的懲罰機制有關。因為在犯罪團夥中如果出賣兄弟,將永遠無法在江湖立足,並且其家人也將受到黑社會的追殺。正是這樣的第三方懲罰機制,使得報復和懲罰是可信的,從而促成了囚徒的合作。

相關焦點

  • 博弈論中的「囚徒困境」是什麼意思?
    生活中,人們常常會陷入「囚徒困境」的兩難境地,不知該做出何種抉擇,但不管遇見怎樣的難題,總能找到解決問題的辦法。而且,倘若採用巧妙的方法來解除困境,不僅能夠將難題化解,還可能為自己帶來更多的利益。那麼,博弈論中的「囚徒困境」到底是什麼意思呢?且聽小編為大家解惑。
  • 囚徒的困境-博弈論
    【導讀】博弈是世界上衝突的反映,這是一個古老的概念。在威爾斯民間故事集《英雄的一生》 中有這樣一個故事:交戰中的兩個國王下著棋,他們的軍隊就在附近廝殺。每當某個國王吃一個子時,信使就會來通知另一個國王,他失去了一員大將或一支精銳部隊。
  • 博弈論之囚徒困境,背叛也是有代價的。深度好文,值得收藏
    博弈論之囚徒困境,背叛也是有代價的。讓你人際關係更加穩固好看的皮囊千篇一律,有料的大腦萬裡挑一,歡迎來到心理經濟學課堂,今天投資自已第11天了,這周開始,我們將進入妙趣橫生的五節課,講解五個經典的博弈論。研究人們在類似像棋局一樣的複雜的環境中是如何合作與對抗的。
  • 《博弈與社會》:人類如何走出「囚徒困境」
    《博弈與社會》:人類如何走出「囚徒困境」   ◆  內容簡介  追求幸福是人的天性,但基於個體理性的決策常常與集體理性相衝突,導致所謂「囚徒困境」的出現,不利於所有人的幸福。人類如何走出「囚徒困境」,走向合作共贏?本書用博弈論的視角給出了答案。
  • 博弈論:為何人善總是被人欺?從囚徒困境看人性邏輯怪圈
    為了解決這一問題,我們依然舉例博弈論中的經典悖論——囚徒困境來說明這個問題。至於為何要用囚徒困境來說明這一問題,我們後續會提到這個經典悖論中的適用性和普遍性。01囚徒困境:個人理性和集體理性原則我們假定有兩個犯罪嫌疑人共同作案。
  • 王嘚吧博弈論:《囚徒困境》與《智豬博弈》
    如果大家覺得中間過於繁瑣,可以直接跳到結論 《囚徒困境》 題設:兩個罪犯A,B分別被警察審訊,根據法律,如果兩個罪犯都招供了各判4年;兩人都不招供的話罪行減輕,但是結合警察手中已有的證據,雙方個判2年;如果一人招供,另一人不招供,那招供的罪犯由於戴罪立功,
  • 兼職收入不高,還要糾結是否交個稅,博弈論教你輕鬆脫離囚徒困境
    日本鈴木一功在《博弈論》中就提到了這種情況,他陷入了「囚徒困境」。一、選擇太難,是因為你陷入了囚徒困境囚徒困境是1950年美國蘭德公司的梅裡爾·弗勒德和梅爾文·德雷希爾擬定出相關困境的理論,後來由顧問艾伯特·塔克以囚徒方式闡述,並命名為囚徒困境。
  • 約翰·納什:均衡博弈走出「囚徒困境」
    ,著名經濟學家、博弈論創始人、電影《美麗心靈》男主角原型。前麻省理工學院助教,後任普林斯頓大學數學系教授,主要研究博弈論、微分幾何學和偏微分方程。1928年6月13日出生在美國西維吉尼亞州工業城布魯?菲爾德的一個中產階級家庭。   1950年,約翰·納什獲得美國普林斯頓高等研究院的博士學位,他的博士論文中有一個重要發現,這就是後來被稱為「納什均衡」的博弈理論。
  • 博弈論教你做生意(1.痛苦的囚徒博弈)
    博弈論專有名詞叫做理性人。所以最終的結果讓大家大跌眼鏡:兩人都選擇了招供。警察達到了自己的目的:在沒有證據的情況下輕鬆地使嫌疑人招了供。深入剖析事情為什麼會這樣呢?張三和李四為什麼會做出如此愚蠢的選擇呢?我們不妨列一個表來看一下:當李四得知三種方案時,首先要考慮的是如何使自己受益。如果坦白要不就是8年,運氣好可以無罪釋放,一天也不用待。
  • 博弈心理學—「囚徒困境」,選擇合作還是選擇背叛?
    最初,博弈論主要研究的是象棋、橋牌、賭博中的勝負問題,博弈指的是兩人在對局中利用各自的策略來對抗對方的策略,以達到取勝的目的。     博弈在生活中無處不在,人們也會不自覺地運用博弈的理論來以最小的代價獲取最大的利益。   在博弈論中,關於囚徒困境,有你個著名的故事:   誰才是兇手  這天,某富豪在家中被殺,現場一片狼藉,富翁家的財產也被盜,通過調查,警察抓到了兩名嫌疑犯。
  • 博弈論:房奴們的囚徒困境,炒房團屢屢得手是有原因的
    但是這裡面會涉及到一個非常有意思命題:囚徒困境。囚徒困境是博弈論中的一個經典例子,大概理論是這樣的:A與B一起犯罪被捕,如果兩人都不揭發對方,則各判刑一年;如果兩個人同時揭發對方,則各判八年;如果一人揭發對方另一人沉默,揭發的人立功無罪釋放,沉默的人判十年。最終,由於AB雙方互不信任,最大的可能是兩人互相揭發。
  • 《博弈論》告訴你,當心陷入囚徒困境
    實際上,處於這種情況的職場人,已經陷入了「囚徒困境」當中。日本顧彼思管理學院鈴木一功所著的《博弈論》一書,針對圍繞利益取捨的問題,解析了職場中的「囚徒困境」,對如何進行商業投資、職場擇業,還有發展人際關係等等,都有很強的指導意義。一、什麼是職場中的「囚徒困境」?所謂的「囚徒困境」,原型取材於一則警方審問強盜的案例。
  • 破冰行動:審訊達人蔡永強的必勝法寶,博弈論之囚徒困境
    當然你會說心理戰術運用的很到位,不過在我看來這些是輔助作用,蔡永強此次刑訊會成功的必殺技其實是用了經濟學博弈論中囚徒困境模型。看來我們強哥私下偷偷學了經濟學呢!什麼是囚徒困境模型呢?兩個共謀犯罪的人被關入監獄,不能互相溝通情況。
  • 博弈論思想,科學家模擬上萬次「囚徒困境」,找到了最成功的決策
    《高地戰》劇照,使用漢字其實是歷史原在《自私的基因裡》,理察道金斯成就指出,進化論對於一些現象無力解釋,比如說囚徒困境在聊這個問題前,我們先來講一個博弈論的經典案例。假說警方抓住了兩名罪犯,姑且就分成甲嫌疑犯和乙嫌疑犯。但是警方並沒有證據可以指控這兩個嫌疑犯。於是,他們就把他們兩個人你分別關在兩個房間,然後分別對他們進行盤問。
  • 有了黑幫大哥,還有什麼「囚徒困境」
    近二三十年,因博弈論的跨界運用,政治學得以再度「降臨人間」。也正因為博弈論工具的使用,政治學此番重回人間,它的主要任務便有兩個:一是對個體進行賦值——對主體性進行描述;二是建構個體間的交往規則,即主體間性問題。如此,大到社會小到個人,便均可做博弈觀。所以雖然是主體性和主體間性這兩個老核桃,但因為有了博弈論這個新工具在手,一時間倒也成果斐然。
  • 「傑有所思:27」博奕論與管理之:囚徒困境
    昨天的文章說了博弈論裡一個經典的案例,今天說的這個案例則更經典,幾乎可以說是博弈論的「起源性」案例,那就是囚徒困境。囚徒困境是典型的不合作博弈,前提是人人做事的出發點都是:人不為己天誅地滅,這就是基本人性,我們在一個陌生社會裡,和陌生人相處的基本思維也是這樣的,事不關己,高高掛起,明知不對,少說為佳……是啊,不能保證這件事對自己有利,首先要可能避免對自己有害。
  • 合作的真相(重複囚徒困境的探討)
    博弈論中有個非常經典的案例叫囚徒困境。在囚徒困境的遊戲中,有兩個對策者,他們可以選擇:合作或者背叛,每個人都必須在不清楚對方選擇的情況下,做出自己的選擇。不論對方選擇什麼,背叛總比合作收益要高。所謂困境是指,如果雙方都選擇背叛,其結果比雙方合作要糟,個人最優策略卻是集體最糟策略。
  • 囚徒困境
    囚徒困境 2016年03月16日 15:27 來源:中國社會科學網綜合 作者: 字號 內容摘要:「囚徒困境」的基本模型如下:有兩個共同犯罪的囚徒被警察抓住了,但是警察卻缺乏足夠的證據指控他們所犯的罪行
  • 約翰·納什:走出「囚徒困境」的指路人
    是馮·諾依曼開創了經濟博弈論,而被馮·諾依曼貶低過的納什的思路卻比馮·諾依曼的合作博弈理論更能反映現實的情況,最終,他關於「非合作博弈」的長篇博士論文一鳴驚人,並發展成了著名的非合作博弈理論(noncooperativegames)。
  • 如何利用囚徒困境,讓選擇的利益最大化?
    唐寂看了一眼電視,答道:「是囚徒困境。」2. 囚徒困境2.1「囚徒困境」理論簡介囚徒困境(Prisoner’s Dilemma),是博弈論的非零和博弈中極具代表性的例子。非零和博弈是指博弈中各方的收益或者損失的總和不是零,區別於零和博弈(例如「你」贏就一定「我」輸的對賭),是一種合作下的博弈。