如何利用囚徒困境,讓選擇的利益最大化?

2021-01-09 人人都是產品經理

人在江湖走,於利益眾多的權衡與博弈中,什麼樣的選擇是相對好、相對優質的呢?本文或許對你有所啟發。

1. 精英律師

又是歲末年初。

南方的城市裡,雖未至嚴冬,已頗有寒意,正是三兩知己一邊火鍋一邊暢談的相聚好時機。

青子看著電視裡正在放著的《精英律師》,說道:

「這集看過了,說的是富豪百億遺產爭奪案,富豪弟弟和富豪老婆,爭來爭去,到最後選了個和解方案,誰也沒有成功獨吞全部財產。」

【精英律師-劇照】

未待眾人接話,青子像是突然想起了什麼,對著唐寂大聲說道:「有利有弊,互相猜忌,最後兩邊折衷和解,這是不是你以前跟我講的那個什麼…..什麼罪犯案例?」

唐寂看了一眼電視,答道:「是囚徒困境。」

2. 囚徒困境2.1「囚徒困境」理論簡介

囚徒困境(Prisoner’s Dilemma),是博弈論的非零和博弈中極具代表性的例子。

非零和博弈是指博弈中各方的收益或者損失的總和不是零,區別於零和博弈(例如「你」贏就一定「我」輸的對賭),是一種合作下的博弈。

囚徒困境指出,個人的最佳選擇可能並非團體最佳選擇,或者說,在一個群體中,個人做出理性選擇(個人利益最大化)時,卻可能導致集體的非理性(集體利益非最大化,甚至集體利益最小化)。

囚徒困境的故事,可簡述為:

警方逮捕了甲、乙兩名嫌犯,但並沒有足夠證據指控二人入罪。於是,警方分開囚禁甲、乙,並分別和二人見面,且向雙方提供以下相同選擇:

若一人認罪並作證檢舉對方,而對方保持沉默,則此人即時無罪獲釋,沉默者判刑10年;若二人皆沉默不檢舉,則二人同時判刑1年;若二人相互檢舉,則二人同時判刑7年。

最終,甲乙二人在以下合理前提條件下:

被隔斷無交流均獲知懲罰的確實有效性確認抉擇後對方無報復手段雙方皆為理性人,會最大限度為自己爭取利益

最終選擇「相互檢舉」,導致」二人同時判刑7年」。

2.2《精英律師》案例分析

在《精英律師》案例中,富豪孫浩瀚留下了百億遺產,孫超越(孫浩瀚親弟)與藍紅(孫浩瀚妻子)針對繼承權問題對簿公堂。

圍繞是否存在合法有效的遺囑,雙方面臨的情況是:

若存在合法有效的遺囑,孫超越為合法繼承人;若不存在合法有效的遺囑,藍紅作為配偶,是法定繼承人。

因此,在訴訟與和解的抉擇面前,二人的博弈是:

但最終,二人沒有走到「讓對方零繼承」的最壞局面。

通過雙方律師和當事人的正確判斷與有效博弈,在基於「孫浩瀚既不希望親弟零繼承,也不希望妻子零繼承」的情理之上,二人最終達成「相互體諒」的和解。

【精英律師-劇照,來源:愛奇藝】

「百億家產啊,如果是我,我就賭一局!」

「那我可提醒你,相比於翻倍叫地主,這刺激程度可能更接近於俄羅斯輪盤賭。」

「按50-50的概率算,理論上的數學期望,應該跟和解方案相近。」

「哈哈,那還是不要賭這一局了。」

「還有類似的案例嗎?」

「再給你說個候選人投票的故事吧。」

3. 三中選一

候選人投票故事:

現有甲乙丙評委三人,需對ABC候選三人進行投票,投票規則如下:

評委每人對ABC三人進行排序,排序一二三分別對應計分3、2、1;三位評委的排序投票求和,總計分最高者,勝出;如三位評委的投票排序皆為ABC,則A計9分,B計6分,C計3分,A勝出。

已知以下情況:甲欣賞A,乙欣賞B,丙態度不明。

請問:甲是否存在一種策略,最大概率使A勝出?

……

「既然甲想選A,A得3分,乙想選B,B也得3分,那關鍵就是丙想選誰,因為丙的第一順位也是3分。」

「那也不一定,排第二也有2分,兩個2分,跟一個3分一個1分,都是4分。」

「對啊,你也說了,問題就在於只有三個人進行321排序,只要拿到一個3分,另一個至少有一個1分,那也是立於不敗之地了。」

「問題是沒說丙一定會給A投3分啊?」

「那這個問題,是不是可以先討論到底需要多少分才能保證不被淘汰!」

「在數學上,這確實是排列組合的概率和期望問題。」

3.1 囚徒困境下的概率問題

先回到上面《精英律師》裡的案例,若假設有:

遺囑有效的的概率為50%;訴訟勝利獲得全部遺產,100億;訴訟失敗則零繼承,0收益。

那麼,藍紅和孫超越在博弈中的數學期望,應該是:

E=100*0.5+0*(1-0.5)=50(億)

因此,折衷和解,於情於理,符合雙方預期利益。

再看「三選一」案例,其數學本質更接近於如下條件中的排列組合問題。

假設有:甲已將3分賦予A,乙已將3分賦予B

則請問:甲將2分賦予給B和C中的哪位,可使得A得到最多分的概率最大?

本文不展開探討具體的概率計算問題,感興趣的讀者,可以留言探討——A需要至少得多少分,才能保證勝出?

3.2 囚徒困境下的博弈問題

「我倒覺得可以簡單一些,既然甲選A乙選B丙態度不明,那就可以認為是甲乙在博弈,也就是說,甲的排序必須是ACB。另外,故事裡的甲,跟我想的是一樣嗎?」

「不,他輸了。」

囚徒困境中,核心的博弈條件之一,就是理性人。

理性人的兩大特點是:

趨利避害,利己;完全理性,能夠根據趨利避害原則針對成本-收益採取一切機會和手段進行優化選擇。

因此,如果博弈雙方中,存在非理性的一方,比如認為對方與自己利益一致,或認為對方將為集體利益犧牲個人利益,則很可能導致決策失誤,使得自己陷入困境,而對方打破困境。

反之,對局中人的啟示是,重要的不是在困境中抉擇,而是要嘗試引導對方,使之為本方利益或集體最大利益服務,才能打破困境。

4. 六中選二

「故事裡的甲,不是你吧?。」

「是與不是,又有何妨?」

「那還有甲最終獲勝的故事嗎?」

「有。如下所示:

現有甲乙丙評委三人,需對甲團隊ABC、乙團隊DEF候選六人進行投票,投票規則如下:

評委每人投票選擇三人,被選者每人計得1票,不計分;甲、乙可在本方團隊選兩人且在對方團隊選一人;丙可在候選六人中任選三人;三位評委的投票求和,得票最高的前兩位,勝出;如三位評委的投票皆為ABD,則ABD各計3票,需進行二次投票。

已知有以下情況:

甲傾向ABC,乙傾向DEF,丙態度不明;A為甲團隊實力幹將,業績優異;B為甲團隊多年骨幹,兢兢業業;C為甲團隊新鮮血液,成長迅速;D為乙團隊實力幹將,業績良好;E為乙團隊多年元老,穩定輸出;F為乙團隊拼命三郎,低調老實。

請問:甲是否存在一種策略,最大概率使AB勝出?」

……

「六選二,這個我更加不想算了。」

「不見得更難算啊,畢竟只計票不計分。」

「那也是三個3票在六個人身上的排列組合問題……」

「正向推算若太麻煩,為何不試試逆向?」

「何為逆向?」

「算自己多,不如算對方少。」

事實上,如若甲乙丙為同一團隊,ABCDEF為同一團隊下的六位夥伴,所有人互信互利,將有如下隱性條件:

甲乙丙的抉擇以團隊利益最大化為目的從ABCDEF六名候選人中任意選擇兩名的利益差異過小

則此情形下不存在囚徒困境的博弈。

繼續遵循「囚徒困境」的條件作進一步假設:

甲乙為完全理性人,趨利避害;C、F存在一定短板,例如群眾基礎相對薄弱,不能服眾,我們稱之為「劣勢候選人」。

此情形下,甲乙面臨的情況有:

對方都會力求保住自己的優勢候選人儘量控制對方優勢候選人的總票數

那麼,二人的博弈將轉變為:

到此,可以非常清晰地看到,在「六選二」案例中:

為求己方團隊利益最大,甲乙可能會高概率投對方劣勢候選人;最嚴重的後果是「劣幣驅逐良幣」,雙方團隊的優勢候選人皆無法勝出;丙的態度不明確,將進一步加劇此態勢。

這便是真正的囚徒困境。

5. 天下無囚

「所以故事裡的甲,贏了?」

「不是你自己要聽勝利的案例麼?」

「是你的風格?」

「充分利用規則獲得勝利,有什麼不好?掌握主動後說不定還可以賣個人情。」

「不是你的風格。」

「乙之砒霜,甲之蜜糖。」

「那也不是你的風格。」

「In me the tiger sniffs the rose.「

「Whaaaaat?」

「心有猛虎,細嗅薔薇。」

「說人話!」

「菩薩心腸,雷霆手段。」

囚徒困境,作為經典的博弈論案例,對所有面臨抉擇的商業談判、溝通策略、人生選擇,都有著值得深思借鑑的價值,無論是作為對自己的警醒,還是作為對他方的預防。

但是,在囚徒困境中抉擇得再好,也是囚徒的抉擇。打破囚徒困境的唯一出路,就是不要成為囚徒。畢竟,高手人抬人,低手人踩人。畢竟,最重要的不是技巧,而是人心。

願天下無囚!

唐寂看了一眼手錶,站起身,舉起杯子,說道:

「來來來,再過幾天就新年了,大家一起~」

「新年快樂!」

「大吉大利!」

「長命百歲!」

「精神!」

「富強!」

「哈哈哈哈!」

「天下無囚!」

END

歡迎查閱更多精彩文章

產品經理方法論系列文章:

車聯網生態應用建設戰略系列文章:

 

作者:唐寂;微信公眾號:刀法入兵(ID:daofajia)。品牌車企車聯網生態產品負責人,智慧出行行業十年產品人,「影子評審團」評委,曾主導車企多款重量級產品的定義重構和網際網路超級應用融合上車。

本文由 @唐寂 原創發布於人人都是產品經理,未經作者許可,禁止轉載。

題圖來自Unsplash,基於CC0協議

收藏已收藏 | {{ postmeta.bookmark }} 點讚已贊 | {{ postmeta.postlike }}

相關焦點

  • 合作的真相(重複囚徒困境的探討)
    博弈論中有個非常經典的案例叫囚徒困境。在囚徒困境的遊戲中,有兩個對策者,他們可以選擇:合作或者背叛,每個人都必須在不清楚對方選擇的情況下,做出自己的選擇。不論對方選擇什麼,背叛總比合作收益要高。所謂困境是指,如果雙方都選擇背叛,其結果比雙方合作要糟,個人最優策略卻是集體最糟策略。
  • 漢和資本:投資中的「囚徒困境」
    因此在上述的例子中,最終A和B兩個嫌疑犯選擇的都會是「認罪」,雖然對於A和B個人而言這是利益最大化的選擇,但是對於A和B兩人作為一個整體而言並不是最優的選擇。但是簡單的模型並不意味著結論的錯誤,真實市場中參與者面對信息做出的選擇和這個例子中A和B兩名投資者做出的選擇一樣,都是基於自身利益預期最大化的選擇,但導致的結果是市場中每一個投資者都遭受了更大的損失。那麼為什麼投資中會存在「囚徒困境」這個問題?我們從以下幾點來看:1、「囚徒困境」的根本原因是個體理性和集體理性之間的矛盾,也就是個體理性導致的集體非理性。
  • 博弈心理學—「囚徒困境」,選擇合作還是選擇背叛?
    博弈在生活中無處不在,人們也會不自覺地運用博弈的理論來以最小的代價獲取最大的利益。   在博弈論中,關於囚徒困境,有你個著名的故事:   誰才是兇手  這天,某富豪在家中被殺,現場一片狼藉,富翁家的財產也被盜,通過調查,警察抓到了兩名嫌疑犯。
  • 囚徒困境
    囚徒困境 2016年03月16日 15:27 來源:中國社會科學網綜合 作者: 字號 內容摘要:「囚徒困境」的基本模型如下:有兩個共同犯罪的囚徒被警察抓住了,但是警察卻缺乏足夠的證據指控他們所犯的罪行
  • 如何突破生活中的囚徒困境?
    突破囚徒困境只有一種方法:所以有人的行為都應該符合集體理性。哪些事是我麼生活中的囚徒困境?每天到了下班時間還不肯走,怕準點走了留給領導的印象不好,所以都要僵持一會兒且爭做不是第一個走的人。囚徒困境就是為了追求個體利益最大化,而出現的不合理的選擇和行為產生的困境。囚徒困境的最初版本原來是這樣的兩個囚徒。警察給了他們三個選擇:A、都坦白,每人判5年。
  • 從「囚徒困境」現象談企業競爭情報及價格戰中的合作雙贏
    目前博弈論的發展正越來越受到各個領域的重視,因為在現實生活中矛盾和衝突總是無所不在,而利用博弈論可以幫助我們很好地解決這些現實生活中的矛盾和衝突問題。由此可見,如何在矛盾和衝突中成功的選擇和運用策略是一個很有意義的問題。   一、「囚徒困境」現象及其普遍意義  1.
  • 內卷與囚徒困境
    我想到博弈論裡的囚徒困境。在一個封閉的,信息不對稱的系統中,每個人似乎都在爭取自己的利益最大化,但實際上,他們越狠爭取,利益損失越快。在囚徒困境裡,他們會得到更長的刑期,而在衡水,同學們必須付出更多的無畏的努力。一顆美妙的卷白菜,其實是一座無間地獄。
  • 囚徒困境模型
    本文分成二部分,第一部分是介紹囚徒困境,第二部分是參考該模型做的三個練習囚徒困境指兩個囚徒被抓後,選擇相互背叛還是忠誠的博弈問題囚徒困境的實驗:囚徒AB被抓後,信息不相通,警察告知對方,互相指控,雙方都判5年;互相沉默,雙方都判2年;一個指控一個沉默,
  • 一文讀懂囚徒困境
    結果是,兩個囚徒之間不可能達成穩定的盟約。囚徒困境通常被看作個人理性衝突和集體理性衝突的經典情形。因為在囚徒困境局勢中,每個人根據自己的利益做出決策,但是最後的結果卻是集體遭殃。現實中諸多的問題和現象,正是囚徒困境問題的翻版。
  • 兼職收入不高,還要糾結是否交個稅,博弈論教你輕鬆脫離囚徒困境
    日本鈴木一功在《博弈論》中就提到了這種情況,他陷入了「囚徒困境」。一、選擇太難,是因為你陷入了囚徒困境囚徒困境是1950年美國蘭德公司的梅裡爾·弗勒德和梅爾文·德雷希爾擬定出相關困境的理論,後來由顧問艾伯特·塔克以囚徒方式闡述,並命名為囚徒困境。
  • 不只是鬧脾氣,還有囚徒困境作祟
    然而,利己是人的天性,除了情感因素外,雙方進行的利益博弈也是冷戰形成的重要推動力,經濟學上把這種博弈稱為囚徒困境。什麼是囚徒困境?囚徒困境這一理論是由阿爾伯特·塔克在1950年提出的,當時為了讓公眾更容易理解這個理論,塔克就舉了一個關於囚徒的例子來解釋,囚徒困境理論也就此得名。
  • 囚徒困境——「坦白」還是「抵賴」?
    大家在日常生活中,或多或少會接觸到「博弈論」這個話題,其中典型範例是「囚徒困境」。假設你和另一個同夥因為一次犯罪而入獄,警察把你們分開審問,你面前有兩個選項:「坦白」和「抵賴」,不同選擇的結果也不同。不得不承認,無論對方選擇什麼,選擇坦白的自身收益,都比選擇抵賴要高。對方抵賴(坦白無罪>抵賴1年)對方坦白(坦白8年>抵賴10年)如果對方是一個陌路人,在對方決策已定的情況下,選擇坦白的收益總是比同條件下的抵賴要高。
  • 博弈論之囚徒困境
    因為每個囚徒都會發現,如果對方拒供,則自己供認便可立即獲得釋放,而自己拒供則會被判0.5年,因此供認是比較好的選擇;如果對方供認,則自己供認將被判2年,而自己拒供則會被判5年,因此供認是比較好的選擇。無論對方拒供或供認,自己選擇供認始終是更好的,這就是囚徒困境。
  • 部門內部競爭嚴重,新晉領導如何打破職場「囚徒困境」,2招破解
    A小組的預算高,形式和效果好;B小組預算低,但形式和效果略低一點,但如果組合成C方式,既保證了形式和效果,又能夠壓縮一部分預算,但是倆小組長死活不統一,非讓我在他們倆之間做出選擇。」阿峰團隊的情況,不就是典型的」囚徒困境「嗎?鈴木一功這本《博弈論》中給出了解釋,參與博弈的雙方總是想追求自身收益最大化,從而忽略了原本可以雙贏的合作式選擇。
  • 小讀者學堂張志斌:囚徒困境給我們日常推廣中的啟示
    大斌小課 丨成長贏丨 發起人張志斌這是張志斌公眾號的第925篇日更原創文章在了解囚徒困境前有一個概念需要了解就如同樊登讀書、小讀者學堂、各種代理機制的設計,有時各代理商和公司之間為了完成好各自的工作,都想各自利益最大化,最終卻沒能實現整體最好的結果。我們來看看囚徒困境,幫大家進一步理解這個問題。假設你我合謀作案,不幸被抓住了。如果我倆誰都不招供的話,我們都會判5年監禁。
  • 法國總統憂心脫歐談判:小夥伴們當心囚徒困境…
    法國總統憂心脫歐談判:小夥伴們當心囚徒困境… 文/維多利亞2018-01-05 19:46:09來源:FX168財經網
  • 《博弈論》告訴你,當心陷入囚徒困境
    日本顧彼思管理學院鈴木一功所著的《博弈論》一書,針對圍繞利益取捨的問題,解析了職場中的「囚徒困境」,對如何進行商業投資、職場擇業,還有發展人際關係等等,都有很強的指導意義。一、什麼是職場中的「囚徒困境」?所謂的「囚徒困境」,原型取材於一則警方審問強盜的案例。在互相被獨立告知的情況下,擺在強盜面前只有三條路,三個結果。
  • 哲學難題:囚徒困境與紐科姆問題
    囚徒困境一個犯罪團夥的兩名成員西蒙和彼得因涉嫌從事武裝搶劫而被捕。警方沒有足夠的證據向搶劫中的任何一人行刑。上述問題被稱為「囚徒困境」,可以應用到現實世界的很多方面,包括博弈論,經濟學,氣候變化,體育和社會/政治問題。
  • 「囚徒困境」在商戰中的應用,竟然還可以這麼玩?
    如果囚徒甲是堅守盟約的人,那麼囚徒乙正好可以在事前誘使他訂立盟約,然後被捕後囚徒乙就可以通過背盟而逍遙法外。囚徒甲當然也很清楚做一個堅守盟約的人很可能被囚徒乙利用,所以他為什麼要堅持盟約呢?結果是,兩個囚徒之間不可能達成穩定的盟約。囚徒困境通常被看作個人理性衝突和集體理性衝突的經典情形。因為在囚徒困境局勢中,每個人根據自己的利益做出決策,但是最後的結果卻是集體遭殃。現實中諸多的問題和現象,正是囚徒困境問題的翻版。
  • 在理性的利益選擇中,總有一部分利益被人們捨棄
    看完理性選擇理論的小視頻同學們可能會問:「可是正常情況下,我們都是理性的人,在很多選擇上明明可以保持好自己的原則問題,這樣一來集體的利益就應該達到最大化。」正是因為你是一個理性的人,並且你知道對方是理性的,對方也知道你知道他是理性的。