博弈論:為何人善總是被人欺?從囚徒困境看人性邏輯怪圈

2020-12-05 羅sir職話

文 | 羅sir

博弈論是分析存在相互依賴情況下理性人如何決策的理論工具。

在現實生活中,我們總是能看到一些「老實人」因為善良被欺負被針對,面對這一現象,我們應該如何選擇博弈?

為了解決這一問題,我們依然舉例博弈論中的經典悖論——囚徒困境來說明這個問題。

至於為何要用囚徒困境來說明這一問題,我們後續會提到這個經典悖論中的適用性和普遍性。

01

囚徒困境:個人理性和集體理性原則

我們假定有兩個犯罪嫌疑人共同作案。警察抓住他們以後,分開拘押,並告訴他們:你們兩個人可以選擇坦白,或是不坦白;如果一個人坦白,另一個人不坦白,則坦白的一方會被立即釋放,而不坦白的一方會被判刑10年,如果兩人都坦白,則會每人各判刑5年;如果兩人都抵賴的話,因證據不足,則每人會在關押1年後釋放。

那麼,這兩個犯罪嫌疑人應該如何選擇?

我們看到,這裡博弈的有兩個參與人:犯罪嫌疑人A和B;且每個人都有兩個行動方式:坦白或不坦白;但兩個人都隔離審查,誰都不能觀察到對方是否選擇坦白還是不坦白,因此我們說這是一個不完美信息靜態博弈

即他們雙方之間無法知道對方的決策方式。

現在我們來看看參與人A和B會如何決策。我們首先假定他們都是理性的,沒人會想去坐牢,哪怕是多坐一天都會帶來更多的痛苦。因此,他們的目標是能少坐就少坐。

同時呢,我們還假定他們每個人只會關心自己的利益得失。那麼不管對A還是B來說,坦白就是最優的選擇,因為他們無法實現約定不坦白,也無法假定對方會選擇不坦白,那麼此時他們個人的最佳決策就是選擇坦白。

如果兩人都選擇坦白,那麼等待他們的就是一起被判刑5年。

但是,就這兩個囚徒而言,在這個博弈中的帕累託最優是「都不坦白」,各只坐一年牢。所謂帕累託最優,就是指是指資源分配的一種最為理想的狀態。

這裡我們要提到的一個概念就是個人理性集體理性之間的矛盾。

對上述A和B兩個人來說,個人的理性是選擇坦白,因為我們無法得知對方的策略如何;但是從集體理性的角度出發,選擇都不坦白,各坐一年牢,才是對雙方的最優選擇。

現在我們回到前文中的問題,為何人善總是被人欺?

囚徒困境告訴我們,很多時候兩方或以上的人數在選擇博弈的時候,大家遵循的是個人理性的原則,因為信息不對等,我們無法準確預估對方的選擇是如何的。

但是就善良的人來說,他可能會選擇集體理性原則來做出決策,即替對方考慮並以此為決策依據。而根據囚徒困境來看,如果一方選擇個人理性作為決策參考,那麼對應的,選擇集體理性的另一方就會面臨吃虧。

這就是所謂「人善被人欺」的博弈困境。

為了讓這個觀點更通俗易懂,我們還是拿囚徒困境舉例。

02

囚徒困境實例

在上述囚徒困境中,如果我們假設嫌疑人A是「善良的」,那麼他可能就會選擇雙方都不坦白。因為從集體理性出發,雙方都不坦白,那麼僅僅只判刑1年,這是有利於雙方的帕累託最優。

但在實際情況下,嫌疑人B為了更符合自身的利益,那麼他會根據個人理性作為決策依據。即自己受到的損失最小,那麼嫌疑人B就會選擇坦白。

那麼現在我們再來看這個博弈結果,嫌疑人A顧全大局考慮,選擇不坦白。嫌疑人B從個人理性出發,選擇坦白。那麼得出的結果就是,嫌疑人A因為不坦白,被判刑10年,嫌疑人B因為坦白,而被立即釋放。

由此,這是博弈論中的為何人善被人欺的原因所在。即我們在做出決策的時候,常常會考慮到對方的情緒和局面,也正因為為對方著想過多,導致我們在博弈中出現了「人善被人欺」的不利博弈局面。

也許你此時有點明白這個道理,但也許還顯得懵懵懂懂,為了加強你的印象,我們再例舉一個生活中的常見博弈場景:借錢

我們假設,一個多年未曾聯繫的大學朋友突然打電話找你借五百元錢。那麼此時你的選擇通常只有兩個:借給他,或者不借給他。

而根據個人理性原則來看,這個朋友你不曾聯繫,也與你現在沒有什麼交集,況且借出去了能不能還給自己都是未知,那麼此時你的最優選擇是不借給他。

但如果從集體理性角度來看呢?這個大學朋友幾乎是懇求著告訴你,自己很久沒吃過飯了,這五百元可以解決他的一個月夥食費用。

那麼我們現在來看這個博弈局面:

個人理性原則:你選擇不借給他,你不會有任何損失。但他可能會失去一個月的夥食費用。

集體理性原則:你暫時損失五百元錢,他說不定會還給你。而對方呢,則可以得到五百元錢,繼續生活一個月下去。

如果你足夠考慮到對方的可憐狀態,又想到對方是你的大學室友,那麼你會選擇借給他。而其結果呢,很可能是這五百元錢付之東流,你損失五百元失去一個大學室友。

所以我們說,為什麼「老實人」總是會被欺負?因為他們往往都顧及到對方的感受和得失,從而在一次又一次的博弈中,自己的個人理性原則為了集體理性原則受到損失。

當然,在實際的現實生活中,這樣的博弈例子還有許多許多。朋友叫你明天請假去某地玩耍,但自己明明要上班,按理來說最好的選擇是拒絕他不去,但礙於朋友的面子,只能服從於集體理性原則,選擇向公司請假,陪朋友去玩一天。

那些無法推脫不願去參加的聚會、幫忙帶飯帶奶茶等等,都是個人理性服從於集體理性原則下的自我受損行為。

現在,你或許可以發出感慨,博弈論竟會如此神奇?

我要說的是,生活中的博弈無處不在,但很多時候,我們沒有建立系統的博弈思維,我們是很難分清這是否是在博弈,從而導致為了不拒絕別人,個人理性服從集體理性導致自己長期受損。

那麼我們應該如何改變這一局面?

建立博弈思維,走出人性邏輯怪圈。

03

博弈思維:利己就是最大的利他

我在本文開篇就點出,博弈論是分析存在相互依賴情況下理性人如何決策的理論工具。

這句話有兩個關鍵點,其一是相互依賴,其二是理性人。

換句話說,任何產生依賴關係的雙方,都存在博弈局面,而在博弈之中,我們又假定人是理性人。

那麼根據這一原則,建立博弈思維的重點就在於依賴關係。

在生活中,任何一切交易關係、依賴關係本質上都是一種博弈狀態。但千萬不要認為「博弈」是一種貶義詞,博弈作為一種客觀存在的狀態,我們需要理性認識到它的存在。

而運用博弈思維思考,我們需要知道以下幾點:

參與人集體理性和個人理性原則選擇權和選擇帶來的後果參與人,是指的參與方都有哪些人。集體理性和個人理性原則,通俗地講就是利己思維和利他思維。至於選擇權和選擇的後果,就是我們需要通過博弈中的已知信息去推測,可能出現的幾種後果。

當我們知道了這幾點信息,那麼我們就可以快速在腦海中列出各項選擇以及選擇所帶來的後果。

而在面對博弈中個人理性和集體原則之間,我的建議是:選擇個人理性原則。

即只求個體的最優選擇,不求集體的最優選擇。

邏輯思維的羅振宇說過一句話我很喜歡:商業就是最大的慈善。開公司,創造就業、帶動GDP的增長,這不就是最大的慈善嗎?

同理,利己其實就是最大的利他行為。為什麼這麼說?

我們拿企業做廣告之間的競爭博弈舉一個例子:

企業做廣告的成本很高,不一定能給企業來帶利潤,但為什麼大部分企業都做廣告呢?我們假定某個行業內有兩個企業,如果每個企業都不做廣告,那麼他們之間各得10元利潤;如果都做廣告,各得4元的利潤;如果一個企業不做廣告,那麼做廣告的企業就可以賺到12元,不做廣告的企業就只能賺到2元。

而按照博弈中的個人理性原則,就是兩個企業都做廣告。因為無論別人做廣告與否,你的最優選擇都是做廣告。但是如果按照集體理性原則博弈,那麼有一方就會選擇不做廣告,為什麼?因為在集體理性原則看來,雙方都不做廣告都賺10元,是最佳選擇。

但在實際過程中,選擇集體理性原則博弈的公司,就會面臨巨大的虧損,因為他假定對方也不做廣告,大家都賺10元,但是對方卻做了廣告,那麼只能導致自己賺2元錢。

從這個類似於囚徒困境的例子中,我們可以得出:利己實際上就是最大的利他行為

按照囚徒困境來看,雙方都選擇不做廣告是最為合算的。但實際情況是,由於沒有籤訂相應的契約,選擇集體理性原則博弈的一方,必然會承擔最大的損失。

經濟學原則也表明,利己行為也是能夠促進社會效益最大化的。

當我們所有人都追求自己想要的物質精神、財富,那麼整個社會的總財富才會增加。同理,按照分工理論來看,當我們都只做自己份內的事情,那麼所有人都會享受到整個商業社會帶來的商品和物質供應。

現在,我們可以用博弈論來解決人善被人欺的問題了。具體應該怎麼做?

建立博弈思維,用個人理性原則作為決策依據,在觸及自己核心利益的時候,我們應該明白:利己才是最大的利他。

END.

作者:羅sir,新青年的職場內參。點擊【關注】,每天免費獲取更多職場知識。

相關焦點

  • 博弈論之囚徒困境
    今天我們來講博弈論中一個非常經典的模型,叫做囚徒困境。兩個人因盜竊被捕,警方懷疑其有搶劫行為,但未獲得確鑿證據可以判他們犯了搶劫罪,除非有一個人供認或兩個人都供認。即使兩個人都不供認,也可判他們犯盜竊物品的輕罪。
  • 博弈論中的「囚徒困境」是什麼意思?
    生活中,人們常常會陷入「囚徒困境」的兩難境地,不知該做出何種抉擇,但不管遇見怎樣的難題,總能找到解決問題的辦法。而且,倘若採用巧妙的方法來解除困境,不僅能夠將難題化解,還可能為自己帶來更多的利益。那麼,博弈論中的「囚徒困境」到底是什麼意思呢?且聽小編為大家解惑。
  • 囚徒的困境-博弈論
    那些把遊戲看作模擬戰爭的人,也可以把戰爭看作一種遊戲。這方面的一個經典的例子是普魯士人在長達一個世紀的時期內都迷戀一種名叫Kriegspiel的遊戲,也就是戰爭遊戲在18世紀,Kriegspiel被軍事學校當作教育科目之一。這個遊戲的遊戲板上有一張地圖,包括法國—比利時邊界,地圖被縱橫分成3 600個小方格。棋子可以跨過邊界前進或後退,就像軍隊一樣。
  • 囚徒困境的困境究竟在哪?
    不知道手機前面的各位有沒有聽說過囚徒困境,這是一個很經典很有代表性的博弈論模型,甚至由此能產生很多關於生活中事例的思考,下面先簡單介紹一下什麼是囚徒困境。兩個共謀犯罪的人被關入監獄,不能互相溝通情況。如果兩個人都不揭發對方,則由於證據不確定,每個人都坐牢一年;若一人揭發,而另一人沉默,則揭發者因為立功而立即獲釋,沉默者因不合作而入獄十年;若互相揭發,則因證據確實,二者都判刑八年。
  • 約翰·納什:均衡博弈走出「囚徒困境」
    ,著名經濟學家、博弈論創始人、電影《美麗心靈》男主角原型。前麻省理工學院助教,後任普林斯頓大學數學系教授,主要研究博弈論、微分幾何學和偏微分方程。1928年6月13日出生在美國西維吉尼亞州工業城布魯?菲爾德的一個中產階級家庭。   1950年,約翰·納什獲得美國普林斯頓高等研究院的博士學位,他的博士論文中有一個重要發現,這就是後來被稱為「納什均衡」的博弈理論。
  • 《博弈與社會》:人類如何走出「囚徒困境」
    《博弈與社會》:人類如何走出「囚徒困境」   ◆  內容簡介  追求幸福是人的天性,但基於個體理性的決策常常與集體理性相衝突,導致所謂「囚徒困境」的出現,不利於所有人的幸福。人類如何走出「囚徒困境」,走向合作共贏?本書用博弈論的視角給出了答案。
  • 王嘚吧博弈論:《囚徒困境》與《智豬博弈》
    如果大家覺得中間過於繁瑣,可以直接跳到結論 《囚徒困境》 題設:兩個罪犯A,B分別被警察審訊,根據法律,如果兩個罪犯都招供了各判4年;兩人都不招供的話罪行減輕,但是結合警察手中已有的證據,雙方個判2年;如果一人招供,另一人不招供,那招供的罪犯由於戴罪立功,
  • 你是個自私的人嗎?「囚徒困境」或可解釋
    美國耶魯大學一項研究顯示,若你對陌生人伸出援手前總是忍不住問自己「這樣做對我有什麼好處」,說明你是一個自私鬼。通常來說,人傾向於與陌生人合作,但為何有人會拒絕幫助他人?研究人員在《國家科學院學報》上發表文章說,他們憑藉演化博弈理論和行為經濟學理論,分析人幫助他人的決策過程。
  • 博弈論:房奴們的囚徒困境,炒房團屢屢得手是有原因的
    而真正需要住房的人卻只能做一個接盤俠,承擔起被炒房團禍害過的高房價,成為一個光榮的房奴,從此大半輩子做牛做馬。房奴意味著什麼大家都很清楚,自然也就痛恨炒房團。而更多的連成為房奴的資格都沒有的人們,更是對抬高房價的炒房團恨得咬牙切齒。最近,有媒體記者臥底炒房團得到了一些消息:北京的某個炒房團又準備搞事情了,他們的下一個目標是天津。
  • 博弈論之囚徒困境,背叛也是有代價的。深度好文,值得收藏
    博弈論之囚徒困境,背叛也是有代價的。讓你人際關係更加穩固好看的皮囊千篇一律,有料的大腦萬裡挑一,歡迎來到心理經濟學課堂,今天投資自已第11天了,這周開始,我們將進入妙趣橫生的五節課,講解五個經典的博弈論。研究人們在類似像棋局一樣的複雜的環境中是如何合作與對抗的。
  • 兼職收入不高,還要糾結是否交個稅,博弈論教你輕鬆脫離囚徒困境
    日本鈴木一功在《博弈論》中就提到了這種情況,他陷入了「囚徒困境」。一、選擇太難,是因為你陷入了囚徒困境囚徒困境是1950年美國蘭德公司的梅裡爾·弗勒德和梅爾文·德雷希爾擬定出相關困境的理論,後來由顧問艾伯特·塔克以囚徒方式闡述,並命名為囚徒困境。
  • 博弈論思想,科學家模擬上萬次「囚徒困境」,找到了最成功的決策
    囚徒困境在聊這個問題前,我們先來講一個博弈論的經典案例。假說警方抓住了兩名罪犯,姑且就分成甲嫌疑犯和乙嫌疑犯。但是警方並沒有證據可以指控這兩個嫌疑犯。於是,他們就把他們兩個人你分別關在兩個房間,然後分別對他們進行盤問。
  • 博弈論教你做生意(1.痛苦的囚徒博弈)
    一般人可能會說,這不太簡單了嘛,傻帽才會選擇坦白呢。是呀我們從上帝視角第一眼就看出了最優的選擇,那就是雙方都不坦白,只會各判兩年。但是要注意的是,首先這兩個人是被隔離審訊的,他們不知道對方所作出的選擇是什麼。其次雙方沒有任何的關係,不是什麼好兄弟啊什麼好朋友。他們只是這次案件走到了一起而已,說簡單點就是他們只會為自己的利益考慮,這是放在第一位的。博弈論專有名詞叫做理性人。
  • 《博弈論》告訴你,當心陷入囚徒困境
    職場中,跳槽是每位職場人經常需要面對的問題,而很多人判斷是否跳槽的關鍵也是看下一家能夠漲多少工資,畢竟,現實經濟壓力擺在面前。但因為自己內心還是期待更多的工作成就感和滿足感,會對進不了工資少前景好的公司感到遺憾。實際上,處於這種情況的職場人,已經陷入了「囚徒困境」當中。
  • 博弈心理學—「囚徒困境」,選擇合作還是選擇背叛?
    最初,博弈論主要研究的是象棋、橋牌、賭博中的勝負問題,博弈指的是兩人在對局中利用各自的策略來對抗對方的策略,以達到取勝的目的。     博弈在生活中無處不在,人們也會不自覺地運用博弈的理論來以最小的代價獲取最大的利益。   在博弈論中,關於囚徒困境,有你個著名的故事:   誰才是兇手  這天,某富豪在家中被殺,現場一片狼藉,富翁家的財產也被盜,通過調查,警察抓到了兩名嫌疑犯。
  • 從「囚徒困境」現象談企業競爭情報及價格戰中的合作雙贏
    【關鍵詞】博弈論 囚徒困境 企業競爭情報 價格戰 合作雙贏   「生活是一個永無止息的決策過程,我們每個人都無法逃避這樣的現實:或是成為某個策略的影響者,或是被某個策略所影響。其實,我們每個人都是生活這場遊戲的策略家。既然這樣,當一個出色的策略家總比當一個蹩腳的策略家更好一點。」
  • 約翰·納什:走出「囚徒困境」的指路人
    是馮·諾依曼開創了經濟博弈論,而被馮·諾依曼貶低過的納什的思路卻比馮·諾依曼的合作博弈理論更能反映現實的情況,最終,他關於「非合作博弈」的長篇博士論文一鳴驚人,並發展成了著名的非合作博弈理論(noncooperativegames)。
  • 「傑有所思:27」博奕論與管理之:囚徒困境
    昨天的文章說了博弈論裡一個經典的案例,今天說的這個案例則更經典,幾乎可以說是博弈論的「起源性」案例,那就是囚徒困境。囚徒困境是典型的不合作博弈,前提是人人做事的出發點都是:人不為己天誅地滅,這就是基本人性,我們在一個陌生社會裡,和陌生人相處的基本思維也是這樣的,事不關己,高高掛起,明知不對,少說為佳……是啊,不能保證這件事對自己有利,首先要可能避免對自己有害。
  • 有了黑幫大哥,還有什麼「囚徒困境」
    近二三十年,因博弈論的跨界運用,政治學得以再度「降臨人間」。也正因為博弈論工具的使用,政治學此番重回人間,它的主要任務便有兩個:一是對個體進行賦值——對主體性進行描述;二是建構個體間的交往規則,即主體間性問題。如此,大到社會小到個人,便均可做博弈觀。所以雖然是主體性和主體間性這兩個老核桃,但因為有了博弈論這個新工具在手,一時間倒也成果斐然。
  • 如何利用囚徒困境,讓選擇的利益最大化?
    唐寂看了一眼電視,答道:「是囚徒困境。」2. 囚徒困境2.1「囚徒困境」理論簡介囚徒困境(Prisoner’s Dilemma),是博弈論的非零和博弈中極具代表性的例子。非零和博弈是指博弈中各方的收益或者損失的總和不是零,區別於零和博弈(例如「你」贏就一定「我」輸的對賭),是一種合作下的博弈。