博弈論:為何人善總是被人欺?從囚徒困境看人性邏輯怪圈

2020-12-05 羅sir職話

文 | 羅sir

博弈論是分析存在相互依賴情況下理性人如何決策的理論工具。

在現實生活中，我們總是能看到一些「老實人」因為善良被欺負被針對，面對這一現象，我們應該如何選擇博弈？

為了解決這一問題，我們依然舉例博弈論中的經典悖論——囚徒困境來說明這個問題。

至於為何要用囚徒困境來說明這一問題，我們後續會提到這個經典悖論中的適用性和普遍性。

囚徒困境：個人理性和集體理性原則

我們假定有兩個犯罪嫌疑人共同作案。警察抓住他們以後，分開拘押，並告訴他們：你們兩個人可以選擇坦白，或是不坦白；如果一個人坦白，另一個人不坦白，則坦白的一方會被立即釋放，而不坦白的一方會被判刑10年，如果兩人都坦白，則會每人各判刑5年；如果兩人都抵賴的話，因證據不足，則每人會在關押1年後釋放。

那麼，這兩個犯罪嫌疑人應該如何選擇？

我們看到，這裡博弈的有兩個參與人：犯罪嫌疑人A和B；且每個人都有兩個行動方式：坦白或不坦白；但兩個人都隔離審查，誰都不能觀察到對方是否選擇坦白還是不坦白，因此我們說這是一個不完美信息靜態博弈。

即他們雙方之間無法知道對方的決策方式。

現在我們來看看參與人A和B會如何決策。我們首先假定他們都是理性的，沒人會想去坐牢，哪怕是多坐一天都會帶來更多的痛苦。因此，他們的目標是能少坐就少坐。

同時呢，我們還假定他們每個人只會關心自己的利益得失。那麼不管對A還是B來說，坦白就是最優的選擇，因為他們無法實現約定不坦白，也無法假定對方會選擇不坦白，那麼此時他們個人的最佳決策就是選擇坦白。

如果兩人都選擇坦白，那麼等待他們的就是一起被判刑5年。

但是，就這兩個囚徒而言，在這個博弈中的帕累託最優是「都不坦白」，各只坐一年牢。所謂帕累託最優，就是指是指資源分配的一種最為理想的狀態。

這裡我們要提到的一個概念就是個人理性和集體理性之間的矛盾。

對上述A和B兩個人來說，個人的理性是選擇坦白，因為我們無法得知對方的策略如何；但是從集體理性的角度出發，選擇都不坦白，各坐一年牢，才是對雙方的最優選擇。

現在我們回到前文中的問題，為何人善總是被人欺？

囚徒困境告訴我們，很多時候兩方或以上的人數在選擇博弈的時候，大家遵循的是個人理性的原則，因為信息不對等，我們無法準確預估對方的選擇是如何的。

但是就善良的人來說，他可能會選擇集體理性原則來做出決策，即替對方考慮並以此為決策依據。而根據囚徒困境來看，如果一方選擇個人理性作為決策參考，那麼對應的，選擇集體理性的另一方就會面臨吃虧。

這就是所謂「人善被人欺」的博弈困境。

為了讓這個觀點更通俗易懂，我們還是拿囚徒困境舉例。

囚徒困境實例

在上述囚徒困境中，如果我們假設嫌疑人A是「善良的」，那麼他可能就會選擇雙方都不坦白。因為從集體理性出發，雙方都不坦白，那麼僅僅只判刑1年，這是有利於雙方的帕累託最優。

但在實際情況下，嫌疑人B為了更符合自身的利益，那麼他會根據個人理性作為決策依據。即自己受到的損失最小，那麼嫌疑人B就會選擇坦白。

那麼現在我們再來看這個博弈結果，嫌疑人A顧全大局考慮，選擇不坦白。嫌疑人B從個人理性出發，選擇坦白。那麼得出的結果就是，嫌疑人A因為不坦白，被判刑10年，嫌疑人B因為坦白，而被立即釋放。

由此，這是博弈論中的為何人善被人欺的原因所在。即我們在做出決策的時候，常常會考慮到對方的情緒和局面，也正因為為對方著想過多，導致我們在博弈中出現了「人善被人欺」的不利博弈局面。

也許你此時有點明白這個道理，但也許還顯得懵懵懂懂，為了加強你的印象，我們再例舉一個生活中的常見博弈場景：借錢。

我們假設，一個多年未曾聯繫的大學朋友突然打電話找你借五百元錢。那麼此時你的選擇通常只有兩個：借給他，或者不借給他。

而根據個人理性原則來看，這個朋友你不曾聯繫，也與你現在沒有什麼交集，況且借出去了能不能還給自己都是未知，那麼此時你的最優選擇是不借給他。

但如果從集體理性角度來看呢？這個大學朋友幾乎是懇求著告訴你，自己很久沒吃過飯了，這五百元可以解決他的一個月夥食費用。

那麼我們現在來看這個博弈局面：

個人理性原則：你選擇不借給他，你不會有任何損失。但他可能會失去一個月的夥食費用。

集體理性原則：你暫時損失五百元錢，他說不定會還給你。而對方呢，則可以得到五百元錢，繼續生活一個月下去。

如果你足夠考慮到對方的可憐狀態，又想到對方是你的大學室友，那麼你會選擇借給他。而其結果呢，很可能是這五百元錢付之東流，你損失五百元失去一個大學室友。

所以我們說，為什麼「老實人」總是會被欺負？因為他們往往都顧及到對方的感受和得失，從而在一次又一次的博弈中，自己的個人理性原則為了集體理性原則受到損失。

當然，在實際的現實生活中，這樣的博弈例子還有許多許多。朋友叫你明天請假去某地玩耍，但自己明明要上班，按理來說最好的選擇是拒絕他不去，但礙於朋友的面子，只能服從於集體理性原則，選擇向公司請假，陪朋友去玩一天。

那些無法推脫不願去參加的聚會、幫忙帶飯帶奶茶等等，都是個人理性服從於集體理性原則下的自我受損行為。

現在，你或許可以發出感慨，博弈論竟會如此神奇？

我要說的是，生活中的博弈無處不在，但很多時候，我們沒有建立系統的博弈思維，我們是很難分清這是否是在博弈，從而導致為了不拒絕別人，個人理性服從集體理性導致自己長期受損。

那麼我們應該如何改變這一局面？

建立博弈思維，走出人性邏輯怪圈。

博弈思維：利己就是最大的利他

我在本文開篇就點出，博弈論是分析存在相互依賴情況下理性人如何決策的理論工具。

這句話有兩個關鍵點，其一是相互依賴，其二是理性人。

換句話說，任何產生依賴關係的雙方，都存在博弈局面，而在博弈之中，我們又假定人是理性人。

那麼根據這一原則，建立博弈思維的重點就在於依賴關係。

在生活中，任何一切交易關係、依賴關係本質上都是一種博弈狀態。但千萬不要認為「博弈」是一種貶義詞，博弈作為一種客觀存在的狀態，我們需要理性認識到它的存在。

而運用博弈思維思考，我們需要知道以下幾點：

參與人集體理性和個人理性原則選擇權和選擇帶來的後果參與人，是指的參與方都有哪些人。集體理性和個人理性原則，通俗地講就是利己思維和利他思維。至於選擇權和選擇的後果，就是我們需要通過博弈中的已知信息去推測，可能出現的幾種後果。

當我們知道了這幾點信息，那麼我們就可以快速在腦海中列出各項選擇以及選擇所帶來的後果。

而在面對博弈中個人理性和集體原則之間，我的建議是：選擇個人理性原則。

即只求個體的最優選擇，不求集體的最優選擇。

邏輯思維的羅振宇說過一句話我很喜歡：商業就是最大的慈善。開公司，創造就業、帶動GDP的增長，這不就是最大的慈善嗎？

同理，利己其實就是最大的利他行為。為什麼這麼說？

我們拿企業做廣告之間的競爭博弈舉一個例子：

企業做廣告的成本很高，不一定能給企業來帶利潤，但為什麼大部分企業都做廣告呢？我們假定某個行業內有兩個企業，如果每個企業都不做廣告，那麼他們之間各得10元利潤；如果都做廣告，各得4元的利潤；如果一個企業不做廣告，那麼做廣告的企業就可以賺到12元，不做廣告的企業就只能賺到2元。

而按照博弈中的個人理性原則，就是兩個企業都做廣告。因為無論別人做廣告與否，你的最優選擇都是做廣告。但是如果按照集體理性原則博弈，那麼有一方就會選擇不做廣告，為什麼？因為在集體理性原則看來，雙方都不做廣告都賺10元，是最佳選擇。

但在實際過程中，選擇集體理性原則博弈的公司，就會面臨巨大的虧損，因為他假定對方也不做廣告，大家都賺10元，但是對方卻做了廣告，那麼只能導致自己賺2元錢。

從這個類似於囚徒困境的例子中，我們可以得出：利己實際上就是最大的利他行為。

按照囚徒困境來看，雙方都選擇不做廣告是最為合算的。但實際情況是，由於沒有籤訂相應的契約，選擇集體理性原則博弈的一方，必然會承擔最大的損失。

經濟學原則也表明，利己行為也是能夠促進社會效益最大化的。

當我們所有人都追求自己想要的物質精神、財富，那麼整個社會的總財富才會增加。同理，按照分工理論來看，當我們都只做自己份內的事情，那麼所有人都會享受到整個商業社會帶來的商品和物質供應。

現在，我們可以用博弈論來解決人善被人欺的問題了。具體應該怎麼做？

建立博弈思維，用個人理性原則作為決策依據，在觸及自己核心利益的時候，我們應該明白：利己才是最大的利他。

END.

作者：羅sir，新青年的職場內參。點擊【關注】，每天免費獲取更多職場知識。

博弈論:為何人善總是被人欺?從囚徒困境看人性邏輯怪圈

相關焦點

博弈論之囚徒困境

博弈論中的「囚徒困境」是什麼意思?

囚徒的困境-博弈論

囚徒困境的困境究竟在哪?

約翰·納什:均衡博弈走出「囚徒困境」

《博弈與社會》:人類如何走出「囚徒困境」

王嘚吧博弈論:《囚徒困境》與《智豬博弈》

你是個自私的人嗎?「囚徒困境」或可解釋

博弈論:房奴們的囚徒困境,炒房團屢屢得手是有原因的

博弈論之囚徒困境,背叛也是有代價的。深度好文,值得收藏

兼職收入不高,還要糾結是否交個稅,博弈論教你輕鬆脫離囚徒困境

博弈論思想,科學家模擬上萬次「囚徒困境」,找到了最成功的決策

博弈論教你做生意(1.痛苦的囚徒博弈)

《博弈論》告訴你,當心陷入囚徒困境

博弈心理學—「囚徒困境」,選擇合作還是選擇背叛?

從「囚徒困境」現象談企業競爭情報及價格戰中的合作雙贏

約翰·納什:走出「囚徒困境」的指路人

「傑有所思:27」博奕論與管理之:囚徒困境

有了黑幫大哥,還有什麼「囚徒困境」

如何利用囚徒困境,讓選擇的利益最大化?