文 | 羅sir
博弈論是分析存在相互依賴情況下理性人如何決策的理論工具。
在現實生活中,我們總是能看到一些「老實人」因為善良被欺負被針對,面對這一現象,我們應該如何選擇博弈?
為了解決這一問題,我們依然舉例博弈論中的經典悖論——囚徒困境來說明這個問題。
至於為何要用囚徒困境來說明這一問題,我們後續會提到這個經典悖論中的適用性和普遍性。
01
囚徒困境:個人理性和集體理性原則
我們假定有兩個犯罪嫌疑人共同作案。警察抓住他們以後,分開拘押,並告訴他們:你們兩個人可以選擇坦白,或是不坦白;如果一個人坦白,另一個人不坦白,則坦白的一方會被立即釋放,而不坦白的一方會被判刑10年,如果兩人都坦白,則會每人各判刑5年;如果兩人都抵賴的話,因證據不足,則每人會在關押1年後釋放。
那麼,這兩個犯罪嫌疑人應該如何選擇?
我們看到,這裡博弈的有兩個參與人:犯罪嫌疑人A和B;且每個人都有兩個行動方式:坦白或不坦白;但兩個人都隔離審查,誰都不能觀察到對方是否選擇坦白還是不坦白,因此我們說這是一個不完美信息靜態博弈。
即他們雙方之間無法知道對方的決策方式。
現在我們來看看參與人A和B會如何決策。我們首先假定他們都是理性的,沒人會想去坐牢,哪怕是多坐一天都會帶來更多的痛苦。因此,他們的目標是能少坐就少坐。
同時呢,我們還假定他們每個人只會關心自己的利益得失。那麼不管對A還是B來說,坦白就是最優的選擇,因為他們無法實現約定不坦白,也無法假定對方會選擇不坦白,那麼此時他們個人的最佳決策就是選擇坦白。
如果兩人都選擇坦白,那麼等待他們的就是一起被判刑5年。
但是,就這兩個囚徒而言,在這個博弈中的帕累託最優是「都不坦白」,各只坐一年牢。所謂帕累託最優,就是指是指資源分配的一種最為理想的狀態。
這裡我們要提到的一個概念就是個人理性和集體理性之間的矛盾。
對上述A和B兩個人來說,個人的理性是選擇坦白,因為我們無法得知對方的策略如何;但是從集體理性的角度出發,選擇都不坦白,各坐一年牢,才是對雙方的最優選擇。
現在我們回到前文中的問題,為何人善總是被人欺?
囚徒困境告訴我們,很多時候兩方或以上的人數在選擇博弈的時候,大家遵循的是個人理性的原則,因為信息不對等,我們無法準確預估對方的選擇是如何的。
但是就善良的人來說,他可能會選擇集體理性原則來做出決策,即替對方考慮並以此為決策依據。而根據囚徒困境來看,如果一方選擇個人理性作為決策參考,那麼對應的,選擇集體理性的另一方就會面臨吃虧。
這就是所謂「人善被人欺」的博弈困境。
為了讓這個觀點更通俗易懂,我們還是拿囚徒困境舉例。
02
囚徒困境實例
在上述囚徒困境中,如果我們假設嫌疑人A是「善良的」,那麼他可能就會選擇雙方都不坦白。因為從集體理性出發,雙方都不坦白,那麼僅僅只判刑1年,這是有利於雙方的帕累託最優。
但在實際情況下,嫌疑人B為了更符合自身的利益,那麼他會根據個人理性作為決策依據。即自己受到的損失最小,那麼嫌疑人B就會選擇坦白。
那麼現在我們再來看這個博弈結果,嫌疑人A顧全大局考慮,選擇不坦白。嫌疑人B從個人理性出發,選擇坦白。那麼得出的結果就是,嫌疑人A因為不坦白,被判刑10年,嫌疑人B因為坦白,而被立即釋放。
由此,這是博弈論中的為何人善被人欺的原因所在。即我們在做出決策的時候,常常會考慮到對方的情緒和局面,也正因為為對方著想過多,導致我們在博弈中出現了「人善被人欺」的不利博弈局面。
也許你此時有點明白這個道理,但也許還顯得懵懵懂懂,為了加強你的印象,我們再例舉一個生活中的常見博弈場景:借錢。
我們假設,一個多年未曾聯繫的大學朋友突然打電話找你借五百元錢。那麼此時你的選擇通常只有兩個:借給他,或者不借給他。
而根據個人理性原則來看,這個朋友你不曾聯繫,也與你現在沒有什麼交集,況且借出去了能不能還給自己都是未知,那麼此時你的最優選擇是不借給他。
但如果從集體理性角度來看呢?這個大學朋友幾乎是懇求著告訴你,自己很久沒吃過飯了,這五百元可以解決他的一個月夥食費用。
那麼我們現在來看這個博弈局面:
個人理性原則:你選擇不借給他,你不會有任何損失。但他可能會失去一個月的夥食費用。
集體理性原則:你暫時損失五百元錢,他說不定會還給你。而對方呢,則可以得到五百元錢,繼續生活一個月下去。
如果你足夠考慮到對方的可憐狀態,又想到對方是你的大學室友,那麼你會選擇借給他。而其結果呢,很可能是這五百元錢付之東流,你損失五百元失去一個大學室友。
所以我們說,為什麼「老實人」總是會被欺負?因為他們往往都顧及到對方的感受和得失,從而在一次又一次的博弈中,自己的個人理性原則為了集體理性原則受到損失。
當然,在實際的現實生活中,這樣的博弈例子還有許多許多。朋友叫你明天請假去某地玩耍,但自己明明要上班,按理來說最好的選擇是拒絕他不去,但礙於朋友的面子,只能服從於集體理性原則,選擇向公司請假,陪朋友去玩一天。
那些無法推脫不願去參加的聚會、幫忙帶飯帶奶茶等等,都是個人理性服從於集體理性原則下的自我受損行為。
現在,你或許可以發出感慨,博弈論竟會如此神奇?
我要說的是,生活中的博弈無處不在,但很多時候,我們沒有建立系統的博弈思維,我們是很難分清這是否是在博弈,從而導致為了不拒絕別人,個人理性服從集體理性導致自己長期受損。
那麼我們應該如何改變這一局面?
建立博弈思維,走出人性邏輯怪圈。
03
博弈思維:利己就是最大的利他
我在本文開篇就點出,博弈論是分析存在相互依賴情況下理性人如何決策的理論工具。
這句話有兩個關鍵點,其一是相互依賴,其二是理性人。
換句話說,任何產生依賴關係的雙方,都存在博弈局面,而在博弈之中,我們又假定人是理性人。
那麼根據這一原則,建立博弈思維的重點就在於依賴關係。
在生活中,任何一切交易關係、依賴關係本質上都是一種博弈狀態。但千萬不要認為「博弈」是一種貶義詞,博弈作為一種客觀存在的狀態,我們需要理性認識到它的存在。
而運用博弈思維思考,我們需要知道以下幾點:
參與人集體理性和個人理性原則選擇權和選擇帶來的後果參與人,是指的參與方都有哪些人。集體理性和個人理性原則,通俗地講就是利己思維和利他思維。至於選擇權和選擇的後果,就是我們需要通過博弈中的已知信息去推測,可能出現的幾種後果。
當我們知道了這幾點信息,那麼我們就可以快速在腦海中列出各項選擇以及選擇所帶來的後果。
而在面對博弈中個人理性和集體原則之間,我的建議是:選擇個人理性原則。
即只求個體的最優選擇,不求集體的最優選擇。
邏輯思維的羅振宇說過一句話我很喜歡:商業就是最大的慈善。開公司,創造就業、帶動GDP的增長,這不就是最大的慈善嗎?
同理,利己其實就是最大的利他行為。為什麼這麼說?
我們拿企業做廣告之間的競爭博弈舉一個例子:
企業做廣告的成本很高,不一定能給企業來帶利潤,但為什麼大部分企業都做廣告呢?我們假定某個行業內有兩個企業,如果每個企業都不做廣告,那麼他們之間各得10元利潤;如果都做廣告,各得4元的利潤;如果一個企業不做廣告,那麼做廣告的企業就可以賺到12元,不做廣告的企業就只能賺到2元。
而按照博弈中的個人理性原則,就是兩個企業都做廣告。因為無論別人做廣告與否,你的最優選擇都是做廣告。但是如果按照集體理性原則博弈,那麼有一方就會選擇不做廣告,為什麼?因為在集體理性原則看來,雙方都不做廣告都賺10元,是最佳選擇。
但在實際過程中,選擇集體理性原則博弈的公司,就會面臨巨大的虧損,因為他假定對方也不做廣告,大家都賺10元,但是對方卻做了廣告,那麼只能導致自己賺2元錢。
從這個類似於囚徒困境的例子中,我們可以得出:利己實際上就是最大的利他行為。
按照囚徒困境來看,雙方都選擇不做廣告是最為合算的。但實際情況是,由於沒有籤訂相應的契約,選擇集體理性原則博弈的一方,必然會承擔最大的損失。
經濟學原則也表明,利己行為也是能夠促進社會效益最大化的。
當我們所有人都追求自己想要的物質精神、財富,那麼整個社會的總財富才會增加。同理,按照分工理論來看,當我們都只做自己份內的事情,那麼所有人都會享受到整個商業社會帶來的商品和物質供應。
現在,我們可以用博弈論來解決人善被人欺的問題了。具體應該怎麼做?
建立博弈思維,用個人理性原則作為決策依據,在觸及自己核心利益的時候,我們應該明白:利己才是最大的利他。
END.
作者:羅sir,新青年的職場內參。點擊【關注】,每天免費獲取更多職場知識。