說起博弈論,那就不得不提入門級概念——囚徒困境。
警察抓了兩個賊,分開審訊,如果兩個賊都招供,那麼兩個人都判3年,如果一方招,一方不招,那麼不招的5年,招供的有功勞所以無罪釋放。
如果都不招,那麼因為證據不足,都判一年。
對於兩個賊來說,招還是不招是個博弈問題,從純理性的角度來看,每個人最佳的策略都是招。
因為如果對方招了,那麼你肯定只能招,但是如果對方不招,你最好也招了,因為能無罪釋放。不管對方採取什麼,你最好都選擇招。
這看起來是一個非常無解的博弈,但是無解的原因,恰好就是解決的辦法。
它的無解,恰恰是因為它往往是單次博弈,如果把這個博弈場景換一下,換成多次博弈,人們的選擇就會不一樣。
比如有一個重複遊戲,讓雙方在牌子裡寫上朋友/敵人,然後同時亮牌。
假如兩個人都寫朋友,那麼平分100美元,而一方寫朋友,一方寫敵人的,寫敵人的拿走全部100美元,如果都寫敵人呢,那雙方什麼都拿不到。
這個遊戲是固定的兩個人玩有限的次數,比如100次,他們就會大量的選擇合作,都寫「朋友」,直到最後幾次才開始選擇背叛。
我們為什麼在熟人面前,選擇做一個好人,背後就是這個原因。
但是問題又來了,如果是有限次的博弈,其實從純理性上來說,也應該是一直選擇背叛的。
讓我們回到第100次上來,既然這是最後一次,那麼最佳選擇肯定是選敵人是吧?
那麼第99次呢?既然第100次你肯定會選擇不合作,我為什麼99次要合作呢?我當然也會選擇不合作,以此類推,最理性的策略,自然是第一次就不要合作。
但是現實生活中往往是相反的,人們總是會選擇合作。其中一個原因,是因為現實中的博弈次數雖然有限,但是不像遊戲裡一樣,一次接著一次有規律,它是隨機的。
也就是說,在生活中,我們不知道未來還會有幾次博弈,也不會知道下次會不會有博弈,那麼為了避免未來可能被懲罰,這次還是選擇合作吧,畢竟做人留一線,日後好相見。
所以實驗者,也把這個100元敵人朋友遊戲,作為單次囚徒困境博弈,進行了實驗。在大學生裡,電視臺裡和監獄裡,最後真實的結果是53%的女性,還有47%的男性選擇了「朋友」。
還有一個原因,就是博弈論裡著名的「四人幫模型」,也叫作「KMRW定理」——在不完全信息博弈中,參與者不知道對方是好人還是壞人(自私的理性人),那麼只要博弈次數足夠多,合作能帶來好處,雙方都會願意維護自己的好人人設,直到最後幾次才選擇背叛。
但是人生並不知道最後幾次在哪裡,所以理論的核心,簡單說就是——從理性博弈來說,裝好人,有好處。
為什麼呢?我們假設有兩個人,一個喜歡合作的好人,一個坑蒙拐騙的壞人。第一次合作,壞人發現,什麼鬼?好人沒有背叛他,盡然選擇了合作?
這時候壞人就會想,這人是不是傻?因為囚徒博弈要進行很多輪,合作雙方都有好處,這次好人讓壞人佔了便宜,但是壞人也知道好人不可能一直當傻子,所以與其惹怒好人,並讓好人黑化最後什麼都得不到。
還不如壞人也選擇當好人,一起合作,長期下來兩個人都有好處。
好人一看壞人和他合作了,就會認為壞人不壞,就會一直合作下去,於是一個真好人,一個假裝的好人,兩人就一路合作下去了,直到最後幾輪,暴露身份,但是中間過程雙方都賺到了不是麼?
這個情節是不是有點熟悉?壞人騙了好人,但是騙著騙著,壞人自己也變成了好人。
甚至到了最後,壞人自己也分不清,自己是在假裝好人呢?還是本質上就是一個好人。
這裡的壞人,我們說的是純理性出發,「自私自利」的利益核算,也就是大智若愚裡面的「智」,而愚,其實就是寧可吃虧也不選擇的背叛的「好人思維」。
那麼大智若愚,就是那個在博弈中先選擇當好人的那種智慧。
所以,自私的理性人,為了不暴露自己理性的事實,從而讓別人也開始理性,博弈滑入困境,還不如假裝自己是一個好人。
假裝著,假裝著,有些人忘記了,而有些人到了最後就會暴露,比如官場裡的「59歲效應」,等到了快退休前,貪一筆。
博弈論裡,咱們說的是理性人的裝好人策略。於是有人會說,那麼為什麼我們不做真好人呢?
裝好人的本質,還是理性思維的「KMRW定理」應用,底層是智慧。
但是真好人的本質,是對世界真相的認知不足,對於世界總有一種一廂情願的期待。用單純的善良,來逃避對複雜世界的思考。
上一篇剛剛說過,簡單並不好,簡單有兩種,一種是見識了世界的複雜以後,選擇簡單。另一種是盲目的簡單。
好人也是,一種是認識了這個世界理性的本質,自私的本質,但是依然選擇裝好人,因為裝好人可以連接更多合作可能,從而獲得利益。
另一種是真正的好人,做好人是一種基於內心的選擇,他並不在意外在世界的利益收穫。
他只求內心的自恰,做好事這件事,在道德優越感上,對於內心自我感覺的澆灌。
身處黑暗婆娑世界,我們希望大家都裝好人,但是不要真好人。
基於利益結合的合作,才是最長久的,基於一廂情願的付出,總會有扛不住的一天。