人在江湖走,於利益眾多的權衡與博弈中,什麼樣的選擇是相對好、相對優質的呢?本文或許對你有所啟發。
又是歲末年初。
南方的城市裡,雖未至嚴冬,已頗有寒意,正是三兩知己一邊火鍋一邊暢談的相聚好時機。
青子看著電視裡正在放著的《精英律師》,說道:
「這集看過了,說的是富豪百億遺產爭奪案,富豪弟弟和富豪老婆,爭來爭去,到最後選了個和解方案,誰也沒有成功獨吞全部財產。」
【精英律師-劇照】
未待眾人接話,青子像是突然想起了什麼,對著唐寂大聲說道:「有利有弊,互相猜忌,最後兩邊折衷和解,這是不是你以前跟我講的那個什麼…..什麼罪犯案例?」
唐寂看了一眼電視,答道:「是囚徒困境。」
2. 囚徒困境2.1「囚徒困境」理論簡介囚徒困境(Prisoner’s Dilemma),是博弈論的非零和博弈中極具代表性的例子。
非零和博弈是指博弈中各方的收益或者損失的總和不是零,區別於零和博弈(例如「你」贏就一定「我」輸的對賭),是一種合作下的博弈。
囚徒困境指出,個人的最佳選擇可能並非團體最佳選擇,或者說,在一個群體中,個人做出理性選擇(個人利益最大化)時,卻可能導致集體的非理性(集體利益非最大化,甚至集體利益最小化)。
囚徒困境的故事,可簡述為:
警方逮捕了甲、乙兩名嫌犯,但並沒有足夠證據指控二人入罪。於是,警方分開囚禁甲、乙,並分別和二人見面,且向雙方提供以下相同選擇:
若一人認罪並作證檢舉對方,而對方保持沉默,則此人即時無罪獲釋,沉默者判刑10年;若二人皆沉默不檢舉,則二人同時判刑1年;若二人相互檢舉,則二人同時判刑7年。最終,甲乙二人在以下合理前提條件下:
被隔斷無交流均獲知懲罰的確實有效性確認抉擇後對方無報復手段雙方皆為理性人,會最大限度為自己爭取利益最終選擇「相互檢舉」,導致」二人同時判刑7年」。
2.2《精英律師》案例分析在《精英律師》案例中,富豪孫浩瀚留下了百億遺產,孫超越(孫浩瀚親弟)與藍紅(孫浩瀚妻子)針對繼承權問題對簿公堂。
圍繞是否存在合法有效的遺囑,雙方面臨的情況是:
若存在合法有效的遺囑,孫超越為合法繼承人;若不存在合法有效的遺囑,藍紅作為配偶,是法定繼承人。因此,在訴訟與和解的抉擇面前,二人的博弈是:
但最終,二人沒有走到「讓對方零繼承」的最壞局面。
通過雙方律師和當事人的正確判斷與有效博弈,在基於「孫浩瀚既不希望親弟零繼承,也不希望妻子零繼承」的情理之上,二人最終達成「相互體諒」的和解。
【精英律師-劇照,來源:愛奇藝】
「百億家產啊,如果是我,我就賭一局!」
「那我可提醒你,相比於翻倍叫地主,這刺激程度可能更接近於俄羅斯輪盤賭。」
「按50-50的概率算,理論上的數學期望,應該跟和解方案相近。」
「哈哈,那還是不要賭這一局了。」
「還有類似的案例嗎?」
「再給你說個候選人投票的故事吧。」
3. 三中選一候選人投票故事:
現有甲乙丙評委三人,需對ABC候選三人進行投票,投票規則如下:
評委每人對ABC三人進行排序,排序一二三分別對應計分3、2、1;三位評委的排序投票求和,總計分最高者,勝出;如三位評委的投票排序皆為ABC,則A計9分,B計6分,C計3分,A勝出。已知以下情況:甲欣賞A,乙欣賞B,丙態度不明。
請問:甲是否存在一種策略,最大概率使A勝出?
……
「既然甲想選A,A得3分,乙想選B,B也得3分,那關鍵就是丙想選誰,因為丙的第一順位也是3分。」
「那也不一定,排第二也有2分,兩個2分,跟一個3分一個1分,都是4分。」
「對啊,你也說了,問題就在於只有三個人進行321排序,只要拿到一個3分,另一個至少有一個1分,那也是立於不敗之地了。」
「問題是沒說丙一定會給A投3分啊?」
「那這個問題,是不是可以先討論到底需要多少分才能保證不被淘汰!」
「在數學上,這確實是排列組合的概率和期望問題。」
3.1 囚徒困境下的概率問題先回到上面《精英律師》裡的案例,若假設有:
遺囑有效的的概率為50%;訴訟勝利獲得全部遺產,100億;訴訟失敗則零繼承,0收益。那麼,藍紅和孫超越在博弈中的數學期望,應該是:
E=100*0.5+0*(1-0.5)=50(億)
因此,折衷和解,於情於理,符合雙方預期利益。
再看「三選一」案例,其數學本質更接近於如下條件中的排列組合問題。
假設有:甲已將3分賦予A,乙已將3分賦予B
則請問:甲將2分賦予給B和C中的哪位,可使得A得到最多分的概率最大?
本文不展開探討具體的概率計算問題,感興趣的讀者,可以留言探討——A需要至少得多少分,才能保證勝出?
3.2 囚徒困境下的博弈問題「我倒覺得可以簡單一些,既然甲選A乙選B丙態度不明,那就可以認為是甲乙在博弈,也就是說,甲的排序必須是ACB。另外,故事裡的甲,跟我想的是一樣嗎?」
「不,他輸了。」
囚徒困境中,核心的博弈條件之一,就是理性人。
理性人的兩大特點是:
趨利避害,利己;完全理性,能夠根據趨利避害原則針對成本-收益採取一切機會和手段進行優化選擇。因此,如果博弈雙方中,存在非理性的一方,比如認為對方與自己利益一致,或認為對方將為集體利益犧牲個人利益,則很可能導致決策失誤,使得自己陷入困境,而對方打破困境。
反之,對局中人的啟示是,重要的不是在困境中抉擇,而是要嘗試引導對方,使之為本方利益或集體最大利益服務,才能打破困境。
4. 六中選二「故事裡的甲,不是你吧?。」
「是與不是,又有何妨?」
「那還有甲最終獲勝的故事嗎?」
「有。如下所示:
現有甲乙丙評委三人,需對甲團隊ABC、乙團隊DEF候選六人進行投票,投票規則如下:
評委每人投票選擇三人,被選者每人計得1票,不計分;甲、乙可在本方團隊選兩人且在對方團隊選一人;丙可在候選六人中任選三人;三位評委的投票求和,得票最高的前兩位,勝出;如三位評委的投票皆為ABD,則ABD各計3票,需進行二次投票。已知有以下情況:
甲傾向ABC,乙傾向DEF,丙態度不明;A為甲團隊實力幹將,業績優異;B為甲團隊多年骨幹,兢兢業業;C為甲團隊新鮮血液,成長迅速;D為乙團隊實力幹將,業績良好;E為乙團隊多年元老,穩定輸出;F為乙團隊拼命三郎,低調老實。請問:甲是否存在一種策略,最大概率使AB勝出?」
……
「六選二,這個我更加不想算了。」
「不見得更難算啊,畢竟只計票不計分。」
「那也是三個3票在六個人身上的排列組合問題……」
「正向推算若太麻煩,為何不試試逆向?」
「何為逆向?」
「算自己多,不如算對方少。」
事實上,如若甲乙丙為同一團隊,ABCDEF為同一團隊下的六位夥伴,所有人互信互利,將有如下隱性條件:
甲乙丙的抉擇以團隊利益最大化為目的從ABCDEF六名候選人中任意選擇兩名的利益差異過小則此情形下不存在囚徒困境的博弈。
繼續遵循「囚徒困境」的條件作進一步假設:
甲乙為完全理性人,趨利避害;C、F存在一定短板,例如群眾基礎相對薄弱,不能服眾,我們稱之為「劣勢候選人」。此情形下,甲乙面臨的情況有:
對方都會力求保住自己的優勢候選人儘量控制對方優勢候選人的總票數那麼,二人的博弈將轉變為:
到此,可以非常清晰地看到,在「六選二」案例中:
為求己方團隊利益最大,甲乙可能會高概率投對方劣勢候選人;最嚴重的後果是「劣幣驅逐良幣」,雙方團隊的優勢候選人皆無法勝出;丙的態度不明確,將進一步加劇此態勢。這便是真正的囚徒困境。
5. 天下無囚「所以故事裡的甲,贏了?」
「不是你自己要聽勝利的案例麼?」
「是你的風格?」
「充分利用規則獲得勝利,有什麼不好?掌握主動後說不定還可以賣個人情。」
「不是你的風格。」
「乙之砒霜,甲之蜜糖。」
「那也不是你的風格。」
「In me the tiger sniffs the rose.「
「Whaaaaat?」
「心有猛虎,細嗅薔薇。」
「說人話!」
「菩薩心腸,雷霆手段。」
囚徒困境,作為經典的博弈論案例,對所有面臨抉擇的商業談判、溝通策略、人生選擇,都有著值得深思借鑑的價值,無論是作為對自己的警醒,還是作為對他方的預防。
但是,在囚徒困境中抉擇得再好,也是囚徒的抉擇。打破囚徒困境的唯一出路,就是不要成為囚徒。畢竟,高手人抬人,低手人踩人。畢竟,最重要的不是技巧,而是人心。
願天下無囚!
唐寂看了一眼手錶,站起身,舉起杯子,說道:
「來來來,再過幾天就新年了,大家一起~」
「新年快樂!」
「大吉大利!」
「長命百歲!」
「精神!」
「富強!」
「哈哈哈哈!」
「天下無囚!」
END歡迎查閱更多精彩文章
產品經理方法論系列文章:
車聯網生態應用建設戰略系列文章:
作者:唐寂;微信公眾號:刀法入兵(ID:daofajia)。品牌車企車聯網生態產品負責人,智慧出行行業十年產品人,「影子評審團」評委,曾主導車企多款重量級產品的定義重構和網際網路超級應用融合上車。
本文由 @唐寂 原創發布於人人都是產品經理,未經作者許可,禁止轉載。
題圖來自Unsplash,基於CC0協議
收藏已收藏 | {{ postmeta.bookmark }} 點讚已贊 | {{ postmeta.postlike }}