14思維模型:博弈論一動態決策法

2020-12-13 模型思維

為什麼麥當勞和肯德基都擠在一起開店呢？我們來看一組數據　

成都市０－２５０米競品門店數量佔比達到了恐怖的７５％，幾乎只要有麥當勞的地方就有肯德基，可見其競爭的激烈程度，為什麼出現這種結果，難道是兄弟哥倆好，絕對不是，是殘酷的市場競爭博弈所造成的。在每個城市的競爭博弈中都找到了一種均衡的狀態。到底什麼是博弈？他們是如何下面我們一起來認識一下博弈論。

認識博弈論

現代經濟博弈論是在２０世紀５０年代由匈牙利／美國著名數學家馮·諾依曼的經濟學家奧斯卡·摩根斯坦引入經濟學的，目前已成為經濟分析的主要工具之一，對產業組織理論、委託代理理論、信息經濟學等經濟理論的發展做出了非常重要的貢獻。

從１９９４年諾貝爾經濟學獎授予３位博弈論專家開始，共有７屆的諾貝爾經濟學獎與博弈論的研究有關。

１、博弈論概念

博弈論是研究相互依賴、相互影響的決策主體的理性決策行為以及這些決策的均衡結果的理論。

２、博弈論４要素：

參與人：在一場競賽或博弈中，每一個有決策權的參與者成為一個局中人。只有兩個局中人的博弈現象稱為「兩人博弈」，而多於兩個局中人的博弈稱為「多人博弈」。

策略：一局博弈中，每個局中人都有選擇實際可行的完整的行動方案，即方案不是某階段的行動方案，而是指導整個行動的一個方案，一個局中人的一個可行的自始至終全局籌劃的一個行動方案，稱為這個局中人的一個策略。

得失：一局博弈結局時的結果稱為得失。每個局中人在一局博弈結束時的得失，不僅與該局中人自身所選擇的策略有關，而且與全局中人所取定的一組策略有關。

均衡：均衡是平衡的意思，在經濟學中，均衡意即相關量處於穩定值。在供求關係中，某一商品市場如果在某一價格下，想以此價格買此商品的人均能買到，而想賣的人均能賣出，此時我們就說，該商品的供求達到了均衡。所謂納什均衡，以約翰·納什命名，所有參與者都不想改變自己的策略的這樣一種相對靜止的狀態。

３、博弈論研究的假設

決策主體是理性的，最大化自己的利益；

完全理性是共同知識；

每個參與人被假定為對所處環境及其他參與者的行為形成正確信念與預期。

４、博弈論的分類

合作博弈和非合作博弈：合作博弈和非合作博弈的區別在於相互發生作用的當事人之間有沒有一個具有約束力的協議，如果有，就是合作博弈，如果沒有，就是非合作博弈。經濟學家們所談的博弈論一般是指非合作博弈，由於合作博弈論比非合作博弈論複雜，在理論上的成熟度遠遠不如非合作博弈論。

靜態博弈、動態博弈兩類：靜態博弈是指在博弈中，參與人同時選擇或雖非同時選擇但後行動者並不知道先行動者採取了什麼具體行動；動態博弈是指在博弈中，參與人的行動有先後順序，且後行動者能夠觀察到先行動者所選擇的行動。通俗的理解：＂囚徒困境＂就是同時決策的，屬於靜態博弈，下棋就是動態博弈。

完全信息博弈和不完全信息博弈：完全博弈是指在博弈過程中，每一位參與人對其他參與人的特徵、策略空間及收益函數有準確的信息。不完全信息博弈是指如果參與人對其他參與人的特徵、策略空間及收益函數信息了解的不夠準確、或者不是對所有參與人的特徵、策略空間及收益函數都有準確的信息，在這種情況下進行的博弈就是不完全信息博弈。

零和和非零和博弈：零和博弈，又稱零和遊戲，屬非合作博弈。指參與博弈的各方，在嚴格競爭下，一方的收益必然意味著另一方的損失，博弈各方的收益和損失相加總和為「零」，雙方不存在合作的可能。也可以說：自己的幸福是建立在他人的痛苦之上的，二者的大小完全相等，因而雙方都想盡一切辦法以實現「損人利己」。零和博弈的結果是一方吃掉另一方，一方的所得正是另一方的所失，整個社會的利益並不會因此而增加一分。賭博就是零和博弈。

非零和博弈是一種合作下的博弈，博弈中各方的收益或損失的總和不是零值，自己的所得並不與他人的損失的大小相等，自己的幸福也未必建立在他人的痛苦之上，博弈雙方存在「雙贏」的可能，進而達成合作。

例如：一天晚上，狐狸踱步來到了水井旁，低頭俯身看到井底水面上月亮的影子，它認為那是一塊大奶酪。這隻餓得發昏的狐狸跨進一隻吊桶下到了井底，把與之相連的另一隻吊桶升到了井面。下井後，它才明白這「奶酪」是不能吃的，自己已鑄成大錯，處境十分不利，長期下去就只有等死了。

兩天兩夜過去了，沒有一隻動物光顧水井，時間一分一秒地不斷流逝，銀色的上弦月出現了。沮喪的狐狸正無計可施時，剛好一隻口渴的狼途經此地，狐狸不禁喜上眉梢，它對狼打招呼道：「喂，夥計，我免費招待你一頓美餐你看怎麼樣」看到狼被吸引住了，狐狸於是指著井底的月亮對狼說：「你看到這個了嗎？這可是塊十分好吃的奶酪，我已吃掉了這奶酪的那一半，剩下這一半也夠你吃一頓的了。就請委屈你鑽到我特意為你準備好的桶下到井裡來吧。」狐狸儘量把故事編得天衣無縫，這隻狼果然中了它的奸計。狼下到井裡，它的重量使狐狸升到了井口，這隻被困兩天的狐狸終於得救了。

這個故事中狐狸和狼所進行的博弈，我們稱為零和博弈。零和博弈是一種完全對抗、強烈競爭的對局。在零和博弈的結局中．參與者的收益總和是零（或某個常數），一個參與者的所得恰是另一參與者的所失。狐狸和狼一隻在上面，一隻在下面，下面的這一隻想上去，就得想辦法讓上面的一隻下來。

但是通過博弈調換位置以後，仍然是一隻在上面．一隻在下面。如果狼明白狐狸掉到了井裡，動了憾隱之心，搬來一塊石頭放到上面的桶中，完全可以利用石頭的重量把狐狸拉上來。或者，如果狐狸擔心狼沒有這種樂於助人的精神，通過欺騙到達井口以後，再用石頭把狼再拉上來。這兩種方式的結局是兩個參與者都到了井上面，那麼雙方進行的就是一種正和博弈。

囚徒困境

警方逮捕甲、乙兩名嫌疑犯，但沒有足夠證據指控二人有罪。於是警方分開囚禁嫌疑犯，分別和二人見面，並向雙方提供以下相同的選擇：

若一人認罪並作證檢控對方（相關術語稱「背叛」對方），而對方保持沉默，此人將即時獲釋，沉默者將判監１０年。

若二人都保持沉默（相關術語稱互相「合作」），則二人同樣判監半年。

若二人都互相檢舉（互相「背叛」），則二人同樣判監２年。

若對方沉默、我背叛會讓我獲釋，所以會選擇背叛。

若對方背叛指控我，我也要指控對方才能得到較低的刑期，所以也是會選擇背叛。

二人面對的情況一樣，所以二人的理性思考都會得出相同的結論——選擇背叛。背叛是兩種策略之中的支配性策略。因此，這場博弈中唯一可能達到的納什均衡，就是雙方參與者都背叛對方，結果二人同樣服刑２年。

這場博弈的納什均衡，顯然不是顧及團體利益的帕累託最優解決方案。以全體利益而言，如果兩個參與者都合作保持沉默，兩人都只會被判刑半年，總體利益更高，結果也比兩人背叛對方、判刑２年的情況較佳，這種結果叫做帕累託最優，在不損害他人利益的情況下，使得自己的利益最大化。但根據以上假設，二人均為理性的個人，且只追求自己個人利益。均衡狀況會是兩個囚徒都選擇背叛，結果二人判監均比合作為高，總體利益較合作為低。這就是「困境」所在。

在這種情況下沒有一個參與者可以通過獨自行動而增加收益，例如，如果甲獨自改變策略進行合作，乙仍然是背叛，那麼他的收益會從－２下降到－１０，這與他的初衷增加收益相悖，所以他不會改變策略。

如果關了兩年後，甲乙都被釋放了，但是又都因為盜竊被捕，如果發生這樣會一直重複出現的困境，那麼，甲乙會考慮作出背叛行為後可能遭到的報復，所以，最有可能進行合作，在無數次進行這個重複博弈的時候，他們的納什均衡會趨向於帕累託最優。

囚徒困境的啟示

案例１、一個和尚擔水吃，三個和尚沒水吃。就是典型的囚徒困境。

案例２、牧民放牧的囚徒困境，每個牧民都希望多放幾隻羊，而草原上的草是有限的，如果我當雷鋒，少放幾隻羊，肯定就吃虧了，所以大家以後都多放羊，最後草原資源枯竭，誰都得不到好處。

案例３、排汙企業的囚徒困境。如果在一個城市裡有２家相同的化工廠，由於環保局的要求都安裝了排汙設備並嚴格執行排汙標準，每天要消耗１０萬元，這樣自然會使產品價格提高，進而失去市場競爭力。

此時會有三種情況發生

１、大家都嚴格執行排汙標準，共同把產品價格提高，雙方不會有大影響。

２、一家遵守標準，一家偷偷晚上偷偷排汙水，一方受益，一方損失。

３、大家都不遵守標準，晚上偷偷排汙水，雙方都得益。

如果環保管的不太嚴，每家企業的最優策略就是晚上偷偷排汙水，這就是一個納什均衡，但是這樣會影響環境，只有政府強行管制，讓大家都嚴格執行排汙標準，才能實現帕累託最優。

囚徒困境在生活中比比皆是，例如擠公交地鐵，插隊事件，如果每個人都為了個人利益最大化插隊，反而使自己的利益最小化。

智豬博弈

在博弈論經濟學中，「智豬博弈」是一個著名的納什均衡的例子。假設豬圈裡有一頭大豬、一頭小豬。豬圈的一頭有豬食槽，另一頭安裝著控制豬食供應的按鈕，按一下按鈕會有１０個單位的豬食進槽，但是誰按按鈕就會首先付出２個單位的成本，若小豬去按，大豬等在槽邊，大小豬吃到食物的收益比是９∶１；同時去按，同時到槽邊開吃，收益比是７∶３；如果大豬去按，小豬等在槽邊，收益比是６∶４。那麼，在兩頭豬都有智慧的前提下，最終結果是小豬選擇等待。支付矩陣如下

實際上小豬選擇等待，讓大豬去按控制按鈕，而自己選擇「坐船」（或稱為搭便車）的原因很簡單：在大豬選擇行動的前提下，小豬也行動的話，小豬可得到１個單位的純收益（吃到３個單位食品的同時也耗費２個單位的成本，以下純收益計算相同），而小豬等待的話，則可以獲得４個單位的純收益，等待優於行動；在大豬選擇等待的前提下，小豬如果行動的話，小豬的收入將不抵成本，純收益為－１單位，如果小豬也選擇等待的話，那麼小豬的收益為零，成本也為零，總之，等待還是要優於行動。

「智豬博弈」故事給了競爭中的弱者（小豬）以等待為最佳策略的啟發。在博弈中，每一方都要想方設法攻擊對方、保護自己，最終取得勝利；但同時，對方也是一個與你一樣理性的人，他會這麼做嗎？這時就需要更高明的智慧。博弈其實是一種鬥智的競爭。

智豬博弈的啟示

１、搭便車策略

在小企業經營中，學會如何「搭便車」是明智的選擇。在某些時候，如果能夠注意等待，讓其他大的企業首先開發市場，有所不為才能有所為，等待產業市場中出現具有贏利能力新產品、繼而大舉仿製牟取利潤的企業。

例如：中國很多山寨手機廠商採用的全是搭便車，等蘋果公司出現新產品時，山寨廠商很快就可以山寨出外形一樣的手機，可以達到以假亂真的目的。還有國內的很多汽車廠商，採用的策略是逆向開發，完全模仿國外汽車，就是搭便車策略。

２、如何消除搭便車？

智豬博弈可以採用減量加移位方案，投食量僅為原來的一半，但同時將投食口移到按鈕附近。那麼大豬小豬將會爭著踩按鈕。等待者不得食，多勞者多得食。對於規則設計者來說，減量移位方案是一個最好的方案。成本不高而收穫很大。企業要建立多勞多得，少勞少得的管理制度，防止大鍋飯的出現，國家也要建立智慧財產權保護的制度，保護創新者的利益不受損失，同時也要給予小企業的政策優惠，才能保證經濟的良性發展，達到帕累託最優。

海灘佔位博弈

日常生活中，如果我們仔細觀察，就會發現在同一條街上兩家超市經常會開在一起，你在沙灘遊玩的時候，也往往能發現兩家冷飲店相依為鄰——這跟肯德基麥當勞經常比鄰開店的道理其實是一樣的。

把肯德基和麥當勞的分析簡化，在一條長為１０００ｍ的街上，　

第一次博弈：二者分別開在兩個端點上，各佔５００ｍ範圍的顧客。

如果麥當勞向中間移動２５０ｍ，它的顧客範圍就變成了２５０＋（７５０／２）＝６２５ｍ

肯德基也發現了這個規律，向中間移動了２５０ｍ，二者的顧客範圍重新變成了各自佔據５００ｍ的顧客範圍。第二次博弈：在原來基礎上，麥當勞繼續移動５００ｍ位置，佔據顧客範圍成了：５００＋（５００／２）＝７５０，於是肯德基繼續跟著也移動了５００ｍ位置，各自佔領５００ｍ，經過多次博弈之後，雙方都到了中點處，都分得了５００ｍ的顧客範圍。

有人可能會問，為什麼不在線上的２５０ｍ和７５０ｍ處選址呢，這樣既方便了街上的每一個地點的顧客，還能確保肯德基麥當勞各自都包攬一部分顧客的生意？經過上面ｎ次博弈的分析，我們可以知道，這兩個點的均衡狀態是不穩定的，如果由一方改變選址，就會使自己獲益，所以會不斷競爭，為了比對手獲得更多的客流量，一旦一方擴張，另一方就會馬上做出應對策略，這就是博弈的精妙之處了。

支付矩陣如下：

這樣我們就可以理解為什麼開店都喜歡扎堆了，就是多次博弈的結果，如果以後誰要是開飯店，一定要學習一些博弈論，幫助自己找到自己的最優策略。

電視臺選擇最符合大眾口味的節目放在黃金時段播放，就是為了獲得最大量的觀眾。

總結：

企業角度：博弈論與傳統諮詢工具相結合，可以幫助企業開啟解決戰略定位、股權分配、股權融資、價值塑造、商業模式等疑難雜症的新視角。

個人角度：換位思考，想讓自己的決策最優，先考慮給定自己的決策對方如何最優，從合作共贏的角度出發，互惠互利，保證多方利益的均衡，才能走向良性的發展軌跡，達成帕累託最優。

14思維模型:博弈論一動態決策法

相關焦點

博弈論常見模型初學筆記

博弈論

漫談博弈論

《控制理論與應用》2018年第5期《博弈論》專刊回顧

博弈論，又稱為對策論

《妙趣橫生博弈論》讓你真正對博弈論產生興趣的一本書

可以幫我們做出正確決策的博弈論!妙趣橫生的博弈論

策略思維:了解博弈論,讓你成就自我

建立一個簡單的博弈論分析模型,解讀分析兆馳等的新進入者的進入策略

懂點博弈論,人生會大不一樣

智慧樹博弈策略與完美思維答案

博弈論(Game Theory)| 知識

博弈論：為什麼交智商稅的總是你

重述博弈論的「道統」:簡·奧斯丁與經濟學

BNU課程思政雲享會 | 博弈思維：從博弈論的角度幫助學生理解國家的大政方針政策

博弈論雜談:序幕

[趣味數學]從日常生活中看「博弈論」

在遊戲裡學管理人大教授用《率土之濱》解讀博弈論

LED晶片產業進入與退出決策博弈分析

92思維模型：PrOACT決策模型一決策的藝術

14思維模型:博弈論一動態決策法

相關焦點

博弈論常見模型初學筆記

博弈論

漫談博弈論

《控制理論與應用》2018年第5期《博弈論》專刊回顧

博弈論，又稱為對策論

《妙趣橫生博弈論》讓你真正對博弈論產生興趣的一本書

可以幫我們做出正確決策的博弈論!妙趣橫生的博弈論

策略思維:了解博弈論,讓你成就自我

建立一個簡單的博弈論分析模型,解讀分析兆馳等的新進入者的進入策略

懂點博弈論,人生會大不一樣

智慧樹博弈策略與完美思維答案

博弈論(Game Theory)| 知識

博弈論：為什麼交智商稅的總是你

重述博弈論的「道統」:簡·奧斯丁與經濟學

BNU課程思政雲享會 | 博弈思維：從博弈論的角度幫助學生理解國家的大政方針政策

博弈論雜談:序幕

[趣味數學]從日常生活中看「博弈論」

在遊戲裡學管理 人大教授用《率土之濱》解讀博弈論

LED晶片產業進入與退出決策博弈分析

92思維模型：PrOACT決策模型一決策的藝術

在遊戲裡學管理人大教授用《率土之濱》解讀博弈論