14思維模型:博弈論一動態決策法

2020-12-13 模型思維

為什麼麥當勞和肯德基都擠在一起開店呢?我們來看一組數據 

成都市0-250米競品門店數量佔比達到了恐怖的75%,幾乎只要有麥當勞的地方就有肯德基,可見其競爭的激烈程度,為什麼出現這種結果,難道是兄弟哥倆好,絕對不是,是殘酷的市場競爭博弈所造成的。在每個城市的競爭博弈中都找到了一種均衡的狀態。到底什麼是博弈?他們是如何下面我們一起來認識一下博弈論。

認識博弈論

現代經濟博弈論是在20世紀50年代由匈牙利/美國著名數學家馮·諾依曼的經濟學家奧斯卡·摩根斯坦引入經濟學的,目前已成為經濟分析的主要工具之一,對產業組織理論、委託代理理論、信息經濟學等經濟理論的發展做出了非常重要的貢獻。

從1994年諾貝爾經濟學獎授予3位博弈論專家開始,共有7屆的諾貝爾經濟學獎與博弈論的研究有關。

、博弈論概念

博弈論是研究相互依賴、相互影響的決策主體的理性決策行為以及這些決策的均衡結果的理論。

、博弈論4要素

參與人:在一場競賽或博弈中,每一個有決策權的參與者成為一個局中人。只有兩個局中人的博弈現象稱為「兩人博弈」,而多於兩個局中人的博弈稱為「多人博弈」。

策略:一局博弈中,每個局中人都有選擇實際可行的完整的行動方案,即方案不是某階段的行動方案,而是指導整個行動的一個方案,一個局中人的一個可行的自始至終全局籌劃的一個行動方案,稱為這個局中人的一個策略。

得失:一局博弈結局時的結果稱為得失。每個局中人在一局博弈結束時的得失,不僅與該局中人自身所選擇的策略有關,而且與全局中人所取定的一組策略有關。

均衡:均衡是平衡的意思,在經濟學中,均衡意即相關量處於穩定值。在供求關係中,某一商品市場如果在某一價格下,想以此價格買此商品的人均能買到,而想賣的人均能賣出,此時我們就說,該商品的供求達到了均衡。所謂納什均衡,以約翰·納什命名,所有參與者都不想改變自己的策略的這樣一種相對靜止的狀態

、博弈論研究的假設

決策主體是理性的,最大化自己的利益;

完全理性是共同知識;

每個參與人被假定為對所處環境及其他參與者的行為形成正確信念與預期。

、博弈論的分類

合作博弈和非合作博弈:合作博弈和非合作博弈的區別在於相互發生作用的當事人之間有沒有一個具有約束力的協議,如果有,就是合作博弈,如果沒有,就是非合作博弈。經濟學家們所談的博弈論一般是指非合作博弈,由於合作博弈論比非合作博弈論複雜,在理論上的成熟度遠遠不如非合作博弈論。

靜態博弈、動態博弈兩類:靜態博弈是指在博弈中,參與人同時選擇或雖非同時選擇但後行動者並不知道先行動者採取了什麼具體行動;動態博弈是指在博弈中,參與人的行動有先後順序,且後行動者能夠觀察到先行動者所選擇的行動。通俗的理解:"囚徒困境"就是同時決策的,屬於靜態博弈,下棋就是動態博弈。

完全信息博弈和不完全信息博弈:完全博弈是指在博弈過程中,每一位參與人對其他參與人的特徵、策略空間及收益函數有準確的信息。不完全信息博弈是指如果參與人對其他參與人的特徵、策略空間及收益函數信息了解的不夠準確、或者不是對所有參與人的特徵、策略空間及收益函數都有準確的信息,在這種情況下進行的博弈就是不完全信息博弈。

零和和非零和博弈:零和博弈,又稱零和遊戲,屬非合作博弈。指參與博弈的各方,在嚴格競爭下,一方的收益必然意味著另一方的損失,博弈各方的收益和損失相加總和為「零」,雙方不存在合作的可能。也可以說:自己的幸福是建立在他人的痛苦之上的,二者的大小完全相等,因而雙方都想盡一切辦法以實現「損人利己」。零和博弈的結果是一方吃掉另一方,一方的所得正是另一方的所失,整個社會的利益並不會因此而增加一分。賭博就是零和博弈。

非零和博弈是一種合作下的博弈,博弈中各方的收益或損失的總和不是零值,自己的所得並不與他人的損失的大小相等,自己的幸福也未必建立在他人的痛苦之上,博弈雙方存在「雙贏」的可能,進而達成合作。

例如:一天晚上,狐狸踱步來到了水井旁,低頭俯身看到井底水面上月亮的影子,它認為那是一塊大奶酪。這隻餓得發昏的狐狸跨進一隻吊桶下到了井底,把與之相連的另一隻吊桶升到了井面。下井後,它才明白這「奶酪」是不能吃的,自己已鑄成大錯,處境十分不利,長期下去就只有等死了。

兩天兩夜過去了,沒有一隻動物光顧水井,時間一分一秒地不斷流逝,銀色的上弦月出現了。沮喪的狐狸正無計可施時,剛好一隻口渴的狼途經此地,狐狸不禁喜上眉梢,它對狼打招呼道:「喂,夥計,我免費招待你一頓美餐你看怎麼樣」看到狼被吸引住了,狐狸於是指著井底的月亮對狼說:「你看到這個了嗎?這可是塊十分好吃的奶酪,我已吃掉了這奶酪的那一半,剩下這一半也夠你吃一頓的了。就請委屈你鑽到我特意為你準備好的桶下到井裡來吧。」狐狸儘量把故事編得天衣無縫,這隻狼果然中了它的奸計。狼下到井裡,它的重量使狐狸升到了井口,這隻被困兩天的狐狸終於得救了。

這個故事中狐狸和狼所進行的博弈,我們稱為零和博弈。零和博弈是一種完全對抗、強烈競爭的對局。在零和博弈的結局中.參與者的收益總和是零(或某個常數),一個參與者的所得恰是另一參與者的所失。狐狸和狼一隻在上面,一隻在下面,下面的這一隻想上去,就得想辦法讓上面的一隻下來。

但是通過博弈調換位置以後,仍然是一隻在上面.一隻在下面。如果狼明白狐狸掉到了井裡,動了憾隱之心,搬來一塊石頭放到上面的桶中,完全可以利用石頭的重量把狐狸拉上來。或者,如果狐狸擔心狼沒有這種樂於助人的精神,通過欺騙到達井口以後,再用石頭把狼再拉上來。這兩種方式的結局是兩個參與者都到了井上面,那麼雙方進行的就是一種正和博弈。

囚徒困境

警方逮捕甲、乙兩名嫌疑犯,但沒有足夠證據指控二人有罪。於是警方分開囚禁嫌疑犯,分別和二人見面,並向雙方提供以下相同的選擇:

若一人認罪並作證檢控對方(相關術語稱「背叛」對方),而對方保持沉默,此人將即時獲釋,沉默者將判監10年。

若二人都保持沉默(相關術語稱互相「合作」),則二人同樣判監半年。

若二人都互相檢舉(互相「背叛」),則二人同樣判監2年。

若對方沉默、我背叛會讓我獲釋,所以會選擇背叛。

若對方背叛指控我,我也要指控對方才能得到較低的刑期,所以也是會選擇背叛。

二人面對的情況一樣,所以二人的理性思考都會得出相同的結論——選擇背叛。背叛是兩種策略之中的支配性策略。因此,這場博弈中唯一可能達到的納什均衡,就是雙方參與者都背叛對方,結果二人同樣服刑2年。

這場博弈的納什均衡,顯然不是顧及團體利益的帕累託最優解決方案。以全體利益而言,如果兩個參與者都合作保持沉默,兩人都只會被判刑半年,總體利益更高,結果也比兩人背叛對方、判刑2年的情況較佳,這種結果叫做帕累託最優,在不損害他人利益的情況下,使得自己的利益最大化。但根據以上假設,二人均為理性的個人,且只追求自己個人利益。均衡狀況會是兩個囚徒都選擇背叛,結果二人判監均比合作為高,總體利益較合作為低。這就是「困境」所在。

在這種情況下沒有一個參與者可以通過獨自行動而增加收益,例如,如果甲獨自改變策略進行合作,乙仍然是背叛,那麼他的收益會從-2下降到-10,這與他的初衷增加收益相悖,所以他不會改變策略。

如果關了兩年後,甲乙都被釋放了,但是又都因為盜竊被捕,如果發生這樣會一直重複出現的困境,那麼,甲乙會考慮作出背叛行為後可能遭到的報復,所以,最有可能進行合作,在無數次進行這個重複博弈的時候,他們的納什均衡會趨向於帕累託最優

囚徒困境的啟示

案例1、一個和尚擔水吃,三個和尚沒水吃。就是典型的囚徒困境。

案例2、牧民放牧的囚徒困境,每個牧民都希望多放幾隻羊,而草原上的草是有限的,如果我當雷鋒,少放幾隻羊,肯定就吃虧了,所以大家以後都多放羊,最後草原資源枯竭,誰都得不到好處。

案例3、排汙企業的囚徒困境。如果在一個城市裡有2家相同的化工廠,由於環保局的要求都安裝了排汙設備並嚴格執行排汙標準,每天要消耗10萬元,這樣自然會使產品價格提高,進而失去市場競爭力。

此時會有三種情況發生

1、大家都嚴格執行排汙標準,共同把產品價格提高,雙方不會有大影響。

2、一家遵守標準,一家偷偷晚上偷偷排汙水,一方受益,一方損失。

3、大家都不遵守標準,晚上偷偷排汙水,雙方都得益。

如果環保管的不太嚴,每家企業的最優策略就是晚上偷偷排汙水,這就是一個納什均衡,但是這樣會影響環境,只有政府強行管制,讓大家都嚴格執行排汙標準,才能實現帕累託最優。

囚徒困境在生活中比比皆是,例如擠公交地鐵,插隊事件,如果每個人都為了個人利益最大化插隊,反而使自己的利益最小化。

智豬博弈

在博弈論經濟學中,「智豬博弈」是一個著名的納什均衡的例子。假設豬圈裡有一頭大豬、一頭小豬。豬圈的一頭有豬食槽,另一頭安裝著控制豬食供應的按鈕,按一下按鈕會有10個單位的豬食進槽,但是誰按按鈕就會首先付出2個單位的成本,若小豬去按,大豬等在槽邊,大小豬吃到食物的收益比是9∶1;同時去按,同時到槽邊開吃,收益比是7∶3;如果大豬去按,小豬等在槽邊,收益比是6∶4。那麼,在兩頭豬都有智慧的前提下,最終結果是小豬選擇等待。支付矩陣如下

實際上小豬選擇等待,讓大豬去按控制按鈕,而自己選擇「坐船」(或稱為搭便車)的原因很簡單:在大豬選擇行動的前提下,小豬也行動的話,小豬可得到1個單位的純收益(吃到3個單位食品的同時也耗費2個單位的成本,以下純收益計算相同),而小豬等待的話,則可以獲得4個單位的純收益,等待優於行動;在大豬選擇等待的前提下,小豬如果行動的話,小豬的收入將不抵成本,純收益為-1單位,如果小豬也選擇等待的話,那麼小豬的收益為零,成本也為零,總之,等待還是要優於行動。

「智豬博弈」故事給了競爭中的弱者(小豬)以等待為最佳策略的啟發。在博弈中,每一方都要想方設法攻擊對方、保護自己,最終取得勝利;但同時,對方也是一個與你一樣理性的人,他會這麼做嗎?這時就需要更高明的智慧。博弈其實是一種鬥智的競爭。

智豬博弈的啟示

1、搭便車策略

在小企業經營中,學會如何「搭便車」是明智的選擇。在某些時候,如果能夠注意等待,讓其他大的企業首先開發市場,有所不為才能有所為,等待產業市場中出現具有贏利能力新產品、繼而大舉仿製牟取利潤的企業。

例如:中國很多山寨手機廠商採用的全是搭便車,等蘋果公司出現新產品時,山寨廠商很快就可以山寨出外形一樣的手機,可以達到以假亂真的目的。還有國內的很多汽車廠商,採用的策略是逆向開發,完全模仿國外汽車,就是搭便車策略。

2、如何消除搭便車?

智豬博弈可以採用減量加移位方案,投食量僅為原來的一半,但同時將投食口移到按鈕附近。那麼大豬小豬將會爭著踩按鈕。等待者不得食,多勞者多得食。對於規則設計者來說,減量移位方案是一個最好的方案。成本不高而收穫很大。企業要建立多勞多得,少勞少得的管理制度,防止大鍋飯的出現,國家也要建立智慧財產權保護的制度,保護創新者的利益不受損失,同時也要給予小企業的政策優惠,才能保證經濟的良性發展,達到帕累託最優。

海灘佔位博弈

日常生活中,如果我們仔細觀察,就會發現在同一條街上兩家超市經常會開在一起,你在沙灘遊玩的時候,也往往能發現兩家冷飲店相依為鄰——這跟肯德基麥當勞經常比鄰開店的道理其實是一樣的。

把肯德基和麥當勞的分析簡化,在一條長為1000m的街上, 

第一次博弈:二者分別開在兩個端點上,各佔500m範圍的顧客。

如果麥當勞向中間移動250m,它的顧客範圍就變成了250+(750/2)=625m

肯德基也發現了這個規律,向中間移動了250m,二者的顧客範圍重新變成了各自佔據500m的顧客範圍。第二次博弈:在原來基礎上,麥當勞繼續移動500m位置,佔據顧客範圍成了:500+(500/2)=750,於是肯德基繼續跟著也移動了500m位置,各自佔領500m,經過多次博弈之後,雙方都到了中點處,都分得了500m的顧客範圍。

有人可能會問,為什麼不在線上的250m和750m處選址呢,這樣既方便了街上的每一個地點的顧客,還能確保肯德基麥當勞各自都包攬一部分顧客的生意?經過上面n次博弈的分析,我們可以知道,這兩個點的均衡狀態是不穩定的,如果由一方改變選址,就會使自己獲益,所以會不斷競爭,為了比對手獲得更多的客流量,一旦一方擴張,另一方就會馬上做出應對策略,這就是博弈的精妙之處了。

支付矩陣如下:

這樣我們就可以理解為什麼開店都喜歡扎堆了,就是多次博弈的結果,如果以後誰要是開飯店,一定要學習一些博弈論,幫助自己找到自己的最優策略。

電視臺選擇最符合大眾口味的節目放在黃金時段播放,就是為了獲得最大量的觀眾。

總結:

企業角度:博弈論與傳統諮詢工具相結合,可以幫助企業開啟解決戰略定位、股權分配、股權融資、價值塑造、商業模式等疑難雜症的新視角。

個人角度:換位思考,想讓自己的決策最優,先考慮給定自己的決策對方如何最優,從合作共贏的角度出發,互惠互利,保證多方利益的均衡,才能走向良性的發展軌跡,達成帕累託最優。

相關焦點

  • 博弈論常見模型初學筆記
    大家早安、午安、晚安,今天我先從機器學習的學習中休息一下,來了解一些常見的博弈論模型,然後繼續學習機器學習等。以下博弈論的介紹來自網絡。
  • 博弈論
    納什的開創性論文《n人博弈的均衡點》(1950),《非合作博弈》(1951)等等,給出了納什均衡的概念和均衡存在定理。此外,萊因哈德·澤爾騰、約翰·海薩尼的研究也對博弈論發展起到推動作用。今天博弈論已發展成一門較完善的學科。2類型編輯(1)合作博弈——研究人們達成合作時如何分配合作得到的收益,即收益分配問題。
  • 漫談博弈論
    總的來看,「對策論」的使用目前基本局限於運籌學和數學領域,而在其他領域和媒體報導中,「博弈論」這個詞已經佔據了壓倒性的優勢。 博弈無處不在從研究對象來看,博弈論跟遊戲(尤其是棋牌遊戲)還真有著非常密切的關係;要不然,馮·諾依曼怎麼會無緣無故叫它「Game Theory」呢?那麼,博弈論的研究對象究竟是什麼呢?
  • 《控制理論與應用》2018年第5期《博弈論》專刊回顧
    綜述與評論電力系統控制與決策中的博弈問題 ――工程博弈論初探「作者」 梅生偉, 魏韡, 劉鋒「摘要」 由於在處理多主體、多目標與複雜決策時序等方面具有的獨特優勢, 博弈論從其誕生至今半個多世紀以來, 已經對經濟學、社會學
  • 博弈論,又稱為對策論
    納什的開創性論文《n人博弈的均衡點》(1950),《非合作博弈》(1951)等等,給出了納什均衡的概念和均衡存在定理。此外,萊因哈德·澤爾騰、約翰·海薩尼的研究也對博弈論發展起到推動作用。今天博弈論已發展成一門較完善的學科。
  • 《妙趣橫生博弈論》讓你真正對博弈論產生興趣的一本書
    有人的地方就有江湖,有江湖的地方就有博弈。書中通過用博弈論思維對大量的案例進行分析,使我們讀完後對博弈論會有深刻的理解。這本書之所以推薦,是因為看了本書後,我們會對博弈論產生強烈的興趣,興趣為師,有興趣就會關注,當人們持續關注一個問題時,那麼問題已經解決了90%。
  • 可以幫我們做出正確決策的博弈論!妙趣橫生的博弈論
    各位書友大家好,歡迎繼續做客老齊的讀書圈,一直以來很多小夥伴,都希望老齊講講博弈論,什麼是博弈論呢?他是經濟學的分析工具之一,目的就是通過對結果的充分研究,找出最優的解決方案。比如歷史上我們的孫子兵法,其實就是一部博弈論著作,它裡面很多的知識,都是博弈論範疇。今天我們就找來一本書,好好聊聊博弈論,書名叫做妙趣橫生的博弈論,副標題是事業與人生的成功之道,號稱是西方世界的孫子兵法。
  • 策略思維:了解博弈論,讓你成就自我
    人生是一個永不停息的決策過程。從事什麼樣的工作,怎樣打理一宗生意,該和誰結婚,怎樣將孩子撫養成人,要不要競爭總裁的位置,都是這類決策的例子。你不是在一個真空的世界裡做決定。相反,你身邊全是和你一樣的決策制定者。雖然衝突的成分很多,但是合作的因素也不少。
  • 建立一個簡單的博弈論分析模型,解讀分析兆馳等的新進入者的進入策略
    建立一個簡單的博弈論分析模型,解讀分析兆馳等的新進入者的進入策略 李倩 發表於 2018-07-26 11:10:43 寡頭博弈的決策變量包括價格和產量,但這主要是短期的
  • 懂點博弈論,人生會大不一樣
    在納什眼裡,追求女生就是一場「博弈」,而「博弈」是要遵循一定規則的,是需要「博弈」策略的。果然這一策略成功地引起了美女的注意。哪怕自己說了很多直男話語,也絲毫沒有降低他在美女面前的印象分。博弈論真的有這麼神奇嗎?
  • 智慧樹博弈策略與完美思維答案
    博弈策略與完美思維單元測試答案1【單選題】(20分) 博弈論中,參與人從一個博弈中得到的結果常被稱為( B )。 A. 效果 B. 支付 C. 決策 D.利潤 2【單選題】(20分)根據博弈的參與人之間是否達成具有約束力的契約來分,博弈可分為( B )。 A. 靜態博弈和動態博弈 B. 合作博弈和非合作博弈 C. 完全信息博弈和不完全信息博弈 D.
  • 博弈論(Game Theory)| 知識
    博弈論最初主要研究象棋、橋牌、賭博中的勝負問題,人們對博弈局勢的把握只停留在經驗上,沒有向理論化發展,正式發展成一門學科則是在20世紀初。., 1950, 1951)利用不動點定理證明了均衡點的存在,為博弈論的一般化奠定了堅實的基礎。此外,塞爾頓、哈桑尼的研究也對博弈論發展起到推動作用。今天博弈論已發展成一門較完善的的學科。
  • 博弈論:為什麼交智商稅的總是你
    舉個例子,就拿博弈論中最著名的「囚徒困境」定理來說,該模型作為博弈論的經典試驗,為我們全面揭示了什麼是博弈論以及其中的幾個重點:假設有兩個自私的小偷A和B聯合犯事、私入民宅被警察抓住。所以現代的博弈論在開始研究合作之前,就設定了兩個前提:一、每個人都是自私的;二、沒有權威幹預個人決策。也就是說,個人可以完全按照自己利益最大化的企圖進行決策。在最大程度上減少了不可控的因素。
  • 重述博弈論的「道統」:簡·奧斯丁與經濟學
    簡·奧斯丁,200年前的一位女性作家,對於重述博弈論的「道統」而言,她的六部小說自然是再合適不過的材料。博弈論基於理性選擇理論,考慮兩個或兩個以上個體之間的相互作用,關注於單個個體的選擇。策略思維(奧斯丁用「洞察」一詞指代)是博弈論的核心概念。在作者眼中,簡·奧斯丁的小說「系統探討了博弈論的核心思想」。
  • BNU課程思政雲享會 | 博弈思維:從博弈論的角度幫助學生理解國家的大政方針政策
    本期的分享人是北京師範大學系統科學學院周亞副教授,他講授的是本科生通識課「博弈思維」課程。談到博弈論,首先要明確的是,它絕不是厚黑學,絕不是教人爾虞我詐的學問,而是我們觀察、分析客觀世界的一種普適方法及應有之視角。
  • 博弈論雜談:序幕
    此外在過去,「對策論」這一名稱也曾被使用過,比如說,在我國有一個從事博弈論研究的學術組織,名字就叫「中國運籌學會對策論分會」,聽起來就像是個非法組織。可以說,對策論也是個非常nice的翻譯,而且十分直觀、易於理解,因為博弈論是決策理論的一個分支,所謂上有決策下有對策,從構詞上看,可謂十分優美,儘管可能有一些誤導成分存在,但它的研究對象和研究意義基本也都十分明了了。
  • [趣味數學]從日常生活中看「博弈論」
    一、博弈及其分類  「博弈論」就是分析博弈行為和博弈決策的一門科學。  今年的諾貝爾經濟學獎,已於前不久為「博弈論」研究專家羅伯特?奧曼和託馬斯?謝林所獲得,1994年度和1996年度的諾貝爾經濟學獎,也分別由納什、澤爾滕、海薩尼、莫裡斯和維克瑞等「博弈論」專家分享。
  • 在遊戲裡學管理 人大教授用《率土之濱》解讀博弈論
    上周,中國人民大學專攻經濟社會學和社會博弈論的教授王水雄,就在人大課堂上借《率土之濱》手遊講授了博弈論。 王教授基於遊戲中的切身體驗,講述了在以「囚徒困境」等為主要模型的經典博弈框架上,嵌入時空條件、社會結構、注意力控制、行為意義賦予等社會性因素之後,對現實決策有實際效用的博弈鑲嵌問題。 他指出《率土之濱》中的玩家博弈存在著多層博弈空間,博弈雙方同時存在著共同利益和衝突利益。
  • LED晶片產業進入與退出決策博弈分析
    本文通過建立一個簡單的博弈論分析模型,解讀分析兆馳等的新進入者(下文簡稱A公司)的進入策略(Entry Strategy,本文中戰略和策略等價)和在位者如三安,華燦等(下文簡稱S公司)的進入阻絕戰略(Entry-deterring Strategies)。
  • 92思維模型:PrOACT決策模型一決策的藝術
    這6大標準是衡量決策質量的重要維度,同時約翰哈蒙德、拉爾夫基尼、霍華德雷法教授通過40多年的研究和諮詢經驗,總結出PrOACT決策模型,也是哈佛大學決策科學的重要課程之一。1、跳出自己自己的認知和眼界決定了自己能看到的,自己沒有看到可能對你來說很重要,所以跳出自己的思維框架去找尋更優秀的方案非常重要,例如王剛夫婦為什麼只看到一所好的公立學校,就決定要買旁邊的學區房呢?有沒有更好的公立學校呢?為什麼非要選擇公立學校呢?