博弈論

2021-02-18 快樂天天有

博弈論又被稱為對策論(Game Theory)既是現代數學的一個新分支,也是運籌學的一個重要學科。

博弈論主要研究公式化了的激勵結構間的相互作用。是研究具有鬥爭或競爭性質現象的數學理論和方法。 博弈論考慮遊戲中的個體的預測行為和實際行為,並研究它們的優化策略。生物學家使用博弈理論來理解和預測進化論的某些結果。

博弈論已經成為經濟學的標準分析工具之一。在生物學、經濟學、國際關係、計算機科學、政治學、軍事戰略和其他很多學科都有廣泛的應用。

基本概念中包括局中人、行動、信息、策略、收益、均衡和結果等。其中局中人、策略和收益是最基本要素。局中人、行動和結果被統稱為博弈規則。

中文名

博弈論

外文名

Game Theory

別 名

對策論、賽局理論

所屬學科

應用數學

目錄

1理論歷史

2類型

3諾貝爾獎

4要素

5博弈類型

6納什均衡

▪ 案例一

▪ 案例二

▪ 案例三

7中國應用

1理論歷史編輯

約翰·馮·諾依曼

博弈論[1] 是二人在平等的對局中各自利用對方的策略變換自己的對抗策略,達到取勝的目的。博弈論思想古已有之,中國古代的《孫子兵法》等著作就不僅是一部軍事著作,而且算是最早的一部博弈論著作。博弈論最初主要研究象棋、橋牌、賭博中的勝負問題,人們對博弈局勢的把握只停留在經驗上,沒有向理論化發展。

博弈論考慮遊戲中的個體的預測行為和實際行為,並研究它們的優化策略。

近代對於博弈論的研究,開始於策梅洛(Zermelo),波萊爾(Borel)及馮·諾依曼(von Neumann)。

1928年,馮·諾依曼證明了博弈論的基本原理,從而宣告了博弈論的正式誕生。1944年,馮·諾依曼和摩根斯坦共著的劃時代巨著《博弈論與經濟行為》將二人博弈推廣到n人博弈結構並將博弈論系統地應用於經濟領域,從而奠定了這一學科的基礎和理論體系。

1950~1951年,約翰·福布斯·納什(John Forbes Nash Jr)利用不動點定理證明了均衡點的存在,為博弈論的一般化奠定了堅實的

策墨洛(Zermelo)

基礎。納什的開創性論文《n人博弈的均衡點》(1950),《非合作博弈》(1951)等等,給出了納什均衡的概念和均衡存在定理。此外,萊因哈德·澤爾騰、約翰·海薩尼的研究也對博弈論發展起到推動作用。今天博弈論已發展成一門較完善的學科。

2類型編輯

(1)合作博弈——研究人們達成合作時如何分配合作得到的收益,即收益分配問題。
  (2)非合作博弈——研究人們在利益相互影響的局勢中如何選決策使自己的收益最大,即策略選擇問題。
  (3)完全信息/不完全信息博弈:參與者對所有參與者的策略空間及策略組合下的支付有充分了解稱為完全信息;反之,則稱為不完全信息。
  (4)靜態博弈和動態博弈

靜態博弈:指參與者同時採取行動,或者儘管有先後順序,但後行動者不知道先行動者的策略。

動態博弈:指雙方的的行動有先後順序並且後行動者可以知道先行動者的策略。

3諾貝爾獎編輯

約翰·納什

從1994年諾貝爾經濟學獎授予3位博弈論專家開始,共有7屆的諾貝爾經濟學獎與博弈論的研究有關[2] ,分別為:

1994年,授予加利福尼亞大學伯克利分校的約翰·海薩尼(J.Harsanyi)、普林斯頓大學約翰·納什(J.Nash)和德國波恩大學的賴因哈德·澤爾滕(Reinhard Selten)。以表彰這三位數學家在非合作博弈的均衡分析理論方面做出了開創性的貢獻,對博弈論和經濟學產生了的重大影響。

1996年,授予英國劍橋大學的詹姆斯·莫裡斯(James A. Mirrlees)與美國哥倫比亞大學的威廉·維克瑞(William Vickrey)。前者在信息經濟學理論領域做出了重大貢獻,尤其是不對稱信息條件下的經濟激勵理論,後者在信息經濟學、激勵理論、博弈論等方面都做出了重大貢獻。

2001年,授予加利福尼亞大學伯克利分校的喬治·阿克爾洛夫(George A. Akerlof )、美國史丹福大學的麥可·斯賓塞(A. Michael Spence )和美國哥倫比亞大學的約瑟夫·斯蒂格利茨(Joseph E. Stiglitz)。他們的研究為不對稱信息市場的一般理論奠定了基石,他們的理論迅速得到了應用,從傳統的農業市場到現代的金融市場,他們的貢獻來自於現代信息經濟學的核心部分。

2005年,授予美國馬裡蘭大學的託馬斯·克羅姆比·謝林(Thomas Crombie Schelling)和耶路撒冷希伯來大學的羅伯特·約翰·奧曼(Robert John Aumann)。二者的研究通過博弈論分析促進了對衝突與合作的理解。

2007年,授予美國明尼蘇達大學的裡奧尼德·赫維茨(Leonid Hurwicz)、美國普林斯頓大學的埃裡克·馬斯金(Eric S. Maskin)以及美國芝加哥大學的羅傑·邁爾森(Roger B. Myerson)。三者的研究為機制設計理論奠定了基礎。

2012年,授予美國經濟學家埃爾文·羅斯(Alvin E. Roth)與羅伊德·沙普利(Lloyd S. Shapley)。他們創建「穩定分配」的理論,並進行「市場設計」的實踐[3] 。

作為一門工具學科能夠在經濟學中如此廣泛運用並得到學界垂青實為罕見。

2014年,授予法國經濟學家梯若爾。他在產業組織理論以及串謀問題上,採用了博弈論的思想,讓理論和問題得以解決。在規制理論上也有創新。

4要素編輯

(1)局中人:在一場競賽或博弈中,每一個有決策權的參與者成為一個局中人。只有兩個局中人的博弈現象稱為「兩人博弈」,而多於兩個局中人的博弈稱為 「多人博弈」。
  (2)策略:一局博弈中,每個局中人都有選擇實際可行的完整的行動方案,即方案不是某階段的行動方案,而是指導整個行動的一個方案,一個局中人的一個可行的自始至終全局籌劃的一個行動方案,稱為這個局中人的一個策略。如果在一個博弈中局中人都總共有有限個策略,則稱為「有限博弈」,否則稱為「無限博弈」。
  (3)得失:一局博弈結局時的結果稱為得失。每個局中人在一局博弈結束時的得失,不僅與該局中人自身所選擇的策略有關,而且與全局中人所取定的一組策略有關。所以,一局博弈結束時每個局中人的「得失」是全體局中人所取定的一組策略的函數,通常稱為支付(payoff)函數。
  (4)對於博弈參與者來說,存在著一博弈結果 。
  (5)博弈涉及到均衡:均衡是平衡的意思,在經濟學中,均衡意即相關量處於穩定值。在供求關係中,某一商品市場如果在某一價格下,想以此價格買此商品的人均能買到,而想賣的人均能賣出,此時我們就說,該商品的供求達到了均衡。所謂納什均衡,它是一穩定的博弈結果。

5博弈類型編輯

博弈的分類根據不同的基準也有不同的分類。

一般認為,博弈主要可以分為合作博弈和非合作博弈。合作博弈和非合作博弈的區別在於相互發生作用的當事人之間有沒有一個具有約束力的協議,如果有,就是合作博弈,如果沒有,就是非合作博弈。

從行為的時間序列性,博弈論進一步分為靜態博弈、動態博弈兩類:靜態博弈是指在博弈中,參與人同時選擇或雖非同時選擇但後行動者並不知道先行動者採取了什麼具體行動;動態博弈是指在博弈中,參與人的行動有先後順序,且後行動者能夠觀察到先行動者所選擇的行動。通俗的理解:"囚徒困境"就是同時決策的,屬於靜態博弈;而棋牌類遊戲等決策或行動有先後次序的,屬於動態博弈

按照參與人對其他參與人的了解程度分為完全信息博弈和不完全信息博弈。完全博弈是指在博弈過程中,每一位參與人對其他參與人的特徵、策略空間及收益函數有準確的信息。不完全信息博弈是指如果參與人對其他參與人的特徵、策略空間及收益函數信息了解的不夠準確、或者不是對所有參與人的特徵、策略空間及收益函數都有準確的信息,在這種情況下進行的博弈就是不完全信息博弈。

經濟學家們所談的博弈論一般是指非合作博弈,由於合作博弈論比非合作博弈論複雜,在理論上的成熟度遠遠不如非合作博弈論。非合作博弈又分為:完全信息靜態博弈,完全信息動態博弈,不完全信息靜態博弈,不完全信息動態博弈。與上述四種博弈相對應的均衡概念為:納什均衡(Nash equilibrium),子博弈精煉納什均衡(subgame perfect Nash equilibrium),貝葉斯納什均衡(Bayesian Nash equilibrium),精煉貝葉斯納什均衡(perfect Bayesian Nash equilibrium)。

博弈論還有很多分類,比如:以博弈進行的次數或者持續長短可以分為有限博弈和無限博弈;以表現形式也可以分為一般型(戰略型)或者展開型;以博弈的邏輯基礎不同又可以分為傳統博弈和演化博弈。

6納什均衡編輯

納什均衡(Nash Equilibrium):在一策略組合中,所有的參與者面臨這樣一種情況,當其他人不改變策略時,他此時的策略是最好的。也就是說,此時如果他改變策略他的支付將會降低。在納什均衡點上,每一個理性的參與者都不會有單獨改變策略的衝動。納什均衡點存在性證明的前提是「博弈均衡偶」概念的提出

。所謂「均衡偶」是在二人零和博弈中,當局中人A採取其最優策略a*,局中人B也採取其最優策略b*,如果局中人仍採取b*,而局中人A卻採取另一種策略a,那麼局中人A的支付不會超過他採取原來的策略a*的支付。這一結果對局中人B亦是如此。

這樣,「均衡偶」的明確定義為:一對策略a*(屬於策略集A)和策略b*(屬於策略集B)稱之為均衡偶,對任一策略a(屬於策略集A)和策略b(屬於策略集B),總有:偶對(a, b*)≤偶對(a*,b)≤偶對(a*,b*)。

對於非零和博弈也有如下定義:一對策略a*(屬於策略集A)和策略b*(屬於策略集B)稱為非零和博弈的均衡偶,對任一策略a(屬於策略集A)和策略b(屬於策略集B),總有:對局中人A的偶對(a, b*) ≤偶對(a*,b*);對局中人B的偶對(a*,b)≤偶對(a*,b*)。

有了上述定義,就立即得到納什定理:

任何具有有限純策略的二人博弈至少有一個均衡偶。這一均衡偶就稱為納什均衡點。

納什定理的嚴格證明要用到不動點理論,不動點理論是經濟均衡研究的主要工具。通俗地說,尋找均衡點的存在性等價於找到博弈的不動點。
  納什均衡點概念提供了一種非常重要的分析手段,使博弈論研究可以在一個博弈結構裡尋找比較有意義的結果。

但納什均衡點定義只局限於任何局中人不想單方面變換策略,而忽視了其他局中人改變策略的可能性,因此,在很多情況下,納什均衡點的結論缺乏說服力,研究者們形象地稱之為「天真可愛的納什均衡點」。

塞爾頓(R·Selten)在多個均衡中剔除一些按照一定規則不合理的均衡點,從而形成了兩個均衡的精煉概念:子博弈完全均衡和顫抖的手完美均衡。

案例一

囚徒困境

在博弈論中,含有佔優戰略均衡的一個著名例子是由塔克給出的「囚徒困境」(prisoner's dilemma)博弈模型。該模型用一種特別的方式為我們講述了一個警察與小偷的故事。假設有兩個小偷A和B聯合犯事、私入民宅被警察抓住。警方將兩人分別置於不同的兩個房間內進行審訊,對每一個犯罪嫌疑人,警方給出的政策是:如果兩個犯罪嫌疑人都坦白了罪行,交出了贓物,於是證據確鑿,兩人都被判有罪,各被判刑8年;如果只有一個犯罪嫌疑人坦白,另一個人沒有坦白而是抵賴,則以妨礙公務罪(因已有證據表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。如果兩人都抵賴,則警方因證據不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。下表給出了這個博弈的支付矩陣。

囚徒困境博弈 [Prisoner's dilemma]

A╲B

坦白

抵賴

坦白

8,8

0,10

抵賴

10,0

1,1

對A來說,儘管他不知道B作何選擇,但他知道無論B選擇什麼,他選擇「坦白」總是最優的。顯然,根據對稱性,B也會選擇「坦白」,結果是兩人都被判刑8年。但是,倘若他們都選擇「抵賴」,每人只被判刑1年。在表2.2中的四種行動選擇組合中,(抵賴、抵賴)是帕累託最優,因為偏離這個行動選擇組合的任何其他行動選擇組合都至少會使一個人的境況變差。但是,「坦白」是任一犯罪嫌疑人的佔優戰略,而(坦白,坦白)是一個佔優戰略均衡,即納什均衡。不難看出,此處納什均衡與帕累託存在衝突。

單從數學角度講,這個理論是合理的,也就是選擇都坦白。但在這樣多維信息共同作用的社會學領域顯然是不合適的。正如中國古代將官員之間的行賄受賄稱為「陋規」而不是想方設法清查,這是因為社會體系給人行為的束縛作用迫使人的策發生改變。比如,從心理學角度講,選擇坦白的成本會更大,一方坦白害得另一方加罪,那麼事後的報復行為以及從而不會輕易在周圍知情人當中的「出賣」角色將會使他損失更多。而8年到10年間的增加比例會被淡化,人的尊嚴會使人產生復仇情緒,略打破「行規」。我們正處於大數據時代,向更接近事實的處理一件事就要儘可能多地掌握相關資料併合理加權分析,人的活動動影像動因複雜,所以囚徒困境只能作為簡化模型參考,具體決策還得具體分析。

案例二

智豬博弈[4]

一、經濟學中的「智豬博弈」(Pigs』payoffs) 這個例子講的是:

假設豬圈裡有一頭大豬、一頭小豬。豬圈的一頭有豬食槽,另一頭安裝著控制豬食供應的按鈕,按一下按鈕會有10個單位的豬食進槽,但是誰按按鈕就會首先付出2個單位的成本,在去往食槽的路上會有兩個單位豬食的體能消耗,若大豬先到槽邊,大小豬吃到食物的收益比是9∶1;同時行動(去按按鈕),收益比是7∶3;小豬先到槽邊,收益比是6∶4。那麼,在兩頭豬都有智慧的前提下,最終結果是小豬選擇等待。

"智豬博弈"由納什於1950年提出。實際上小豬選擇等待,讓大豬去按控制按鈕,而自己選擇「坐船」(或稱為搭便車)的原因很簡單:在大豬選擇行動的前提下,小豬選擇等待的話,小豬可得到4個單位的純收益,而小豬行動的話,則僅僅可以獲得大豬吃剩的1個單位的純收益,所以等待優於行動;在大豬選擇等待的前提下,小豬如果行動的話,小豬的收入將不抵成本,純收益為-1單位,如果小豬也選擇等待的話,那麼小豬的收益為零,成本也為零,總之,等待還是要優於行動。

用博弈論中的報酬矩陣可以更清晰的刻畫出小豬的選擇:



小豬




行動

等待

大豬

行動

5,1

4,4


等待

9,-1

0,0

從矩陣中可以看出,當大豬選擇行動的時候,小豬如果行動,其收益是1,而小豬等待的話,收益是4,所以小豬選擇等待;當大豬選擇等待的時候,小豬如果行動的話,其收益是-1,而小豬等待的話,收益是0,所以小豬也選擇等待。綜合來看,無論大豬是選擇行動還是等待,小豬的選擇都將是等待,即等待是小豬的佔優策略。

在小企業經營中,學會如何「搭便車」是一個精明的職業經理人最為基本的素質。在某些時候,如果能夠注意等待,讓其他大的企業首先開發市場,是一種明智的選擇。這時候有所不為才能有所為!

高明的管理者善於利用各種有利的條件來為自己服務。「搭便車」實際上是提供給職業經理人面對每一項花費的另一種選擇,對它的留意和研究可以給企業節省很多不必要的費用,從而使企業的管理和發展走上一個新的臺階。這種現象在經濟生活中十分常見,卻很少為小企業的經理人所熟識。

在智豬博弈中,雖然小豬的「撿現成」的行為從道義上來講令人不齒,但是博弈策略的主要目的不正是使用謀略最大化自己的利益嗎?

案例三

美女的硬幣[5]

一位陌生美女主動過來和你搭訕,並要求和你一起玩個遊戲。美女提議:「讓我們各自亮出硬幣的一面,或正或反。如果我們都是正面,那麼我給你3元,如果我們都是反面,我給你1元,剩下的情況你給我2元就可以了。」聽起來不錯的提議。如果我是男性,無論如何我是要玩的,不過經濟學考慮就是另外一回事了,這個遊戲真的夠公平嗎?

紳士/美女

女正面

女反面

正面

3,-3

-2,+2

反面

-2,+2

1,-1

假設我們出正面的概率是x,反面的概率是1-x。為了使利益最大化,應該在對手出正面或反面的時候我們的收益都相等,不然對手總是可以改變正反面出現的概率讓我們的總收入減少,由此列出方程就是3x+(-2)*(1-x)=(-2)*x+1*(1-x)

這個方程通俗的說就是在對手一直出正面你得到的利益,和你對手一直出反面得到利益是一樣的且最大。解方程得x=3/8,也就是說平均每八次出示3次正面,5次反面是我們的最優策略。而將x=3/8代入到收益表達式3*x+(-2)*(1-x)中就可得到每次的期望收入,計算結果是-1/8元。

同樣,設美女出正面的概率是y,反面的概率是1-y,列方程-3y+2(1-y)=2y+(-1)*(1-y)

解得y也等於3/8,而美女每次的期望收益則是2(1-y)-3y=1/8元。這告訴我們,在雙方都採取最優策略的情況下,平均每次美女贏1/8元。其實只要美女採取了(3/8,5/8)這個方案,不論你再採用什麼方案,都是不能改變局面的。如果全部出正面,每次的期望收益是(3+3+3-2-2-2-2-2)/8=-1/8元

如果全部出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。而任何策略無非只是上面兩種策略的線性組合,所以期望還是-1/8元。但是當你也採用最佳策略時,至少可以保證自己輸得最少。否則,你肯定就會被美女採用的策略針對,從而賠掉更多。看起來這個博弈模型似乎沒有什麼用處,但是其實這可能牽涉了金融市場定價中最重要的一個模型:定價權重模型了。

總的來說「博弈論」其本質是將日常生活中的競爭矛盾以遊戲的形式表現出來,並使用數學和邏輯學的方法來分析事物的運作規律。既然有遊戲的參與者那麼也必然存在遊戲規則的制定者。深入的了解競爭行為的本質,有助於我們分析和掌握競爭中事物之間的關係,更方便我們對規則進行制定和調整,使其最終按照我們所預期的目的進行運作。

7中國應用編輯

《孫子兵法》是我國乃至世界最早的一部經典博弈論著作,近幾年由於博弈論在全球的大範圍流行,出現了多部收集整理博弈論知識的書籍,如《博弈論的詭計》、《最神奇的博弈論定律》等。中國經緯智庫是最早研究新型博弈理論的民間智庫之一,由理事宋雪峰牽頭研究以公布的《多腿凳定律》《定量無窮大》《十字弓博弈基礎》已經被引用到社會經濟發展的方方面面。

「博弈論」與傳統諮詢工具相結合,可以幫助企業開啟解決戰略定位、股權分配、股權融資、價值塑造、商業模式等疑難雜症的新視角。(該論述源自經邦)

相關焦點

  • 漫談博弈論
    「博弈論」大家肯定都聽說過,印象中,這可是個「高大上」的理論。總的來看,「對策論」的使用目前基本局限於運籌學和數學領域,而在其他領域和媒體報導中,「博弈論」這個詞已經佔據了壓倒性的優勢。 博弈無處不在從研究對象來看,博弈論跟遊戲(尤其是棋牌遊戲)還真有著非常密切的關係;要不然,馮·諾依曼怎麼會無緣無故叫它「Game Theory」呢?那麼,博弈論的研究對象究竟是什麼呢?
  • 博弈論,又稱為對策論
    博弈論博弈論,又稱為對策論(Game Theory)、賽局理論等,既是現代數學的一個新分支,也是運籌學的一個重要學科。博弈論主要研究公式化了的激勵結構間的相互作用,是研究具有鬥爭或競爭性質現象的數學理論和方法。
  • 博弈論雜談:序幕
    這些年很多老闆都點我,讓我說博弈論,但是我真的不會,最近又有人點我,所以我打算給編出來,既然是編的,也就只能算作是「雜談」了。首先我們來看「博弈論」這個名字是怎麼來的,在英語中,博弈論被稱為Game Theory,直譯過來就是「遊戲理論」,這個直譯有點過於直白了,現在已經被遺棄。在臺灣地區,博弈論被翻譯成「賽局理論」,聽起來就和遊戲更為接近一些。
  • 《妙趣橫生博弈論》讓你真正對博弈論產生興趣的一本書
    有人的地方就有江湖,有江湖的地方就有博弈。書中通過用博弈論思維對大量的案例進行分析,使我們讀完後對博弈論會有深刻的理解。這本書之所以推薦,是因為看了本書後,我們會對博弈論產生強烈的興趣,興趣為師,有興趣就會關注,當人們持續關注一個問題時,那麼問題已經解決了90%。
  • 博弈論雜談:研究範式
    同時,博弈論也有兩大研究分支,這便是「非合作博弈論」與「合作博弈論」。十分粗略地看,非合作博弈論主要採取實然性研究範式,而合作博弈論主要採取應然性研究範式,當然了這種劃分極不嚴格,但是對於我們來說,這也足夠了,沒有必要較真。好了,現在問題就來了,什麼是非合作博弈論,什麼又是合作博弈論呢?
  • 博弈論,誰主沉浮?
    這是一部由博弈領域的兩位領軍人物——朱·弗登博格和讓·梯若爾編著的集大成之作,囊括了迄今為止除演化博弈之外的所有博弈論的理論和方法,代表了博弈論發展的最高水平。它不僅涵蓋了博弈論的方方面面,而且幾乎對每一個論題都給出了嚴密的數學推導和證明。《博弈論》具有以下幾個特點:第一,覆蓋面廣,幾乎涵蓋了博弈論的各個領域。
  • 讀書筆記 | 博弈論
    本書是「博弈論之父」馮·諾依曼的代表作,囊括了迄今為止除演化博弈之外的所有博弈論的理論和方法,代表了博弈論發展的高階水平。◆ 前言博弈論就是站在研究者的角度,充分考慮博弈各方所有可能的行動方案,並運用數學方法找出最合理的行動方案的一種理論或方法。
  • 什麼是博弈論與納什均衡
    納什均衡,從實質上說,是一種非合作博弈狀態。近代對於博弈論的研究,開始於策墨咯,波雷爾及馮-諾伊曼。1928年,馮-諾依曼證明了博弈論的基本原理,從而宣告了博弈論的正式誕生。1944年,馮-諾依曼和摩根斯坦共著的劃時代巨著《博弈論與經濟行為》將二人博弈推廣到n人博弈結構並將博弈論系統的應用於經濟領域,從而奠定了這一學科的基礎和理論體系。
  • 博弈論(Game Theory)| 知識
    還可以參見演化博弈理論(evolutionary game theory)和行為生態學(behavioral ecology)。博弈論也應用於數學的其他分支,如概率論、統計和線性規劃等。博弈論的發展博弈論思想古已有之,我國古代的《孫子兵法》就不僅是一部軍事著作,而且算是最早的一部博弈論專著。
  • 博弈論雜談:基本假設
    今天我們來點學術的話題,博弈論的基本假設。經典博弈論研究中的一個基本假設,就是參與人是完全理性的。什麼是完全理性?實話實說,學術界對此還沒有達成共識,這就讓我們很糾結了,因為對於博弈論來說,這是一個十分核心的問題。能不能搞清楚,這是學術大佬的事兒,我估計是搞不清楚了,但其實,這並不影響我們來了解博弈論。
  • 博弈論困境的一些解決路徑
    , 特別是社會學與博弈論的融合方式。並在此基礎之上提出了他的「社會博弈論」, 它表現為三個層次: 結構博弈、鑲嵌式博弈和「結構—博弈—功能主義」 模型。本文節選自該文第二部分《博弈論困境的一些解決路徑》。參考文獻和注釋省略。博弈論困境的一些解決路徑文/王水雄在過去的50 多年裡,博弈論逐漸成為經濟學的一種標準語言。
  • 重述博弈論的「道統」:簡·奧斯丁與經濟學
    所以,博弈論在普通人看來高不可攀,心生畏懼和崇敬,雖然看不懂,但是似乎很厲害的樣子。  通常對待自己不了解的事物有三種態度:好奇而去學習;完全置之不理;激烈反對和批評。博弈論在美國可能就遇到了很多第三種態度。因此,《簡·奧斯丁的謀略》第41頁開始,用一節篇幅回應了對博弈論的批評。其中有一種批評值得一提,因為它不是針對博弈論的假設或者邏輯,而是針對博弈論的起源和發展。
  • 博弈論基礎Game Theory Basics
    而當我們面對群體智能決策問題、要使多智能體系統具備更強大能力時,對博弈論的學習與應用必不可少。今天,小編為你整理了中科院自動化所張海峰副研究員講授的《博弈論基礎》課程,邀你一起了解人工智慧強化學習語境中的博弈論。
  • 對抗機器學習的博弈論方法
    這篇文章,我將與你分享如何將博弈論應用於對抗式機器學習。讀完這篇文章,你會學到:博弈論如何應用於機器學習?博弈論如何幫助解決對抗性學習問題?基於博弈論方法的一個例子讓我們從一個簡單的示例開始:垃圾郵件檢測。以下部分描述了W. Liu和S. Chawal為對抗性學習而開發的博弈理論模型(ieeexplore.ieee.org/document/5360532)。
  • 博弈論:為什麼交智商稅的總是你
    ——《博弈論,走向成功的必修課》。其實,運用好的知識可以用到我們生活的方方面面,例如博弈論。01博弈論是什麼?舉個例子,就拿博弈論中最著名的「囚徒困境」定理來說,該模型作為博弈論的經典試驗,為我們全面揭示了什麼是博弈論以及其中的幾個重點:假設有兩個自私的小偷A和B聯合犯事、私入民宅被警察抓住。
  • 博弈論:產品價格怎麼定才合適,賣的好?博弈論教你定價三步法
    這種與為了達成交易而與客戶產生的關係,事實上就是博弈論。在與客戶交流的過程中,本質上就是一場博弈。但很多人不清楚的是,雙方或多方博弈,結局不一定是兩敗俱傷或者輸贏皆有;博弈論中對此有三種博弈結局,分別是:負和博弈、零和博弈和共和博弈。
  • 高考志願填報與博弈論
    最近在讀萬維鋼老師著的《博弈論究竟是什麼》,可以說高考志願填報本質上同樣是一個典型的博弈論問題。 由此可見,考生填報志願時,既要考慮自己想上哪些高校,同時也要考慮其他學生的策略對自己錄取概率的影響,簡單來說,就是「你的計劃裡應該有他人的計劃」,這就是典型的博弈論問題, 和常見的博弈論問題類似,例如囚徒困境,高考志願填報的博弈的核心是根據其他參與者的策略,選擇最優的應對方式。
  • [趣味數學]從日常生活中看「博弈論」
    可以說,「博弈論」已經改變了經濟學的傳統輪廓線。從對「博弈論」簡要、通俗的介紹中可以發現,我們身邊充滿了博弈,或者說,我們身邊的許多行為、現象都可用博弈來概括。「博弈論」不僅屬於經濟學,也理應屬於社會學、政治學、心理學、歷史學等,這些學科也有理由分享「博弈論」那旖旎的學術風光和精細的分析技巧。
  • 博弈與信息(博弈論概論第4版)/經濟科學譯叢 艾裡克·拉斯穆
    私信小編,回覆:【4209】即可獲取)【最好的電子書下載網站】https://bestebookdownload.com/【網盤地址】https://590m.com/dir/14789250-38900555-6453cb本書可能是最成功的介紹博弈論的教科書
  • 博弈論常見模型初學筆記
    大家早安、午安、晚安,今天我先從機器學習的學習中休息一下,來了解一些常見的博弈論模型,然後繼續學習機器學習等。以下博弈論的介紹來自網絡。