博弈論雜談:基本假設

2021-02-19 回到2049

距2029年5月19日北京工體(鳥巢)

個人演唱會還有

知識就是力量,歡迎回到2049.

今天我們來點學術的話題,博弈論的基本假設。經典博弈論研究中的一個基本假設,就是參與人是完全理性的。什麼是完全理性?實話實說,學術界對此還沒有達成共識,這就讓我們很糾結了,因為對於博弈論來說,這是一個十分核心的問題。

能不能搞清楚,這是學術大佬的事兒,我估計是搞不清楚了,但其實,這並不影響我們來了解博弈論。簡單來說,完全理性指的就是參與人足夠聰明、擁有無窮的計算和推理能力,而且從來不會犯錯誤。而博弈論研究的主要範式,便是如果大家都這樣聰明,最終會出現一個怎樣的結果呢?比如說,我和黃博士、潘博士、張博士四個人分一個蛋糕,我們都足夠聰明,都會選擇最大的,那麼最終蛋糕會分成什麼樣呢?

在博弈論中,這個最終可能出現的結果就被稱為「納什均衡」。可見,所謂的納什均衡,就是這樣一種局面:對於每個人來說,如果其他人都不改變他們行為的話,那麼他自己也不願意改變自己的行為。一個球隊的薪金空間就那麼大,每個人都想要符合自己能力的最大的合同,老闆該怎麼辦?最終,他該如何分配薪金空間?當然了,每個人的選擇並不單一,比如說我現在去NBA,球隊可能願意一下給我5年合同,這就保證我此後五年的衣食無憂,那麼我願意5年拿1億美元,但是如果你只給我一年合同,那麼一年之後我還得找工作,說不定得來CBA了,那我就得多要一點了,比如一年3000萬美元。總之,直觀上看,一個均衡結果就是一個穩定的局面,一旦出現,就不會發生變化。

而博弈論的主要研究內容,正是這種均衡是否存在。納什認為,如果參與人的個數有限,且每個參與人的策略個數也有限的話,那麼均衡就一定存在,這個均衡被稱為「混合策略納什均衡」。當然了,什麼是混合策略,學術界目前的意見也不統一,但可以肯定的是,這種混合策略絕對不是隨機的,而是明確的。我就是5年1億,要麼就是1年3000萬,你自己均衡去吧。可見,納什均衡的存在是有條件的,並非在任何場合中都存在。

不過即便納什均衡是有條件的,我相信你現在也一定有一個疑問,那就是這個博弈論這不完全在這瞎扯淡麼?原因就在於,這個完全理性,別說人類永遠不可能擁有,甚至人類的理性就無法解釋什麼是完全理性,自己給自己做了個套,成為了活在套子裡的人。不僅人類,就算是1000年後的人工智慧,可能也無法擁有完全理性,這個概念實在太哲學了。那麼作為博弈論的基礎,完全理性假設是不是就荒謬呢?由此,博弈論也是很荒謬的呢?

事實上,這正是很多人批評甚至攻擊博弈論和理論經濟學的主要依據。不過,假設雖然是哲學化的,但並不意味著由此建立的理論就是無用的。也就是說,假設肯定不完美,但是絕對不荒謬。拋棄這個假設的研究非常有意義,但是基於這個假設的研究,也永遠不會過時。原因有兩點。

首先,我們不能簡單地以「假設是否符合現實」,來評價一個模型的好壞。因為不論何種理論,就算是牛頓和愛因斯坦的理論,創建這些理論的模型,也都只是現實世界的近似,你要等火箭跑出1/2光速,那估計相對論永遠不可能出現,因為沒有相對論,我估計火箭也跑不出來1/2光速。所以說,好的模型和假設,並非是對現實世界的扭曲,而是對現實世界的抽象,它可以幫助我們抓住所研究問題的主要矛盾,並拋開不重要的細節。而至於什麼是好的假設、什麼是壞的假設,對任何具體問題來說,這都是一件非常微妙的事情,並沒有統一或絕對的標準。就像著名統計學家喬治-鮑克斯所說:所有的模型都是錯誤的,但有些是有用的。完全理性模型正是這樣一種模型。

其次,理論研究除了可以用來解釋歷史、理解現在和預測未來以外,它還可以被作為基準比較對象。就比如說我,帥的一塌糊塗,對世界上絕大多數小妹妹來說,我都是可望而不可即的,基本上等同於一個哲學化的存在,但是你可以以我為標準,找一個差的不是那麼大男朋友還是很現實的。所以說,基於完全理性假設的模型,有時候可以對現實有非常好的逼近,這不假,更重要之處則在於,它永遠可以作為一個理想的基準比較對象,這就好比是在物理學中,我們經常假設物體存在於真空中一樣。真實的世界可以紛繁複雜、不斷變化和演進,但是基準比較對象卻可以簡單明了,且永遠不變,所以某些學者也說:理論模型要比現實更加真實。以上便是對完全理性模型的嘖嘖稱奇,excited!

當然了,在我們肯定完全理性模型的同時,也要看到不一樣的聲音。事實上,與完全理性相對的,在博弈論中,就有一個重要的研究方向,這就是「有限理性模型」,這一假設從上世紀90年代起,開始吸引了學術界的大量關注。這個方向的基本假設,就是人沒有那麼聰明、沒有那麼理性。不可否認,這是非常有意義的一個研究方向。但是,與完全理性一樣的是,什麼是有限理性,也沒人能說得清,事實上,沒有多少知識水平的我們也能感覺出來,這個有限理性要比完全理性更加含糊不清。原因很簡單,所有基於完全理性假設的模型,在本質上都是相通的,也就是說,其實只有一個完全理性模型。但是有限理性模型,卻顯然可以擁有非常非常多個,甚至是無數個。一個人哪方面理性?哪方面不理性?理性程度是百分之多少?不理性程度又是多大?你能說得清?反正我是不知道。所以,相較於有限理性模型,基於完美性和唯一性的完美理性模型,更具有現實指導意義。

最後,博弈論還有一個比較前沿的研究方向,叫做「行為博弈論」,這就有點像自然科學了,它主要是用實驗的辦法,來研究現實生活中人們進行各種博弈的時候,究竟會出現什麼結果。總的來看,行為博弈論的很多結果,與博弈論的分析有著很大的出入,它可以揭示現實中人們決策的真實規律,這當然非常有意義,但是,我們並不能用這些實驗結果,來簡單否定依靠完全理性模型所得出的結論。所以當你再聽說某人的實驗結果,推翻了經典博弈論的預測,那他不是一派胡言,就是想搞一個大新聞。

事實上,對於經典博弈論來說,預測只是它的幾個功能中,最不重要、最不能當真的一個,而且很多的實驗控制也不能做到非常嚴格。即便它能做到,也足夠使我們信服經典結論不符合現實,但作為基準比較對象,完全理性模型也仍然有其永遠存在、永遠值得研究的價值。

總之,完全理性模型、有限理性模型與行為博弈論,是三個各有所長並相互補充的研究方向,它們都有其存在的價值與意義,沒有簡單的誰對誰錯、誰好誰壞之分。小孩子才考慮對錯,成年人全都要。

如果真就只能選一個,那麼還要選完全理性模型,因為它不畏懼人類變得越來越聰明,恰恰相反,它還十分希望這一天早日到來,也就是說,隨著時間的流逝,它只會變得越來越正確,它具有所謂的「自我應驗性」。反過來,對於有限理性模型與行為博弈論,隨著我們知識水平的不斷提高和人生經驗的繼續豐富,我們今天發現的規律,到了明天可能就一文不值了,隨著時間的流逝,它會變得越來越不靠譜,也就是具有某種「反自我應驗性」。所以,如果你相信人類會越來越聰明,信息傳播會越來越通暢,那麼完全理性模型就是墜吼的。

請看下集《博弈論雜談:研究範式》。

相關焦點

  • 博弈論雜談:序幕
    這些年很多老闆都點我,讓我說博弈論,但是我真的不會,最近又有人點我,所以我打算給編出來,既然是編的,也就只能算作是「雜談」了。首先我們來看「博弈論」這個名字是怎麼來的,在英語中,博弈論被稱為Game Theory,直譯過來就是「遊戲理論」,這個直譯有點過於直白了,現在已經被遺棄。在臺灣地區,博弈論被翻譯成「賽局理論」,聽起來就和遊戲更為接近一些。
  • 博弈論雜談:研究範式
    同時,博弈論也有兩大研究分支,這便是「非合作博弈論」與「合作博弈論」。十分粗略地看,非合作博弈論主要採取實然性研究範式,而合作博弈論主要採取應然性研究範式,當然了這種劃分極不嚴格,但是對於我們來說,這也足夠了,沒有必要較真。好了,現在問題就來了,什麼是非合作博弈論,什麼又是合作博弈論呢?
  • 漫談博弈論
    而臺灣地區譯成「賽局理論」,聽起來跟遊戲更接近了,但是容易讓人聯想到「田忌賽馬」,我覺得是一個比較糟糕的譯名。至於為什麼說「容易讓人聯想到『田忌賽馬』的譯名就不太合適」,後面我們還會說到。此外,「對策論」這個譯名,也在內地大量使用。比如,國內博弈論研究的一個重要學術組織就叫「中國運籌學會對策論分會」。
  • 博弈論
    博弈論主要研究公式化了的激勵結構間的相互作用。是研究具有鬥爭或競爭性質現象的數學理論和方法。 博弈論考慮遊戲中的個體的預測行為和實際行為,並研究它們的優化策略。生物學家使用博弈理論來理解和預測進化論的某些結果。博弈論已經成為經濟學的標準分析工具之一。在生物學、經濟學、國際關係、計算機科學、政治學、軍事戰略和其他很多學科都有廣泛的應用。
  • 博弈論,又稱為對策論
    博弈論思想古已有之,中國古代的《孫子兵法》等著作就不僅是一部軍事著作,而且算是最早的一部博弈論著作。博弈論最初主要研究象棋、橋牌、賭博中的勝負問題,人們對博弈局勢的把握只停留在經驗上,沒有向理論化發展。博弈論考慮遊戲中的個體的預測行為和實際行為,並研究它們的優化策略。
  • 什麼是博弈論與納什均衡
    也是運籌學的一個重要學科。博弈論考慮遊戲中的個體的預測行為和實際行為,並研究它們的優化策略。納什均衡:又稱為非合作博弈均衡,是博弈論的一個重要術語,以約翰-納什命名。假設有n人局中人參與博弈,給定其他人策略的條件下,每個局中人選擇自己的最優策略(個人最優策略可能依賴於也可能不依賴於他人的戰略),從而使自己利益最大化。所有局中人策略構成一個策略組合。
  • 博弈論困境的一些解決路徑
    序數論革命之後,當今微觀經濟學的前提假設已經越來越建立在行為人稟賦的一組最基本的、容易作真實性檢驗的假定之上, 越來越脫出微分最大化的傳統,這與博弈論帶來的影響不無關係。比較典型地, 如: 安德魯•馬斯—科萊爾、麥可•D•溫斯頓、傑裡•R•格林的《微觀經濟學》。不過,隨著博弈論方法和理論模式在與社會科學融合的過程中, 仍然存在一定的困境。
  • 高考志願填報與博弈論
    最近在讀萬維鋼老師著的《博弈論究竟是什麼》,可以說高考志願填報本質上同樣是一個典型的博弈論問題。 由此可見,考生填報志願時,既要考慮自己想上哪些高校,同時也要考慮其他學生的策略對自己錄取概率的影響,簡單來說,就是「你的計劃裡應該有他人的計劃」,這就是典型的博弈論問題, 和常見的博弈論問題類似,例如囚徒困境,高考志願填報的博弈的核心是根據其他參與者的策略,選擇最優的應對方式。
  • 博弈論(Game Theory)| 知識
    博弈論的基本概念博弈要素:(1)局中人(players):在一場競賽或博弈中,每一個有決策權的參與者成為一個局中人。只有兩個局中人的博弈現象稱為「兩人博弈」,而多於兩個局中人的博弈稱為 「多人博弈」。博弈論的意義博弈論的研究方法和其他許多利用數學工具研究社會經濟現象的學科一樣,都是從複雜的現象中抽象出基本的元素,對這些元素構成的數學模型進行分析,而後逐步引入對其形勢產生影響的其他因素,從而分析其結果。基於不同抽象水平,形成三種博弈表述方式,標準型、擴展型和特徵函數型,利用這三種表述形式,可以研究形形色色的問題。
  • 讀書筆記 | 博弈論
    本書是「博弈論之父」馮·諾依曼的代表作,囊括了迄今為止除演化博弈之外的所有博弈論的理論和方法,代表了博弈論發展的高階水平。◆ 前言博弈論就是站在研究者的角度,充分考慮博弈各方所有可能的行動方案,並運用數學方法找出最合理的行動方案的一種理論或方法。
  • 對抗機器學習的博弈論方法
    這篇文章,我將與你分享如何將博弈論應用於對抗式機器學習。讀完這篇文章,你會學到:博弈論如何應用於機器學習?博弈論如何幫助解決對抗性學習問題?基於博弈論方法的一個例子讓我們從一個簡單的示例開始:垃圾郵件檢測。以下部分描述了W. Liu和S. Chawal為對抗性學習而開發的博弈理論模型(ieeexplore.ieee.org/document/5360532)。
  • 博弈論:為什麼交智商稅的總是你
    ——《博弈論,走向成功的必修課》。其實,運用好的知識可以用到我們生活的方方面面,例如博弈論。01博弈論是什麼?舉個例子,就拿博弈論中最著名的「囚徒困境」定理來說,該模型作為博弈論的經典試驗,為我們全面揭示了什麼是博弈論以及其中的幾個重點:假設有兩個自私的小偷A和B聯合犯事、私入民宅被警察抓住。
  • 博弈論中的幾個經典案例
    博弈論(Game Theory),亦名「對策論」、「賽局理論」,屬應用數學的一個分支, 博弈論已經成為經濟學的標準分析工具之一。
  • 博弈論,誰主沉浮?
    這是一部由博弈領域的兩位領軍人物——朱·弗登博格和讓·梯若爾編著的集大成之作,囊括了迄今為止除演化博弈之外的所有博弈論的理論和方法,代表了博弈論發展的最高水平。它不僅涵蓋了博弈論的方方面面,而且幾乎對每一個論題都給出了嚴密的數學推導和證明。《博弈論》具有以下幾個特點:第一,覆蓋面廣,幾乎涵蓋了博弈論的各個領域。
  • 坤鵬論:博弈論給你講個關於股市的故事
    ——坤鵬論今天是股票故事會第三場,是階段性的最後一場。同時,這篇文章也是坤鵬論未來對博弈論介紹的開篇引子。在股市中基本分兩種投資:一種是投入資金於資產,它就是投資,投資就是和企業共同成長,分享企業增長的利潤。一種是投入資金於機會,它就是投機,投機就是博弈,越是短期交易,越應該懂博弈論。
  • 謝丹:礦機的數學博弈論 如何實現帕累託最優
    加密貨幣的挖礦是一個新興的行業,其產業鏈短、技術立足的特點使得礦機定價是一個很奇妙的博弈:定價高了,礦機商賣不出去;定價低了,礦場賺了大部分錢。其實礦場中礦機本身的運營,也是需要數學博弈論在後面支撐的。挖礦主要的數學模型關注的就是幾個:幣價、算力、算力功耗。
  • 重述博弈論的「道統」:簡·奧斯丁與經濟學
    所以,博弈論在普通人看來高不可攀,心生畏懼和崇敬,雖然看不懂,但是似乎很厲害的樣子。  通常對待自己不了解的事物有三種態度:好奇而去學習;完全置之不理;激烈反對和批評。博弈論在美國可能就遇到了很多第三種態度。因此,《簡·奧斯丁的謀略》第41頁開始,用一節篇幅回應了對博弈論的批評。其中有一種批評值得一提,因為它不是針對博弈論的假設或者邏輯,而是針對博弈論的起源和發展。
  • 博弈論基礎Game Theory Basics
    而當我們面對群體智能決策問題、要使多智能體系統具備更強大能力時,對博弈論的學習與應用必不可少。今天,小編為你整理了中科院自動化所張海峰副研究員講授的《博弈論基礎》課程,邀你一起了解人工智慧強化學習語境中的博弈論。
  • 《妙趣橫生博弈論》讓你真正對博弈論產生興趣的一本書
    有人的地方就有江湖,有江湖的地方就有博弈。書中通過用博弈論思維對大量的案例進行分析,使我們讀完後對博弈論會有深刻的理解。這本書之所以推薦,是因為看了本書後,我們會對博弈論產生強烈的興趣,興趣為師,有興趣就會關注,當人們持續關注一個問題時,那麼問題已經解決了90%。
  • 博弈論中的「囚徒困境」是什麼意思?
    那麼,博弈論中的「囚徒困境」到底是什麼意思呢?且聽小編為大家解惑。關於博弈論之「囚徒困境」,網絡上流傳著這樣一則故事,故事的版本很多,但大體意思相同。可以做出假設,要是乙方選擇沉默,甲方只承認自己犯了盜竊罪,且檢舉乙方殺了富翁,根據檢察官的交易原則,甲方被無罪釋放,則甲方會選擇背叛;要是乙方檢舉甲方不僅偷了富翁家的東西還把富翁殺害了,甲方只有在指控乙方殺了富翁的情況下才能被判刑短期,則甲方會選擇背叛。