【維言送聽】好的納什均衡和壞的納什均衡

2021-02-15 經濟學原理

好的納什均衡和壞的納什均衡


張維迎

謝謝主持人。主持人已經提到了,一個多月前,一位重要的博弈論大師約翰·納什去世了,由此引起了很多人對博弈論的更大興趣。之所以用《博弈與社會》這個題目是因為沒想到更合適的,我今天要講的主要內容是簡單給大家概括一下我認為有意思的東西。當然,一個多小時的時間也不可能講太多,而且我希望能夠給大家留些時間去提問題。

1納什和博弈論如何變革了經濟學 ?

首先我們來看經濟學由於納什或納什均衡發生的革命性變化。在古希臘時代,經濟學是道德哲學的一部分。我們知道,亞當·斯密創立了現代經濟學,但他的第一本書是《道德情操論》,斯密本人是格拉斯哥大學的倫理學教授。在斯密之後,納什之前,經濟學被簡單地理解為有關物質財富的生產和配置的理論。

在納什之後,經濟學研究擴展到了社會制度中的激勵理論,或者簡單說經濟學研究的是制度和激勵問題。經濟學關注資源配置理論的時候,主要的研究對象就是財富如何生產,如何分配。當經濟學關心一般的社會制度和激勵機制時,關注的核心就是人與人之間的相互合作。在這樣一個轉變中,納什均衡的提出發揮了革命性作用。

我們再往前看以資源配置理論為核心的傳統經濟學,這個經濟學的核心就是價格理論。我們過去說,懂不懂經濟學就看你懂不懂價格理論。比亞當·斯密更早的人,如威廉·配第(William Petty)這些人研究經濟學,他們更喜歡用數學方式,用線性代數的方式分析問題。用這種方式分析問題最容易分析的就是物質財富,因為物質財富在物理上有一個量,從貨幣的角度看也有一個量。

物質財富生產特別適用於定量分析法,所以新古典經濟學也越來越轉向研究物質財富的生產和分配。在這個理論中,每個人決策時面臨的是非人格化參數。我在決定買什麼不買什麼,或者找這個工作還是那個工作時,我有一個偏好,剩下就是各種參數,比如價格參數,蘋果或桃的價格啦,工資的多少啦,我不需要考慮其他人的想法。

但是我們知道,社會關係是人與人之間的關係。在新古典經濟學中,我們假定市場中,人與人之間的關係完全通過價格來體現,或者說價格是一個參數,對所有人都一樣,每個消費者都有自己的最優選擇,然後就形成需求函數;每個生產者有自己利潤最大化的選擇,於是就形成供給函數。在市場當中,似乎總有一隻無形之手來讓需求和供給相等,於是達到了所謂的均衡,這就是傳統經濟學的基本理論。

所謂均衡,在傳統經濟學裡是指價格處於這樣的狀態:需求等於供給,每個消費者達到效用最大,每個生產者達到利潤最大。在均衡狀態下是沒有經濟利潤的,所有的收益都是成本。如果大家記得經濟學思維中的成本是指機會成本的話,均衡情況下就沒有利潤。這是我們傳統的經濟學思維。這種思維進一步簡化就變成了成本-收益分析,或者叫供求分析。薩繆爾森的書裡有一句話:「只要會說需求和供給,鸚鵡都能變成經濟學家。」這是傳統的經濟學。

經濟學家在發展出了這套非常成熟的價格理論之後,做出的數學模型確實非常完美,非常漂亮。將這些理論應用於分析其他社會問題,我們一般叫做理性選擇理論。但當我們這樣去分析社會問題時,就會面臨很多困難。其中一個困難就是大量的經濟行為其實是沒有價格的。最簡單的例子,政治談判和競選就沒有價格,這裡的沒有價格是指沒有用貨幣表示的價格。

另外,人們在實際行為中關心的不僅僅是物質利益,比如我找工作並不是只關心工資,我還關心其他的東西,如工作環境、對我未來職業選擇的影響,還有這個職業的社會聲譽,等等。有些職業的工資可能不高,但是它使我們有成就感,比如媒體。媒體的工資不算高,但是為什麼好多人願意做呢?它有著很高的成就感。我們通過媒體知道每天發生的事情,媒體人往往有另外一種追求,而不只是為了賺錢。經濟學家其實也是這樣。這個是傳統經濟學難以分析的。

還有,人在決策當中,面臨的不一定只是非人格化的參數,還面臨其他人的決策。有時候,我做還是不做某件事,依賴於你做還是不做;或者我願意選擇什麼,依賴於你會選擇什麼,而不是簡單的只面臨一個價格或收入等非人格化參數。

舉一個例子,兩個人討價還價,在這個過程,我出什麼樣的策略,我的價碼是多少,依賴於我判斷你的價碼是多少,而不是說我通過一個確定的價格參數來機械性地選擇。即便應用於最簡單的例子——去地攤上買東西,傳統價格理論的局限還是很大。

傳統經濟學假定,一個生產者在決策時,首先要要素價格給定,產品價格給定,然後最小化成本,選擇最優生產組合,再選擇最優產量。假定中產品價格是給定的,但競爭中並非如此。

比如寡頭企業決策時,價格不是給定的,價格多少不僅取決於他,還取決于于對方。這時傳統的價格理論就沒有辦法分析。這點也說明,為什麼我們現在要把寡頭競爭的博弈論模型追溯到年法國數學家古諾1838年做出的分析,他是第一個真正用數學模型分析寡頭競爭的人,而不局限於一個我們所謂的完全競爭市場。

當然了,這些局限性並沒有阻礙經濟學家試圖把傳統價格理論應用於非經濟問題的研究,這方面的典型是諾貝爾經濟學獎得主、芝加哥大學教授加裡·貝克爾(Gary Becker),他試圖用經濟學分析方法去分析所有的人類行為問題。另外我們知道,法經濟學也是試圖用成本-收益方法來闡述法律制度。

現在來看,這些研究總體上並不令人滿意,這時就迫切需要一種新的更為一般化的分析方法來克服剛才講的價格理論的缺陷:它可以分析非價格、非物質的東西,可以分析人與人之間的相互關係或互動情況,這個理論就是博弈論。

在納什之前,也有其他的經濟學家提出過類似理論,比較有名的像剛才講的古諾,像計算機的發明人馮·諾依曼,還有他的合作者摩根斯特恩(Oskar Morgenstern),但博弈論真正成型還要歸功於納什。所以一般我們認為,非合作博弈的創始人就是納什,他把之前已經發展出來的理論組裝起來。納什對博弈論的貢獻,某種意義上就像亞當·斯密對經濟學的貢獻,在斯密之前也有好多經濟學理論,亞當·斯密第一個把它們組成為系統理論。

馮·諾依曼(John von Neumann,1903~1957)

我們知道,納什發展出的最重要的概念就是納什均衡。我在這裡稍微給大家介紹一下。首先我要糾正一點,一般我們講的博弈論就是非合作博弈論,但在中文裡特別容易誤解,讓人覺得非合作博弈是研究人怎麼不合作的。事實不是這樣,非合作博弈研究的是每個人獨立決策的結果會是什麼樣。我們恰恰是希望用非合作博弈理論來解釋人們為什麼不合作,只有搞明白了為什麼不合作,才能更好促進合作。

先來給大家做一個簡單概述,什麼叫博弈論。博弈論指的是研究人與人之間行為互動的一般理論。所謂社會,就是互動。很多經濟學家對博弈論的應用範圍評價極高,比如諾貝爾獎得主奧曼(Robert Aumann)。另外一個經濟學家哈特(Sergiu Hart)在文章裡說,博弈論可以視為整個社會科學理性一脈的總括。我們研究的人的行為有理性的有非理性的,博弈論為理性行為分析提供了一個統一場理論。

這裡我們講的社會,可以廣泛地理解,既包括人類個體組成的社會,也包括其他各種個體組成的群體,比如公司、國家,動物、植物、計算機這些都可以應用博弈論分析。我們研究國家之間的關係,研究中央政府和地方政府的關係,都符合我們講的社會範疇。

博弈論不像經濟學或政治科學等學科其他分析工具那樣,採取不同的就事論事的框架,來對各種具體問題進行分析,如完全競爭、寡頭、壟斷、國際貿易、稅收、選舉、遏制,還有動物行為等等;相反,博弈論是先提出一些一般的原理,這些原理適用於所有互動的情況,然後考察這些方法具體應用會產生何種結果。

博弈論為我們分析整個社會變化和社會結構提供了一個微觀基礎。曾獲得諾貝爾經濟學獎的邁爾森(Roger Myerson)教授曾說,發現納什均衡的意義可以和生命科學中發現DNA雙螺旋結構的意義相媲美,納什構造了經濟分析新語言的基本詞彙。另一位經濟學家這樣認為,越來越多地,博弈論語言變成了經濟學語言,純理論指的就是博弈論,我們現在講的社會科學的純理論就是指博弈論。這種評價是相當高的,但並沒有言過其實。

有了這樣的理論,所以在納什之後,我們的經濟分析不再是簡單的資源配置理論,不再是簡單的價格理論,而是可以分析各種各樣的制度的理論,包括市場制度。傳統經濟學只分析市場制度,我們現在要分析大量的非市場制度;傳統的經濟學只分析物質生產和分配,我們現在不僅分析物質的,也分析非物質的,不僅分析經濟問題,也分析社會、政治、文化問題以及它們之間的相互關係。我們還可以分析制度是怎麼演化的,這個傳統經濟學沒有辦法分析,有了博弈論之後,制度演進分析變得容易。

所以博弈論使得經濟學發生了根本性轉型,也正在使得其他社會科學發生這種轉型,包括政治科學,包括法律,甚至包括最基礎的像心理學,社會學等等,包括對動物的研究,動物學,都在發生一些重要的變化。

我講的一個基本問題是,從博弈論或者以納什劃分為界,納什之前和納什之後,經濟學是很不一樣的。現在大學教科書裡邊,基本的經濟學原理主要是資源配置理論或價格理論,這個過去叫微觀經濟學。博弈論作為單拎出的一部分,有些教科書會把它放進去,但是並不是所有都放進去,放進去的份量非常有限,比如曼昆(Gregory Mankiw)的教科書《經濟學原理(微觀部分)》有一點博弈論的內容,但是大部分內容仍然是以傳統價格理論為主。

2納什均衡的制度意義

接下來稍微給大家介紹一下納什均衡,為什麼這個均衡如此重要,如此有意義。簡單地說,納什均衡是一種分析和預測互動情況下理性人行為的概念工具,我們假定人們是理性的,然後在相互作用的情況下,研究他們會有的行為和後果。

約翰·納什(John Nash,1928-2015)

我們先從預測人的行為說起。在傳統經濟學的價格理論裡,一個人的效用函數依賴於自己的選擇,比如你買了幾個蘋果,買了幾個梨,對你的效用產生了怎樣的影響。在博弈論裡,一開始就改變了這個效用函數,一般講我們消費者的偏好,不僅依賴於你的行為,而且依賴於別人的行為,所以在這裡我們看到的跟傳統經濟學不一樣,第一要看到自己的行為,第二還要看別人的行為,別人可能是一個人,也可能是好多人,可能是N個人,這是非常重要的一點。

我們假定每個人都是獨立做出決策,然後來研究什麼樣的結果最可能出現。納什均衡就是這樣最可能出現的結果,或者說最可能出現的一種策略或者策略組合,每個人都根據自己情況選做出最優選擇,如果一個策略或者一個行動選擇變成納什均衡,意味著什麼?意味著給定別人的選擇,沒有任何人有積極性改變自己的選擇。舉例來說,今天晚上在這裡,每個人來的時候都要選擇自己的座位,我們現在都已經各自坐好,你可以說我們現在就是納什均衡,因為沒有人有積極性跑到另外一個地方去。

現在我們把納什均衡理解為一種制度安排來思考一下。如果一個制度是納什均衡意味著什麼?意味著所有人都要遵守它;反過來說如果一個制度不是納什均衡,至少有一部分人不會遵守它,也可能所有人都不遵守它。這就是為什麼納什均衡對我們分析社會制度和制度演化如此重要的一個原因。我這樣講比較抽象,下面我們會用簡單的例子說明這點。

首先,納什均衡是沒有價值判斷的,它不告訴你這個制度安排是好還是不好,它只告訴你如果每個人都選擇自己認為的最優行為,會造成什麼樣的結果。當然了,如果我們主觀上給納什均衡本身加一個價值判斷的話,可能有好的納什均衡,也有不好的納什均衡。什麼叫好的納什均衡什麼叫不好的納什均衡,依賴於我們用什麼標準衡量。傳統的經濟學裡我們會用社會福利函數,或者帕累託效率標準來衡量,如果這個制度達不到帕累託均衡,我們說這是不好的,達到了就是好的。

我想,衡量好還是不好,更一般的標準就是合作。為什麼這樣講呢?因為人類的所有進步,每個人利益的改善都來自相互的合作。所以什麼叫好的納什均衡?如果這個納什均衡達到了一個合作的目的,合作是納什均衡,我們就說這是好的納什均衡,否則就是壞的納什均衡。我們先從壞的納什均衡講起,如果學了一點博弈論就知道,這是教科書上常提的囚徒困境。為了下面要講的內容,我稍微為大家複習一下。

假如兩個人組成的社會,每個人都有兩個選擇,可以選擇合作,也可以選擇不合作。當然了,這個概念可以作為一般應用,也可以理解為在團隊中的努力還是不努力,合作是努力,不合作是不努力。你也可以講合作就是誠實,不合作就是欺騙。為了方便簡潔我們簡單地用合作和不合作。這樣的話,每個人最終會得到什麼,不僅依賴於你選擇合作或不合作,還依賴於別人的選擇。

在兩個人情況下,有四種可能性:第一種兩個人都合作;第二種兩個人都不合作;第三種是第一個人合作,第二個人不合作;第四種第一個不合作,第二個人合作。對應這四種可能性,每個人的報酬,或者說叫效用,或者博弈論中叫支付,是不一樣的。我們先從個人講起,因為博弈論是從個人的決策開始的,先要研究對單個人來講,什麼是最好的。

在這個案例裡面,對單個人來說最好就是別人合作,他不合作,他就賺便宜了。比如別人好好幹活,你偷懶,你分享別人的成果,你賺了;其次是兩個人都合作;再其次是兩個人都不合作;最糟糕的是你合作,別人不合作,你被別人騙了。凡是滿足這樣一個條件的,都叫囚徒困境。

圖1:囚徒困境

圖1用具體的數值描述了這個博弈。在這裡,從A的角度來看,如果B合作,他不合作,他得到4;其次是兩個人都合作,他得到3;再其次是兩個人都不合作,他得到0;最糟糕是什麼?他合作, B不合作,結果他得到-1。圖一裡邊的第一個數字代表第一個人的報酬,第二個代表第二個人的報酬,這是表述的慣例。

我們看到,如果是這樣情況,每個人出於自己的利益選擇,他會選擇什麼呢?從A的角度出發,如果B合作,他最好是不合作,他得到4;如果B不合作,他合作的話就虧了,不合作是0,所以從他的利益出發,最好選擇不合作。從B的角度講也是一樣,所以每個人的最優選擇都是不合作,結果是每個人都得到0。而我們作為局外人,明明看到這樣更好:如果兩個人都合作得到3。這就是我們過去講的個人理性與集體理性的矛盾,這就是囚徒困境的意思。

兩人都不合作的納什均衡顯然是壞的均衡,從這裡我們就可以體會到制度的意義。一個制度其實是某種遊戲規則,實際上就是博弈規則,這就是制度的含義。它不僅在影響人的行為,還決定著什麼樣的納什均衡會出現。什麼叫好的制度?好的制度就是能使得合作變成納什均衡的制度;反過來,壞的制度就是使得不合作變成納什均衡的制度。在剛才這個例子當中,我們可以設想這也許就是人民公社制度,大家吃大鍋飯,誰好好幹活誰吃虧,誰耍奸誰得到好處,最後結果是大家沒飯吃。

圖2:包產到戶下的納什均衡

我們現在看制度改變起什麼意義?假如人民公社變成包產到戶,在包產到戶的情況下,你賺不了別人的便宜,你只能吃自己地上打的糧食。以前,如果農民兩人都合作,每人可以得到3,倆人都不合作,得到0。現在就變化了,如果第一個農民A努力,第二個人偷懶的話,農民A自家能拿到3,B只能拿到0;反過來說,如果B努力,A偷懶的話,A只能得到0,B得到3。你看,在這樣的制度下,納什均衡是大家都會合作。

從A來講,不管B合不合作,我自己一定會好好幹活,B最後選擇也是好好幹活。結果就從前面壞的納什均衡變成了好的納什均衡,即合作的納什均衡,這就是我們講的制度的意義:制度影響納什均衡,一個好的制度鼓勵人們合作,一個不好的制度使大家不合作。

但我們馬上遇到一個問題了,農業是由於生產落後,不需要實際上物理上的合作,每個人自己種自己的地就好。當然,互助組合作社之類的我們先不講它。但是,任何一個工業企業不可能分成個體生產,如果你把一個大企業分成一個個個體戶的話,公司的價值就沒有了,我們需要這個公司本身就是因為它可以創造出單個人創造不出的東西,也就是說N個人放在一塊創造的價值大於每個人創造的價值乘以N,這才是我們需要團隊的原因。所以我剛才這個例子,並不能完全概括我們面臨的問題。

圖3:私有產權下的納什均衡

如果在集體當中,囚徒困境一定會存在的話,怎麼解決它?現在來看,私有產權就能解決它。

這裡的私有產權可以這樣設想,還是一個博弈,如果現在企業有一個老闆,一個僱員,老闆合作,僱員也合作的話,每個人得到3;如果老闆合作,僱員不合作的話,老闆就可以處罰僱員,僱員只能得到0,老闆還能得到2;如果僱員合作,老闆不合作的話,老闆照樣付僱員3的工資,老闆就虧了。從這裡可以發現,一個人幹活只能創造2的價值,兩個人幹活可以創造6的價值,於是企業的價值就出現了。這時候,僱員和老闆都會選擇合作,如圖3所示。

所以,在有了私有產權的博弈當中,我們看到合作就變成一個納什均衡了。為什麼現代企業制度能夠出現並且持續存在,即便它有好多諸如偷懶這些問題,就是因為有私有產權制度,簡單說有老闆。如果一個企業沒有老闆就會變成囚徒困境博弈,納什均衡就是沒人合作,這就是國有企業的問題。如果一個企業有老闆了,那就改變了制度,改變了遊戲規則,合作就變成了納什均衡。這就是前面講的制度的意義。

再進一步,一方面人們是在給定博弈規則的情況下做出選擇,我們可以預測納什均衡是什麼;另一方面,納什均衡本身可以反過來分析遊戲規則本身,因為遊戲規則也是人類博弈的結果,它不是由一個外在力量給我們強加的,哪怕計劃經濟也是人類博弈的結果。當然在這個結果當中,可能我們發現我們犯了錯誤,我們可能會改正它。我現在要跟大家介紹一下,好多情況下,我們可以用納什均衡理解制度本身,甚至分析制度的演化。

17世紀有本很重要的書——霍布斯(Thomas Hobbes)的《利維坦》,《利維坦》描述了一個沒有政府的自然世界裡充斥著人與人之間的戰爭,即所謂叢林規則。叢林規則就是我們剛才講的囚徒困境。霍布斯認為,為了走出叢林規則,我們就需要一個政府,有了這個政府以後,我們有一個統一的意志,強加一個統一的規則,不能通過傷害別人得到好處,結果對所有人都好。

霍布斯的這個解釋從博弈論角度看,就是通過設立政府使一個社會走出了囚徒困境,變得可以合作,這是他最早分析制度的含義。儘管他本身並沒有用博弈論的概念,但現在我們完全可以用納什均衡的理論去理解它。

我們來把一般的制度框架概括一下。我剛才講的制度就是遊戲規則,我們分析制度要看制度是怎麼產生的,是怎麼執行的,這是兩個最重要的維度。無論產生還是執行,都有兩種類型,一個是分散的,或者非專業化的;另外一個是集中的、專業化的。分散的、非專業化的就是我們社會當中自發的從上到下,集中的、專業化叫從下到上。

如果這樣,我們就看到有四種可能的制度,第一種制度無論是產生還是執行,都是分散出現的,你不知道誰設計的它,你也找不到有專門的人去執行它,這個就叫做社會規範;第二種,無論它的產生還是執行,都是有集中的、專業化的機構做的,這個我們叫法律,或者立法,我們有專門的立法機關來造法,在中國是全國人大,也有專門的機構來執行它,包括警察,法院。

但是一般的社會規範,我們找不到誰製造了它,我們不知道誰執行它,在人類長期歷史演化中每個人都可以執行,每個人都可以不執行。你看到一些違反社會規範的行為,你可以譴責,你也可以睜一隻眼閉一隻眼。總之,我們最重要的遊戲規則,就是社會規範和法律。

另外在介於這兩者之間的還有其他類型,一類的產生是自發的,分散的,非專業化的。但是它的執行有一定的專業化,比如英國的習慣法。習慣法不是任何一個機構制定的,但是它是法院執行的。

我們中國傳統的「禮」,可能介於社會規範和立法之間。「禮」不是政府制定的,但另一方面,大家覺得好像是儒家制定的「禮」,儒家是一批專業化的人才。在禮的執行當中,既有分散的,如大量的「禮」是民間執行的,也有一部分得到了法律的認可,比如縣太爺在判案的時候,傳統的「禮」是判案的依據。所以它介於這法律和社會規範二者之間。

我們還可以更多地細分,我們的社會制度或者遊戲規則簡單地說就是這樣一些東西,都可以歸結這幾類,包括我們的文化也可以說是社會規範。

3社會規則的基本功能:激勵與協調

下面我簡單給大家分析一下社會規則的基本功能。這裡要講的有些是在某種制度情況下人們如何行為,有些是這些制度本身是如何形成的。我大體歸結了人類所有的制度、遊戲規則的四大作用:第一是激勵功能,提供正確的激勵,當然也可能是錯誤的激勵;第二是協調功能;第三是承諾功能;第四是信號功能。

圖4:作為激勵機制的社會規範或法律

先看一下激勵功能。剛才已經談到的私有財產制度就有激勵功能,包產到戶就是激勵機制。現在更一般的來講,在博弈當中,如果沒有這些遊戲規則的話,我們得到就是不好的納什均衡。法律是來幹什麼得呢?如圖4,假如說合作是一個合同,我們大家都要合作,如果你不合作的話,你直接得到4,但這個時候你要受到一點懲罰,就是y(或x),從你的所得中減去,因為你違反了合同,要補償人家。

我們先假定不去考慮圖中的a和b。只有這個懲罰y和x足夠大,人們才可能去合作。在這裡,只要y大於1,x大於1,當你預計你不合作之後,帶來的好處要扣除你要承擔的懲罰,你覺得不如合作的話,你就會選擇合作。這個時候這種法律就可能使得合作成為納什均衡。

社會規範也一樣,社會規範不像法律那麼有強制性,但就像我剛才講的,我們人不只重視物質的東西,也重視非物質的東西,當別人鄙視你的時候,你會有不愉快的感覺。比如,你看到別人的東西,你抓過來自己吃,人家不打你,甚至罵都不罵你,人家只瞪你一眼,你會有什麼感覺?你心裡會有點不舒服,這就是一種成本。如果有了規範,所有人都要遵守這個規範,你違反這個規範的話,就相當於你要付出一種成本。

這個成本多大?在這裡要看人的臉皮薄厚,如果這個人的臉皮很薄,意味著a或b很大,這樣的話,別人瞪你一眼你就很痛苦,一晚上睡不著覺。但如果你這個人臉皮厚的話,那你可能不在乎這個東西,這就意味著a或b很低,社會規範對你起不到懲罰作用。

一個社會規範要發揮激勵機制的功能,它一定要使得這個懲罰像剛才講的法律一樣,達到一定的程度。當然,對每個人來說,a和b的大小,依賴於社會規範得到普遍遵守程度。如果這種規範大家都違反的話,就沒人覺得是一種懲罰了,如果所有人都違反規範的話,意味著每個人臉皮都會變厚。

以腐敗為例,如果這個社會只有少數腐敗分子的話,一個腐敗分子被揭露出來,他就抬不起頭來,即使不用使用法律對他懲罰,他的同事,他的朋友,都看不起他,他就不敢怎麼腐敗。但是如果這個社會腐敗普遍,任何一個腐敗官員被揭露出來以後,都不覺得有什麼,不會受到聲譽上道德上的譴責。

本來一個人幹了壞事,有兩個東西懲罰他,一個是法律,另一個是社會聲譽。現在在中國情況下,因為腐敗太普遍了,所以聲譽機制不太起到約束作用,只能靠法律,這就是為什麼監管就變得越來越難的原因。好多腐敗官員被審判的時候都是一臉無辜的樣子,好多觀眾也覺得他怎麼這麼倒黴。我沒時間分析更深的東西,我只是說,在這裡邊a或者b究竟多大,它有一個均衡,這個均衡依賴於遵守或違反法律和社會規範的普遍性。

像我們國家社會問題就非常嚴重,不僅是腐敗問題。比如我們的大學生的推薦信經常造假,我們中國人真的不覺得這是一個問題了,而且覺得很正當。找一個有影響力的老師給你寫推薦信,即便這老師不了解你,但這孩子出國,寫一個推薦信也不麻煩,自己寫好,老師籤字就行了,大家覺得這是很自然的事。

同樣的事情如果在國外,會被認為是非常丟人的事,不誠實是最丟人的。但在中國,因為大家普遍說謊,沒人認為說謊是不誠實的,所以我們造假東西就會這麼多,這意味著我們社會規範破壞到如此程度,不大可能是一個合作型社會。

人類走出囚徒困境,或者從不合作走向合作最重要機制,也許就是博弈論研究的重複博弈導致的聲譽機制,時間關係不能細講。簡單說,一個社會人們越是有積極性從事重複博弈,人們就越願意合作。你騙一次人家,得到一次好處,但損害了未來聲譽,大家以後不跟你合作,你就沒有機會得到合作的好處了,你會覺得騙人划不來。反過來說,一個社會中大家只注重眼前利益,沒有重複博弈、長期博弈的可能性,這個社會一定坑蒙拐騙橫行。

一個社會是不是有重複博弈的可能性,很大程度上取決於產權制度,在有明確的私有產權界定的情況下,我們從事的就是長期博弈。最簡單的例子就是挖礦,如果這個礦的產權是清楚的永久的,你自己不挖還可以賣給別人,這個時候你開礦就會非常注意安全。為什麼?出現安全事故損害的是自己。如果這個礦是集體的,國家的,今天讓挖,明天可能就不讓挖了,能挖的時間你一定會瘋狂採挖,掠奪性開採,你也不會買那麼多安全設備,事故就會不斷發生。

這是非常重要的一點,傳統經濟學的價格理論只能解釋市場是一隻看不見的手,它沒法解釋我這裡講的市場是一雙隱型的眼睛,你幹了好事,市場能記得住,你幹了壞事,市場也能記得住,你不要以為你騙了人家就真的會獲得便宜,你早晚會得到報應,所謂天網恢恢疏而不漏,這就是市場。市場不僅是看不見的手,也是隱型的眼睛,這個理論對我們理解中國社會是非常非常重要的。

好多人誤解了市場,只從價格理論角度理解市場,沒有按照我剛才講的從博弈這樣的角度理解市場,就說所有的坑蒙拐騙問題,最後唯一的解決方式是由政府來管制,政府就成立了各種審批機構,監管機構。你看我們有食品醫藥局,工商局,安檢局,等等。但這種機構越多,騙子反倒越多,因為這種機構本身消滅了社會聲譽機制,一個社會沒有人在乎自己聲譽的時候,你靠政府監管是沒辦法解決問題的。

圖5:作為協調預期的社會規範或法律

制度的第二個作用,是協調機制。協調機制我也用一個簡單的博弈來講(圖5)。假如我們有一個門,比較小的一個門,一次只能進一個人。現在有兩個人同時到了門口,那現在就有一個問題,如果兩個人都急著往進走,誰都進不來,如果兩個人都謙讓的話,也是誰都進不來,最好是一個先走,一個後走。

圖5中,我們假定如果兩個人同時搶著進門,撞在一起,每個人虧了1;如果兩個人都謙讓,延誤了進門,也虧了1;但是如果第一個人先走,第二個人讓一下後走,第一個人到了2,第二個人得到1,反過來如果第二個人先走,第一個人先走,第一個人得到1,第二個人得到2。

我們再想像,如果你碰到一個人,你預期這個人會先走的話,你的最優選擇是什麼?後走,你讓他一下。反過來說,你預期他後走,你的最優選擇是什麼?先走。一個人先走,另一個人後走,無論哪一個人先走,哪一個人後走,都是納什均衡,在這個博弈當中,有兩個納什均衡。

我們人類博弈的最大難題不是有沒有納什均衡,而是有太多納什均衡,現在我們就面臨兩個納什均衡,那怎麼辦?怎麼協調?誰先走,誰後走,我們就得有一個規則。

最典型的例子,如果一個老人和一個年輕人都到了門口,一般讓誰先走?老人先走。一個年輕人和一個小孩在門口,誰先走?小孩先走。我們中國人講一句話叫「尊老愛幼」,這句話就是遊戲規則,就是一種文化,一個制度,有了這個遊戲規則我們就知道,當一個老齡人和年輕人遇到一起,我們知道怎麼處事。我們還有「尊師重教」,老師和學生到門口,老師先走!

這就是遊戲規則。有了這些遊戲規則以後,我們就可以避免衝突。沒有這樣的遊戲規則,沒有這樣的文化或習慣的話,可能兩個人都謙讓,也可能兩個人都搶著走,對誰都不好。同樣類似的例子還有交通規則,我們在路上開車,靠左行還是靠右行?如果預計錯了,你以為別人靠左你也靠左,而他以為你認為他靠右,結果兩個人撞在一塊,所以我們需要協調,制度就起這樣的協調作用。

我們用納什均衡來解釋制度,使我們對文化或制度的認識發生了非常重要的變化。一個企業文化,一個國家文化的實質是什麼?就是幫助人們協調出特定的納什均衡。如果我們心照不宣,我知道你會怎樣行動,不需要到了門口還商量誰先走,這會提高很多效率,因為商量會耽誤事。有了這樣的規則,老年人一般不用謙讓,他知道年輕人會尊重他,他應該先走,年輕人一般也不會搶。這就讓我們從完全不一樣的視角發現,我們的文化實質上做了一個遊戲規則來協調人的行為。

一個企業或者一個機構裡邊,如果沒有好的文化,沒有形成統一的預期,是非常危險的。好比一個老闆,嘴上說我們要重視客戶利益,結果一個銷售人員賣東西的時候發現這個東西有殘次,沒有賣給客戶,回去後老闆反而批評他,推銷員說這個產品質量有問題,老闆說你管他呢,客戶不知道,你賣出去就是了。

這意味著什麼?沒有企業文化!老闆嘴上說要重視客戶利益,但實際他的行為不是這樣。員工知道老闆是這樣的話,員工也一定會能把客戶能騙一次就騙一次,因為他騙完客戶之後有獎金,老老實實拿回去沒有獎金。反過來說,如果不合格的產品拿回來了,老闆表揚這個員工,那麼員工就知道我應該怎麼行為。我們說兩個企業合併,文化不一樣會出現衝突,就類似說一個企業是規定靠左行,另一個企業靠右行,就發生了衝突。

國家之間也是這樣,遊戲規則不一樣,就會發生衝突。這就是為什麼人類需要一些普遍的、大家共同接受的遊戲規則。無論是中國還是美國之間,還是中國跟歐洲、印度、越南之間,如果我們想在一個平臺上博弈的話,我們必須有一些協調我們行動的規則,即所謂共同的普遍接受的價值觀,就是共同遵守的遊戲規則。

如果我們不承認這一點,那意味著什麼?意味著就像開車一樣,別人靠左行,我們非要靠右行,衝突就不可避免。反過來也可以這樣說,如果我們不接受一些共同的遊戲規則,意味著什麼?意味著人類的衝突只能用拳頭,用武力來解決。

當然我們中國人說,武力足夠強大的話,霸道一些也行。所以越是武力不夠強大的國家,越需要遊戲規則的保護。反倒是武力足夠強大的國家,就像社會當中一樣,可以霸道一些,可以不守規矩。越弱勢的人,越弱勢的民族,越需要爭取一個普遍規則的保護。

這是我講的法律和社會規範的第二個作用,協調作用,協調出一個納什均衡。在這個作用當中,我們也可以發現,好多法律能做的事,其實社會規範都可以做。現在我們有一個趨勢,就是把太多的事務用法律解決,這不是一個好現象,法律能解決的問題有限,這麼多事要藉助成文法解決不是好現象。人類的社會規範,道德規範給了我們一定的靈活性,人類要面臨好多複雜的情況,但法律是僵硬的規則。

這裡我要提醒一點,我們好多人以為法治社會就是由國家制定法律並嚴格執行法律,做到任何情況下「有法可依,違法必究「。那不叫法治社會。法治是大家認可的遊戲規則,所有人都遵守遊戲規則,無論這種遊戲規則是政府制定的還是民間自發形成的。你不要以為只有政府制定的法才叫法,法治的法包括所有的遊戲規則。


4社會規則的基本功能:承諾與信號

社會規則的第三個基本功能就是承諾作用,這裡特別講一下法律的承諾作用。什麼叫承諾作用?承諾就是你要付出成本,在這種成本的制約下,你事後不會採取機會主義行為。

舉個例子,你去買房,說這個房子我看上了,我要買,但我今天沒帶錢,你給我留著。人家敢不敢給你留?不敢,因為人家給你留下,第二天不你不來了怎麼辦?你放兩萬塊錢押金,人家就敢給你留,因為不去這兩萬塊錢就拿不回來,這就是承諾。

承諾改變你事後的最優選擇,沒有這種承諾情況下,違約是最優的,有了承諾後違約就不是最優的了,這就是承諾的作用。就像合同,我們籤一個合同就是做一個承諾,只要籤字了,違反這個合同,你就要負擔這個合同規定的賠償。

刑事犯罪為什麼要政府來公訴,而不是按民法來?民法和刑法不一樣,民法就是民不告官不糾,你是當事人,你受害了,你可以起訴他,你不起訴就沒人管。但是觸及刑法了,即便受害人不起訴,政府也必須起訴。

為什麼刑法要這樣呢?它使得當事人之間沒有商量餘地。假如一個富人殺了一個窮人,富人有錢,窮人家屬想要錢,很可能由富人提出一個補償辦法,給你一千萬。窮人一想人反正死了,有一千萬,家庭可以生活得更好,這事就私了吧。但這樣的話,就沒有辦法有效遏制嚴重的犯罪行為。有了刑法之後,你不能私了,不是給一千萬就可以免除責任的,你殺人就得償命,這就是一種承諾。

下面我要稍微給大家解釋一下,民主和法治從這個角度理解,就是政府對公眾做出的承諾。先簡單講一下法治,西方的概念就是有限政府,什麼意思呢?如果政府是一個權力不受限制的政府,政府說話,老百姓是不相信的,結果反倒對政府不好。無論任何制度下,老百姓和政府之間是有一個博弈的,你也可以限制老百姓某種選擇,但是你不可能消滅老百姓的自然選擇權。即便計劃經濟下,我也可以偷懶,你沒有辦法。

在這裡,我們分析一下政府和老百姓之間的博弈。政府力量的強大程度,依賴於政府是不是得到老百姓信任,越得到老百姓信任就越強大,越得不到老百姓信任就越弱。17世紀英國政府變成世界上最強的政府,與兩個事有關,一個就是大憲章。今年是大憲章800周年,1215年,英王約翰被迫與一些大貴族籤了一個協議,這個協議的核心就是限制國王徵稅的權力。另一個是光榮革命把政府的權力從國王轉向議會,政府權力變小了,但從某種意義上,政府也變得強大了。

在英國光榮革命之前,英國國債只有200萬英鎊,沒有人敢借錢給政府,因為借錢以後他說不還就不還了。光榮革命後,誰都敢借錢給政府,因為你不還錢,就把你趕下去。結果政府能借到的錢的數量大大增加,十年間從200萬增加到1700萬左右,還在不斷增加,這就使得英國政府有巨大的財力在英法戰爭中佔據優勢,最後確立了世界霸主地位。

光榮革命紀念畫

這個例子說明了什麼?表面上看,法治是限制政府權力,但實際上會讓政府更強大;非法治下,名義上政府無所不能,什麼權力都有,但實際上由於老百姓不相信它,本質上是脆弱的。

民主也一樣。我們中國古代就有民本思想,像孟子講的民為貴君為輕,政府就是為人民服務的。但為什麼長期以來,我們沒有辦法讓政府為人民服務呢?因為我們只是嘴上說說而已,沒有制度保證,他不服務你也沒有辦法制裁它。從今天來看,我們需要進行的好多制度變革,就是使政府口頭的承諾變成實際承諾,違反這種承諾,你要付出代價,這樣人民才會相信你。

制度的第四個功能就是信號傳遞。碰到一個陌生人,你要不要跟他合作?你可能不敢跟他合作,因為你不相信他。一個人是不是合作,依賴於對未來的耐心。一個人越重視未來,你越可以相信他,他不重視未來,你就沒法相信他。我們怎麼知道一個人重視還是不重視未來呢?我們可以觀察好多信號,那個人知道我們觀察,他就可能會有意傳遞一個信號。

比如送禮,就可以解釋為他為了傳遞願意跟你合作的信號。他花這麼大的代價,給你買一個禮品,就是傳遞一個重視你的信號。我們好多社會規範也有這個功能。從這個角度來看,有一些社會規範不一定是好的,比如文化大革命,很多人為了當紅衛兵,為了表達對毛主席的忠誠,就告發父母,打他老師,這個對社會就很不好。我們今天有沒有類似不好的社會規範?也可能有。所以說不是所有的社會規範都是好的。有些不好的,我們就要去改變。

我還想到一個問題,我們常說,中國人最愛面子,好像西方人不愛面子,我一直對這個有所懷疑。西方人有時候比中國人更愛面子。什麼例子可以看出來呢?比如說中國人不搞決鬥,西方人長期有決鬥,就是為了一個面子的事,或者說尊嚴。決鬥到近代才廢除,法律禁止以後,實際上好多人還在決鬥。英國首相有決鬥致死的,美國總統有決鬥致殘的。像熊彼特,這麼著名的經濟學家也跟別人決鬥過。

決鬥可能是為了雞毛蒜皮的事。兩個男人為一個女人爭風吃醋,就要冒著生命危險決鬥。西方人不愛面子嗎?他們比我們還愛面子。中國人還經常講「好死不如賴活著」,一到生命的事,還是讓一步算了,好多看法不一定對。當然,決鬥就是很壞的社會規範,所以被廢除了。

還有一類社會規範,比如說過去的羞辱性懲罰。怎麼羞辱呢?你犯罪以後,刻字或遊街,這種羞辱最後是不利於人改造的,不利於人類合作,所以西方早就廢了,我們直到現在都沒有完全廢除。我昨天還看到一個地方開什麼公判大會,公判大會就是羞辱性懲罰。這些東西都值得我們思考,所以有些社會規範不一定是好的,有些當時是好的,但隨著社會的發展,也可能變壞,這就需要我們去改變它。

我前邊給大家簡單介紹了從納什均衡或博弈論的角度看,社會制度或遊戲規則起的幾個作用。分析這些可以看出,有演化博弈理論幫助,我們的分析會更好一些。比如人民公社為什麼會使人與人之間變得越來越互不信任,農民變得越來越懶?傳統中國的農村,什麼樣的人能夠致富?勤勞的人可以。勤勞致富是中國人的傳統,人民公社化之後,勤勞就不可能致富了,所以大家變得懶惰了,但這是一個演化的過程。

在我小的時候,老農民還是比較勤勞的,年輕農民就耍奸。為什麼?老農民在個體戶或49年之前養成的工作習慣不是一下子能改變的,他種地還比較認真,年輕人就不會,他父母也不會教他認真。當我長大的時候,我準備上大學的時候,就是70年代末期,老農民已經變懶了。為什麼?一個是原來的老農民有一部分死了,還有一部分隨著時間推移,他看別人都耍奸,他也慢慢學著耍奸了。

所以這個制度就會這麼去演進。改革開放後,農村實行包產到戶,農民很快就變得勤快了。但有些東西很難快速轉變,過去致富除了勤勞,還有誠實。做人要誠實,我們父母從小就這樣教我們,這點現在沒有,很難恢復,還得多少年,我不知道。這些東西我們都可以應用剛才講的納什均衡或者動態演化博弈等理論來分析。

5博弈論的不足與未來

講完這些之後,我最後給大家講點博弈論不足的地方。博弈論最大的不足就是好多的假設,跟我們實際生活不一定相符,最大的一點還是理性人。博弈論和過去的經濟學一樣,假設人是理性的,我們知道,這麼多年來好多人包括經濟學自己對理性論都提出過批評,這些批評可以歸結為三個方面。

一是有限理性。人是想理性,但是你能力有限,記憶有限,加工能力有限,所以你現在做的不一定是對自己最好的。第二是有限毅力,最簡單例子就是抽菸,你知道抽菸對你有害,但你還是戒不了煙,這就是有限毅力。第三類叫有限自利,人並不是像經濟學家講都是自利的,還有利他主義。

這三種批評,都有一定道理,但我覺得都沒有講到關鍵點上,經濟學的理性人假設是一種工具,不是經濟學家就真的相信人就這麼理性,包括剛才說到的股票市場,我們身上也有好多動物精神,我們貪婪,這個東西我們免不了。

真正的批評在什麼地方?經濟學中理性的假設的缺陷並不是剛才講的這些,而在於經濟學的理性是工具理性。工具理性假設指什麼?每個人的偏好是規定的,你總是找一個最好的方式滿足你的偏好,這就是我們講的效用最大化。其實我們看,真正的人最重要的理性是什麼?不是工具理性,而是價值理性,也可以叫目標理性,就是你應該追求什麼,不應該追求什麼,而不是我要追求的都是規定好的,只來研究用什麼樣的方式去滿足。

這是人與人最重要的差別,我們的計算能力是有限的,一個人最需要考慮的是什麼東西是值得我追求的,什麼東西不值得我追求。在工具理性裡,理性在制定目標方面是沒有作用的,理性是欲望和情感的奴隸,這是休謨講的。而在價值理性或目標理性中,理性幫助人們選擇目標,所以理性是欲望的主人,這是康德講的。

作為經濟學家,我越來越認識到其實我們人類最重要是有價值理性、目標理性。我們在生活中說這個人犯傻,不是從工具理性角度,而是從價值理性角度來講。我們經常會聰明反被聰明誤,包括我們對金錢,我們對權力的過分貪婪,本質上都是不理性的。

這些人與人之間的差別,我認為不是簡單自利還是利他能解釋的,而在於我們真正的理性程度。一個人看得越長遠,意味著他越理性。一個小偷,一個強盜和一個偉大的企業家,如比爾蓋茨、賈伯斯或馬化騰的差別在什麼地方?不是說一個自利,一個不自利,而是一個理性,一個不理性。你當強盜,搶人家,這是很不理性的。這是我覺得最重要的一個問題。

我希望未來博弈論研究的重點,能夠往這方面轉,我們要重新對理性人本身,理性的含義做出一個界定來。在中國古代,荀子說:「君子樂得其道,小人樂得其欲。以道制欲,則樂而不亂;以欲忘道,則惑而不樂。」真正的君子一定要以道制欲,在他看來,道義,公平公正最重要。小人呢,則滿足他短暫的生理的物質的欲望。

如果我們經濟學能在這方面做一些突破,我想再回過頭來看,博弈論的很多方法還得有一些改變。如果不從這方面突破的話,經濟學包括博弈論面臨的好多批評就可能還繼續存在,這也是我自己努力思考的一個問題。

總結一下我剛才這一個多小時跟大家講的東西。由於納什提出的納什均概念,創造了一門新的學科,就是非合作博弈理論。非合作博弈論使經濟學發生了革命性轉變——從傳統的資源配置理論轉變成了人類合作或者說制度激勵機制理論。納什均衡可以使我們很好地研究制度,研究過去我們講的人與制度之間,好人重要還是好制度重要,可以使我們研究制度演進。

這對我們國家來講更為重要,我們國家目前有太多壞的納什均衡,壞的納什均衡不是說中國人不聰明,而是太聰明,但是結果是什麼?對所有人都不利,包括政府官員,那麼多的政府官員因貪汙而落馬。我在《博弈與社會》這本書專門有對政府腐敗的分析,大家有興趣看一下。

腐敗有可能是傳統意義上的理性選擇,那就是工具理性的選擇,腐敗為什麼這麼嚴重?就是你的遊戲規則有問題,這種遊戲規則導致納什均衡一定是腐敗均衡。我們怎麼改變呢?一個辦法就是削減政府權力,如果實行了法治,實行了言論自由,新聞自由,那可能不腐敗就變成一個均衡。

現在,我們的反腐敗措施在一定程度上可以遏制一下腐敗行為,但沒有改變均衡本身,只是在某一定短期情況下使腐敗不是最優的,但不等於以後仍然不是最優的,我只是從個人理性的角度來講。

最後就是我個人的感受,我希望我們學經濟的人都思考這個問題,經濟學家應開始注意研究價值理性,研究很多非物質的東西對我們的影響,經濟學家過去太執著於研究財富,GDP這些物質的東西,影響人的行為好像都是物質的,其實好多不是,用博弈論我們完全可以研究這些東西。

過去批評經濟學家的人都說經濟學家太注重研究物質,這有些道理。以色列曾發生過這樣一個故事,一家幼兒園規定五點放學,家長應該五點去接孩子,但是有些家長總是去得很晚,家長去得晚的話,幼兒園老師就得等著,不能把孩子一個人扔在那。後來為了解決這個問題,就出了一個新的規定,如果你來晚了超過15分鐘,家長要付一筆錢,來的越晚交的越多。傳統經濟學預測,這樣的話家長就不會來晚了。結果恰恰相反,實行新的制度以後,更多家長來得晚了,而且來得更晚。

有人批評經濟學家,你看你們經濟學的預測是錯的。錯在哪裡?錯就錯在如果你簡單從過去的價格理論理解,你只能從物質層面解釋說他害怕罰款。其實人有好多心理成本,過去沒有這個制度的情況下,我去晚了會覺得很對不起老師,我要道歉,現在有了制度以後,我去晚了給錢就得了,理直氣壯。我有更重要的事,幹嘛為了這點錢趕這十幾分鐘呢。

所以,如果我們只注重從物質利益角度去理解行為,似乎跟經濟學過去理解完全矛盾,但是我們如果把非物質的,特別是心理的成本加進去的話,那就完全可以解釋這種現象。

這樣的事情還有很多,包括在公司裡邊加班給不給錢,有些人可能加班給錢他就不加班了,加班不給錢他反倒加班,為什麼呢?因為不給錢以後,他加班以後有榮譽感,老闆會表揚他,心理感覺好。你給錢的話,你這加班不是為了錢嗎?我們知道凡是能夠用錢買到的東西,都不是最珍貴的東西。我作為經濟學家講這句話,你們可能覺得奇怪,但這是實實在在的。

市場經濟最大好處,就是把過去珍貴的東西變得不珍貴了,所以每人都用得起,造福於好多人。過去你出差,要從當地買一些土特產帶回來給朋友,那很珍貴,現在不珍貴了,因為那地方的禮品北京都可以買著,所以沒什麼意義了。但是我們仍然保留了一些用錢買不到的東西。我舉這個例子是說我們好多思路還要拓展,但我仍然認為博弈論為我們經濟學,乃至整個社會科學提供了一種新的方法。

我在19年前出版的那本《博弈論與信息經濟學》,是想把博弈論引到中國經濟學界,這本書到現在仍然是被引用最多的經濟學書籍,這說明我們中國的經濟學家,經濟學研究生都開始應用博弈論的方法分析經濟學問題。前年出的這本《博弈與社會》,其實是想把博弈論引入整個社會科學,所以這本書有大量的非經濟學例子,包括剛才講的社會習慣、文化,包括大學、政府的運行機制等等。我希望通過這本書,讓更多人學會用博弈論的方法分析社會問題。今天晚上我的講座也是這樣的目的。我先講到這裡,謝謝大家!

本號是張維迎教授《經濟學原理》及《博弈與社會》兩門課程的指定公眾號,也是兩部同名教材的移動端配套資源。想跟張維迎學經濟學嗎?快點擊文章右上方的藍字、搜索jingjixue_yuanli或搜索以下二維碼關注本號吧!



相關焦點

  • 張維迎:好的納什均衡和壞的納什均衡
    現在更一般的來講,在博弈當中,如果沒有這些遊戲規則的話,我們得到就是不好的納什均衡。法律是來幹什麼得呢?如圖四,假如說合作是一個合同,我們大家都要合作,如果你不合作的話,你直接得到4,但這個時候你要受到一點懲罰,就是y(或x),從你的所得中減去,因為你違反了合同,要補償人家。我們先假定不去考慮圖中的a和b。只有這個懲罰y和x足夠大,人們才可能去合作。
  • 張維迎:中國壞的納什均衡太多
    財知道:博弈論聽著很高深,請您簡單介紹下什麼是納什均衡。張維迎:簡單說,納什均衡就是一個所有人都作最優決策,沒有人願意改變它的狀態。這個聽起來還是抽象,一個更簡單的說法也許是這樣,就是說假如我們籤一個合同,如果沒有任何外在強制力的話,大家都有積極性去遵守這個合約,這個合約就是一個納什均衡。
  • 納什均衡近似解
    然後我們來討論一下納什均衡的背景,事實上,求解納什均衡的複雜度被證明是PPAD-complete,而後者可以在某種程度上理解為對某個組合圖形,我們知道其必有一個子部分滿足某種性質,試圖尋找算法找到這個子部分。
  • 「納什均衡」與作業僵局
    一、什麼是「納什均衡」?---從博弈論說起。看過電影《美麗心靈》的該知道數學家納什。納什最重要的貢獻就是提出了「納什均衡」,並由此獲得1994年諾貝爾經濟學獎。 「納什均衡」是博弈論中的一個重要推論,了解「納什均衡」,必須先從博弈開始說起。人類社會中的所有集體活動都可以用「博弈」來解釋。
  • 納什北京說「博奕」 闡明「納什均衡」研究過程(圖)
    納什被認為是一位數學天才,他在21歲時就提出了納什均衡理論,後來成為博弈論的兩大基礎之一。 新華網北京8月21日電(記者陳勇 韓潔 魏忠傑)「我聽懂了納什!」約翰·納什的公眾報告於今晚20點45分結束後一名聽眾興奮地告訴記者。納什僅用一個多小時,詳盡地向兩千多名聽眾闡明了為他贏得1994年度諾貝爾經濟學獎的「納什均衡」的研究過程。聽眾們說,大師並不深奧。
  • 納什均衡給經濟學帶來革命性變化
    生物學家使用博弈理論來理解和預測進化論的某些結果。如今,博弈論已經成為經濟學的標準分析工具之一。在生物學、經濟學、國際關係、計算機科學、政治學、軍事戰略和其他很多學科都有廣泛的應用。  博弈論引起大眾關注,還是因為在經濟學博弈論中享有國際聲譽的天才數學家約翰·納什,由他提出「納什均衡」理論,通過以他為原型的奧斯卡獲獎影片《美麗心靈》,讓這個數學理論和方法得以廣泛普及。
  • 如何通俗的理解納什均衡點?
    導讀:如何通俗的理解納什均衡點?1、市場上有2家企業A和B,都是賣紙的,紙的成本都是2元錢,A和B都賣5塊錢。有一天A降價到4塊錢,於是A銷量大增,B銷量大減。B看到了後,降價到3塊錢,於是B銷量大增,A銷量大減。
  • 什麼是博弈論與納什均衡
    博弈論考慮遊戲中的個體的預測行為和實際行為,並研究它們的優化策略。納什均衡:又稱為非合作博弈均衡,是博弈論的一個重要術語,以約翰-納什命名。假設有n人局中人參與博弈,給定其他人策略的條件下,每個局中人選擇自己的最優策略(個人最優策略可能依賴於也可能不依賴於他人的戰略),從而使自己利益最大化。所有局中人策略構成一個策略組合。
  • 用納什均衡揭秘A股漲跌的邏輯
    您的朋友圈這兩天可能已經被納什均衡這四個字刷了屏。但笨虎估計,看到這篇文章的朋友還有大約50%不清楚納什均衡是什麼意思。為什麼是大約50%呢?看下去您就知道啦。簡單的說,納什均衡說的是在一場博弈中,每個人都選擇了一種策略,使得整體利益達到了一種相對的最優狀態;此時,任何一個人單獨改變策略都不會得到好處。因此,這場博弈就處於一種靜止的均衡狀態。最經典的例子就是囚徒困境。警察抓到2個共犯,隔離分別審訊。警察的策略是坦白從寬,如果2個人都坦白罪行就分別判8年監禁。
  • 納什:如何科學追求對象?
    這篇文章的目的是更加準確和全面地描述納什均衡提出的過程和其價值。什麼是納什均衡納什均衡是是非合作博弈的概念,涉及兩個或兩個以上的博弈者,假設其中每個博弈者都知道其他博弈者的均衡策略,單個博弈者都無法通過單方面改變自己的策略來獲取利益(Osborne et al, 1994)。
  • 系統工程講堂第五十二講——納什均衡:博奕論的前世今生
    題目:系統工程講堂第五十二講——納什均衡:博奕論的前世今生主講人:劉進副教授(系統工程學院作戰運籌與規劃系)時間:2019年4月12日(周五) 8:30-10:30地點:系統工程學院一樓110學術廳講座摘要:博弈論是研究競爭與合作的交互式決策的數學理論,納什均衡是博弈論中最重要的概念。
  • 約翰·納什:天才的光輝與坎坷
    天才的光芒:「納什均衡」橫空出世1928年,約翰·納什出生在西維吉尼亞。
  • 納什的少年天才成長之路,值得很多家庭學習
    他的名字成為了數學以及經濟學領域的代名詞,「納什均衡」、「納什談判解」、「納什程序」……他提出的博弈理論也越來越有影響力,在經濟學、政治學、社會學以及生物學中都有所應用。啟蒙教育中父母鼓勵納什自學,父親不給他看繪本,而是將百科全書、科學雜誌作為納什的童年讀物。納什不懂的,父親都會一一告訴他,就這樣納什從小養成了自學、思考的習慣。當然如果從「健康」角度看,這樣的學習方式讓他從童年開始就異於常人了。在小學階段,老師課上講的他都不聽,沉浸在自己的世界裡納什的成績其實並不好,一直到了4歲以後,他的數學天賦開始正式啟動。
  • 納什:戰勝精神分裂症的重生
    【青年天才】21歲寫博士論文論證納什均衡在普林斯頓大學,納什建立起對拓撲、代數幾何、博弈論和邏輯學的興趣,並對博弈論進行深入研究。約翰·納什1928年6月13日出生於美國西維吉尼亞州的工業城市布魯菲爾德。他的父親是一名電氣工程師,母親是一位英語及拉丁語教師。
  • 納什紀念與博弈論視野下的國際關係
    天才留下的理論對於博弈論來說,這位天才最廣為人知的貢獻是,在他年僅22歲時,就提出了後來被稱為「納什均衡」的博弈理論。納什均衡是一種策略組合,在這一組合中,每個參與人的策略是對其他參與人策略的最優反應。由此,從自身利益出發,沒有任何單獨的一方願意改變其策略。不少學者認為,「納什均衡」使亞當·斯密的「看不見的手」陷入尷尬。
  • 博弈論大師約翰·納什領獎返家途中遇車禍身亡
    納什生於1928年6月13日,22歲就以一篇僅27頁、以非合作博弈(Non-cooperative Games)為題的博士論文畢業,該論文提出了奠定納什學術生涯基礎的博弈理論,被稱為「納什均衡」的理論廣泛運用在經濟學,計算機學,進化生物學,人工智慧,會計學,政治學和軍事理論上。
  • 柏文喜:地方政府在復工決策這一囚徒困境中的納什均衡分析
    之前,有不少經濟學家對長期停工的經濟損失和復工的機會成本與代價,進行了建模與測算,尤其以攜程旅行網董事長、教授梁建章為代表, 並提出了儘快復工的建議。但顯然並未成為各地政府的選擇。長期不復工當然不行,但立即全面復工的風險顯而易見。復工與否,真是雙刃見骨的囚徒困境。
  • 諾貝爾獎得主澤爾滕眼中的納什和博弈論
    不過,獲得諾貝爾獎之後,澤爾滕與納什成了好朋友。2005年,在接受《第一財經日報》專訪時他表示,以納什為故事原型的《美麗心靈》是一部很好的電影, 但人們不能根據這部電影來看待納什的一生,而且影片中關於博弈論的描寫並不準確。在納什意外逝世之際,我們找出這篇10年前的訪談,希望以澤爾滕之口,還原更為真實的納什和博弈論。
  • 精神分裂到諾貝爾獎,「博弈之父」納什的傳奇人生
    5.納什的偶像是牛頓和尼採這樣的孤獨的思想者和超人。《美麗心靈:納什傳》的作者是《紐約時報》記者,哥倫比亞大學教授西爾維婭·娜薩。她耗時三年才最終完成了這部震撼人心的學者傳記。剛進入普林斯頓的納什非常心高氣傲,幾乎不去上課,而把他的大部分時間花在思考上。他經常泡在圖書館,鑽到桌子或椅子下面,或者躺在地板上,吹著巴赫的曲子,在自己的腦海裡工作。1950年,納什以博弈論為主題,寫了一篇27頁的博士論文就順利畢業了。在那篇論文裡他提出了一個重要概念,也就是後來的「納什均衡」。
  • 《美麗心靈》原型約翰·納什車禍去世 傳奇一生回顧
    原標題:《美麗心靈》原型約翰·納什車禍去世 傳奇一生回顧   《美麗心靈》原型夫婦去世 獲阿貝爾獎後打計程車回家遭遇車禍揭天才數學家的一生才華橫溢卻精神分裂30年 沉迷於命理學和宗教預言 1990年後神奇恢復並獲得諾貝爾獎  奧斯卡獲獎影片《美麗心靈