「納什均衡」與作業僵局

2020-12-18 芥末堆

「納什均衡」與作業僵局

作者:隱蔽的歷史 發布時間:

「納什均衡」與作業僵局

作者:隱蔽的歷史 發布時間:

筆者曾以「劇場效應」一詞分析了當下中國教育慘烈的軍備競賽(《從坐著看戲到站著看戲-兼談教育現狀》)。「劇場效應」是個通俗比喻,不僅適用於教育領域,也廣泛適用於各行各業的過度競爭現象(比如:手機的攝像頭越來越多、屏幕越來越大、各單位加班時間越來越長……等)。「劇場效應」這種現象還可以從博弈論角度進行學理分析。

一、什麼是「納什均衡」?---從博弈論說起。

看過電影《美麗心靈》的該知道數學家納什。納什最重要的貢獻就是提出了「納什均衡」,並由此獲得1994年諾貝爾經濟學獎。

 「納什均衡」是博弈論中的一個重要推論,了解「納什均衡」,必須先從博弈開始說起。

人類社會中的所有集體活動都可以用「博弈」來解釋。社會中的人、企業、國家,幾乎隨時隨地都在「博弈」(購物時討價還價、企業間合同談判、中美之間的「貿易戰」……)。

舉個慄子:

令狐衝和張無忌在一起吃飯,令狐衝分到一份麵條,張無忌分到一份米飯。麵條、米飯的熱量、售價相同,兩人各吃各的。假設米飯與麵條的福利都等於1。則令狐衝和張無忌各自佔有的福利為1,兩人總福利等於2。

起初兩人各吃各的飯,兩人之間無博弈。經過一段時間後,令狐衝對麵條產生了厭倦,於是在某一天,令狐衝想品嘗張無忌的米飯,這就產生了兩人之間進行博弈的可能。

第一輪博弈:令狐衝身高馬大,孔武有力,採取暴力脅迫手段奪取了張無忌 的米飯。令狐衝一人吃了兩份飯,張無忌無飯可吃。此時,令狐衝的福利為1+1=2,張無忌的福利為1-1=0。令狐衝+張無忌的總福利不變仍為2。這輪博弈沒有增加總福利量,只是福利發生了轉移,這種博弈局面稱為「零和博弈」。例如,封建社會中統治者憑藉暴力對農民的殘酷剝削,社會中的各種詐騙犯罪行為,就類似於零和博弈。又如,超級中學獨佔了全省的清北升學人數,代價卻是普通中學升入名校人數銳減,也類似於零和博弈。在生活中,這類結果也稱為「單贏」。成因在於博弈雙方資源(實力)的不對等和強勢一方的打破規則、恃強凌弱。

第二輪博弈:張無忌被令狐衝打劫後,痛感自己的羸弱,苦練九陽神功。某一天當令狐衝故技重施時,遭到了張無忌的強力反彈,兩人激烈拼搶,在爭奪中麵條和米飯都被破壞而無法食用。結果,當天兩人不但都挨了餓,而且還都受了傷,還要去醫院看病,治療過程將減少各自的福利0.5。所以,這一輪博弈的結果是雙方的福利均為-0.5,達成的福利總量為-1。這種導致福利總量減少的博弈稱為「負和博弈」。例如,國家之間慘烈的戰爭(如第一次世界大戰。),破壞了社會生產力,減少了全世界的福利總量;歷史上有的農民起義推翻了舊王朝,嚴重破壞了生產力,在一段時間內也減少了文明社會的福利總量。在生活中,這類博弈結果也稱為「雙輸」「多輸」。成因在於博弈各方力量接近,且均採取對抗策略。

第三輪博弈:痛定思痛,令狐衝,張無忌握手言和,採取合作策略,各自把一半食物與對方交換,雙方都品嘗到對方的飲食(兩人營養都更豐富了),由於兩人的健康指數和心理狀況都因此輪博弈得到了改善,故福利都比原來增加了0.2,這輪博弈達成的雙方福利總和為2.4。對比初始狀態,福利總量增加了0.4,所以這輪博弈為「正和博弈」。例如,二戰後成立聯合國,減少了各國衝突,增加了世界福利總量;歐洲成立了歐共體增進各國合作減少彼此對抗,經濟全球化深入推動各國合作,都推動了世界福利總量飛速提升。在生活中,這類博弈結果稱為「共贏」「雙贏」「多贏」。成因在於博弈參與者改變了博弈策略,從對抗走向了合作,從個體理性走向了集體理性。今天的文明社會,即使是實力不對等的博弈,佔上風的一方也往往不會採取直接掠奪的博弈策略,就是看到了合作策略能帶來長遠的穩定收益。這是人類社會經過反覆博弈後的理性選擇,也是人類文明告別叢林法則,趨於整體進步的表現。

總結圖:

人類社會的絕大部分集體活動,都可以在博弈論中找到答案。小到公司企業的興衰,大到國家民族的治亂,都能看出群體博弈的力量。

總結:博弈的分類和後果:

1、爭取正和博弈。

把參加博弈各方的所有收益相加,得數為正數的為「正和博弈」,此時,博弈的結果整體促進了社會總福利。達成正和博弈是社會進步的根本所在,應盡力創造條件增加或維持正和博弈。如十字路口紅綠燈制度就是典型的合作型正和博弈。交通參與者在路口越合作,每個人的長期通過效率越高,社會的整體交通福利越好。反之,無紅綠燈設計,或紅綠燈故障的路口,每個人都搶行,極易形成人人難以通過的負和博弈。

2、控制零和博弈。

把參加博弈各方的所有收益相加,得數為零的為「零和博弈」。此時,可能博弈的某一方是利益獲得者,另一方是利益損失者,也可能大家都有得有失,但得失相互抵消後,社會的總福利只是發生了轉移,但總量維持不變。零和博弈改變了福利的分配狀態。有時候可以選擇,有時候必須選擇,有時候儘量避免。如學校考試排名,公司獎金分配,財政資金分配等。零和博弈有利於調動部分人群的積極性,但存在邊際收益遞減的問題,所以需要及時調整零和博弈格局。

3、避免負和博弈。

把參加博弈各方的所有收益相加,得數為負數的為「負和博弈」,此時,博弈的結果整體減少了社會的福利。負和博弈減少了社會總福利量,且增加了各方的對抗,會激化矛盾。故制度設計和政策安排應引導各方淡化短期利益,重視長期收益,促進各方合作,減少各方對抗。如商家間避免惡性降價競爭、開發商減少暴力拆遷、城管避免釣魚執法等。

二、「納什均衡」:一種負和博弈的僵局。

承接前文,「負和博弈」是最差的一種博弈結果。

引入:「納什均衡」則是指無法終結,且持續惡化的「負和博弈」。(「納什均衡」有數學定義,本文側重其在經濟學、社會學領域中的含義。)

含義:所謂納什均衡,指的是博弈參與人的這樣一種策略組合,在該博弈演進中,任何參與者單獨改變博弈策略都不會得到好處。換句話說,除非所有人同時改變博弈策略,否則沒有任何人會改變策略,則該博弈組合就是一個納什均衡。

延伸:在沒有強大外力介入情況下,「負和博弈」中的參與者均不會改變博弈策略,無人願意與其他博弈者合作,「負和」局面不斷惡化,博弈的結果越來越差,導致社會總福利持續減少的惡果。通俗來說,就是「惡性循環」無法中止。

例:納什均衡的推演:愈演愈烈的作業。

作業布置多少合適?這可不光是寫作業的學生和布置作業的老師博弈的結果,而是多方力量博弈的結果。作業這輪博弈的參與者有學生、家長、老師、班主任、學校管理層、其他競爭學校、政府管理部門。

根據前文所述:

第一輪博弈:正和博弈階段。老師布置的作業不多,學生能順利完成,也樂意完成。雙方的博弈策略為合作博弈,師生都是正收益,此時為「正和博弈」。

第二輪博弈:零和博弈階段。來自家長、考核機制和管理層的壓力,推動了某一科個別教師增加作業量。當此學科作業量激增後,那些作業量較少的學科學習時間將被嚴重蠶食,這些學科成績會顯著下降,但學生的各科總成績不變。教師之間有得有失,收益在教師之間發生了轉移,教師們的收益之和不變。

第三輪博弈:負和博弈階段。為捍衛自己學科的學習時間,這些學科老師也被迫增加作業量。此時,所有學科的作業量都持續增加。學生的身心健康受損,寫作業的積極性下降,教師的批改作業量和勞動強度也大為增加,但大家的考核排名並未有本質變化。此時,博弈就進入了「負和博弈」階段。

第四輪博弈:納什均衡階段。但,悲哀的是,此時沒有老師敢減少自己的作業量,因為你一旦減少作業量,學生就會把這部分時間用於寫其他作業,你的學科利益就會短期受損。這就形成了大家相互加碼,無人選擇退出的「納什均衡」局面。此時,納什均衡下大家的福利總和持續減少(所有參與者都更累了,但排名收益並未有大的變化),形成了沒有贏家、都是輸家的僵持局面,但堅持當下策略卻是僵局中每個參與者的最佳選擇,因為改變當下的策略,自身利益會減少的更快。

第五輪:納什均衡的強化。當某學校、某老師試圖減少作業量,以打破越來越累的「納什均衡」僵局,就會招致家長的強烈反彈:為何不補課?隔壁學校可是在補課呢!為何不重視成績?基於此,單個學校、學科無法獨立改變增加作業的博弈策略,除非所有的學校全部同時結束對抗,走向合作,以集體理性取代個體瘋狂。

這就解釋了作業為何愈來愈多且難以控制難以減少的內在機制。作業布置的「納什均衡」,其原因就在於社會用短期的評價機制考量學生學習和教師業績,必然推動各個博弈參與者為謀求短期收益,採取非理性的對抗性博弈策略。最終形成「負和博弈僵局」,即「納什均衡」局面。

同理,愈演愈烈的惡性補課、惡性延長的學習時間、越來越少的假期、變本加厲的生源大戰,都可以在「納什均衡」中找到答案。


三、如何避免形成負和博弈尤其是納什均衡?

其一、增加優質資源供給,緩解福利焦慮。因為資源越是短缺,人們越趨向於非理性的短期利益,趨向對抗,拒絕合作。比如增加優質學位數量會一定程度緩解了人們爭搶學位的拼搶現象。

其二,增加替代選項。技術進步帶來替代資源的爆炸式增長,是緩解博弈困境的重要機遇。比如辦好職業院校,引導部分學生分流,也會降低競爭烈度。

其三、增加監督機制。防止博弈各方中某一方違規搶跑,否則博弈很容易從正和、零和演化為負和局面。如限制作業布置的上限,嚴懲節假日補課等。

其四、調整福利分配。在資源供給短期內難於增加,替代技術進步緩慢情況下,改變利益分配方案也是一個思路。如把學位按人口比例分解到各下級學校,學校以對教師實行綜合評價制度替代單一成績評價等。

四、繼續來看納什故事:

烈日炎炎的下午,納什教授給學生上課,窗外樓下有幾個工人正施工,機器的響聲成了刺耳的噪音,於是納什走到窗前狠狠地把窗戶關上。馬上有同學提出意見:「教授,請別關窗子,實在太熱了!」而納什教授一臉嚴肅地回答說:「課堂的安靜比你舒不舒服重要得多!」然後轉過身一邊嘴裡叨叨著「給你們來上課,在我看來不但耽誤了你們的時間,也耽誤了我的寶貴時間……」,一邊在黑板上寫著數學公式。

正當教授一邊自語一邊在黑板上寫公式之際,一位叫阿麗莎的漂亮女同學(這位女同學後來成了納什的妻子)走到窗邊打開了窗子,電影中納什用責備的眼神看著阿麗莎:「小姐……」而阿麗莎對窗外的工人說道:「打擾一下,嗨!我們有點小小的問題,關上窗戶,這裡會很熱;開著,卻又太吵。我想能不能請你們先修別的地方,大約45分鐘就好了。」正在幹活的工人愉快地說:「沒問題!」又回頭對自己的夥伴們說:「夥計們,讓我們先休息一下吧!」阿麗莎回過頭來快活地看著納什教授,納什教授也微笑地看著阿麗莎,既像是講課,又像是在評論:「你們會發現在多變性的微積分中,往往一個難題會有多種解答。」

阿麗莎對「開窗難題」的解答,使我們得出啟示:那些看似零和博弈或者是負和博弈的問題,也會因為參與者的巧妙博弈策略而轉為正和博弈。正如上文中納什教授所說:「多變性的微積分中,往往一個難題會有多種解答。」

關鍵點就是,用合作策略取代對抗策略。關鍵點就是,以集體理性取代個人理性。

本文轉自微信公眾號「隱蔽的歷史」,作者郭山。文章為作者獨立觀點,不代表芥末堆立場。

1、本文是

芥末堆網

轉載文章,原文:

隱蔽的歷史;

2、芥末堆不接受通過公關費、車馬費等任何形式發布失實文章,只呈現有價值的內容給讀者;

3、如果你也從事教育,並希望被芥末堆報導,請您

填寫信息

告訴我們。

來源: 隱蔽的歷史

推廣: 芥末堆商務合作:010-5726 9867

相關焦點

  • 納什均衡
    納什均衡名稱來源及簡介:    納什均衡,Nash equilibrium  ,又稱為非合作博弈均衡,是博弈論的一個重要術語,以約翰·納什命名。約翰·納什1948年作為年輕數學博士生進入普林斯頓大學。其研究成果見於題為《非合作博弈》(1950)的博士論文。
  • 納什均衡是約翰·納什一個人的
    納什組合知識A、知識B、知識C、知識D的過程中,甲也組合了知識A、知識B、知識C、知識D ,納什發現了納什均衡,甲發現了與納什發現的知識相同的知識。納什均衡是納什發現的,甲發現的知識不是納什均衡,甲發現的與納什均衡相同的知識可以以甲自己的名字命名。
  • 「納什均衡」應用於諸多領域
    東楚網黃石新聞網(黃石日報)「納什均衡」  應用於諸多領域而現在,納什雖然已故,博弈論卻已成為人類分析經濟和社會問題的最重要工具之一,「納什均衡」理論奠定了現代主流博弈理論和經濟理論的根本基礎。「納什均衡」的提出和不斷完善幫助博弈論廣泛應用於經濟學、管理學、社會學、政治學、軍事科學等諸多領域。  「納什均衡」是指所有參與人戰略的這樣一種組合:在這一組合中,給定其他參與人的戰略,沒有任何人有積極性改變自己的戰略。
  • 納什均衡理論定義與使用
    ——納什均衡理論  所以保密、信息安全很重要!----------------------------------------納什均衡理論定義  假設有n個局中人參與博弈,給定其他人策略的條件下,每個局中人選擇自己的 納什均衡最優策略(個人最優策略可能依賴於也可能不依賴於他人的戰略
  • 張維迎:中國壞的納什均衡太多
    納什為社會科學創造了全新的研究方法,那我們紀念納什最好的方式就是理解納什均衡,學會應用博弈論的方法去分析和理解我們所生活的世界。改革形成更好的納什均衡在人民公社的情況下偷懶是納什均衡,包產到戶後,好好幹活,大家都幹活,打的糧食多,這才是納什均衡。
  • 博弈,博弈中的納什均衡在哪裡?其中是否有納什均衡?
    在這一章裡,我們會接觸鬥雞博弈,由兩個純粹的納什均衡組成——使結果極難預測。該博弈與邊緣政策的藝術緊密相關。由兩人參加的鬥雞博弈有一個簡單且流行的版本。兩個摩託車手朝對方開過去(如果我們在拍電影,他們最好用的是偷來的車),首先逃避相撞的那方輸掉遊戲,並永遠被稱為"膽小鬼"。那個毫不退縮的車手在博弈中獲勝並成為鎮上的英雄。
  • 納什均衡給經濟學帶來革命性變化
    博弈論引起大眾關注,還是因為在經濟學博弈論中享有國際聲譽的天才數學家約翰·納什,由他提出「納什均衡」理論,通過以他為原型的奧斯卡獲獎影片《美麗心靈》,讓這個數學理論和方法得以廣泛普及。  博弈論就是利用對方的策略變換自己的對抗策略,達到取勝的目的。均衡是平衡的意思,在經濟學中,均衡意即相關量處於穩定值。
  • 【中華工商時報】經濟學家的納什均衡
    【中華工商時報】經濟學家的納什均衡  央視國際網站是這樣介紹納什的:「納什被認為是一位數學天才,他在21歲時就提出了納什均衡理論,後來成為博弈論的兩大基礎之一。他的名字早已被寫進數學和經濟學的教科書,但30歲後,他不幸出現了精神分裂,從學術界消失。令人驚奇的是,在他的妻子艾麗西亞的照料下,納什30年後又逐漸恢復了健康,並於1994年獲得了諾貝爾經濟學獎。
  • 如何通俗的理解納什均衡點?
    導讀:如何通俗的理解納什均衡點?1、市場上有2家企業A和B,都是賣紙的,紙的成本都是2元錢,A和B都賣5塊錢。有一天A降價到4塊錢,於是A銷量大增,B銷量大減。B看到了後,降價到3塊錢,於是B銷量大增,A銷量大減。
  • 約翰·納什:均衡博弈走出「囚徒困境」
    均衡中的不均衡   「納什均衡」是指所有參與人戰略的這樣一種組合:在這一組合中,給定其他參與人的戰略,沒有任何人有積極性改變自己的戰略。換言之,構成納什均衡的戰略對每個人都是最優的。   常被提及的「囚徒困境」即是「納什均衡」理論的經典模型。即兩個共謀犯罪的人被關入監獄,不能互相溝通情況。
  • 張維迎親筆悼念博弈論之父納什 詳解何為「納什均衡」
    在這本書中,張維迎對納什均衡做出了以下評價和解讀:  納什均衡是博弈論最重要、最一般化的均衡概念。它是指所有參與人戰略的這樣一種組合:在這一組合中,給定其他參與人的戰略,沒有任何人有積極性改變自己的戰略。換言之,構成納什均衡的戰略對每個人都是最優的。  納什均衡有一個很重要的特點,即信念和選擇之間的一致性。
  • 王芳:納什均衡:理性人的複雜決策
    根據對他人選擇的預期,每一個參與人選擇自己的最優策略以實現自身利益的最大化,博弈達到均衡狀態,沒有人願意偏離這個狀態,這就是納什均衡。  -王芳  納什均衡是非合作博弈分析框架下完全信息靜態博弈的一般概念,其典型的博弈模型有囚徒困境、鬥雞博弈,等等。隨著信息條件的變化和行動選擇的動態可觀測,博弈的均衡解變得更加精煉。
  • 用納什均衡揭秘A股漲跌的邏輯
    您的朋友圈這兩天可能已經被納什均衡這四個字刷了屏。但笨虎估計,看到這篇文章的朋友還有大約50%不清楚納什均衡是什麼意思。為什麼是大約50%呢?看下去您就知道啦。簡單的說,納什均衡說的是在一場博弈中,每個人都選擇了一種策略,使得整體利益達到了一種相對的最優狀態;此時,任何一個人單獨改變策略都不會得到好處。因此,這場博弈就處於一種靜止的均衡狀態。最經典的例子就是囚徒困境。警察抓到2個共犯,隔離分別審訊。警察的策略是坦白從寬,如果2個人都坦白罪行就分別判8年監禁。
  • 問題來了,納什均衡究竟是什麼?
    「納什均衡」是「博弈論」中一個很著名的概念,它是由美國數學家約翰·納什首先提出的,並用它的名字來命名。關於它和它的創造者約翰·納什,還有這一段不為人知的曲折傳奇故事。1948年納什到普林斯頓大學讀數學系的博士。那一年他還不到20歲。當時普林斯頓可謂人傑地靈,大師如雲。
  • 秦始皇的帕累託最優和漢高祖的納什均衡
    1.納什均衡 所謂納什均衡,就是在既定的博弈的場景中,博弈參與者都會採取的某種確定策略。這個確定策略,無論是好是壞,大家都得這麼做。 戰國的納什均衡 戰國七雄的中華大地就是一種納什均衡的博弈場景。
  • 納什均衡有多重要:若引用一次就給納什1美元,他早成富翁了
    1950年,約翰·納什憑藉兩篇論文引起經濟學界的關注,這兩篇論文確定了日後博弈論的合作與非合作模式在經濟學應用中的方向。後者是從他證明n人博弈存在一個非合作均衡點開始的,這個普遍性的證明簡單而精巧。在納什的框架裡,每一個參與者按照別人的策略選擇自己的策略,當所有這些選擇相互一致的時候就達到均衡。
  • 納什均衡理論告訴你,為什麼「A女配D男」
    每個博弈者的均衡策略都是為了達到自己期望收益的最大值納什均衡是由數學家和經濟學家約翰·福布斯·納什提出的,納什曾獲得1994年諾貝爾經濟學獎,第74屆奧斯卡最佳形片《美麗心靈》就是根據納什的真實經歷改編而成的。
  • 尋找納什均衡的方法——條件策略下劃線法
    上述確定博弈均衡(或不均衡)的方法可以更加直觀也更加方便地表示為所謂的「條件策略下劃線法」。首先是用下劃線來表示甲廠商的條件策略。例如,當乙廠商選擇合作時,甲廠商的條件策略是不合作,此時,他得到的支付是矩陣左下角單元格中的第一個數字7。
  • 王東嶽:納什均衡是小企業和大企業競爭時的最佳策略
    那麼在這樣一個對局中,小豬一定採取不去踏板,守在食槽邊的策略,而大豬只好去踏,因為大豬不踏收益是0,大豬去踏還得4個收益,所以小豬、大豬一定採取大豬去踏、小豬不踏的博弈平衡,在數學上叫納什均衡。 納什這個人,是美國上個世紀一個著名的數學家。 所謂納什均衡,就是指局中每個參與者所採取的策略相對而言都是最優反應。
  • 約翰·納什
    約翰·納什  約翰·福布斯·納什1928年出生於西維吉尼亞州勃魯費爾。1945—1947年,在位於美國匹茲堡的卡內基技術學院學習並獲得理科學士學位;1948年獲得同校數學碩士學位。  約翰·福布斯·納什由於與另外兩位數學家、經濟學家在非合作博弈理論的均衡分析方面做出了開創性的貢獻,而獲得1994年諾貝爾經濟學獎。博弈論和納什均衡已經成為產業組織、環境及自然資源領域、信息領域、國際貿易等諸多領域裡重要的分析工具。除博弈論,納什還在數學的其他很多領域做出了顯著的貢獻。