作者:隱蔽的歷史 發布時間:
作者:隱蔽的歷史 發布時間:
筆者曾以「劇場效應」一詞分析了當下中國教育慘烈的軍備競賽(《從坐著看戲到站著看戲-兼談教育現狀》)。「劇場效應」是個通俗比喻,不僅適用於教育領域,也廣泛適用於各行各業的過度競爭現象(比如:手機的攝像頭越來越多、屏幕越來越大、各單位加班時間越來越長……等)。「劇場效應」這種現象還可以從博弈論角度進行學理分析。
看過電影《美麗心靈》的該知道數學家納什。納什最重要的貢獻就是提出了「納什均衡」,並由此獲得1994年諾貝爾經濟學獎。
「納什均衡」是博弈論中的一個重要推論,了解「納什均衡」,必須先從博弈開始說起。
人類社會中的所有集體活動都可以用「博弈」來解釋。社會中的人、企業、國家,幾乎隨時隨地都在「博弈」(購物時討價還價、企業間合同談判、中美之間的「貿易戰」……)。
舉個慄子:
令狐衝和張無忌在一起吃飯,令狐衝分到一份麵條,張無忌分到一份米飯。麵條、米飯的熱量、售價相同,兩人各吃各的。假設米飯與麵條的福利都等於1。則令狐衝和張無忌各自佔有的福利為1,兩人總福利等於2。
起初兩人各吃各的飯,兩人之間無博弈。經過一段時間後,令狐衝對麵條產生了厭倦,於是在某一天,令狐衝想品嘗張無忌的米飯,這就產生了兩人之間進行博弈的可能。
第一輪博弈:令狐衝身高馬大,孔武有力,採取暴力脅迫手段奪取了張無忌 的米飯。令狐衝一人吃了兩份飯,張無忌無飯可吃。此時,令狐衝的福利為1+1=2,張無忌的福利為1-1=0。令狐衝+張無忌的總福利不變仍為2。這輪博弈沒有增加總福利量,只是福利發生了轉移,這種博弈局面稱為「零和博弈」。例如,封建社會中統治者憑藉暴力對農民的殘酷剝削,社會中的各種詐騙犯罪行為,就類似於零和博弈。又如,超級中學獨佔了全省的清北升學人數,代價卻是普通中學升入名校人數銳減,也類似於零和博弈。在生活中,這類結果也稱為「單贏」。成因在於博弈雙方資源(實力)的不對等和強勢一方的打破規則、恃強凌弱。
第二輪博弈:張無忌被令狐衝打劫後,痛感自己的羸弱,苦練九陽神功。某一天當令狐衝故技重施時,遭到了張無忌的強力反彈,兩人激烈拼搶,在爭奪中麵條和米飯都被破壞而無法食用。結果,當天兩人不但都挨了餓,而且還都受了傷,還要去醫院看病,治療過程將減少各自的福利0.5。所以,這一輪博弈的結果是雙方的福利均為-0.5,達成的福利總量為-1。這種導致福利總量減少的博弈稱為「負和博弈」。例如,國家之間慘烈的戰爭(如第一次世界大戰。),破壞了社會生產力,減少了全世界的福利總量;歷史上有的農民起義推翻了舊王朝,嚴重破壞了生產力,在一段時間內也減少了文明社會的福利總量。在生活中,這類博弈結果也稱為「雙輸」「多輸」。成因在於博弈各方力量接近,且均採取對抗策略。
第三輪博弈:痛定思痛,令狐衝,張無忌握手言和,採取合作策略,各自把一半食物與對方交換,雙方都品嘗到對方的飲食(兩人營養都更豐富了),由於兩人的健康指數和心理狀況都因此輪博弈得到了改善,故福利都比原來增加了0.2,這輪博弈達成的雙方福利總和為2.4。對比初始狀態,福利總量增加了0.4,所以這輪博弈為「正和博弈」。例如,二戰後成立聯合國,減少了各國衝突,增加了世界福利總量;歐洲成立了歐共體增進各國合作減少彼此對抗,經濟全球化深入推動各國合作,都推動了世界福利總量飛速提升。在生活中,這類博弈結果稱為「共贏」「雙贏」「多贏」。成因在於博弈參與者改變了博弈策略,從對抗走向了合作,從個體理性走向了集體理性。今天的文明社會,即使是實力不對等的博弈,佔上風的一方也往往不會採取直接掠奪的博弈策略,就是看到了合作策略能帶來長遠的穩定收益。這是人類社會經過反覆博弈後的理性選擇,也是人類文明告別叢林法則,趨於整體進步的表現。
總結圖:
人類社會的絕大部分集體活動,都可以在博弈論中找到答案。小到公司企業的興衰,大到國家民族的治亂,都能看出群體博弈的力量。
總結:博弈的分類和後果:
1、爭取正和博弈。
把參加博弈各方的所有收益相加,得數為正數的為「正和博弈」,此時,博弈的結果整體促進了社會總福利。達成正和博弈是社會進步的根本所在,應盡力創造條件增加或維持正和博弈。如十字路口紅綠燈制度就是典型的合作型正和博弈。交通參與者在路口越合作,每個人的長期通過效率越高,社會的整體交通福利越好。反之,無紅綠燈設計,或紅綠燈故障的路口,每個人都搶行,極易形成人人難以通過的負和博弈。
2、控制零和博弈。
把參加博弈各方的所有收益相加,得數為零的為「零和博弈」。此時,可能博弈的某一方是利益獲得者,另一方是利益損失者,也可能大家都有得有失,但得失相互抵消後,社會的總福利只是發生了轉移,但總量維持不變。零和博弈改變了福利的分配狀態。有時候可以選擇,有時候必須選擇,有時候儘量避免。如學校考試排名,公司獎金分配,財政資金分配等。零和博弈有利於調動部分人群的積極性,但存在邊際收益遞減的問題,所以需要及時調整零和博弈格局。
3、避免負和博弈。
把參加博弈各方的所有收益相加,得數為負數的為「負和博弈」,此時,博弈的結果整體減少了社會的福利。負和博弈減少了社會總福利量,且增加了各方的對抗,會激化矛盾。故制度設計和政策安排應引導各方淡化短期利益,重視長期收益,促進各方合作,減少各方對抗。如商家間避免惡性降價競爭、開發商減少暴力拆遷、城管避免釣魚執法等。
承接前文,「負和博弈」是最差的一種博弈結果。
引入:「納什均衡」則是指無法終結,且持續惡化的「負和博弈」。(「納什均衡」有數學定義,本文側重其在經濟學、社會學領域中的含義。)
含義:所謂納什均衡,指的是博弈參與人的這樣一種策略組合,在該博弈演進中,任何參與者單獨改變博弈策略都不會得到好處。換句話說,除非所有人同時改變博弈策略,否則沒有任何人會改變策略,則該博弈組合就是一個納什均衡。
延伸:在沒有強大外力介入情況下,「負和博弈」中的參與者均不會改變博弈策略,無人願意與其他博弈者合作,「負和」局面不斷惡化,博弈的結果越來越差,導致社會總福利持續減少的惡果。通俗來說,就是「惡性循環」無法中止。
舉例:納什均衡的推演:愈演愈烈的作業。
作業布置多少合適?這可不光是寫作業的學生和布置作業的老師博弈的結果,而是多方力量博弈的結果。作業這輪博弈的參與者有學生、家長、老師、班主任、學校管理層、其他競爭學校、政府管理部門。
根據前文所述:
第一輪博弈:正和博弈階段。老師布置的作業不多,學生能順利完成,也樂意完成。雙方的博弈策略為合作博弈,師生都是正收益,此時為「正和博弈」。
第二輪博弈:零和博弈階段。來自家長、考核機制和管理層的壓力,推動了某一科個別教師增加作業量。當此學科作業量激增後,那些作業量較少的學科學習時間將被嚴重蠶食,這些學科成績會顯著下降,但學生的各科總成績不變。教師之間有得有失,收益在教師之間發生了轉移,教師們的收益之和不變。
第三輪博弈:負和博弈階段。為捍衛自己學科的學習時間,這些學科老師也被迫增加作業量。此時,所有學科的作業量都持續增加。學生的身心健康受損,寫作業的積極性下降,教師的批改作業量和勞動強度也大為增加,但大家的考核排名並未有本質變化。此時,博弈就進入了「負和博弈」階段。
第四輪博弈:納什均衡階段。但,悲哀的是,此時沒有老師敢減少自己的作業量,因為你一旦減少作業量,學生就會把這部分時間用於寫其他作業,你的學科利益就會短期受損。這就形成了大家相互加碼,無人選擇退出的「納什均衡」局面。此時,納什均衡下大家的福利總和持續減少(所有參與者都更累了,但排名收益並未有大的變化),形成了沒有贏家、都是輸家的僵持局面,但堅持當下策略卻是僵局中每個參與者的最佳選擇,因為改變當下的策略,自身利益會減少的更快。
第五輪:納什均衡的強化。當某學校、某老師試圖減少作業量,以打破越來越累的「納什均衡」僵局,就會招致家長的強烈反彈:為何不補課?隔壁學校可是在補課呢!為何不重視成績?基於此,單個學校、學科無法獨立改變增加作業的博弈策略,除非所有的學校全部同時結束對抗,走向合作,以集體理性取代個體瘋狂。
這就解釋了作業為何愈來愈多且難以控制難以減少的內在機制。作業布置的「納什均衡」,其原因就在於社會用短期的評價機制考量學生學習和教師業績,必然推動各個博弈參與者為謀求短期收益,採取非理性的對抗性博弈策略。最終形成「負和博弈僵局」,即「納什均衡」局面。
同理,愈演愈烈的惡性補課、惡性延長的學習時間、越來越少的假期、變本加厲的生源大戰,都可以在「納什均衡」中找到答案。
其一、增加優質資源供給,緩解福利焦慮。因為資源越是短缺,人們越趨向於非理性的短期利益,趨向對抗,拒絕合作。比如增加優質學位數量會一定程度緩解了人們爭搶學位的拼搶現象。
其二,增加替代選項。技術進步帶來替代資源的爆炸式增長,是緩解博弈困境的重要機遇。比如辦好職業院校,引導部分學生分流,也會降低競爭烈度。
其三、增加監督機制。防止博弈各方中某一方違規搶跑,否則博弈很容易從正和、零和演化為負和局面。如限制作業布置的上限,嚴懲節假日補課等。
其四、調整福利分配。在資源供給短期內難於增加,替代技術進步緩慢情況下,改變利益分配方案也是一個思路。如把學位按人口比例分解到各下級學校,學校以對教師實行綜合評價制度替代單一成績評價等。
烈日炎炎的下午,納什教授給學生上課,窗外樓下有幾個工人正施工,機器的響聲成了刺耳的噪音,於是納什走到窗前狠狠地把窗戶關上。馬上有同學提出意見:「教授,請別關窗子,實在太熱了!」而納什教授一臉嚴肅地回答說:「課堂的安靜比你舒不舒服重要得多!」然後轉過身一邊嘴裡叨叨著「給你們來上課,在我看來不但耽誤了你們的時間,也耽誤了我的寶貴時間……」,一邊在黑板上寫著數學公式。
正當教授一邊自語一邊在黑板上寫公式之際,一位叫阿麗莎的漂亮女同學(這位女同學後來成了納什的妻子)走到窗邊打開了窗子,電影中納什用責備的眼神看著阿麗莎:「小姐……」而阿麗莎對窗外的工人說道:「打擾一下,嗨!我們有點小小的問題,關上窗戶,這裡會很熱;開著,卻又太吵。我想能不能請你們先修別的地方,大約45分鐘就好了。」正在幹活的工人愉快地說:「沒問題!」又回頭對自己的夥伴們說:「夥計們,讓我們先休息一下吧!」阿麗莎回過頭來快活地看著納什教授,納什教授也微笑地看著阿麗莎,既像是講課,又像是在評論:「你們會發現在多變性的微積分中,往往一個難題會有多種解答。」
阿麗莎對「開窗難題」的解答,使我們得出啟示:那些看似零和博弈或者是負和博弈的問題,也會因為參與者的巧妙博弈策略而轉為正和博弈。正如上文中納什教授所說:「多變性的微積分中,往往一個難題會有多種解答。」
關鍵點就是,用合作策略取代對抗策略。關鍵點就是,以集體理性取代個人理性。
本文轉自微信公眾號「隱蔽的歷史」,作者郭山。文章為作者獨立觀點,不代表芥末堆立場。
1、本文是
芥末堆網轉載文章,原文:
隱蔽的歷史;2、芥末堆不接受通過公關費、車馬費等任何形式發布失實文章,只呈現有價值的內容給讀者;
3、如果你也從事教育,並希望被芥末堆報導,請您
填寫信息告訴我們。
推廣: 芥末堆商務合作:010-5726 9867