旅鼠之謎
自然界有一種可愛的動物叫做「旅鼠」。它們長得很像大家經常見到的寵物倉鼠,常年出沒在地球高寒地帶,身上覆蓋著一層厚厚的禦寒毛髮,平均塊頭只有15釐米左右。中世紀時,斯堪地那維亞半島的農民把這種嚙齒類動物叫做「天鼠」,這是因為它們的數量會發生神秘的周期性起伏,有的年份裡看不到幾隻,有的年份地裡又會一夜之間憑空冒出漫山遍野的旅鼠,仿佛「從天而降」一樣。這種數量起伏的完整周期一般會持續三到四年。
為什麼旅鼠的種群數量會發生周期性的變化呢?這得從兩方面說起。首先,旅鼠的繁殖能力非常驚人,終其一生都在拼命生育。它們通常一個月就會達到性成熟,之後每五個星期就能產下一窩崽,每一窩都有8隻左右。根據測算,如果食物和地盤充足,只要一年的時間,一個旅鼠種群的成員數量就會直接翻10倍。另一方面,旅鼠所分布的挪威、西伯利亞等高緯度地區植被有限,食物對旅鼠來說是一種極度稀缺的資源,數量龐大而又飢腸轆轆的旅鼠們會刨開雪地凍土,把草根也啃得一乾二淨。暴漲的數量加上稀缺的資源,導致種群迅速陷入饑荒,沒有東西吃的旅鼠成批餓死,然後種群的數量又會跌回之前的狀態。
對於生活在極地附近的動物來說,種群數量在豐年和荒年裡發生波動其實很正常,但是像旅鼠波動得如此劇烈的就顯得不合常理了。為什麼這麼說呢?因為在動物界,其實廣泛存在著各種調控種群數量的「計劃生育」機制,它們的存在就是為了避免出現旅鼠成批餓死的這種情況。比方說,對於大部分鳥類而言,每一窩孵幾隻蛋是一個需要精打細算的事情,生得少了不利於自己的基因在種群內傳播,可如果生育數量超過了食物鏈承載的極限,生下來的雛鳥也只能餓死,平白消耗了有限的生育資源。於是一些鳥類發展出了獨特的信號識別系統,比如歐椋鳥會在繁殖期仔細聆聽棲息地範圍內同類的鳴叫聲,如果聲音很大就表明種群數量較高,生育需要謹慎;如果聲音很小就意味著可以放心生育。這種信號反饋機制寫在了歐椋鳥的基因裡,讓它的種群數量可以長期維持在一個正常範圍之內。
所以問題來了,旅鼠這個物種到底怎麼了?
進化穩定策略
為了回答這個問題,首先需要了解一個叫做「進化穩定策略」的概念,它由理論生物學家梅納德·史密斯提出,是進化博弈論領域的基礎。簡單來說,如果有這麼一種生存策略,一個種群的大部分成員都採用它,而且採用這個策略而非其他策略的生物個體,能夠更好地適應自己種群的當前狀態,那麼它就是進化上的穩定策略。
我們知道,進化是生物一代代不斷適應自然環境的過程。自然環境既包含捕食者和食物等外部生存條件,也包含源於自己同類的種群內競爭壓力。大多數人對前者已經有了足夠的認識,而後者往往更容易被研究者忽略。史密斯提出進化穩定策略這個概念,正是想要描述一種能夠幫助個體成功應對種群內部重複博弈競爭壓力的最佳策略。
舉個例子,博弈論研究裡經典的「針鋒相對」策略就是很多生物種群內的近似進化穩定策略。在多輪次的博弈中,這種策略類型會首先假定對方是好人並在初次博弈中向對方伸出合作之手,如果對方合作,自己下一輪博弈也會合作;一旦對方背叛,自己下一輪就會還擊;可對方只要在下一輪裡痛改前非恢復合作,自己在下下輪裡依然會不計前嫌地和對方繼續合作。一個種群中大部分個體都是這種類型,那麼它們之間就會開展持續的合作,不斷形成雙贏;假設這時有少量惡意策略個體入侵了種群並展開欺騙,儘管針鋒相對策略個體會因此遭受損失,但惡意策略只是日常遇到對手中的少數,大部分情況下針鋒相對策略還是能和其他同類繼續雙贏,所以總體損失並不大;而惡意策略個體則因為欺騙「針鋒相對」而不停地遭到整個種群大部分對手的報復,很快就會被淘汰。可以說,如果大部分成員都是針鋒相對類型,那麼這個種群既可以很好地適應大自然,也能很好地處理內部成員之間的關係。
然而不幸的是,「永遠背叛」同樣也能成為進化穩定策略。試想一個種群裡的所有成員都相互傷害、絕不合作,這時如果有哪個個體主動與陌生人合作就無異於自找不痛快;相反,維持互害關係雖然同樣會給自己造成損失,但這種損失總比單方面信任對方然後被對方欺騙來得少,所以它依然是種群個體在當前狀態下自保的最佳策略。永遠背叛策略佔優的種群適應大自然的能力是非常糟糕的,它很容易被相同生態位上的其他能夠建立成員間合作關係的競爭物種所淘汰。唯一能破解這個困局的辦法,就是種群裡有足夠多的成員同時將策略變為善良的「針鋒相對」,但對於一個已經習慣相互欺騙的群體而言,他們兩兩之間達成互信都已經困難重重,驟然達成一個更廣泛的多人合作機制又有多大的可能性呢?更可能出現的情況是,就算一些個體痛改前非,單方面展現出合作誠意,在其他依然習慣互害的個體眼裡,這只不過增大了從天真的對手身上騙取更多利益的預期,反過來為堅持永遠背叛策略提供了更堅實的理由。
上面兩個截然相反的例子透露出了進化穩定策略的一個重要性質:如果某個進化穩定策略在種群內部獲得了統治地位,那麼其他策略再想要入侵這個種群就會變得非常困難,因為進化穩定策略就是個體在種群當前狀態下的最佳選擇,任何妄圖採取其他策略的個體只能讓自己的生存境況惡化。
至此,我們就不難理解旅鼠種群的困境了。在旅鼠種群裡,「拼命生育」就是一種進化穩定策略,而拼命生育就意味著「永遠背叛」,因為極地食物資源有限,本來只有所有旅鼠節制生育、節用資源,大家的後代才能都活下來;但是假設哪只旅鼠真的主動控制後代數量,其他同類受到繁殖欲望的驅使又沒這麼做,那麼這種「計劃生育」基因在種群內的比例就會越來越低而趨向滅絕,最後只能是那些拼命生育、置資源總量有限而不顧的策略笑到最後。儘管這個策略會傷害到旅鼠種群的整體利益,但它卻能夠勝過節制生育的策略,將自己快速傳播到整個種群中。旅鼠這種相貌可愛的動物竟然生活在這樣一個同類互害程度遠超其他物種的黑暗叢林裡,著實讓人唏噓不已。
旅鼠的例子清晰地闡明了一個道理:某個種群當前的進化穩定策略絕對不等於整個種群應該採取的「最優策略」。進化穩定策略保證的是個體在此時此刻的生存利益而不是種群的整體利益,如果某種策略能夠兼顧兩者,那只是由於種群利益恰好與個體利益一致而已。正因為如此,《自私的基因》的作者理察·道金斯認為「進化穩定策略」有可能是自達爾文以來進化論理論上最重要的發展之一,因為它真正地將基因的自利邏輯貫徹到底:生物是基因的載體,基因所編碼的生存策略只用保證更好地複製和傳播自己就行了,種群的整體利益根本不在基因的考慮範圍之內。的確,大多數情況下,如果某個生物種群的進化穩定策略恰好也能提升整個種群適應自然的能力,那麼自然選擇肯定也會更偏好它。但仍然會存在一些情況,一個糟糕的進化穩定策略會為了一己之私將整個種群推向周期性的崩潰甚至是滅絕。
抱團的力量
旅鼠這樣的永遠背叛型進化穩定策略,很容易讓人想到經典的囚徒困境,但前者的內涵其實遠遠超出了後者,前者代表了一種更普遍意義上的「博弈平衡狀態」。這個狀態可以由合作型策略達成,也可以由背叛型策略達成,還可以由混合型策略達成,無論哪種,博弈的個體都會發現自己陷入了親手參與製造的「泥沼」:自己一方面成為了塑造種群環境的一員,另一方面也被種群環境所圈定,無法掙脫。類似的現象我們在經濟制度形成、文化習俗變遷等很多領域都能觀察到,這表明「進化穩定策略」這個概念並不僅僅適用於生物學研究,它其實是一個普遍存在的規律。包括阿克塞爾羅德在內的眾多科學家對這個規律進行了抽象和一般化,在數學上找到了掙脫「永遠背叛」泥沼的關鍵,這個關鍵就是兩個字:抱團。
前面旅鼠的例子已經告訴我們,任何個體試圖反抗「永遠背叛」策略流行的大環境都是毫無意義的。但如果是一群相互合作的個體抱團闖入,情況就變得不一樣了。這群合作的個體雖然在與原來的群體成員博弈時會遭受損失,但小集體成員彼此之間的合作會給自身帶來收益,只要這個收益足夠大就可以彌補背叛的損失,讓他們能夠有足夠的實力抵禦惡劣環境的傷害。
顯然,收益是否夠抵消損失,取決於這個抱團的小集體有多少成員。也就是說,只要小集體的規模達到了某個最低線,這個小集體就能夠成功地在永遠背叛策略流行的大環境中生存下來。那麼這條線到底是多少呢?儘管具體的數字依賴每一輪博弈裡合作和背叛行為分別可以獲得的收益大小,但總體來說,最低線其實可以很低,低到足以違背大部分人的直覺判斷。
阿克塞爾羅德在《合作的進化》一書中,對這個能讓小集體成功存活的最小成員規模進行了測算。首先假定在一輪典型的囚徒困境博弈中,博弈雙方選擇合作,每個人可以得3分;一方合作一方背叛,背叛者拿5分,合作者只能拿0分;雙方均選擇背叛,每個人只能拿1分。那麼根據上面的分值來計算,如果一個外來的針鋒相對型策略小集體想要在永久背叛的大群體裡站穩腳跟,小集體的人數最少只需要在入侵後佔整個大群體人數的5%就可以。
不僅如此,這個5%的比例還可以繼續下降。我們知道,預期對於博弈結果會產生重大影響。最初雙方從合作中的收益往往是最高的,隨著博弈接近結束,博弈雙方對於合作的預期也會越來越低,這一方面造成了相互背叛可能性的升高,另一方面會讓每一輪合作的收益下降,這就讓重複博弈的收益也出現了經濟學上常見的邊際遞減效應。邊際遞減的速度取決於「未來」有多遠。博弈次數越多,博弈的結束越顯得遙不可及,雙方繼續維持合作的意願也就越高,博弈收益的邊際遞減速度就會越慢,這也越有利於合作策略的生存。阿克塞爾羅德發現,如果將博弈次數增加到200次,那麼針鋒相對策略小集體的最小成員人數在永久背叛大群體中的佔比甚至可以從5%下降到1‰。
這些研究給我們帶來了什麼啟示呢?
首先,一個永遠背叛成為進化穩定策略的群體,想要自發地跳出這個困境是很難的,這一方面是因為個人勢單力薄的反抗等於自取滅亡,另一方面也是由於長期相互背叛的個體之間實在是難以建立起信任:如果沒有過合作的先例,你根本不知道某個宣稱要和你一起對抗大環境的人是真想和你合作,還是只想通過單方背叛拿到更高的收益而哄騙你。
反過來說,如果永遠背叛的群體想要維持現狀,那它需要做的事情就是避免被外部有合作習慣的小集體入侵,同時防止群體內部的某些個體抱團。換句話說,必須讓群體長期處於一盤散沙的狀態,不允許成員自發組成小集團。
緊接上一條,打破地理隔離、實現大規模的成員流動也是永遠背叛策略集體維持現狀的必要條件。這是因為封閉的地理單元裡博弈個體數量較少,很容易由於自然突變等原因迅速出現一批互信的成員建立起合作關係並發展壯大,只有大規模的外來成員遷入,才能淹沒小地理單元裡自發出現的合作關係。旅鼠之所以一直處於永遠背叛狀態,一個很大的原因就在於這個物種過於強大的遷徙能力:每當一個地區被擠得水洩不通,多出的旅鼠們就會馬上遷徙到鄰近區域,把鄰近區域也拖進拼命生育的軍備競賽中,這樣就很難留出足夠的時間和空間讓一小群旅鼠演化出節制生育的基因。
最後,永遠背叛的群體看似強大,但實際上是很容易被入侵的。一個非常低比例的合作策略小集體就能夠在這樣的群體裡紮根下來,只要時間足夠,它們就能通過自然選擇之手逐步壯大,最終將合作的秩序擴張到這個原本黑暗的角落裡。
合作秩序的擴張
既然互害的群體無法避免被抱團的合作策略個體入侵,那麼反過來,合作的群體能否避免被欺騙策略組隊入侵呢?答案是肯定的,但這樣的合作群體需要滿足兩個條件。
第一,合作策略本身必須具有睚眥必報的特點,也就是說,合作策略的個體一旦在某輪博弈裡被騙,那麼它下次就一定會報復回去。針鋒相對策略就有這個特點,而在第二次遭到背叛後才報復回去的「兩報還一報」策略無疑太過寬容了,由它組成的群體很容易遭到那種喜歡試探一次後再合作的惡意策略入侵,因此它並不如針鋒相對策略穩健。
第二個條件是博弈收益的邊際遞減速度必須大於等於某個臨界值,或者說,博弈的時間要足夠長。以各種合作策略中最穩健的針鋒相對策略為例,假設相互合作、單方背叛、被單方背叛和相互背叛行為所獲得的分值依然是3分、5分、0分和1分,那麼只要當每一輪博弈的收益值至少是前一輪收益的2/3時,惡意策略無論是單獨還是抱團作為小集體前來,這個合作群體都能阻止它們的入侵。
善良策略只要抱團就能入侵永遠背叛的群體,而惡意策略卻無法抱團入侵滿足上面兩個條件的善良策略群體,這是善良策略相比於永遠背叛策略的絕對優勢,它給我們描繪了一副基調光明的圖畫:永遠背叛的進化穩定策略雖然存在,但善良的合作策略一方面能夠集體入侵這種群體,另一方面又能保護自己免遭對方的入侵,使得合作秩序總是處於一種擴張的態勢下,這也許就是大自然隱藏在弱肉強食之後更加美好的真相吧。