關注風雲之聲 提升思維層次
導讀
石頭剪刀布,有什麼策略可言嗎?
最近,我看到一張非常有趣的美劇截屏:
美劇截屏
石頭剪刀布,沒有什麼策略可言。
你去跟中國科學院理論物理研究所的研究人員說吧。他們撰寫了一篇論文,討論人類如何在非競賽-非合作類的策略性行動中做決定。
中國科學院理論物理研究所真的有這麼一篇論文嗎?真的有,2014年發的,他們的官網有一篇文章介紹這個成果。
這篇論文的標題是《Social cycling and conditional responses in the Rock-Paper-Scissors game》(《石頭-布-剪刀遊戲中的社交循環和條件響應》),在《Scientific Reports》 雜誌上發表。(原文連結:http://www.itp.cas.cn/xwzx/kydt/201407/t20140730_4169491.html) 你也許會問,這個遊戲連三歲的小朋友都會玩,有什麼可研究的? 答案是,他們發現了玩家選擇下一次出什麼時的「定向轉動行為」。
論文報告了在浙江大學實驗社會學實驗室進行的跨度近四年的實驗(2010月12月—2014月3月)。
實驗一共招募了浙江大學的360位學生,將他們分成 60 組,每組6 名學生,每一組都玩石頭-剪刀-布的遊戲 300 輪,每一輪都是這同樣 6 名學生隨機兩兩配對廝殺以攢取點數。遊戲結束後,每名學生根據其贏得的總點數獲得相應的真實報酬。 從這些實驗結果,三位作者發現每個學生的遊戲策略似乎很符合經典博弈論的納什均衡理論,即石頭、剪刀、布三種動作在每輪被選中的概率大約是三分之一。這完全是意料之中的。
但出人意料的是,由 6 名學生組成的群體的行為在統計上表現出偏離完全隨機的定向轉動行為。即如果上一輪的結果是贏,那麼下一輪有最高的概率仍然採取上一輪已經採用過的動作;如果上一輪的結果是平,那麼下一輪保持同樣動作的概率也較高,但也有較高的概率逆時針改變動作(即從石頭變為布、或從布變為剪刀、或從剪刀變為石頭,即能贏上一輪跟自己持平的對手的那一個);但是,如果上一輪的結果是輸,那麼下一輪就有最高的概率順時針改變動作(即從石頭變為剪刀、或從剪刀變為布、或者從布變為石頭,即能贏上一輪打敗自己的對手的那一個)。三位研究者將這樣的統計模式稱為條件反應模式。
研究者們基於條件反應模式進行了理論建模,發現只考慮了條件反應模式的理論模型能夠定量地解釋幾乎所有的實驗觀察事實,例如群體層次的定向轉動行為、個體層次的動作選擇慣性效應等等。
這項研究說明,人們看上去非常複雜的個體決策行為和群體動力學行為實際上可以基於很簡單的條件反應模式進行理解。而且理論計算表明,通過優化條件反應模式的決策參數,群體有可能獲得比採用納什均衡策略更高的平均收益,因而實現更高的群體效益。
由此人們可以想到許多深入的問題。例如,條件反應模式到底是人腦的一種基本決策機制呢?還是只不過是更為根本的微觀神經機制的後果和表現?
中國科學技術大學袁嵐峰與鄭昌成榮獲
2020年「安徽省最美科技工作者」稱號 搞科技,鈔能力是硬道理 | 袁嵐峰
不可被破解的量子網際網路,到底是個什麼網?| 袁嵐峰
關於腦機接口設備還有很多問題需要被回答 | 袁嵐峰
背景簡介:本文作者袁嵐峰,中國科學技術大學化學博士,中國科學技術大學合肥微尺度物質科學國家研究中心副研究員,科技與戰略風雲學會會長,「科技袁人」節目主講人,安徽省科學技術協會常務委員,中國青少年新媒體協會常務理事,入選「典贊·2018科普中國」十大科學傳播人物,微博@中科大胡不歸,知乎@袁嵐峰(https://www.zhihu.com/people/yuan-lan-feng-8)。
責任編輯:祝陽