就連「石頭剪刀布」,人類也玩不過AI了?

2021-01-07 網易

  如果說有一種解決問題的方法能跨域文化、種族和地域,那麼除了抽籤這種純靠運氣的方式,恐怕只剩下猜拳了。

  人們普遍認可 「石頭-剪刀-布」 三者之間的克制關係。「公平+隨機」 的特性使其不僅是活躍氣氛的小遊戲,更能作為一種相對公平的解決問題的手段,廣泛應用在解決分歧,決定順序,或者確定歸屬的關鍵時刻。

  更不用說,在誰洗碗、誰拖地、誰做飯之類的家務活上,猜拳自帶的 「願賭服輸」 可以有效維繫家庭和睦,堪稱隨叫隨到的家庭關係調解員。

  在大多數人的認知裡,猜拳是隨機事件,玩家獲勝的概率應該是一樣的且恆定在三分之一,但事實可能並非如此。

  近日,浙江大學何賽靈教授的研究團隊開發了一個基於馬爾可夫鏈的 AI 模型,專門用來玩猜拳遊戲。在和 52 名人類玩家分別大戰 300 回合之後,AI 擊敗了 95% 的玩家。

  

  AI 模型淨勝場數變化

  對於人類玩家來說,規則是贏 +2 分,平 +1 分,輸不得分。在與 AI 對戰之前,參與者知道獲勝會獲得金錢獎勵,總分越高,贏的錢越多。因此玩家故意放水或者隨便亂選的概率極低。

  即便如此,AI 仍然大勝人類。在最懸殊的一場較量中,AI 獲得了 198 次勝利,55 次平手,僅輸了 47 次,勝率超過人類對手 4 倍。全部 15600 回合詳盡的原始博弈數據,在論文的補充資料中給出(詳見參考文獻)。

  如果猜拳勝負真的是隨機概率,那麼從統計學的角度來講,15600 場比賽下來,AI 獲得如此大優勢的概率非常低。

  擁有「智囊團」的Multi-AI模型

  本質上來看,猜拳屬於博弈問題,其背後蘊藏著經典的納什均衡,而每個個體的習慣、認知、策略和策略變化都會影響實際勝率。比如你和對手很熟悉,那麼你可能知道他/她經常出布,因此可以多出剪刀來克制。

  浙江大學何賽靈教授團隊提出的 AI 模型就是利用了類似的方法,證明了猜拳真的存在針對不同個體的長期制勝策略,可以有效提高勝率。

  這套 AI 模型基於 n-階馬爾可夫鏈設計,擁有記憶性,能夠向前追溯最多 n 個歷史狀態並加以利用。

  為了在實戰中應對人類玩家的不同性格和策略,研究團隊還發明了一套 Multi-AI 模型。

  「建立對每個人都有效的單一模型很困難,因此我們決定將單個模型結合起來,使其能夠區分和適應更多不同的競爭策略。」 研究人員在論文中解釋稱。

  在與人類對戰的第一套 Multi-AI 模型中,他們放入了 1-5 階馬爾可夫鏈,即 5 個獨立的 AI 模型,分別參考之前 1-5 個動作。Multi-AI 會從整體上參考 5 個 AI 模型各自的決策,至於選擇哪個,還要看它們最近 5 次的表現。

  這裡的 「最近 5 次」 被定義為一個超參數,名為 Focus length,可以視情況調整大小,實現進一步優化。在與人類對戰的第二套 Multi-AI 模型中,該參數就被設為了 10。

  打個比方,每一個 n 階馬爾可夫鏈模型就像是一位軍師,各自有不同的決策標準。而 Multi-AI 模型就是司令,手底下有好多名軍師組成的智囊團。做決策時,每個軍師會提交自己的出拳建議,司令會根據他們過去幾次(Focus Length)的表現,採納綜合分數最高的人的建議,以提高長期勝率。

  如果人類玩家連續勝利,就會促使 Multi-AI 轉向選擇其他 AI 模型的更優解。如果人類玩家連續失敗,大概率會轉換策略,或者打破之前的出拳規律,這時 Multi-AI 也可以隨之調整。

  最終的社會實驗結果反映出了這個想法的有效性。在 52 名志願者中,只有不到 5 人擊敗了 AI。很多人都在最初 20-50 個回合裡處於領先,但隨後就被 AI 捕捉到了隱藏的行為模式,飲恨敗北。

  那些擊敗 AI 的人,勝率也只是稍微高出一些,並未拉開太大差距。

  6 年前被質疑的研究

  值得一提的是,在開發 AI 模型背後的算法時,研究團隊閱讀了 6 年前另一個浙大團隊的研究成果,但使用了另一種不同的博弈策略。

  相較於之前對於所有玩家數據整體以統計學的方式進行研究,這裡的 Multi-AI 模型更強調針對不同玩家之間的個性差異、出拳策略,來及時的進行調控,選取當下最適宜的博弈策略。

  2014 年 5 月,很多媒體都報導了一項以 「石頭剪刀布」 遊戲為對象的科研成果。

  這項研究課題原本是 「可控實驗社會博弈系統中一些非平衡統計物理問題」,但媒體和輿論關注的重點大多是 「如何提高猜拳勝率」,因此還被質疑是浪費經費。

  其實不然。這項研究還被《麻省理工科技評論》評為 2014 年最佳成果(預印本)之一。

  
編輯:王星

  圖文來源:Deeptech深科技

  聲明:轉載此文是出於傳遞更多信息之目的。若有來源標註錯誤或侵犯了您的合法權益,請作者持權屬證明與本網聯繫,我們將及時更正、刪除,謝謝。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺「網易號」用戶上傳並發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關焦點

  • 玩,你就輸了!「石頭剪刀布」警惕新型詐騙方式
    「剪刀石頭布」的遊戲我們都玩過,玩法簡單明了,不存在什麼規則漏洞。玩一次,憑運氣;玩多了,比心理。最近,遼寧警方破獲了一起新型詐騙案,據說,受害人超過5000人,涉案金額超過500萬多元,而嫌疑人的「作案工具」,正是「石頭剪刀布」。電影《動物世界》裡,犯罪集團利用一場「石頭剪刀布」的遊戲,操控著賭徒們的命運。
  • 如何在「石頭剪刀布」遊戲中獲勝?
    玩 「石頭剪刀布」就像數數那麼簡單,但要獲勝卻沒那麼容易。贏得遊戲的機率是多少?這簡單——三分之一。至少概率是這樣告訴我們的。但人們並不是隨機地玩這個遊戲——研究表明,人們會按照一種隱藏的模式來玩,根據這種模式,勝利的概率可以高於三分之一。
  • 「石頭剪刀布」或能揭示生物演化?
    「石頭剪刀布」是遊戲中解決爭端的常用方式,每人各出剪刀、石頭、布中的一種,通過石頭砸剪刀、剪刀剪布、布包住石頭的規則,可以在兩人甚至多人中決出勝負。不過,科學家發現,大自然也用自己的方式玩著類似「石頭剪刀布」這樣的遊戲,數學家和生物學家利用這種方式研究了從人類社會到培養皿中的細菌的各種現象。如今,研究者又發現,當玩家不斷改變策略時,三種武器的使用頻率會輪流上升與下降,呈現出一種固定的模式。這一發現或許可以幫助我們理解生物在生存之爭中是如何維持競爭策略的。
  • 《石頭剪刀布傳奇》:給孩子正向競爭觀
    出版方供圖南報網訊(記者 解悅)每個孩子都玩過「石頭、剪刀、布」的遊戲,現在,來讀 一讀關於這個傳奇遊戲的故事《石頭剪刀布傳奇》,看看「石頭、剪刀、布」在輸掉 遊戲和贏得遊戲時的表現吧。這是一個讓孩子們著迷的故事,藉由孩子每天都在玩的遊戲,幫助爸爸媽媽完成 孩子的正向競爭觀啟蒙——「石頭、剪刀、布」在打敗別人時,不趾高氣昂,在被別 人打敗時,也沒有沮喪和自我否定。跟著三位小夥伴一起,孩子們會發現,與自己的小夥伴共同享受旗鼓相當的歡樂,才是競爭和比賽的意義所在。隨著社會發展,無論是在哪個國家,競爭壓力都越來越大,沒有人能脫離競爭環境 。
  • 石頭剪刀布英文怎麼說?一首好聽的兒歌告訴你!
    你和小夥伴們通常喜歡玩什麼遊戲呢?有一個遊戲大家肯定都玩過:石頭剪刀布! Rock Paper Scissors !rock 石頭   paper 紙    scissors剪刀(英文裡用「紙」代替我們說的「布」,都是手掌打開代表的形狀)石頭剪刀布,英文裡通常的順序是 Rock Paper Scissors!
  • 「石頭剪刀布」制勝策略引爭議 專家稱屬博弈論
    研究作者在論文中稱所發現的「贏家留,輸家變」的策略可以帶來更多人類決策模式的研究,而未參與該論文的科研人員則肯定了從博弈論角度研究剪刀石頭布這一方向,但樣本來源應更豐富。 記者 劉嘉  研究者給出「獲勝策略」  石頭剪刀布的遊戲人人都不陌生,但要做「常勝將軍」確非易事。
  • 《微信》石頭剪刀布和搖骰子玩法說明介紹
    微信是一款非常火熱的聊天軟體,現在有很多小夥伴們都喜歡用這款社交軟體來和身邊的朋友們進行聊天或者辦公,微信同時還有娛樂功能供大家消遣哦,那麼微信石頭剪子布及搖骰子該怎麼玩呢?下面小編就給大家介紹一下微信石頭剪刀布和搖骰子玩法說明,希望對大家有所幫助。
  • 來和這個機器人玩玩「石頭剪刀布」,享受被支配的快感吧
    石頭剪刀布」,體驗被支配的快感!Reddit上一位大神用3層簡單RNN訓練出一個「石頭剪刀布」大師,你下一把想出什麼,它都能猜個差不多。採用3D列印的漂亮外殼,紐扣電池即可供電,不服來戰!關注新智元和群,了解更多前沿AI資訊! 我們每個人都玩過石頭剪刀布,這個簡單的遊戲,似乎總有人特別擅長。你總覺得自己出什麼,都盡在對面的掌握之中。
  • 和YoYo、QQ一起,玩美國版石頭剪刀布吧(組圖)
    上周日(8月9日),兄弟倆擔當起小老師的角色,帶領同住廊橋水岸的16位小朋友進行英語交流,體驗美國孩子常玩的小遊戲,大家很快就成了好朋友。美國版小遊戲受追捧「石頭剪刀布」是中國孩子都玩過的遊戲,在美國版本中,只是對應的詞語變換成了英語,當說完「Rock(石頭)、Paper(布)、 Scissors(剪刀),show(出)」之後,孩子們就根據各自出示的動作斷定輸贏,遊戲大意並未變化。「因為大家都會玩,動作和單詞都簡單,孩子們對這個遊戲的接受度最高,這是人氣最旺的一個遊戲。」
  • 聽兒歌學日語:石頭剪刀布
    小朋友們對中文的「石頭剪刀布」兒歌已經耳熟能詳啦!日語兒歌中也有同樣的歌曲喲,我們一起來聽一聽吧!學習兒歌的同時一起學習幾個單詞吧。グー チョキ パーグー チョキ パーでいろんなものをつくってみよう。グー チョキ パーで なにつくろう なにつくろうみぎてがチョキで、ひだりてもチョキで かにさん かにさんグー チョキ パーでグー チョキ パーで なにつくろう なにつくろう みぎてがグーで ひだりてがパーで めだまやき めだまやき日語單詞:石頭
  • 「石頭剪刀布」用英語怎麼說?
    石頭剪刀布遊戲源於中國,然後傳到日本、韓國等地,隨著亞歐貿易的不斷發展,後來又傳到了歐洲。因此,石頭剪刀布是中國的東西,但英語中不說stone-scissors-cloth而是rock-paper-scissors
  • 物種間的競爭,其實也是在進行「石頭剪刀布」
    加州大學聖地牙哥分校生物動力學和合成生物學博士生麥可·廖(Michael Lio)參與了這種工程細菌系統的開發,他說這三種菌株的相互關係就像石頭剪刀布一樣。    加州大學聖克魯斯分校的數學生物學家巴裡·西納沃(Barry Sinervo)說,答案就是「石頭剪刀布」。  石頭剪刀布的特點在於,沒有任何一個角色有優勢,無論參與者如何選擇,獲勝的機會都是相等的。而且當兩個人玩的時候,總有一個明確的勝利者。當有更多玩家加入時,遊戲會變得更加複雜,不同策略的成功率往往會周期性地上升和下降。
  • 李易峰主演《動物世界》石頭剪刀布遊戲竟然如此燒腦
    李易峰主演的《動物世界》在暑期上映,不過整個暑期,我都沒有注意到這部影片。近日,咕咯嗒土雞蛋通過搜索最新電影才觀看了這部電影。總體來說電影的表現手法比較新穎,故事情節緊湊有內涵。最讓我震驚的是,一個我們經常玩的遊戲石頭剪刀布,竟然可以如此燒腦!
  • 別不服,這樣的「石頭剪刀布」你玩不來
    「猜拳」就是所有人都會玩的石頭剪刀布,三種手勢相互克制互為輸贏,絕對簡單公平。然而在福本伸行的作品中,原本再簡單不過的猜拳,被上升到了燒腦的高度,看完不禁懷疑之前自己玩的是不是假的石頭剪刀布。預告片中的設置與原著相同,3種手勢變成了相對應的紙牌,不過紙牌數有所限制。
  • 抖音石頭剪刀布一把十手倒過來念梗是什麼意思 有啥內涵梗
    抖音石頭剪刀布一把十手倒過來念梗是什麼意思?石頭剪刀布一把十手倒過來念是抖音上出現的新梗,起源是有人在玩石頭剪刀布,然後再倒過來念的,那這個簡單的遊戲為什麼會有這麼多人在玩呢?下面小編帶來了抖音石頭剪刀布一把十手倒過來念梗意思介紹,一起來看看吧。  抖音石頭剪刀布一把十手倒過來念梗意思介紹
  • 英語詞彙:石頭剪刀布英語怎麼說
    新東方網>英語>英語學習>語法詞彙>詞彙指導>正文英語詞彙:石頭剪刀布英語怎麼說 2013-02-25 14:23 來源:網絡 作者:
  • 文藝評論丨《石頭剪刀布》:遊戲規則與問題意識
    《石頭剪刀布》:遊戲規則與問題意識 張璐丹 陶少鴻的中篇小說新作《石頭剪刀布》在《當代》雜誌2015年第5期發表,並被《小說月報》2015年第10期轉載。這是一篇針對官場現象和現實問題進行尖銳批判的作品。
  • 王學兵「勇敢愛」朱丹 微電影《石頭剪刀布》上線
    王學兵「勇敢愛」朱丹 微電影《石頭剪刀布》上線   中新網4月2日電 由劉奮鬥執導,實力派演員王學兵、美女主播朱丹主演的懸疑愛情微電影《石頭剪刀布》將於4月4日正式登陸優酷土豆,並已於3月21日在付費頻道搶先點映。
  • 用科學來解釋,如何在「石頭剪刀布」這個遊戲中大概率的獲勝!
    「石頭剪刀布」這個遊戲在民間很流行,它是一種很常見的隨機遊戲。這個遊戲的規則很簡單直觀:石頭打剪刀,剪刀剪布,布包裹石頭。表面上看,沒有一種姿態是絕對主導的,三者相互制約,形成公平的「雙贏鏈」。也就是說,當玩家在「石頭剪刀布」上做任何手勢時,勝負甚至是1/3的概率。因此,遊戲往往被用作一種公平的獲勝方式。
  • 怎麼成為「石頭剪刀布」大贏家?怎麼讓腦子裡的歌停下來?
    玩「石頭剪刀布」總是輸?你喜歡的人對你無感?別人不願接受你的想法?沒關係,了解一點心理學知識,也許能讓你佔據更多的主動。下面的這些心理學小把戲,會讓你在人生中時時成為贏家。關鍵是,很容易學哦。本文為編譯,有部分刪節。