微軟麻將AI超越人類後,研究團隊稱有意出教材提升人類牌技

2020-12-14 澎湃新聞

人類以後想提升自己的麻將技能,可能要拜人工智慧為師了。

微軟亞洲研究院研發的麻將AI系統Suphx在國際知名專業麻將平臺「天鳳」上榮升十段,且超越99.99%的人類後,研究團隊在接受澎湃新聞(www.thepaper.cn)採訪時稱,有日本出版社有意聯繫,準備把Suphx打的牌譜出一本書,如果對麻將感興趣的,大家可以通過這本書來學怎麼打麻將。

4月9日,微軟亞洲研究院Suphx研發團隊通過線上直播,詳細介紹了Suphx的技術細節,其論文近日在arXiv平臺上發布。直播結束後,微軟亞洲研究首席研究員秦濤、微軟亞洲研究院高級研究工程師李俊傑在接受澎湃新聞採訪時表示,團隊目前正在和天鳳平臺協商,看是否考慮推出類似提升人類牌技的服務。例如,通過輸入一個人當前的牌面,Suphx會告訴這人該打哪張牌,以及它為什麼打那張牌。

有意思的是,據兩位研究員透露,有日本出版社在聯繫,希望Suphx打的牌譜出一本書。「因為有麻將愛好者將 Suphx 稱作麻將教科書、Suphx老師,如果對麻將感興趣同學們,他們可以通過這個書來學怎麼打牌。 」

Suphx如何提升牌技

去年8月,微軟亞洲研究院在世界人工智慧大會上正式宣布由其研發的麻將AI系統Suphx成為首個在國際知名專業麻將平臺「天鳳」上榮升十段的AI系統。

在過去半年多的時間裡,研究團隊對Suphx又進行了調整。具體來說,一是把整個系統架構進行了重新的優化,使它更快、更好。另一個是,在算法上也做了改進,比如「先知教練」。從博弈論的角度來看,麻將是多人非完美信息博弈。麻將一共有136張牌,每一位玩家只能看到很少的牌,包括自己的13張手牌和所有人打出來的牌,更多的牌是看不到,包括另外三位玩家的手牌以及牆牌。面對如此多的隱藏未知信息,麻將玩家很難僅根據自己的手牌做出一個很好的決策。

但通過先知教練,Suphx可以可以看到所有的信息,包括(1)玩家自己的私有手牌,(2)所有玩家的公開牌,(3)其他公共信息, (4)其他三個玩家的私有手牌,(5)牆牌。只有(1)(2)和(3)是正常的玩家可以獲得的,而(4)和(5)是只有「先知」才能獲得的額外的 "完美 "信息。

在Suphx中,Suphx研發團隊首先使用包括完美信息在內的所有特徵來對「先知」進行強化學習訓練,在這一步中控制「先知」的學習進度,不能讓其過於強大。然後,通過對完美特徵增加mask逐漸使「先知」最終過渡到正常AI。接著,繼續訓練正常AI並進行一定數量的迭代,採用衰減學習率和拒絕採樣的技巧來調整訓練過程,讓AI的技術不斷精進。

正如AlphaGO一開始以人為師,升級後,開始自己「左右互博」,不斷提升。秦濤在採訪中表示,Suphx也嘗試過完全不用人的數據做訓練,直接用self-play,是可以做好的,只不過是訓練速度會慢一些,這也涉及到背後算法要做一些新的改動,讓計算機學得更快。

未來可用在股票操盤上

Suphx會打麻將只是第一步。兩位研究員稱,團隊正在金融行業和物流行業做一些嘗試,讓Suphx技術落地實際應用場景。

在金融領域裡,如果我們能提前知道明天股票行情是,那麼今天的投資肯定會做得很好,這在某種程度上就是完美信息。例如,今天A股已經閉盤了,那麼我們就知道了今天所有的股票信息,當我們再回頭看昨天,假設昨天做決策的時候就知道了今天股票的信息,那對股票操作來說就是完美信息。研究員認為,在這種情況下可以利用完美信息,幫助我們把模型訓練得更好。實際應用的時候就像麻將裡面一樣,通過完美信息,我們可以得到一個非常強大的老師——Teacher model,這樣學生模型student model也會學的很好。

在機器翻譯領域中,完美信息也很有幫助。比如在機器翻譯中,如果知道一句話的上下文,可能它翻譯得更好,即完美信息。但實際中不一定每句話我們都知道它的上下文,但是訓練中我們可以拿到完美信息,就可以幫助我們將翻譯做得更好。

還有哪些不足

從此次發表的論文看,Suphx的技術表現堪稱完美。但在兩位研究員看來,未來Suphx還有進步的空間。

「比如我們現在很多時候還是用了高手的數據訓練一個模型,然後再到強化學習,但是我們有不同的麻將平臺及規則,不一定所有的平臺都能拿到人類的數據,在這種情況下怎麼能不用人的數據直接從0開始,這是我們在做的一件事情。」秦濤說。

相比圍棋、象棋以及DOTA遊戲,麻將的隨機因素很多,這對模型的訓練和測試都會帶來很大的影響。據研究團隊透露,他們的模型在測試的時候基本上會跑100萬場遊戲,才能明確地知道誰更厲害,這就跟圍棋很不一樣,圍棋五局三勝,麻將不同。這種情況下如何更快地完成對弈,得出可信賴的結果,也是團隊在研究的一個問題。

最後,團隊還在考慮,Suphx能針對性地,面對不同的對手採取一些自適應策略。

(本文來自澎湃新聞,更多原創資訊請下載「澎湃新聞」APP)

相關焦點

  • 新型蝙蝠病毒或致考拉滅絕;微軟麻將AI將教人類打牌;斯坦福研發...
    (快科技)微軟麻將AI超越人類,有意出教材提升人類牌技#計算機微軟亞洲研究院研發的麻將AI系統Suphx在國際知名專業麻將平臺「天鳳」上榮升十段,且超越99.99%的人類後,研究團隊在接受澎湃新聞採訪時稱,有日本出版社有意聯繫,準備把Suphx打的牌譜出一本書,如果對麻將感興趣的,大家可以通過這本書來學怎麼打麻將
  • AI在這張「問卷」上首次超越人類,SuperGLUE被微軟谷歌「攻破」
    在最新的NLU測試基準SuperGLUE中,人類首次被AI超越了。SuperGLUE相比「前輩」GLUE大大提升了問題的難度,提出一年多以來,人類一直處於第一位。現如今,人類一下子被兩家AI超越。一個是來自微軟的DeBERTa,一個是來自谷歌的T5+Meena。
  • 直播丨微軟超級麻將AI Suphx 如何榮升十段?研發團隊深度揭秘技術...
    作為在中國乃至整個亞洲地區都家喻戶曉的大眾娛樂項目,麻將僅在亞洲地區就擁有上億玩家。極高的普及度使得很多人都認為麻將是一項十分容易的棋牌類遊戲。然而,雖然麻將入門容易,但要真正打好麻將、精通麻將卻十分困難。
  • 超越99.9%人類玩家,微軟專業十段麻將AI論文細節首次公布
    在去年 8 月底的世界人工智慧大會上,時任微軟全球執行副總裁的沈向洋正式對外宣布了微軟亞洲研究院研發的麻將 AI「Suphx 」。近日,關於 Suphx 的所有技術細節已經正式公布。一直以來,麻將都因其複雜的出牌、得分規則和豐富的隱含信息,被視為 AI 研究中極具挑戰性的領域。微軟亞洲研究院副院長劉鐵巖曾表示:「可以說 Dota 這類遊戲更「遊戲」,而麻將這類棋牌遊戲更「AI」。」
  • 麻將AI超越99%人類玩家:專業十段,學習能力堪比阿法狗
    近日,微軟發布了一份關於麻將AI「Suphx(意為Super Phoenix,超級鳳凰)」的修訂版預印本文件,介紹說Suphx是一個專業十段水平的「選手」,超越了99%人類玩家,這是電腦程式首次超過麻將中大多數頂級人類玩家。
  • 麻將AI難在哪?微軟宣布公開麻將AI Suphx 的十段秘籍
    近日,微軟亞洲研究院Suphx研發團隊在arXiv平臺上正式發表論文,公布了Suphx背後的核心技術。麻將AI面臨的挑戰麻將AI系統Suphx主要基於深度強化學習技術。儘管深度強化學習在一系列遊戲AI中取得了巨大的成功,但想要將其直接應用在麻將AI上殊為不易,面臨著若干挑戰。
  • 微軟AI模型在SuperGLUE基準超越人類位居排行榜第一
    紐約大學、華盛頓大學和DeepMind在2018年的時候,發布通用語言理解評估(GLUE)基準,來評估模型的語言理解程度,但是有不少自然語言處理模型,在GLUE特定任務的表現,已經遠遠超過人類,但是即便這些模型可以在GLUE超越人類,但是卻無法良好處理某些人類可以輕鬆且完美解決的問題,因此研究人員設計出SuperGLUE,來更好地評估模型能力。
  • 麻將AI難在哪?微軟宣布公開麻將AI Suphx 的十段秘籍_手機網易網
    近日,微軟亞洲研究院Suphx研發團隊在arXiv平臺上正式發表論文,公布了Suphx背後的核心技術。麻將AI面臨的挑戰麻將AI系統Suphx主要基於深度強化學習技術。儘管深度強化學習在一系列遊戲AI中取得了巨大的成功,但想要將其直接應用在麻將AI上殊為不易,面臨著若干挑戰。
  • 微軟最強麻將AI首次公開技術細節!專業十段水平,或能用於金融預測
    Tenhou社區中的人類玩家也證實Suphx具有超強學習能力,99.99%的玩家認為模型經過訓練後表現有所改善。本周,微軟團隊發布了一份修訂版預印本文件,對Suphx進行了全面介紹。二、Suphx:兩天訓練150次,熟練掌握5種模式在微軟的研究中,研究人員選擇用日本4人麻將(Riichi Mahjong)規則訓練Suphx模型,訓練數據來自Tenhou社區。
  • 微軟和谷歌在SuperGLUE榜單上暴錘人類!用「字生圖」只是前菜
    在剛剛刷新的SuperGLUE上,微軟的DeBERTa和谷歌的T5+Meena分列第一第二,超越人類基準線,這是SuperGLUE引入以來,AI首次得分超過了人類的表現。難道說2021,AI正在加快縮小與人類的差距?AI全方面完勝人類,是時間問題,還是技術問題?話說昨天,人類受到了來自AI的2021第一波挑釁:OpenAI的DALL-E 和 CLIP。
  • 強化學習走出研究實驗室,微軟如何落地新型AI解決方案?
    微軟還在內部使用Personalizer在Windows、Edge瀏覽器和Xbox上選擇合適的優惠、產品和內容。這些方案在每個月數十億次的個性化定製中,給參與度帶來了高達60%的提升。團隊還使用了強化學習為視頻會議找到最佳的抖動緩衝,以犧牲毫秒級的信息延遲來提供更好的連接連續性。
  • 7 Papers & Radios | 微軟亞研麻將AI「Suphx」技術細節
    機器之心機器之心 & ArXiv Weekly Radiostation參與:杜偉、楚航、羅若天本周的重要論文有微軟麻將 AI 研究團隊公布 Suphx 所有技術細節,以及港中文聯合商湯科技推出的特徵級通用時序金字塔網絡
  • 『AI翻車』事件已超1000+,特斯拉,微軟、谷歌、蘋果等全部...
    https://incidentdatabase.ai/在這些事故中,有的可能只是鬧了個笑話,但有的已經對人類造成了實質性的傷害,或者為國家完全埋下了隱患。當日,正在高速行駛的特斯拉Model S,玻璃天窗突然脫落,並順勢向後飛去,翻轉數圈後險些砸到後面行駛的車輛。隨即特斯拉官博做出回應,稱「該車輛曾在第三方授權鈑噴中心進行過車頂玻璃的更換,會對此事展開詳細調查」。不少網友對此並不買帳,認為「第三方也是特斯拉授權的,這是明顯的甩鍋行為」。事實上,近些年特斯拉頻頻爆出的交通事故問題,已經讓部分用戶失去了信任。
  • 最新研究稱白鯨可模擬人類聲音與人類「說話」
    一隻白鯨吹出心形水泡  【搜狐科學消息】據國外媒體報導,科學家們表示,那些學習模仿人類聲音的白鯨,也許是嘗試著與人類進行接觸。這隻雄性白鯨名叫Noc,它能發出清晰可辨類似於人類說話的聲音,這使得那些認為鯨類發出聲音與人類截然不同的科學家們大吃一驚。  據報導,Noc在位於美國加州聖地牙哥的國家海洋哺乳動物基金會與海豚和其他的白鯨們一起生活了30年,並於五前去世。直到現在,研究團隊才公布了他們的發現,這些難以置信的聲音記錄也是第一次被披露出來。
  • 牛津大學:AI 超越人類編年史(附下載)
    AlphaGo 在檔案上把這一天記錄為「柯潔點」,意味著人類在智力上最後的輝煌和衰落的開始。「柯潔點」之後,AI 編年史將如何展開?在哪些時間節點上,AI 將實現對人類的超越?牛津大學最近完成了一項對機器學習研究人員的大型調查,調查內容是他們對 AI 進展的看法。
  • 虛擬偶像「成團」,人類攜手AI共同「撐腰」
    全球首支人工智慧MV「智能家園」在2020世界人工智慧大會雲端峰會發布,由四位AI虛擬偶像微軟小冰、百度小度、小米小愛同學和bilibili(下稱「B站」)泠鳶yousa傾情獻唱,他們唱跳全能還會作曲,你要pick哪位虛擬偶像?
  • 馬斯克稱AI會超越人類,智械危機是科幻想像還是我們的未來?
    7月23日消息,埃隆·馬斯克近期在媒體平臺上重申了自己對人工智慧的擔憂,他認為AI在未來將會超越人類,聰明人自以為能掌控一切,但計算機要比他們聰明得多。馬斯克堅信AI會超越人類,總覺得充滿著一股魔幻現實主義色彩,對人類的智慧就這麼沒自信嗎?要知道,他自家的公司還在緊鑼密鼓地研發AI自動駕駛技術,前陣子在世界人工智慧大會上宣傳特斯拉已經「非常接近」實現5級自動駕駛技術,相關的基本功能正在開發。5級自動駕駛技術意味著全自動駕駛,在任何場景下遇到任何情況都無需人類駕駛員的幹預,依賴於先進的AI智能技術。
  • AI唱歌不僅中英文無壓力,還會粵語!微軟聯手浙大研發出DeepSinger
    從整首歌的歌詞、卡點、節奏來看,這首《智聯家園》演唱得不亞於專業音樂團隊。如果只聽音樂,恐怕很難分辨出這是AI生成的歌聲。我們知道,歌聲不同於正常人的語音,高低音轉換,BGM的配合,有著更複雜的模式和節奏,這對於AI來說並不是一件容易的事兒。不過,最近一個研究團隊,卻此基礎上挑戰了更高階的AI技術——生成多種語言風格的AI系統。
  • 如何提高四川熊貓麻將牌技的六大要素技巧與攻略
    四川熊貓麻將是款娛樂性較高,相比之下競技性稍低的棋牌麻將遊戲,牢記以下介紹的六大要素,根本也能夠算半個麻將高手了。熊貓戰績分享進步四川麻將牌技的六大要素1)起牌。2)起牌後,定缺,缺哪家?一般是缺少的那家牌。假設兩家數量持平,保存牌型更規整的那家。3)開始,上場。四川麻將在起完手牌後要定缺門的,他人定缺哪門牌,你一般需求記住。有幾種狀況:三家缺一門,兩家各缺一門,四家缺一門。最多的狀況是兩家各缺一門。
  • 吸收人類400年畫技 微軟小冰央美研究生畢業了
    在小冰的演唱模型今年更新到V5之後,她又學會了一項專業歌手必備的技能「中氣」——通過提升歌聲演繹的預測參數能力,模仿歌手演唱時的中氣,讓出聲能更加飽滿,更具有人聲的那種豐富和充沛感。這一模式現在照搬到了美術界,他們甚至開始想像,她所學習的236位畫家通過小冰這一框架,在現代再次「重生」後的藝術創作景象。我並不懂藝術,但讓小冰就中國城市化進程為主題,以過去大師的技法進行表達而生的畫作,看起來是有種說不出的……魔性?評判還是要交給真正懂藝術的人才行。