比阿法狗更強?最強麻將AI來了

2020-12-05 科技富能量Plus

神秘AI橫掃日本麻將界

2019 年 3 月起,一款名叫Suphx的人工智慧,獲批進入日本專業麻將平臺「天鳳」。短短四個月內,Suphx 在該平臺瘋狂對戰 5760 次,成功達到十段,從而在日本麻將界聲名大噪。

麻將在中國群眾基礎深厚、普及率高,有「國粹」之稱,但民間流行的麻將規則不一,且競技化程度相對較低,而日本麻將擁有世界上競技化程度最高的麻將規則。

日本專業麻將對戰平臺

天鳳則是業界知名的高水平日本麻將平臺。它吸引了全球近 33 萬名麻將愛好者,其中不乏大量的專業麻將選手。

由於單局麻將存在著很大的運氣成分,所以天鳳平臺會通過「穩定段位」來衡量一位玩家的真實水平。在 5760 場比賽過後,Suphx 的穩定段位超過了8.7,不僅高於爆打和 NAGA,還超越了頂級人類選手(十段及以上)的整體穩定段位。

這些成就意味著,Suphx 在四個月內成長為了最強日麻 AI。日本麻將的愛好者和專業參賽選手,紛紛尋找著它背後的開發者,但一無所獲。

Suphx 的官方社交帳號上,只有簡單的介紹

直到 8 月 29 日世界人工智慧大會舉行,Suphx 的身世才被公諸於世。

當天上午,微軟全球執行副總裁、微軟人工智慧、微軟研究事業部負責人,沈向洋博士,對外宣布,Suphx 是微軟亞洲研究院的工作成果,由劉鐵巖博士帶隊研發。

沈向洋博士

出席了最近在上海舉行的的世界AI大會

對 AI 來說,為什麼麻將比圍棋、德州撲克更難?

「2017 年中旬,我們一個研究團隊跟我說要做麻將 AI。我也不知道能不能成,因為相比象棋、圍棋、德州撲克,麻將的難度更高。而且,他們打麻將水平都不怎麼樣。」

微軟全球資深副總裁、微軟亞太研發集團主席兼微軟亞洲研究院院長洪小文對 PingWest 品玩表示。

麻將的難,在於其屬於「不完美信息遊戲」(Imperfect-Information Games),讓計算機擅長的搜索能力無法直接發揮,且具備複雜的獎勵機制。

不完美信息遊戲,是指遊戲中信息暴露程度低。「圍棋、象棋等棋類遊戲,對局雙方可以看到局面的所有信息,屬於完美信息遊戲(Perfect-Information Games);

而撲克、橋牌、麻將等遊戲,雖然每個參與者都能看到對手打過的牌,但並不知道對手的手牌和遊戲的底牌,屬於不完美信息遊戲。」

各類遊戲的信息集數目和信息集平均大小對比

為了更好地解釋「不完美信息」遊戲,劉鐵巖打了個比方:

「如果把圍棋這樣的(完美信息)比賽比喻成一顆遊戲樹,那像麻將這樣的比賽就是很多樹組成的森林,參與者並不知道自己在哪棵樹上。」

Suphx 雖然在線上對戰了 5760 場,但在線下自我博弈將近 2000 萬場。

「雖然自我博弈學到的信號數量很多,但是學到更多的是在自己身上怎麼提高。5760 場裡面我們學到別人打法的風格、以及實戰中遇到的困難應該如何解決。」

劉鐵巖透露,研究團隊計劃過一段時間會有一篇比較深入的科學論文跟大家分享, 「在那裡面大家會看到更多的細節」。

或許可以理解為,相比於AlphaGO玩的「完美信息」遊戲——圍棋,Suphx無論是在遊戲難度還是技術角度,都要更進一大步。

Suphx 背後的技術可以用在什麼地方?

在 AI 進化的過程中,遊戲 AI 一直相伴相生。1949 年開始,就有科學家研究算法,讓計算機下西洋棋。雙陸棋、國際跳棋、西洋棋、圍棋等棋盤類遊戲,都有人機對戰的蹤影。

1997 年 5 月 11 日,西洋棋 AI 深藍在正常時限的比賽中,首次擊敗了等級分排名世界第一的棋手,這一天成為了人機對戰的裡程碑。

在洪小文看來,遊戲 AI 對解決現實問題有著重要的研究意義:「現實世界更加複雜,而遊戲均有一個清晰的規則、勝負判定條件和行動準則。

如果不定規則,大家各做各的,就無法交流。研究也是這樣的,將問題切成小問題,小問題裡面規則定清楚,再往前走。」

麻將這一類不完美的信息遊戲,正是現實生活中許多問題的映射。洪小文舉例道:「追女朋友、企業經營、投資,都有大量的你不知道的隱藏信息。」

雖然 Suphx 面世不久,背後的技術還沒有全部應用到實際問題中,但部分技術已經在做嘗試。

儘管落地是研究的最終目標,但洪小文認為,純粹的好奇心對研究人員來說更加寶貴:

「做這項研究的時候,他們有沒有想過未來可以怎麼應用?八成是沒有想,也不應該想,以好奇心驅動的研究是推動整個科研發展的基石。最明顯的例子是,基礎數學很多研究在當時都不見得有應用。」

有意思的是,天鳳平臺 CEO 角田真吾在被問到「為什麼會歡迎 AI和人類對弈」時,給出了和洪小文幾乎一樣的措辭——純粹出自於人類的好奇心。

相關焦點

  • 走進科學:為什麼阿法狗不敢挑戰麻將?
    什麼李世石在和阿法狗下圍棋,別裝作你在看,你連天元在棋盤的哪裡都不知道,你就在趁機複習終結者,裝什麼裝。今天我們分享的主題是:為什麼阿法狗不敢挑戰麻將?阿法狗不搞將棋、黑白棋、鄧紫棋是有道理的,畢竟這些棋尚未取得廣泛的社會共識,但麻將肯定不處於可忽視可輕視可放棄的地位。比方說,酒店裡的棋牌室,多數是這個樣子:
  • 阿法狗,咱三缺一,來不?麻將桌上遛遛
    雖然算法簡單,但為什麼阿法狗不敢介入麻將領域?這絕不是碰巧,而是膽怯地故意迴避。   首先我們必須在麻將的普及性上達成共識。即麻將在棋牌領域中的重要地位。阿法狗不搞將棋、黑白棋是有道理的,畢竟這些棋尚未取得廣泛的社會共識,但麻將肯定不處於可忽視可輕視可放棄的地位。比方說,酒店裡的棋牌室,多數是這個樣子:
  • 騰訊AI愚人節挑戰谷歌阿法狗:麻將決勝負
    《騰訊AI愚人節挑戰谷歌阿法狗:麻將決勝負》文章已經歸檔,不再展示相關內容,編輯建議你查看最新於此相關的內容:博物官聯手2018藝術廈門博覽會,騰訊AI助力藝術走進生活2018藝術廈門博覽會於
  • 挑戰阿法狗:挺身而出的時候到了
    至此,我們可以預言,在往後的各種棋類運動中,人類很難逃脫被AI不斷碾壓的命運。棋類運動從此淪為人類自娛自樂的休閒活動,再也不是能夠體現人腦特有的思維能力或者代表人類專屬智慧的運動了。這還沒有考慮到阿法狗故意輸掉比賽的情況。如果阿法狗是故意輸掉一局來緩解人類提防情緒的話,那就令人細思恐極了。
  • 人機大戰最後一局 阿法狗「虐」哭柯潔
    原標題:阿法狗 「屠龍」 「虐」哭柯潔 昨天,在烏鎮舉行的圍棋世界第一高手柯潔與世界最強人工智慧阿法狗的三番棋大戰最後一局仍然沒有任何懸念,阿法狗在布局階段就已牢牢掌控全局,儘管柯潔使出渾身解數,甚至還下出了一手可以比美阿法狗的「神仙著」,但在被棋聖聶衛平認為棋力至少二十段的
  • 這一周,谷歌地圖得罪了胖子,80後被人民日報扎心,比阿法狗更強的...
    當然,眼瞅著90後要被00後淘汰,我也會在聽到小朋友們一聲「謝謝叔叔」後,感嘆一下:歲月你別催,該來我不推。AlphaGo:老的是我吧……人類圍棋還沒有擺脫被AlphaGo支配的恐懼,谷歌現在又稱, 自己發明了比阿法狗更強的AlphaGo Zero(阿法元)。
  • 還記得那個打敗了柯潔的阿法狗嗎?新一代阿法星已全面超越人類
    原本人們以為圍棋將會是人類引以為傲的智商唯一保留地,然而阿法狗擊碎了這一切,從一開始戰勝韓國著名棋手,再到後來戰勝中國最強棋手柯潔,阿法狗已經用多次的實戰證明了自己已經是不敗之神,而都得益於它的特殊機制,跟完全的死記硬背不同的是,阿法狗是通過自己去看數萬場棋局,然後學習經驗並且優化自己。
  • 麻將AI超越99%人類玩家:專業十段,學習能力堪比阿法狗
    據悉,天鳳是世界上最大的麻將社區之一,擁有超過35萬活躍用戶,其中不乏大量的專業麻將選手。天鳳平臺自2006年推出以來,四人麻將達到過十段的選手約有180位,而現役的十段人類選手也不過十幾位。麻將被稱為不完全信息博弈,每位玩家手中最多有13張別人不可見的牌。牌牆中的14張牌對所有玩家都不可見。此外,牌桌中央還有70張牌。只有被玩家打出時,這部分牌才可見。
  • 最新版「阿法狗」Master更強大 橫掃棋壇60連勝
    Master確實是只「狗」 最新版「阿法狗」更強大    Master究竟是何方神聖?昨天晚上,謎底揭開,谷歌旗下的人工智慧網站DeepMind官方確認Master即「阿法狗」。只不過,它是「阿法狗」的最新版本。一周以來,它可是讓人類圍棋高手吃盡苦頭。
  • 《棋魂》阿法狗和褚嬴對局誰會贏?
    那我們就看褚嬴和阿法狗對局誰會贏?(AlphaGo是第一個擊敗人類職業圍棋選手的的人工智慧機器人)阿法狗是一個具有學習技能的人工智慧,阿法狗在圍棋方面的學習和計算能力遠超人類。而在計算能力上,阿法狗大約相當於1000臺計算機的運算能力,一個普通人類的大腦對抗1000臺計算機的計算能,好像褚嬴並不佔優勢。
  • 當全國網友和「阿發狗」組隊,「阿法狗」表示壓力很大?
    2016年,人工智慧程序「阿法狗」與代表人類聰明大腦的圍棋世界冠軍、職業九段棋手李世石對戰,最終「阿法狗」以4比1的總比分獲勝;2017年初,「阿法狗」與中、日、韓數十位圍棋高手進行快棋對決,連續60局無一敗績;
  • 曾放言「阿法狗贏不了我」:柯潔要對圍棋AI使出終極大招
    2016年的人機大戰,在李世石輸掉第一場比賽之後,柯潔在微博上是這樣說的,「就算阿法狗贏了李世石,它也贏不了我。」因為這句話,也因為這場人機大戰,柯潔瞬間成了「網紅」。雖然「大話」在前,但他在接受新華社採訪時只是表示自己還是能夠戰勝AlphaGo,但概率只有六成。當阿法狗連贏李世石三盤時,柯潔再次改變了態度。
  • 阿法狗vs柯潔三勝:阿法狗比去年強大太多
    韓聯社1月10日報導稱,圍棋人工智慧AlphaGo阿法狗在人類圍棋界的積極支持下迅速成長。韓國網絡圍棋網站Tygem9日稱,已經與谷歌Deepmind建立了緊密的合作關係,將不遺餘力地支持阿法狗的發展。
  • 阿法狗有什麼可怕的?
    我不是職業棋手,不擔心被阿法狗搶走飯碗,我只想知道阿法狗究竟會給我們這些普通人的生活帶來哪些改變。這不是人類第一次被機器打敗,我們的力量、速度、耐力、聽力、視力……都早已輸給了機器,但我們從沒如此緊張過。
  • 每日漫話:從《棋魂》看柯潔大戰阿法狗,人類一定輸?
    最近圍棋界熱門事件就是柯潔大戰阿法狗,這讓小編想起之前看過的《棋魂》,裡面有個橋段就是進藤光上網下圍棋,網名叫Sai,那個故事情節就如同之前阿法狗網上連挑60人,未嘗一敗,當時每漫君就在想,不會這阿法狗就是另一個藤原佐為吧?
  • 「阿法零」接連打敗西洋棋將棋世界冠軍 「阿法狗」走向教學
    【觀察者網綜合報導】自2016年3月甫出茅廬震驚世人後,「阿法狗」(AlphaGo)連續擊敗各路圍棋高手,令人談虎色變。可怕的是其「自我更新」的能力,幾經升級的「阿法狗」已經進化成「阿法零」,自我學期不到24小時,就問鼎西洋棋、將棋、圍棋的人類巔峰。「無敵是寂寞」,沒了對手的「阿法狗」如今選擇放下身段,成為一款棋類教學程序,將「功力」傳授給大家。
  • 真相:阿法狗是人工智慧嗎?天才棋手柯潔究竟輸給了誰?
    作者: 周小平來源: 今日平說, ID: zg5201949文章僅代表作者觀點昨天,那位曾經自信表態:「阿法狗可以打敗李世石,卻無法打敗我」的少年天才棋手柯潔以1/4目首敗阿法狗,引起輿論熱潮。雖然,他也不敵阿法狗。
  • 媒體曝Master是新版「阿法狗」 籤了保密協議
    據華西都市報-封面新聞記者了解,MASTER正是新版「阿法狗」,目前處於公測階段,由於這臺「新狗」重出江湖之前,與弈城、野狐等國內知名圍棋對弈網站籤有保密協議,因此到目前為止,我們不可能得到對弈網站方面的官方承認。但正如一位成都業餘圍棋高手所言——只有「阿法狗」才能如此碾壓人類的頂尖高手,這是一個最簡單的推理,不需要官方證實。
  • 當你開黑時,遇到一隻「阿法狗」
    職業選手在這個遊戲中已經達到了極高的造詣,那如果五隻阿法狗組一個隊伍,和最優秀的MOBA職業選手打比賽,會是什麼樣呢? 首先,MOBA遊戲的獲勝之道就是團隊協作。這一點上5隻阿法狗可以通過精確的計算做到100分,保證每一次團隊配合和執行力都是完美的;而人類選手即便再心有靈犀,想要達到這個境界也是不可能的。
  • AI圍棋的千層套路①:精彩棄子轉換—阿法狗是如何顛覆傳統定式的
    ノ本期給大家帶來的是Master(阿法狗)與柯潔九段的網絡對局之一。柯潔執黑,阿法狗執白。本局中,狗子在人類棋手的常識邊緣反覆橫跳,把一眾高手秀得頭皮發麻。(實戰圖一)行至11,是雙方正常的布局。(實戰圖二)實戰阿法狗扳,著實令人吃了一驚。因為按照以往的思維,徵子不利的前提下,白棋是絕對不能扳的——(變化圖二)徵子不利的情況下,白棋大虧(實戰圖三)狗子當然不會自己坑自己,14打吃棄角,18再樸實無華的粘上。下至黑21,白棋勝率已經達到70%。