冷撲大師(Libratus)如何顛覆人工智慧深度學習算法

2021-01-17 深度洞悉

【導讀】「冷撲大師」是基於卡內基梅隆大學Tuomas Sandholm教授和博士生Noam Brown所開發的Libratus無限德州撲克人工智慧系統。

卡內基梅隆大學的 Libratus 採用的是一種名為 「納什均衡」的對戰策略,在這一策略裡,只要其他玩家的策略保持不變,單一玩家就無法通過變換策略獲益。

德撲

什麼是納什均衡? 納什均衡是指博弈中這樣的局面,對於每個參與者來說,只要其他人不改變策略,他就無法改善自己的狀況。納什證明了在每個參與者都只有有限種策略選擇並允許混合策略的前提下,納什均衡定存在。以兩家公司的價格大戰為例,價格大戰存在著兩敗俱傷的可能在對方不改變價格的條件下既不能提價,否則會進一步喪失市場;也不能降價,因為會出現賠本甩賣。於是兩家公司可以改變原先的利益格局,通過談判尋求新的利益評估分攤方案,也就是納什均衡。

納什

Libratus 要做的就是識別沒有希望的策略,從而更快地找到納什均衡點。經過反覆的訓練後,Libratus 已經能夠忽略那些糟糕的路徑了。

Libratus的良好戰績 2017年1月11日至30日,Libratus與4名人類選手共玩了12萬手一對一不限注德州撲克,最終奪得勝利拿到了20萬美元獎勵。這是AI Libratus首次在無限注撲克(詳細說來,是一對一無限注德州撲克)中擊敗了頂級職業玩家。(NoamBrown表示所有的錢都付給了專業玩家(當然取決於他們玩得多好)。也很希望拿一部分獎金來做自己學生的費用開銷。) 2017年4月6日至10日,經過為期5天的角逐,Libratus對戰「龍之隊」表演賽在海南生態軟家園結束了,「冷撲大師」最終以792327總記分牌的戰績完勝並贏得200萬獎金。

德撲對抗賽

研發團隊發表的論文被評為NIPS2017的最佳論文 在深度學習火的一塌糊塗的2017年,Libratus研發團隊竟然使用非深度學習方法得出的研究論文拿下了最佳論文,這讓吃瓜群眾和業內人士感動有些意外。 最佳論文:《Safe and Nested Subgame Solving for Imperfect-Information Games》 翻譯為:《在不完全信息博弈中安全、嵌套地求解子博弈》 於是很多人問了,AlphaZero能打敗Libratus嗎?Tuomas Sandholm教授表示,不會的,因為AlphaZero不玩不完備的信息博弈。(德撲屬於不完備信息博弈) 同時NoamBrown還表示Libratus沒有使用到任何深度學習技術。因為深度學習本身並不足以玩撲克這樣的遊戲。

德撲、圍棋與宇宙複雜度對比:

一個太陽大概有10的57次方個氫原子宇宙有10的23次方個類似太陽的恆星宇宙中有10的80次方個原子一對一無限注德撲有10的161次方種不同情況圍棋有10的170次方的可能性

Libratus的爆冷在人工智慧領域有著很大的意義,最起碼讓我們看到了除了深度學習,人工智慧還有很多其他的路可以走,相比於「冷撲大師」完勝人類選手,AlphaZero擊敗柯潔的震撼也變得不那麼明顯了。 【人工智慧新時代,關注你所你關注的】

相關焦點

  • 圍棋阿爾法狗和德撲冷撲大師:哪個更厲害,哪個更有用
    一邊在海南澄邁,德州撲克人工智慧「冷撲大師」(Libratus)經過5日激戰,在33000手一對一無限注德撲比賽中完勝中國「龍之隊」的6名高手,斬獲200萬人民幣獎金;另一邊在北京的中國棋院,谷歌宣布被中國網民稱為「阿爾法狗」的圍棋人工智慧AlphaGo將在5月下旬的烏鎮對陣柯潔領銜的中國頂尖棋手,上演終極一戰。
  • 德州撲克人工智慧之父:阿爾法狗贏不贏都缺實際用處
    一邊在海南澄邁,德州撲克人工智慧「冷撲大師」(Libratus)經過5日激戰,在33000手一對一無限注德撲比賽中完勝中國「龍之隊」的6名高手,斬獲200萬人民幣獎金;另一邊在北京的中國棋院,谷歌宣布被中國網民稱為「阿爾法狗」的圍棋人工智慧AlphaGo將在5月下旬的烏鎮對陣柯潔領銜的中國頂尖棋手,上演終極一戰。
  • AI賭神稱霸德撲的秘密,剛剛被《科學》「曝光」了
    △ Sandholm講解冷撲大師Sandholm則從全局的角度,打開Libratus的大腦,向量子位逐一講解了構成這個撲克AI的三個主要模塊。其中一個用於賽前,兩個用於賽中。Libratus是一個防守大師。深度學習不是唯一與圍棋大師AlphaGo相比,Libratus有很多不同之處。其中就包括:Libratus並沒有使用目前相當火熱的深度學習技術。「深度學習是個非常好的技術,但我們沒有在這個項目應用,是因為深度學習不能給出絕對的保證。
  • 如何區分人工智慧、機器學習和深度學習?
    深度學習(Deep Learning)是一種機器學習的方法,它試圖使用包含複雜結構或由多重非線性變換構成的多個處理層(神經網絡)對數據進行高層抽象的算法。神經網絡是一組大致模仿人類大腦構造設計的算法,用於識別模式。神經網絡通過機器感知系統解釋傳感器數據,能夠對原始輸入進行標記或聚類等操作。
  • 深度學習筆記:深度學習——AlphaGo阿爾法狗
    阿爾法狗(AlphaGo)是第一個擊敗人類職業圍棋選手、第一個戰勝圍棋世界冠軍的人工智慧程序。它主要的原理就是深度學習。柯傑對戰AlphaGo圍棋界公認AlphaGo的棋力已經超過人類職業圍棋頂尖水平,AlphaGo的勝利是人工智慧歷史上的一座裡程碑。早在1997年,IBM的西洋棋系統深藍,擊敗了世界冠軍卡斯帕羅夫時,採用的算法是通過暴力搜索的方式嘗試更多的下棋方法從而戰勝人類,其所依賴的更多是計算機的計算資源優勢。
  • 2017 AI大師會詳解智能商業決策之路:從「識別」到「思考」
    i 黑馬訊 6月24日消息,由鈦媒體和杉數科技聯合主辦的「2017AI大師論壇」在京成功舉辦。Stanford講席教授葉蔭宇坐鎮,喬治亞理工學院、明尼蘇達大學、紐約大學、清華大學青年領袖學者助陣,從深度學習在時空大數據分析中的應用談開,詳細解剖商業智能中的機器學習、深度學習,以及少為人知卻直指真實場景中複雜決策的運籌學。
  • 重磅| 德撲人機大戰收官,Libratus 擊敗世界頂尖撲克選手
    在無限德撲比賽中(一對一、無限制投注的規則),人工智慧擊敗世界最強的人類德州撲克玩家,這是人工智慧歷史上又一裡程碑時刻。比賽過程中,人類選手整體上從未領先過。進入比賽最後一天時,Libratus贏得156萬籌碼。人類選手要挽回劣勢,只有不到 5,000 手的機會。Jason Les 說,最後的感覺就是,自己所能做的就是輸。這太打擊士氣了。
  • 戴瓊海:深度學習遭遇瓶頸,全腦觀測啟發下一代AI算法
    在大會上,中國工程院院士戴瓊海做了主題為《人工智慧:算法·算力·交互》的特邀報告,從算力、算法與人機互動三方面展開了分享,指出光電智能計算是未來算力發展的一大候選,深度學習遭遇算力和算法瓶頸,全腦觀測對於啟發下一代AI算法至關重要,在人機互動的發展中,我們要謹記圖靈的教誨,完善AI倫理,並且機器視覺、觸覺的協同是一大技術重點。
  • 人工智慧系統利用深度學習算法,能夠預測癲癇發作,準確率達到99.6%
    人工智慧系統利用深度學習算法,能夠預測癲癇發作,準確率達到99.6%Artificial intelligence system uses deep learning algorism to predict seisures
  • 楊澤霖:發力人工智慧,做基於深度學習的視覺解決方案
    初次接觸深度學習算法 大三創立公司    2015年,當楊澤霖第一次接觸到深度學習算法時,就敏銳地認識到這將成為一種革命性技術,而圖像識別將成為深度學習算法的第一個發力點。經過多方調研,21歲的楊澤霖同幾個志同道合的夥伴,開始了他們的創業之路——將深度學習技術帶入工業圖像識別領域,服務傳統行業。
  • 深度解讀《中國教育智能化發展報告》:人工智慧如何重塑教育行業?| 造就Talk·鍾昀泰
    隨著人工智慧的發展,原本的三尺講臺、課桌、黑板被裝進平板電腦,遠程教育的應用越來越廣泛。未來,高度發達的人工智慧也許可以使智慧機器人能夠與人類的大腦實現連接,教學場景也不再僅限於簡單的文本、圖像、音頻、視頻等,人們將獲得沉浸式的立體化學習體驗,傳統的教育方式將會被徹底顛覆。
  • 推薦算法系統/人臉識別/深度學習對話機器人高級實戰課
    包含了推薦算法系統實戰、深度學習人臉識別實戰、深度學習對話機器人實戰等高級前沿的精品課程,下面分別介紹下各個實戰項目:1、推薦算法系統實戰首先推薦系統不等於推薦算法,更不等於協同過濾。3、深度學習對話機器人實戰對話機器人是一個用來模擬人類對話或聊天的電腦程式,本質上是通過機器學習和人工智慧等技術讓機器理解人的語言。它包含了諸多學科方法的融合使用,是人工智慧領域的一個技術集中演練營。在未來幾十年,人機互動方式將發生變革。
  • 人工智慧算法可以學習量子力學定律
    人工智慧可以用來預測分子的波函數和電子性質。華威大學、柏林技術大學和盧森堡大學的一個研究小組開發的這種創新人工智慧方法可以用來加速藥物分子或新材料的設計。人工智慧和機器學習算法通常被用來預測我們的購買行為和識別我們的臉或筆跡。
  • 如何從零開始逐步學習人工智慧
    階段一:高等數學 人工智慧的基礎,其中高等數學是必需必會的。而高等數學則包括數據分析、概率論、線性代數及矩陣、凸優化等。良好的數學基礎,也是有利於以後同學們在後續的課程中更好的理解機器學習和深度學習的內容。同時對於AI研究尤為重要,例如人工智慧中的智能很大一部分依託「概率論」實現的。
  • 深度學習之Google Deepmind的Alphago人工智慧算法技術演變歷程
    一、簡介有些人會有如下質疑「Alphago都用了蒙特卡洛搜索樹了,這變成了一部分搜索問題了並不是人工智慧算法了或者說不夠智能了」,但我的拙見是人在思考問題的時候除了直覺、經驗判斷、邏輯推理之外也會去枚舉、搜索,所以我覺得算法包含一部分搜索並不能直接說該算法這不夠智能或者這不是智能算法了
  • 人工智慧、機器學習、神經網絡和深度學習之間是什麼樣的關係?
    但是大家在關注或研究人工智慧領域的時候,總是會遇到這樣的幾個關鍵詞:深度學習、機器學習、神經網絡。那他們之間到底是什麼樣的關係呢?本文引用地址:http://www.eepw.com.cn/article/201806/381185.htm  先說人工智慧,人工智慧是在1956年一個叫達特茅斯會議上提出的。
  • 人工智慧(AI) 機器學習(ML) 深度學習(DL),到底他們哥仨是什麼關係?
    原標題:人工智慧(AI) 機器學習(ML) 深度學習(DL),到底他們哥仨是什麼關係?自從AlphaGo戰勝李世石之後,人工智慧突然間成了坊間談資,仿佛人類已經造出了超越人類智慧的機器。而人工智慧的核心技術機器學習及其子領域深度學習一時間成了人們的掌上明珠。面對這個從天而降的「怪物」,樂觀者有之,悲觀者亦有之。但追溯歷史,我們會發現機器學習的技術爆發有其歷史必然性,屬於技術發展的必然產物。
  • 深度學習:神經網絡算法的昨天、今天和明天
    原標題:深度學習:神經網絡算法的昨天、今天和明天2016年,圍棋人工智慧軟體AlphaGo打敗了韓國圍棋名將李世石。2017年,新一代AlphaGo(AlphaGo Master)的戰鬥力升級,又打敗了世界排名第一的柯潔。
  • 機器學習算法盤點:人工神經網絡、深度學習
    在機器學習或者人工智慧領域,人們首先會考慮算法的學習方式。在機器學習領域,有幾種主要的學習方式。將算法按照學習方式分類是一個不錯的想法,這樣可以讓人們在建模和算法選擇的時候考慮能根據輸入數據來選擇最合適的算法來獲得最好的結果。   監督式學習:
  • ...學院張強鋒課題組利用深度學習人工智慧算法分析單細胞ATAC-seq...
    生命學院張強鋒課題組利用深度學習人工智慧算法分析單細胞ATAC-seq數據清華新聞網10月12日電 10月8日,清華大學生命學院的張強鋒課題組在《自然·通訊》(Nature Communications)上發表題為「SCALE方法基於隱特徵提取進行單細胞ATAC-seq數據分析」(SCALE method for