德州撲克也有「阿爾法狗」了 或下月來華-產業·期貨-新聞-上海...

2021-01-17 中國證券網

  卡耐基梅隆大學(Carnegie Mellon University,以下簡稱CMU)開發的德撲人工智慧程序Libratus,將在4月來到中國,與中國德撲玩家進行德撲界的「人機大戰」。

  新浪科技還獲悉,這款CMU開發的名為Libratus的德撲程序,將以「冷撲大師」的譯名挑戰中國德撲高手,而這場挑戰賽的發起者,正是CMU校友、創新工場創始人李開復。

  新浪科技也就此向創新工場做了進一步求證,但對方表示不予置評。

  Libratus曾碾壓人類高手贏176萬美元

  實際上,Libratus並非初出茅廬的毛頭「程序」。在今年春節期間,Libratus就已經在賓夕法尼亞州匹茲堡的Rivers賭場,將4位人類職業玩家挑落馬下,並且奪走了共計176萬美元的獎金。

  當時,美國東部時間1月30日,CMU開發的Libratus與四名人類職業玩家Jason Les、Dong Kim、Daniel McAulay 和 Jimmy Chou約戰賓夕法尼亞州匹茲堡的Rivers賭場,並在持續20天的比賽時間中,對玩12萬手,最後Libratus贏走了總數200萬美元獎金中的176萬美元 。

  值得注意的是,與Libratus對戰的都是德撲職業玩家中的高手。比如其中的Dong Kim,還在2年前在同一個賭場擊敗了這個人工智慧的前身,但在這場為期二十天的比賽剛剛過半之時,Kim就直言:人類已經沒有真正獲勝的機會。

  Libratus的這場人機大戰中的勝利,也迅速引發關注。即便在AlphaGo之後,AI擊敗人類已經不再是什麼新聞,但人工智慧在德州撲克上擊敗人類,這其中的難度和信息量不可小覷。

  AI玩德撲為何難?

  利用人工智慧程序玩德撲,最大的難度在於「不完整信息博弈」。因為玩德州撲克需要推理能力,而這對於機器來說很難模仿。雖然人工智慧在跳棋、象棋乃至圍棋比賽中,已經完勝人類對手,但無限注德州撲克是一個完全不同的情況。

  此前據AI新媒體《量子位》報導,由於一些卡牌並沒有發出來,在德州撲克的對局裡,任意時間,任何一個玩家,都只能觀察到一部分的情況。要贏,他們需要直覺:一種猜測其他玩家手上是什麼牌的能力。而且還要考慮到對手每一種可能的打法,想得到理想的戰略非常困難。而現實世界中,不完美信息才是常態,各種看不見的隱藏信息產生了大量的不確定性,而德州撲克代表的就是這種類型的博弈。在圍棋界縱橫無敵的AlphaGo,本質上處理的還是完美信息博弈,而AlphaGo無法處理德州撲克的問題,更遑論使出詐唬。

  新浪科技則了解到,為了解決「不完整信息博弈」這種計算機難題,CMU的人工智慧研究者們專注於信息集,通過同時思考未知和已知變量各種可能狀態的方式來進行預測,這需要強大的計算能力。

  在計算能力方面,CMU主要依賴於Bridges Super Computer超級計算機。每個牌局結束後的夜晚,匹茲堡市超級計算中心Bridges電腦執行計算,用以優化Libratus的策略。而在白天的比賽過程中,Bridges用於計算每一手的終結遊戲策略,Bridges提供三種類型的計算選項,稱為節點:常規、大型和超大型。Bridges不是當今世界最大、最快、最強勁的超級計算機,但它可能是面向公眾開放的,最大、最快、最強勁的超級計算機,在Bridges的幫助下,原本在個人電腦上耗時數月的計算,僅僅幾個小時就搞定。

  此外,在計算能力保障的基礎上,CMU在具體技術應用方面,用到了區別於AlphaGo的方法。CMU方面曾披露稱,Libratus沒有用到專業的牌局進行神經網絡的訓練,不同於AlphaGo用了大量的棋局做訓練,這個模型用的是隨機生成的牌局(隨機產生公共牌、底池籌碼、玩家拿牌概率)和嘗試性的動作帶來的結果(在隨機生成的輸入情況下模擬玩家跟牌後的結果)作為訓練數據。

  Libratus還利用了博弈論,與AlphaGo不同,Libratus系統不通過分析大量可能的下一步完成任務,這個CMU構建的新系統通過平衡風險與收益來決定自己的下一步,在納什均衡定義中的完美遊戲狀態。

  最後,在具體操作上,Libratus分三步走。第一階段,Libratus通過名為反事實遺憾最小化(counterfactual regret minimization)的算法,在經過訓練之後獨立於人的玩法形成自己的策略。第二階段,第二個系統屬於一種「殘局解算器」。它可以分析遊戲狀態並聚焦於第一套系統的注意力,使人工智慧在比賽過程中也能進行學習。第三階段,Libratus會藉助Brown,運用一個算法來識別出那些被玩家利用的機器玩法,然後從策略中剔除掉。

  贏了人類又怎樣?

  當然,人工智慧程序Libratus在德撲贏了人類,還不止於會改變德州撲克發展歷程這麼簡單。跟AlphaGo一樣,它很容易應用到其他領域,並且更加有效且快速地解決人類難題。

  因為玩德州撲克需要推理能力和心理戰術,而這對於機器來說很難模仿。在圍棋界縱橫無敵的DeepMind AlphaGo本質上處理的還是完美信息博弈,無法處理德州撲克的不完美信息問題,更遑論使出詐唬(Bluffing)。

  而Libratus的例子說明,AI在面臨不完全或誤導信息時,已經有進行推論的能力。現實世界中,不完美信息才是常態,各種看不見的隱藏信息產生了大量的不確定性,而德州撲克代表的就是這種類型的博弈。

  所以在未來,Libratus這樣的AI,可以用於商業談判、網絡安全、醫療方案制定等領域。

  而人工智慧發展的終極目標,很可能會產生一個通用人工智慧(AGI)。通用人工智慧可以解決任何一個問題,而不是像Libratus或者AlphaGo這樣只能專注於撲克或者圍棋。想要實現AGI就得讓人工智慧學會解決不確定性問題,這也是Libratus讓科技界、科學界興奮不已的最主要原因。

  為何還要在中國掀起「人機大戰」?

  不過,既然Libratus已經在正式比賽中戰勝了頂級職業玩家,為何還要專門來到中國掀起「人機大戰」?更何況德州撲克跟圍棋還不一樣,中國並非德撲的華山之巔。

  新浪科技希望就此向創新工場諮詢,但對方並未對此作出回應。

  不 過新浪科技有可靠渠道和可信資料證明,把CMU的德撲程序Libratus帶進中國的,正是CMU的知名校友、現創新工場創始人:李開復。

  值得一提的是,李開復還專門為「Libratus」取了中文名——冷撲大師。

  至於為何是李開復和創新工場作為主辦方?有接近創新工場方面的人士向新浪科技分析稱,首先CMU是李開復的母校,也是CMU在中國最為知名的代表;其次創新工場主辦此事,可能還與其目前在人工智慧領域的布局有關,去年年底,創新工場正式成立了創新工場人工智慧工程院,並且希望進一步提升知名度攬獲更多的AI人才;值得一提的是,李開復是創投圈內知名的德撲選手,之前先後發起並參與了首屆投資界撲克賽和中國創投名人賽,甚至還吸引了娛樂明星汪峰等參加。

  此外,新浪科技還獲悉,在此次人機撲克大賽期間,Libratus開發者卡耐基梅隆大學教授也將同步來華進行交流。

  有趣的是,在新浪科技獲悉的資料上,表演賽選手名單中包括李開復、沈南鵬、倪正東、吳世春、王小川、許朝軍等科技創投人士,也有許家印、朱曄等企業家,還包括王思聰、汪峰、和華少等娛樂圈焦點人物。

  然而截至發稿前,創新工場方面並未對此發表回應和說明。

相關焦點

  • 德州撲克人工智慧之父:阿爾法狗贏不贏都缺實際用處
    一邊在海南澄邁,德州撲克人工智慧「冷撲大師」(Libratus)經過5日激戰,在33000手一對一無限注德撲比賽中完勝中國「龍之隊」的6名高手,斬獲200萬人民幣獎金;另一邊在北京的中國棋院,谷歌宣布被中國網民稱為「阿爾法狗」的圍棋人工智慧AlphaGo將在5月下旬的烏鎮對陣柯潔領銜的中國頂尖棋手,上演終極一戰。
  • AI又盯上德州撲克? 人工智慧首次戰勝職業玩家
    2017年年初,人工智慧「Master」用連勝60局的戰績橫掃了世界圍棋界各路頂尖高手,一周時間的最後,Alpha Go(阿爾法狗)脫下「Master」的馬甲,宣布暫時閉關。他的最後一個對手、世界冠軍古力留下兩個字:絕望。  在棋壇一騎絕塵之後,網友們依然不服輸:有本事就來跟我打麻將。而人工智慧真的來了,雖然挑戰的項目不是麻將,而是和麻將有相通之處的德州撲克。
  • 德州撲克第三眼:中西合璧的WPT中國賽
    原標題:德州撲克第三眼:中西合璧的WPT中國賽 WPT中國賽異常火爆  作者子曰,從事德州撲克相關媒體運營工作,是德州撲克自媒體博客網站——子曰吧的站長。  隨著德州撲克在中國越來越普及,國內的德州撲克愛好者的群體日漸擴大,大型的德州撲克線下賽事也層出不窮。  辦德州撲克比賽不是一個新鮮事,在國外,最著名的WSOP(World Series of Poker)世界撲克系列賽1970年就開始舉辦,到現在也有45個年頭了。
  • 《遇悅德州撲克》MTT賀歲杯狂歡大獎賽
    下面小編就為大家帶來《遇悅德州撲克》MTT賀歲杯狂歡大獎賽的介紹,以下新聞是由廠商遇悅網絡提供的,希望這篇文章能夠為大家帶來幫助​。        牌局「廝殺」是不是來點真金白銀才會更加刺激、更加過癮!
  • 《遇悅德州撲克》MTT狂歡賽季隆重上線
    下面小編就為大家帶來《遇悅德州撲克》MTT狂歡賽季隆重上線的介紹,以下新聞是由廠商遇悅網絡提供的,希望這篇文章能夠為大家帶來幫助​。        對於喜歡德州撲克的玩家朋友們來說,能和德撲大神來一場公平公正的較量絕對是非常過癮的一件事情。
  • 《遇悅德州撲克》春節七天樂MTT搶先看
    下面小編就為大家帶來《遇悅德州撲克》春節七天樂MTT搶先看的介紹,以下新聞是由廠商遇悅網絡提供的,希望這篇文章能夠為大家帶來幫助​。        不知不覺中又快到春節啦,出門在外的小夥伴們都要趕著回家團圓了,回家的旅途雖然很勞累,但是當和家人團聚在一起時,相信大家都會覺得所有的勞累都是值得的。
  • 規則-網易德州撲克
    限注德州撲克: 你只能增加與大盲注相同的投注額。 底池限制德州撲克:你只能增加當時臺面最大額的投注額(已經完成所有投注)。 無限制德州撲克:你可在手持額度下,增加任何額度的投注額,如果你投入所有籌碼,就是「全押」。
  • 圍棋阿爾法狗和德撲冷撲大師:哪個更厲害,哪個更有用
    一邊在海南澄邁,德州撲克人工智慧「冷撲大師」(Libratus)經過5日激戰,在33000手一對一無限注德撲比賽中完勝中國「龍之隊」的6名高手,斬獲200萬人民幣獎金;另一邊在北京的中國棋院,谷歌宣布被中國網民稱為「阿爾法狗」的圍棋人工智慧AlphaGo將在5月下旬的烏鎮對陣柯潔領銜的中國頂尖棋手,上演終極一戰。
  • 《遇悅德州撲克》新增夜場MTT比賽房
    下面小編就為大家帶來《遇悅德州撲克》新增夜場MTT比賽房的介紹,以下新聞是由廠商遇悅網絡提供的,希望這篇文章能夠為大家帶來幫助​。 晚上十二點還睡不著的夜貓子一族的福利來啦,遇悅德州MTT比賽房增加了夜場【遇悅禮包免費】比賽,打比賽即可免費贏取遇悅專屬精美實物大禮包哦!
  • 《遇悅德州撲克》母親節MTT大賽報開啟
    下面小編就為大家帶來《遇悅德州撲克》母親節MTT大賽報開啟的介紹,以下新聞是由廠商遇悅網絡提供的,希望這篇文章能夠為大家帶來幫助​。 母愛是我們一生之中能感受到的最濃、最真、最純的愛,然而時光飛逝,歲月催人老,母親用皺紋和白髮換來了我們的青春,我們感恩神聖、無私的偉大母愛。
  • 德州撲克人機大戰:人工智慧上半程領先
    繼圍棋之後,人工智慧(AI)又開始挑戰德州撲克
  • 德州撲克技術測驗: 底牌的範圍(Range)
    底牌範圍是整個德州撲克數學概率的基礎,了解底牌範圍可以更精準做出計算,幫助玩家做更有利的決策。本期開始為玩家提供「底牌範圍」和「底牌對抗」攻略,讓玩家們以後從翻牌前開始領先對手。請問德州撲克遊戲中,一共有多少種底牌組合?以下哪一個不是德州撲克的底牌類型?以下哪一個底牌不算「強底牌」?德州撲克遊戲中,玩家的「底牌範圍」代表什麼?
  • AI在六人桌德州撲克賽中戰勝人類選手
    科技日報北京7月14日電 (記者劉霞)據美國《新聞周刊》網站近日報導,美國科學家開發出一種新的人工智慧(AI)程序「合眾為一」(Pluribus),其在6人無限制德州撲克比賽中擊敗了6名全球頂尖選手。研究人員認為,這是人工智慧發展史上的一座裡程碑,未來有望應用於生物醫學、安全等領域。
  • 《遇悅德州撲克》MTT賽場萬元CPG門票等你贏
    《遇悅德州撲克》MTT賽場萬元CPG門票等你贏 來源:廠商投稿 作者:半藏 發表時間:2016-08-12
  • 人工智慧戰勝世界頂尖德州撲克選手
    新華社 Pluribus在六人桌德州撲克比賽中擊敗多名世界頂尖選手。美國卡內基·梅隆大學7月11日宣布,該校和臉書公司合作開發的人工智慧(AI)Pluribus在六人桌德州撲克比賽中擊敗多名世界頂尖選手,成為機器在多人遊戲中戰勝人類的一個裡程碑。
  • 德州撲克人機大戰AI取勝 麻將是人類最後堡壘?
    德州撲克人機大戰人類告負 人工智慧「攻陷」德撲  ■ 廣州日報記者 施紹宗  最新一次「德州撲克人機大戰」前天在美國匹茲堡舉行,美國卡耐基梅隆大學開發的人工智慧Libratus以絕對優勢擊敗4名人類頂尖德州撲克高手,這是人工智慧在各種棋牌遊戲中對人類取得的又一個勝利
  • 以WSOP的名義——天天德州開啟線上撲克賽事新紀元
    8日,是一個註定要載入中國德州撲克發展歷史的重要日子——騰訊天天德州與WSOP(世界撲克系列賽)達成戰略合作關係,同時獲得WSOP ASIA亞洲獨家賽事授權及線下賽事舉辦權。可以說,在有了WSOP這樣一個頂尖撲克賽事品牌的「加持」後,騰訊天天德州把中國德州撲克的賽事水平帶到了一個全新的高度!
  • 聚眾互動《朋友桌德州》或成為撲克賽事新寵
    [摘要]常打線上撲克和行業內的朋友,近期一定對聚眾互動、朋友桌德州、樂視體育超級撲克錦標賽這三個名字有所耳聞。特別是在5月26日聚眾互動召開發布會後,聚眾互動備受行業內矚目。《朋友桌德州》作為聚眾互動的線上撲克競技產品,擁有界面簡潔、操作簡便、比賽豐富、自建賽事,社交性強等特點。《朋友桌德州》沒有採用華而不實的界面,而是採用現在主流的簡約型界面,各種功能一目了然;在操作方面採用了最適合手機單手操作的設計,按鈕功能非常全面,為玩家們提供了便捷的操作方式。
  • 讀書學德州小綠皮之撲克心理學
    數學是一切德州撲克理論的基石,數學是德州撲克的精髓所在,掌握了數學,你就掌握了一切行動背後的理論支持,數學讓德州撲克充滿魅力!小綠皮書多少朋友上桌了只關注自己牌大小,不去觀察收集對手的信息,多少朋友下注只憑自己的感覺,不去思考總結下注的理由等等......玩牌沒套路,桌上被套路!
  • 你知道德州撲克與天使投資之間的相似之處嗎?
    北京有一群天使投資人舉辦過德州撲克比賽,因為從德州撲克的玩法中領悟到天使投資的很多邏輯與真諦。01 德州撲克的玩法與投資的思維是一致的。籌碼就是你的資金量,你有多少錢、有多少籌碼和勝率息息相關。底牌就是你的項目,後面的跟牌就和投資的跟投一樣。