專訪德撲AI背後專家:德撲AI的人工智慧原理不靠深度學習 靠「談判」

2021-02-15 人工智慧學家

卡內基梅隆大學計算機科學學院院長安德魯·摩爾接受採訪

概要:在解決面對不完整信息,獲得最佳策略的問題方面,線性規劃早就已經成為重要方法。

來源:新浪科技

冷撲大師沒有使用深度學習,這多少有點風水輪流轉的意思。

4月6日,在美國擊敗人類頂尖德州撲克選手的人工智慧Liberatus接受創新工場邀請,化名「冷撲大師」,將在海南挑戰中國職業德州撲克選手組成的「龍之隊」。賽前在接受新浪科技專訪時,開發冷撲大師的卡內基梅隆大學計算機科學學院院長安德魯·摩爾(Andrew Moore)揭示了在另一場人機大戰中,戰勝人類背後的基本原理:更加古老的線性規劃(Liner Programming)。

  在解決面對不完整信息,獲得最佳策略的問題方面,線性規劃早就已經成為重要方法。在微觀經濟學和商業管理領域當中,這種算法已經被大量應用在降低生產流程成本。而在人工智慧領域,它和深度學習火熱之前的主流:貝葉斯網絡技術息息相關,而後者也是目前網際網路的通用基礎技術之一。

 2017年1月11日,職業撲克選手賈森·萊斯(Jason Les)在與Libratus較量德州撲克。1月30日,卡內基梅隆大學開發的人工智慧結束了與4名頂尖德州撲克選手之間的比賽,取得勝利。

  在採訪開始前,摩爾表示,德州撲克遊戲中包含了大量的隱藏信息,在本質上就是一種談判。而通過人工智慧談判其實是卡內基梅隆大學研究團隊的初衷。他表示,贏得撲克遊戲勝利能讓人感覺人工智慧非常厲害,但他也很期待人工智慧能夠在協商談判並解決問題方面湧現出更多應用。

  以下為部分採訪實錄,新浪科技整理:

  新浪科技:冷撲大師好像和AlphaGo不一樣,沒有從人類玩牌的結果中學習。德州撲克人工智慧和圍棋人工智慧有哪些不同?

  安德魯·摩爾(以下簡稱AM):撲克是一個規則非常簡單的遊戲,但是有很多隱藏信息,而圍棋沒有隱藏信息,所以做圍棋方面的人工智慧,需要進行非常深度的棋譜搜索。而做撲克遊戲的人工智慧要面對的問題是有非常多的詐唬策略要一一考慮。

  新浪科技:冷撲大師有沒有使用到神經網絡和深度學習技術?

  AM:冷撲大師沒有使用神經網絡和深度學習方面的技術,而是使用了最為傳統的線性規劃(Liner Programming)。

  我可以講得稍微細一點。計算機需要算出最合適數量的詐,因為無論詐數量過多或者過少,都可能被其他牌手利用。數學家約翰·納什曾經計算出的一個等式來解決類似的問題,但是要想真的計算出最合適數量的詐,這個等式可能會有無數的變量,而我們在冷撲大師身上應用的計算機技術可以得出最接近正確答案的解決方式。

  新浪科技:李開復之前寫過自己玩德州撲克的感受,他說想要玩好,就要把人性擺在一邊。冷撲大師在比賽時是靠算牌,還是用統計方式研究對手打心理戰?

  AM:算牌是贏牌的正確方式。不過這樣做的計算量很大,冷撲大師需要完成1000萬小時的計算才能形成它的策略。

  但用統計數據來研究對手玩法不是一個好辦法,因為一旦我知道你在統計我的玩法,我就會故意使用變換押注方法,實際上可以繞開你。

  所以就像我剛才說的,冷撲大師沒有使用心理戰贏牌的企圖,只是使用數學方法而已。

  實際上過去十年是大數據和機器學習發展的十年。但冷撲大師所用的線性規劃與這兩者有很大不同,它是實現最優解(Big Optimization)的技術,相信未來的技術前沿也是實現最優解的技術。

4月6日,6位華人牌手組成的中國龍之隊將在海南挑戰Libratus。但隊長杜悅(左四)表示,龍之隊的勝算可能只有10%。

  新浪科技:和龍之隊比賽的賽制,與常見的多人德州撲克牌局不同。為什麼會選擇一對一形式的比賽?是和算法限制有關嗎?

  AM:德州撲克中最考驗牌手技術的反而是雙人對戰,如果有更多牌手的話,其他牌手間的技術差別反而會被利用。

  新浪科技:除了德州撲克之外,冷撲大師所採用的技術還可以用在哪些領域?

  AM:我最喜歡的商業用途當然是商業談判,可以通過人工智慧來實現在最合適的時間,以最合適的價格找到最合適的供應商。

  談判其實是非完整信息博弈理論中一個不錯的例子,因為談判的時候,我們不一定會透露真實的想法。我們的研究人員認為計算機能夠與人類或者其他計算機進行交談和談判的能力非常重要。計算機的這種能力就是我們下一個研究方向。

  實際上,除了德州撲克之外,相同算法還可以幫助很多需要器官移植的人,比方說Kidney Exchange。在美國,這個算法每年能幫助數百位患者實現腎臟移植的匹配。

  新浪科技:所以冷撲大師背後的技術實際上是通用的。

  AM:冷撲大師所採用的技術確實可以應用到其他領域,來幫助人類找回丟失掉的信息。比如購買一間公寓,這就是一個談判過程。如果我聘請的人類房產中介直接告訴賣家我願意出多少錢買他的房子,那我肯定馬上炒他的魷魚。因為他的工作就是在隱藏我信息的前提下,和賣家達成交易。

  新浪科技:怎麼看待中國的人工智慧市場?對人工智慧開發者有什麼建議?

  AM:從投資數量上能看出中國人工智慧市場的發展是多麼欣欣向榮。這是非常明智的投資,因為各行各業的自動化是未來經濟增長的強勁動力。

  但是,我認為一般意義上的人工智慧技術工具,發展前景其實不大,而可以直接用於行業發展的人工智慧才有真正的發展前景。我喜歡哪些可以將技術應用在已有行業的人工智慧初創公司,而不是那些研發一般性技術供其它公司使用的企業。

  就我個人來說,如果你的初創公司有可以幫助自閉症兒童快速學習的人工智慧技術,那我就會有非常強烈的興趣。而如果你的公司有可以讓機器學習更加準確的技術,那就不是很好了。

 2015年,創新工場CEO李開復獲得卡內基梅隆大學授予榮譽博士畢業前,與安德魯·摩爾(右一)的合影。

  新浪科技: 2015年卡內基梅隆大學有將近50名科學家陸續被Uber挖走。而人工智慧領域的頂尖專家加入企業也是目前的趨勢。您對當前人工智慧教育環境是否有擔憂?

  AM:從2015年1月起,我們新錄用了26名教職員工,而只有4個人離開。目前匹茲堡(卡內基梅隆大學所在地)也已經成為了全世界的自動駕駛技術中心。科研專家加入企業看似是個問題,但這反而對大學和匹茲堡都有利。

實際上,我在擔任卡內基梅隆大學計算機科學學院院長之前,在谷歌從事機器學習系統方面的工作。雖然我喜歡谷歌的工作,但我還是決定重新回到卡內基梅隆大學,因為當今世界上最頂尖大學所從事的研究工作是極其重要的,也將決定21世紀的發展情況。而我所需要解決的一個問題就是,在一個人工智慧已經實現商業化的世界裡,大學可以扮演什麼角色。

  比如卡內基梅隆在10-15年前就已經開發出了自動駕駛技術,那麼下一步應該做什麼?我們不想一直關注業界已經在做的事情,而是可以有哪些前瞻性的研究。

  對於想離開大學的教職工,我不是勸留,而是鼓勵他們這樣做。其實開發冷撲大師的Toumas Sandholm就已經建立了一家公司,叫Strategic Machine Inc.。這家公司就是從卡內基梅隆大學拆分出來的。大學會將人工智慧應用在撲克上的技術授權給公司,公司再專注與不完整信息博弈的研發和商業應用。

  對於新錄用的人,我其實會建議他們在這裡做4-5年的研究,加入業界工作上3年,然後再回來做5年研究,這才是應該有的職業生涯,二者都不耽誤。

來源:新浪科技

人工智慧學家招募科技記者

《人工智慧學家》人工智慧方向的新媒體和人工智慧前沿研究機構,獲得兩家著名投資機構的第一輪融資,在業內形成了很強的影響力,同時開展的前沿研究工作也獲得深度成果,

2016年7月,人工智慧學家基於自身的研究成果和所擁有的頂級科學家資源,在科學院相關機構的支持下,籌備建立未來科技學院 將邀請國內和國際著名科學家、科技企業家講授人工智慧、網際網路、腦科學、虛擬實境、機器人等領域的基本原理和未來發展趨勢。未來科技學院的目標是研究前沿科技未來發展趨勢,培養掌握未來科技動向的企業家和具有獨立創新精神的未來科學家。
為了加快人工智慧學家和未來科技學院的項目建設,人工智慧學家現招募科技媒體記者。工作地點為北京海澱中關村,主要從事工作包括:

前沿科技研究、前沿企業和行業觀察報導 ,條件:熱愛科技前沿發展趨勢的學習和研究,具有人工智慧,機器人,智能駕駛,虛擬實境,腦科學等領域前沿科技領域基礎知識。有較好的文字能力

相關焦點

  • AI賭神稱霸德撲的秘密,剛剛被《科學》「曝光」了
    Libratus所用到的技術既不需要領域專家知識,也沒有使用人類數據,甚至不是專門為撲克設計的。換句話說,這些技術適用於多種不完美信息博弈。 不完美博弈正是德撲的一個主要特徵。圍棋、西洋棋、跳棋等棋類遊戲,屬於完美信息博弈,對戰的雙方,清楚每一時刻局面上的全部情況。相比之下,德州撲克存在大量的隱藏信息,包括:對手持有什麼牌,對手是否在詐唬?
  • 首屆國際分布式AI會議在京召開,姚期智、Lesser坐鎮,德撲、圍棋 AI...
    之所以由華人推動並成立這個會議,其背後則是我國分布式人工智慧的研究群體日益壯大,工業界的應用越來越頻繁,國內學術界迫切需要舉辦一個新的高水平交流平臺。一、德撲&圍棋,全天講解會議從13日開始,上下午分別有一個tutorial。有意思的是,上午tutorial的講者是著名德撲AI研究者Noam Brown,而下午的講者是在圍棋AI領域極為著名的華人學者田淵棟。德撲AI大師:Noam Brown
  • 淺談AI|我覺得這麼下去德撲要涼!
    接著人工智慧將徵服的目標轉向了德州撲克這個領域, 2015年4月24日—5月8日,由卡內基梅隆大學計算機科技小組研發的產品——Claudico與4位全球內最好的德州單挑環節專家展開了為期兩個星期的單挑對決。
  • 阿爾法狗還有德撲版?「PokerLogic」從德撲教育切入博弈AI研究
    往往我們把德撲視為一個概率+欺詐+運氣的遊戲,然而,德撲本質上是一種不完全信息博弈遊戲(參與人未能完全清楚掌握博弈中的信息),技巧性非常強。也就是說,玩家是可以通過教育和訓練提升德撲的競技水平;所以最近興起了一批德州撲克培訓平臺和AI德州撲克機器人研發商,前者如德州撲克培訓大師和步步德撲等,後者如36氪曾報導過的Libratus等。
  • 就算是輸給AI,也不能說人類丟掉了德州撲克的陣地|德撲人機大戰Day1
    用李開復的話說就是:匹茲堡之戰中被擊敗的職業棋手確實都是德撲的頂尖職業牌手,但他們並不懂計算機原理,而此次龍之隊都是學霸,全部擁有計算機領域的從業經驗,會讓比賽還保留懸念。據田淵棟近期在AI科技評論上所做的分享,CMU 的Libratus,也就是現在的冷撲大師有三個特點:一是沒有使用深度學習,而是用到了End-game solver。因為德撲一局時間比較短,幾個回合就結束了,所以可以從下往上構建遊戲樹。這樣的好處是,最下面節點遊戲樹的狀態是比較容易算出來的,用這個反過來指導設計上面的遊戲樹。
  • 的德撲:精英的遊戲,賭徒的狂歡
    有人借它消遣娛樂、有將靠他識人辨人,更有人沉迷其中,賭性成癮,最終身陷囹圄——曾經被陳一舟封殺的老部下,點點網創始人許朝軍就因沉迷德撲,不僅開設學習德撲的學校,甚至組織賭局,賭資將近1億元最終遭到法律制裁……這項風靡世界的娛樂項目,最終隨著2018年下半年相關部門加強對於以德撲為首的網絡棋牌遊戲的治理,走向海外,進入灰色地帶。
  • 「隱秘」的德撲:精英的遊戲,賭徒的狂歡-虎嗅網
    有人借它消遣娛樂、有人靠他識人辨人,更有人沉迷其中,賭性成癮,最終身陷囹圄——曾經被陳一舟封殺的老部下,點點網創始人許朝軍就因沉迷德撲,不僅開設學習德撲的學校,甚至組織賭局,賭資將近1億元最終遭到法律制裁……這項風靡世界的娛樂項目,最終隨著2018年下半年相關部門加強對於以德撲為首的網絡棋牌遊戲的治理,走向海外,
  • 「隱秘」的德撲:精英的遊戲賭徒的狂歡|觀潮
    有人借它消遣娛樂、有將靠他識人辨人,更有人沉迷其中,賭性成癮,最終身陷囹圄——曾經被陳一舟封殺的老部下,點點網創始人許朝軍就因沉迷德撲,不僅開設學習德撲的學校,甚至組織賭局,賭資將近1億元最終遭到法律制裁……這項風靡世界的娛樂項目,最終隨著2018年下半年相關部門加強對於以德撲為首的網絡棋牌遊戲的治理,走向海外,進入灰色地帶。
  • 德撲被攻陷?人工智慧擊敗頂級玩家贏20萬美元
    在無限德撲比賽中(一對一、無限制投注的規則),人工智慧擊敗世界最強的人類德州撲克玩家,這是人工智慧歷史上又一裡程碑時刻。比賽過程中,人類選手整體上從未領先過。進入比賽最後一天時,Libratus 贏得156 萬籌碼。人類選手要挽回劣勢,只有不到 5,000 手的機會。Jason Les 說,最後的感覺就是,自己所能做的就是輸。這太打擊士氣了。
  • 金融圈德撲局:有人整夜梭哈,有人終成籌碼
    「我是2010年在澳門賭場接觸德撲的,那時發現金融圈的很多人都很喜歡這個遊戲,現在我每年也會去一兩次澳門打專業比賽。」李銀桂說自己比一般玩家厲害一點的地方在於自己看的書籍更多,理論更紮實。他並不認同馬雲的「高手看眼神」論,「90%還是靠紮實的基礎」。
  • 【德撲攻略】德州撲克網遊:AK 的基本攻略
    原標題:【德撲攻略】德州撲克網遊:AK 的基本攻略   AK是所有德撲網遊中最受爭議的底牌,也是一副令人又愛又恨的底牌。德撲大師團隊根據國內德州撲克網遊特性,為大家製作了第一套AK打法攻略,希望所有玩家從今天開始能正確認識AK,發揮AK在遊戲中的真正價值。
  • 機器之心專訪吳恩達,深度學習課程項目Deeplearning.ai正式發布
    吳恩達表示:Deepleanring.ai 是一套教育課程,而另外兩個項目則有關人工智慧產品,但他目前還不能透露更多細節。在 Deeplearning.ai 發布前夕,機器之心對吳恩達進行了專訪,內容涉及該項目、近期工作的動向,以及對未來的展望。
  • 吳恩達Deeplearning.ai課程學習全體驗:深度學習必備課程
    8 月 8 日,吳恩達正式發布了 Deepleanring.ai——基於 Coursera 的系列深度學習課程,希望將人工智慧時代的基礎知識傳播到更多人身邊
  • 專訪高手互娛段彬:玩德撲是一種風險管理
    段彬:十年前我就是打電競的,早年打《魔獸》,WCP、WSOP,但是年紀大了以後電競打不動了,但我還是非常喜歡競技的精神,德撲裡面有很多的博弈,使得我非常喜歡這個遊戲。 記者:您認為德州撲克和電競最大的相同點和不同點在哪裡?
  • 吳恩達Deeplearning.ai課程學習全體驗:深度學習必備課程(已獲證書)
    8 月 8 日,吳恩達正式發布了 Deepleanring.ai——基於 Coursera 的系列深度學習課程,希望將人工智慧時代的基礎知識傳播到更多人身邊。一周過去後,許多人已經學完了目前開放的前三門課程。這些新課適合哪些人,它是否能和經典的《機器學習》課程相比呢?讓我們先看看這篇先行體驗。
  • 一臺筆記本打敗超算:CMU冷撲大師團隊提出全新德撲AI Modicum
    CMU 冷撲大師團隊在讀博士 Noam Brown、Tuomas Sandholm 教授和研究助理 Brandon Amos 近日提交了一個新研究:德州撲克人工智慧 Modicum,它僅用一臺筆記本電腦的算力就打敗了業內頂尖的 Baby Tartanian8(2016 計算機撲克冠軍)和 Slumbot(2018 年計算機撲克冠軍)。
  • 德撲AI 不完全信息博弈論文領銜,NIPS 2017最佳論文 3 + 1 已經揭曉
    雷鋒網 AI 科技評論按:人工智慧領域最熱門會議之一的 NIPS 已經開幕了,新鮮報導紛至沓來。最佳論文獎Safe and Nested Subgame Solving for Imperfect-Information Games在不完全信息博弈中安全、嵌套地求解子博弈(卡內基梅隆大學德撲 AI 的論文)論文摘要:對於不完全信息的博弈來說,
  • 德撲常見術語(中英文對照) 新手教學
    這兩天有好幾位剛開始玩德撲的新朋友加了【皇家金剛葫蘆娃】的微信,強烈抗議說看不懂文章裡那些英文的意思,什麼check, fold
  • 專訪WSOP選手:我們非常享受德撲帶來的樂趣
    [摘要]今天騰訊視頻對四位著名的WSOP選手進行專訪,他們分別是Mario Ho、 Chris Moneymaker、Martin Jacobson和Jonathan Duhamel。對我而言,撲克是我的工作,是我的興趣,是我的一切,而且我很慶幸有這樣一份工作,可以到全世界範圍不同地方打比賽獲得獎金,與不同人交流,與不同人競技。 記者:您對本次參賽的其他選手有什麼好的建議? Chris Moneymaker:現在賽事已經進行了兩天,畢竟還有幾天,所以我不太希望給這些參賽的選手建議或想法。
  • ai電銷機器人排名靠前的是哪幾家,哪家品牌最好
    目前市場上有很多智能ai電銷機器人,功能卻是參差不齊,很多企業老總都想找出功能最全效果最好的哪個,那麼ai電銷機器人排名靠前的是哪幾家,哪家品牌最好?這裡由深圳易網行電銷機器人的小編我來為大家解惑!幾年前應用的人工智慧是聊天機器人,通過聊天界面與人溝通,提供一些自動化服務。首次使用這些機器人的企業希望用戶獲得24小時的便利,提高服務質量,人工智慧到目前為止不僅使客戶服務更好,企業本身也節省了很多人力成本。特別是在電銷領域,人工智慧電話機器人的作用非常重要。被人工智慧替代的工作崗位中,99%可以說是電話銷售。