Facebook首次開源超級圍棋AI,復現AI高手AlphaZero

2020-12-07 電子產品世界

  最近,Facebook人工智慧研究所(以下簡稱FAIR)宣布,他們開源了自研的圍棋AI訓練模型和代碼。這意味著,你可以隨時隨地和Facebook人工智慧下圍棋了,而且此圍棋AI程序重現的是名噪一時的AI高手AlphaZero。

本文引用地址:http://www.eepw.com.cn/article/201902/397647.htm

  


  去年5月,FAIR發布了ELF Open GO,ELF OpenGo是FAIR依照DeepMind在《自然》上發表的和AlphaGo Zero以及AlphaZero相關的論文,做出的開源計算機圍棋程序,也就是說,ELF OpenGo不使用人類棋譜與累積的圍棋知識,僅使用單一類神經網絡從自我對弈中學習。

  該圍棋AI之前在和韓國棋院的專業圍棋選手對弈中,都取得不錯的成績。據悉,OpenGo 的最新版本使用2000塊GPU訓練了15天後,在一塊GPU的情況下與4個排名前30的職業選手進行比賽時,取得了20:0全勝的戰績,可謂是戰無不勝。

  


  在這次開源的論文中,FAIR研究人員全面披露了ELF OpenGo的訓練過程,包括取得的是三個突破。

  一是為ELF OpenGo訓練了一個超人類棋藝的模型,他們在2000個GPU上運行類AlphaZero的訓練軟體9天後,有20個模塊的模型超越了人類水平。

  二是提供了模型在訓練過程中的行為分析,包括和其他模型的對比、學習速度、學習難度等等。

  三是通過實施ablation實驗,以研究AlphaZero風格算法的性質,他們發現對於最終模型而言,對局中加倍rollout水平大約提升200 ELO,AI的發揮會受到模型容量的限制。

  最後,此次論文的主要作者為田淵棟,他一直負責Facebook的圍棋AI相關研究,在此前的一篇知乎文章中,他提到:DeepMind不開源也不透露細節,文章裡面一些地方也沒有寫得很清楚。沒有第一手經驗總不是很踏實。所以本著研究目的,我們需要復現一下,先有復現,才有創新,這個是做研究的習慣。而且如果我們去看 ELF OpenGo 的代碼,會發現其完全適用於其它方向的工作。而圍棋對我們來說,只是一個把算法和平臺做好的手段。在這一點上,花點時間把圍棋做好是值得的。

  最後,關於ELF OpenGo最新訓練模型的具體數據可以閱讀原文獲取論文連結了解。


相關焦點

  • Facebook首次開源超級圍棋AI 復現AI高手AlphaZero
    最近,Facebook的人工智慧研究所(以下簡稱FAIR)宣布,他們開源了自研的圍棋AI訓練模型和代碼。這意味著,你可以隨時隨地和Facebook的人工智慧下圍棋了,而且此圍棋AI程序重現的是名噪一時的AI高手AlphaZero。
  • 微信團隊開源圍棋AI技術PhoenixGo,復現AlphaGo Zero論文
    本文介紹了騰訊微信翻譯團隊開源的人工智慧圍棋項目 PhoenixGo,該項目是對 DeepMindAlphaGo Zero論文《Mastering the game of Go without human knowledge》的實現。
  • 來2050「天壤AI圍棋論道」,看圍棋第一人樸廷桓與AI對決
    現圍棋世界第一人樸廷桓,中國女子圍棋世界冠軍宋容慧、唐奕,中國女子國旗職業棋手趙貫汝,職業八段、著名圍棋評論家曹志林,甚至與柯潔對戰的機械臂等等,都將重磅亮相這場圍棋論道。屆時,現世界圍棋第一人—樸廷桓九段,也將於天壤AI圍棋手談一局,還將與現場棋迷交流學棋經歷和感受,分享他和AI交流的心得,探索圍棋新的下法和更廣大的世界。此外,天壤團隊也將展示圍棋AI可以為圍棋提供的輔助功能,如國手人機協作的對弈,機器輔助的講解,AI輔助復盤等等。
  • 首屆國際分布式AI會議在京召開,姚期智、Lesser坐鎮,德撲、圍棋 AI...
    一、德撲&圍棋,全天講解會議從13日開始,上下午分別有一個tutorial。有意思的是,上午tutorial的講者是著名德撲AI研究者Noam Brown,而下午的講者是在圍棋AI領域極為著名的華人學者田淵棟。
  • Facebook AI 年度總結來啦
    我們更新的 XNLI 數據集(https://code.fb.com/ai-research/xlni/)中的語言包括兩種資源很少語言(斯瓦希裡語和烏爾都語),我們的方法有助於跨語言理解,從而減少了對監督訓練數據的需求。
  • Roadstar.ai又添砝碼:自建模擬器,邁向運營深水區
    劉軒在Roadstar.ai 擔任技術總監一職,他的加盟將使得 Roadstar.ai的自動駕駛仿真器裡程迅速提速。現實世界的一面「鏡子」:自研仿真器業內對於自動駕駛仿真器最初的理解,大多是來自於Waymo 的「Carcraft」。
  • 精通西洋棋的AI研究員:AlphaZero真的是一次突破嗎?
    2016 年,DeepMind 推出圍棋引擎 AlphaGo,可擊敗一些人類頂尖圍棋選手。值得注意的是圍棋的複雜性要遠高於西洋棋,正由於此,儘管計算機的算力有了很大提升,但機器依然無法在圍棋上戰勝人類。 因此,AlphaGo 被認為是一次突破。AlphaGo Zero 在 AlphaGo 的基礎上更進一步,可通過完全自我對弈掌握圍棋 。
  • Master連續擊敗圍棋高手,它是阿爾法狗還是韓國AI?
    上周,一個網名為Master的「網絡棋手」在著名圍棋對弈網站弈城登錄,連續打敗柯潔九段、樸廷桓九段、陳耀燁九段、連笑七段等一流高手,取得30連勝之後,神秘網絡ID「Master」給自己放了一天假。從這一數據說明,Master已經超越了人類最頂級圍棋高手,至於具體棋力,也是仁者見仁智者見智。谷歌公司的旗下DeepMind團隊在推特中發文表示,Master就是阿法狗!但此消息目前還未得到谷歌公司證實。
  • Facebook AI 正在升維突破:教AI像人類一樣理解三維世界
    圖 | VoteNet 實現方式(來源:Facebook) 研究人員表示,開源的 -End- 參考: https://ai.facebook.com/blog/pushing-state-of-the-art-in-3d-content-understanding/ https://ai.facebook.com/blog/-detectron2
  • 阿爾法狗之後的圍棋世界
    在阿法狗之前,很多圍棋ai也走出人類所不能理解的變化和對定式的改變,但人類認為那是ai水平不足,並不足以採信,但由於阿法狗的無敵戰績,現在職業棋手已經對這些新的變化非常認可並且推崇,目前職業比賽裡,狗狗流的下法已經非常普遍,而且喜歡走狗狗流的棋手,戰績一般還都不錯。現在幾乎每三盤職業比賽裡,都能看到一盤狗狗改良版的三三定式。
  • AI讓MRI成像快了4倍,核磁檢查再也不用排隊了
    一項即將發表在American Journal of Roentgenology上的新臨床研究首次表明,fastMRI圖像與普通MRI的圖像是可以互換的,該研究專門針對膝蓋掃描,研究人員現在正在努力將結果擴展到身體的其他部位。AI與MRI的結合要了解fastMRI的方法,首先回顧一下MRI的工作原理是有幫助的。
  • 下圍棋so easy,AlphaZero開始玩量子計算!
    來源:創事記歡迎關注「創事記」微信訂閱號:sinachuangshiji文/新智元來源:新智元(ID:AI_era)【新智元導讀】AlphaZero雖然在圍棋項目上戰勝了人類選手AlphaZero一開始是專門用來下圍棋的。圍棋的落子位置太多了大約有10170種。相比之下,西洋棋只有1043種可能的走位。所以AlphaZero使用了一個深層的神經網絡,它學會了從一個特定的位置開始評估它獲勝的可能性。
  • 下圍棋so easy ,AlphaZero開始玩量子計算
    來源:nature等 AlphaZero雖然在圍棋項目上戰勝了人類選手,但所需的大量算力使其很難走進尋常人的生活。 AlphaZero一開始是專門用來下圍棋的。圍棋的落子位置太多了大約有種。相比之下,西洋棋只有種可能的走位。 所以AlphaZero使用了一個深層的神經網絡,它學會了從一個特定的位置開始評估它獲勝的可能性。為了獲勝,AlphaZero有一個功能叫做蒙特卡洛樹搜索,這種方法能夠幫助它在遊戲中「預知未來」。
  • AI界的State of the Art都在這裡了
    項目地址:https://www.stateoftheart.ai/正如這些學生所言:「我們希望將所有資源都高效地分配到如今迅猛發展的 AI 和 ML 領域。」因此這個項目可以更高效地利用手中的資源,包括將時間、精力和計算資源都投入到真正的當前最優方法和結果上。
  • Science封面:AlphaZero達成終極進化體,史上最強棋類AI降臨!
    用5000個TPU,快速掌握將棋、圍棋和西洋棋傳統西洋棋的引擎依賴於由人類高手玩家「手工製作」的數千條規則和啟發式方法,它們都試圖解釋遊戲中可能發生的每一種結果在西洋棋中,AlphaZero僅用了4個小時便首次超越了Stockfish;在日本將棋中,AlphaZero在2小時後首次超過Elmo;在圍棋方面,AlphaZero在2016年的比賽中,經過30個小時的鏖戰,首次擊敗了傳奇棋手李世石。註:每個訓練步驟代表了4096個落子位置。
  • 學界| Facebook新論文介紹相似性搜索新突破:在GPU上實現十億規模
    該團隊已經將相關實現的代碼進行了開源。機器之心在此對該研究論文及其代碼項目進行了簡單介紹。論文地址:https://arxiv.org/abs/1702.08734開源地址:https://github.com/facebookresearch/faiss摘要相似性搜索(similarity search)可以在用於圖像或視頻等複雜數據處理的專用資料庫系統中尋找應用,這些複雜數據通常是用高維特徵表示的,而且往往需要特定的索引結構(indexing
  • 其實,ai不止是一項科技,更是一種文化,一種觀念
    其實,ai不止是一項科技,更是一種文化,一種觀念。自2016年alphago在圍棋系列賽中戰勝職業棋手以來,ai已經開始在某些領域中取得進展,並且在某些問題上實現了突破。在最近的新聞中,谷歌發布的兩張miranda照片不僅僅是事實,還再次為我們揭開了ai正在開始各領域進行科學研究的新面貌。
  • 魔獸爭霸3機制比圍棋還簡單?阿爾法狗能否輕鬆戰勝war3玩家?
    不過,如果拿wai3與圍棋對比,這兩款遊戲誰的難度會更高呢?貼吧玩家們就進行了一次有趣的爭執。一位玩家在貼吧提出了自己特立獨行的觀點,玩家表示自己擅長圍棋與war3,二者對比起來,常規玩家眼中異常複雜的war3機制,其實比之圍棋簡單太多,阿爾法狗等級的人工智慧在這類遊戲上想要戰勝玩家,比之在圍棋中戰勝玩家要簡單太多,圍棋三百多落點,每一枚棋子的下落都會帶來恐怖的變量,即便是人工智慧也難以碾壓人類。
  • 只需1 分鐘,這個網站用 AI 分離歌曲的人聲、伴奏和樂器聲
    糰子DanGo.ai(https://dango.ai/)——微博網友@無吔學生近期利用AI技術做的這個能分離音頻軌道的網站火了。在音樂分離這一領域,實際上已經有一些免費的AI工具。比如,由法國音樂流媒體服務公司Deezer為研究目的而開發的Spleeter開源工具,只需要提供一個音頻文件,然後Spleeter就會將它分成兩個、四個或五個獨立的音軌,非常有用。