谷歌DeepMind團隊圍棋AI新進展:AlphaGo升級版AlphaZero強勢來襲

2021-01-16 AI銳見

近日,據外媒報導,谷歌DeepMind團隊帶來了一個全新的通用的版本。這個程序被稱為AlphaZero,它教會自己在短短三天內玩三種不同的棋盤遊戲(西洋棋、圍棋和日本版西洋棋),沒有人為幹預,這一描述成就的論文發表在《科學》雜誌上。

DeepMind執行長兼聯合創始人Demis Hassabis說「從完全隨機的遊戲開始,AlphaZero逐漸學會了什麼是好的遊戲,並形成了自己對遊戲的評價。從這個意義上講,它不受人類對遊戲思考方式的限制。」

AlphaZero是DeepMind旗下AlphaGo的直系後代。2016年,AlphaGo打敗了圍棋(人類)世界冠軍李世石(Lee Sedol),成為世界各地的頭條新聞。AlphaGo並不滿足於此,去年獲得了一次重大升級,能夠在不需要人工幹預的情況下自學獲勝策略。

通過一遍又一遍地與自己下棋,AlphaGo Zero (AGZ)訓練自己在短短三天時間內從零開始,以0比100完勝最初的AlphaGo 100。它得到的唯一輸入是遊戲的基本規則。

AlphaZero通過應用大量處理能力,5,000張處理單元(TPU),相當於一臺非常大的超級計算機,很快地學會了玩三種棋盤遊戲中的每一種。

不像以前的西洋棋機器那樣以極快的速度處理人類的指令和知識,AlphaZero會產生自己的知識,它只需幾個小時即可完成,其結果已超過任何已知的人或機器。

但是,AlphaZero的基本算法實際上僅適用於可以採取相當數量的操作問題。它還需要一個強大的環境模型,即遊戲規則。

相關焦點

  • DeepMind 推出 AlphaGo 圍棋教學工具,圍棋學習新紀元來啦?
    除了官網上的簡單介紹,作為 DeepMind 圍棋大使、AlphaGo 的「教練」,樊麾也在其個人微博上宣布「AlphaGo 教學工具終於上線。」他表示,教學工具共有兩萬多個變化,三十七萬多步棋組成,通過 AlphaGo 的視角,分析並建議圍棋開局的諸多下法。
  • 谷歌人工智慧公司 DeepMind 介紹阿爾法狗升級版 AlphaZero
    谷歌人工智慧公司 DeepMind 介紹阿爾法狗升級版 AlphaZero 站長之家(ChinaZ.com) 12月7日 消息:據外媒報導,在今天發表於《科學》
  • AlphaGo 圍棋教學工具已發布
    >https://alphagoteach.deepmind.com/zh-hans黃士傑博士:大家好,很高興向大家宣布,AlphaGo教學工具上線了。通過對 AlphaGo 和職業與業餘棋手的下法進行比較,探索圍棋的奧妙。
  • 從AlphaGo到蛋白質摺疊,Deepmind在不斷捅破AI領域的天花板!
    #近日,又一世紀級難題被AI迎刃而解:谷歌旗下子公司Deepmind通過AI建立的算法模型,成功精準預測了蛋白質的摺疊方式,這將對人類了解重要的生物學過程和治療新冠等疾病起到十分關鍵的作用。成立至今,不斷突破AI技術天花板併入谷歌之後,利用谷歌龐大的伺服器計算資源,成功開發出了AlphaGo,戰勝世界圍棋大師李世石的事跡相信大家也很清楚。
  • Deepmind新一代AlphaGo Zero自學3天打敗AlphaGo
    今天凌晨,谷歌旗下Deepmind人工智慧團隊發布了一篇轟動AI界的論文,《Mastering the game of Go without human knowledge》(在沒有人類知識的情況下掌握圍棋),一句話總結這篇論文,他們研發的AlphaGo大表哥AlphaGo Zero能夠在沒有人類圍棋對弈數據的情況下
  • AlphaGo背後團隊Deepmind有多牛 核心團隊成員資料介紹
    在這一為世界矚目的人機大戰上,李世石與AlphaGo的首場「約棋」【為什麼是圍棋】卻以落敗告終。  在今天賽後的發布會上,AlphaGo的靈魂人物戴密斯·哈薩比斯再度強調,團隊所努力的方向並不是提升硬體能力,而是改進算法。眾所周知,此前也曾與人類對弈的機器人「深藍」靠的是窮舉這種笨方法。
  • 升級版AlphaGo 5月決戰柯潔,DeepMind揭秘計算機全新棋風
    機器之心原創參與:李澤南、李亞洲、吳攀4 月 10 日下午,谷歌在北京的中國棋院召開新聞發布會,正式宣布 AlphaGo 將於今年 5 月 23 日在浙江烏鎮對決以柯潔為代表的中國頂尖棋手。據機器之心現場了解,中國圍棋協會和浙江省體育局攜手谷歌三方將聯合主辦「中國烏鎮·圍棋峰會」。
  • 阿爾法狗之後的圍棋世界
    短短幾個月,圍棋AI,已經出現了非常令人驚詫的變化,黑馬一匹又一匹,普遍水平的提高遠遠超出棋界人士的預期。第一個黑馬是來自中國的天壤圍棋,第一次參賽就殺入四強,並戰勝了老盤圍棋ai勁旅,來自韓國的瘋石,其棋力已經接近職業級別。這是一個上海的AI創業團隊,看來還是蠻有實力的。
  • DeepMind新GNN模型,將谷歌地圖預估到達準確率提升50%!
    目前,谷歌Maps交通預測系統由以下部分組成:(1)路由分析器,以構建超路段(2)新GNN 模型,利用多個目標函數進行優化,能夠預測每個超級路段的行程時間。因此,該團隊開始研究能夠處理可變長度序列的模型,例如循環神經網絡(RNN)。但是,向 RNN 添加來自道路網絡的結構也不是容易的事。最後,研究者決定用圖神經網絡。在對交通情況進行建模時,車輛如何穿過道路網絡是該研究的關注點,而圖神經網絡可以對網絡動態和信息傳播進行建模。
  • AlphaGo之後,DeepMind重磅推出AlphaFold:基因序列預測蛋白質結構
    機器之心報導機器之心編輯部Alphabet(谷歌)旗下公司 DeepMind 的人工智慧 AlphaGo 曾在西洋棋、圍棋等項目中取得了超越人類的表現,其研究不僅震驚世界,也兩次登上2017 年 5 月,谷歌 DeepMind 人工智慧項目 AlphaGo(執棋者:黃士傑博士)對戰當時世界第一的圍棋選手柯潔。
  • 圍棋擊敗AlphaZero!各類遊戲測試碾壓前輩,谷歌DeepMind AI再添新員
    編 | 雲鵬智東西11月21日消息,谷歌DeepMind近日推出人工智慧MuZero。一、「自學成才」的MuZero谷歌DeepMind在去年年底發表在《科學》雜誌上的一篇論文中,詳細介紹了AlphaZero,這是一種人工智慧系統,可以通過自學掌握西洋棋、日本「將棋(shogi)」以及中國的棋盤類遊戲「圍棋」的玩法。
  • 不只是AlphaGo,谷歌DeepMind到底是何方神聖?
    谷歌DeepMind的歷史DeepMind最初由丹米斯·哈撒比斯(Demis Hassabis)、穆斯塔法·蘇萊曼(MustafaSuleyman)和謝恩·列格(ShaneLegg)創立,他們都是人工智慧愛好者,有些人認為他們是深度學習的先驅。DeepMind科技於2010年在倫敦成立,四年後被谷歌收購了,其所有權在2015年也發生了變化。
  • 谷歌DeepMind 的可微分神經計算機 DNC 怎麼樣?看 Facebook AI...
    田淵棟,卡耐基梅隆大學機器人系博士學位、上海交通大學碩士學位和學士學位,前谷歌無人車項目組成員,現任 Facebook 人工智慧組研究員,主要負責 Facebook 的智能圍棋項目 Dark Forest。
  • 谷歌團隊發布AlphaGo Zero:柯潔稱人類太多餘了
    【中關村在線新聞資訊】10月19日消息,今天谷歌旗下人工智慧團隊DeepMind在今天對外發布了一款全新的AlphaGo程序。這款軟體名為AlphaGo Zero,與之前擊敗了李世石的AlphaGo Master進行對弈,勝率高達100%。
  • AlphaZero:從小白開始制霸多個遊戲
    其影響遠遠超出了我心愛的棋盤……不僅是因為這些自學成才的專家機器表現得非常出色,還因為我們可以從它們產生的新知識中學習。 和圍棋一樣,AlphaZero 對西洋棋的創造性反應同樣令人興奮,因為自計算機時代以來,這對於人工智慧來說一直是一個巨大的挑戰。早期的先驅者巴貝奇、圖靈、香農、馮·諾依曼都曾嘗試手動設計西洋棋程序。
  • 柯潔終結41連勝圍棋AI:稱其實力遠超初代AlphaGo
    人類AI圍棋之爭,還在繼續。今年5月底,人機圍棋大戰終極對決,最終世界排名第一的柯潔九段和AlphaGo的圍棋終極人機大戰以0:3完敗。賽後,柯潔在接受採訪時直言,AlphaGo太完美,看不到任何勝利的希望。
  • 陳經:根據AlphaGo弈城圍棋網的疑似測試對局預測谷李大戰比分
    弈城圍棋網有一個帳號叫deepmind。2016年1月28號谷歌Deepmind小組開發的圍棋程序AlphaGo戰勝職業選手的勁爆消息出來之後,這個帳號名引發了棋迷的關注。之後AlphaGo的共同第一作者Aja Huang發貼說,這個帳號是他本人的,但否認是AlphaGo。對此我們根據deepmind的歷史戰績進行一些推測。
  • AlphaGo Zero用40天成為世界最強圍棋AI
    棋士柯潔:一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了李喆:完全拋開人類圍棋知識,去年論文裡提到的許多特徵和rollout全部去掉,兩個神經網絡合為一個,只給定棋盤、棋子和規則。
  • 「燒錢機器」DeepMind持續多年虧損後,仍無商業...
    DeepMind是一家人工智慧初創公司,成立10年來研發了眾多明星產品,例如,前不久剛剛推出的AlpaFold,用AI預測蛋白質三維結構,攻克生物科學50年挑戰;2014年推出的人工智慧圍棋選手AlphaGo,2016年擊敗了世界圍棋冠軍、職業九段棋手李世石,2017年擊敗了當今圍棋第一人柯潔。
  • 『燒錢機器』DeepMind持續多年虧損後,仍無商業...
    ,2016年擊敗了世界圍棋冠軍、職業九段棋手李世石,2017年擊敗了當今圍棋第一人柯潔。前者在預測蛋白質結構中達到了無與倫比的精確性,有望解決生物學界和計算機科學界多年來的巨大挑戰。後者在圍棋賽中多次戰勝世界頂級人類選手。