圍棋下不過,DeepMind發布新工具幫助人類開啟「上帝視角」!

2020-12-15 DeepTech深科技

(《麻省理工科技評論》中英文版APP現已上線,年度訂閱用戶每周直播科技英語講堂,還有科技英語學習社區哦~)

DeepMind 發布了一個名為 AlphaGo Teach 的工具,旨在幫助人們學習 AlphaGo 的下圍棋策略。該系統允許用戶自行開局,同時查看 AlphaGo 對於不同落子位置的預期勝率。

這是一個互動的工具,用戶可以看到 AI 程序如何對不同的圍棋布局做出反應,以及看到使用黑棋贏得比賽的機率。用戶可以查看 AlphaGo 自己計劃的布局,以及在相同情況下,人類棋手使用的最多的布局。

DeepMind 旨在幫助圍棋棋手更好地理解 AlphaGo 的行為。今年早些時候,AlphaGo 在兩場對弈和一系列在線比賽中戰勝了人類,之後便「退休」了。在與人類棋手的競技過程中,AlphaGo 棋藝驚人,而且偶爾使用與傳統圍棋路數相反的反常路數,但依然獲得了勝利。

雖然 AlphaGo Teach 不會把圍棋新手變成大師,但它可以幫助有經驗的玩家更好地理解在特定情況下機器學習程序看到的東西。由於它假設用戶對圍棋的目標和玩法有一定的了解,所以完全不熟悉圍棋的人有可能不會感受到該工具對學習圍棋的幫助。

也就是說,這將在人工智慧的領域展現一個有趣的先例——創造一個可以教人類如何思考「超人」系統。這樣反過來可以進一步推動人類智慧的發展。

僅僅幾天之前,DeepMind 就發表了一篇關於 AlphaZero 的論文,現在便又有了 AlphaGo Teach 的消息。由此可見 DeepMind 的研究推進可謂神速。

相關焦點

  • DeepMind 推出 AlphaGo 圍棋教學工具,圍棋學習新紀元來啦?
    雷鋒網 AI 科技評論消息,北京時間 12 月 11 日晚,DeepMind 在 twitter 上宣布推出圍棋教學工具 AlphaGo Teach。上圖中,標有白圈的黑子表示上一手,虛線圓圈表示 AlphaGo 下一步可能的走法,實線圓圈表示人類選手下一步可能的走法,圓圈中的數字表示 AlphaGo 評估的黑子勝率。
  • 碾壓人類!Deepmind改寫圍棋定式開玩星際2!
    【中關村在線原創】在烏鎮圍棋大會之後直到最近幾天,Deepmind的AlphaGo項目負責人之一Aja Huang博士結束了休假,又恰逢歐洲圍棋大會,帶給了全世界圍棋愛好者一個「上帝視角」看三大複雜定式的解說,定式就此改寫。
  • Google DeepMind 團隊發布新算法,下一個被 AI 虐哭的是誰?
    要知道,柯潔可不是旁人,是當時世界第一,年紀輕輕,已經手握多項含金量高比賽的冠軍,代表人類最高水平的棋手都無能為力,可見 AlphaGo 真的不是尋常之輩。賽後,中國圍棋協會也授予了 AlphaGo 職業圍棋九段的稱號,棋聖聶衛平更是盛讚 AlphaGo 的水平相當於職業圍棋二十段。賽後,DeepMInd 團隊宣布 AlphaGo 退役,但相關研究不會停止。
  • 阿爾法狗教學工具上線,柯潔:重新學圍棋
    北京時間12月11日晚間,Deepmind公司在自己官網上線了AlphaGo教學工具,旨在幫助公眾用新的、啟發性的方式下圍棋。這樣的舉措,也進一步兌現了Deepmind在烏鎮人機大戰結束時的承諾:與全世界圍棋愛好者共同分享AlphaGo的數據。AlphaGo的啟蒙老師、歐洲圍棋冠軍樊麾在微博上透露:「AlphaGo教學工具共有兩萬多個變化,三十七萬多步棋組成,通過AlphaGo的視角,分析並建議圍棋開局的諸多下法。
  • 阿爾法狗又逆天,谷歌推教人類下圍棋工具!
    今天下午13時,「尋找圍棋小先鋒」的活動,在上海世博園萬國體育館舉行。聶衛平道場創始人、圍棋九段聶衛平先生、谷歌CEO桑達爾·皮查伊先生和谷歌大中華區總裁石博盟先生參加了此次發布會。如此規格的嘉賓陣容,足以見得谷歌方面和聶衛平對此次圍棋青少年大賽極高的重視程度。
  • DeepMind 第四代:不學規則就能下棋玩遊戲
    谷歌稱 MuZero 可以未知環境中計劃獲勝策略,無需學習規則,便能掌握 Go(圍棋), chess(西洋棋), shogi(日本將棋)和 Atari(電子遊戲)。這和 MuZero 的前幾代——AlphaGo,AlphaGo Zero,AlphaZero 有很大的區別。
  • 多圖詳解 DeepMind 的超人類水準星際爭霸 AI 「AlphaStar」
    星際爭霸 AI 背景自以圍棋為代表的完全信息博弈/遊戲被 AlphaGo 攻克、取得超出人類頂尖棋手的水平之後,研究人員們立刻向非完全信息博弈發起更加猛烈的進攻。典型的非完全信息博弈比如德州撲克,玩家需要在看不到對手的牌面的狀況下做出決策,CMU 的德撲 AI 論文也拿到了 NIPS 2017 的最佳論文獎。
  • 【DeepMind重大突破】DNN具有人類行為,認知心理學破解黑箱
    此文一出,就有學者指出,DeepMind 是在將過去的研究包裝為全新的研究。DeepMind 的最新論文稱過去「首次」將認知心理學方法引入了對深度神經網絡黑箱的理解研究中,並用認知心理學的方法發現了深度神經網絡存有和人類兒童在學習詞彙時也存在的「形狀偏好」的行為。此文一出,就有學者指出,DeepMind 是在將自己的研究包裝為全新的研究。
  • 星際爭霸2人類1:10輸給AI!DeepMind 「AlphaStar」進化神速
    除了此前比賽錄像的展示外,AlphaStar 還和 MaNa 現場來了一局,不過,這局AlphaStar 輸給了人類選手 MaNa 。不過 AlphaStar 採取了變種戰略,選擇在 MaNa 基地附近放下水晶,拍下兩個兵營,準備利用兵營距離的優勢進攻。MaNa 此時還在按照人類的思路,利用使徒騷擾農民。在 AlphaStar 兵營快完成的時候,被 MaNa 發現,他果斷採取了防守措施,在高坡建造了兩個充電站,準備利用封路和高坡的優勢防守即將到來的追獵大軍。
  • 人類是否還有深入研究圍棋等對弈遊戲的必要?
    讓我們想像一下,有一位能夠窮盡圍棋所有變化的「圍棋上帝」,能夠獲知將所有棋局導向最大期望勝利的全部最優途徑,那他也就能在任何局面下下出最優解。這最優解,就是我們俗稱的「神之一手」。無數代人類所追求的每個局面下的最佳一手,也就是最能導向勝利的一手,就是這個「神之一手」。
  • AlphaGo推出圍棋教學工具 棋館要被踢館了?
    在血洗了整個棋壇之後,AlphaGo並沒有「深藏功與名」,而是推出了一套AlphaGo教學工具,作用就是教人下圍棋。Deepmind公司在昨天夜間上線了AlphaGo教學工具,分享AlphaGo的數據,旨在幫助公眾用新的、啟發性的方式下圍棋。
  • 再創新高:DeepMind一年燒掉6.5億美元,谷歌卻揮手免除15億債務
    這家公司因其大量研究成果被社區所熟知,比如打敗圍棋世界冠軍的 AlphaGo、預測蛋白質結構的 AlphaFold 2 等等。DeepMind 以在圍棋領域戰勝最強人類的 AlphaGo 開始廣為人們所知,2017 年 5 月,當時的世界第一選手柯潔在人機大戰中 0 比 3 落敗。
  • 當圍棋開啟直播
    3月21日晚,圍棋七冠王柯潔九段在鬥魚直播平臺開啟了屬於自己的直播。得益於提前一周的預熱,直播間面板關注人數很快便突破30萬,直播熱度也穩定在200萬以上。如果能長期保持下去,這已經是一個接近熱門遊戲頭部主播的華麗數據。不過作為初次亮相的新晉主播,當天的直播過程略顯業餘,或者說準備不足。
  • AlphaGo 打敗了人類,DeepMind 卻輸給了金錢
    相關報導顯示,在 2010 年,Hassabis 曾為了募資而參加了奇點峰會,最終獲得了 200 萬英鎊投資。不過,這一資金短缺的狀況在 2014 年就發生了改變。有了 Google 這樣強大的「金主」作依靠之後,DeepMind 取得了許多不錯的成績,其中最為矚目的當屬 2016 年 AlphaGo 首次擊敗韓國圍棋冠軍李世石,比分為 1:4。此後,DeepMind 還不斷開發出新的 AI 系統,挑戰人類的極限。
  • 陳經:根據AlphaGo弈城圍棋網的疑似測試對局預測谷李大戰比分
    弈城圍棋網有一個帳號叫deepmind。2016年1月28號谷歌Deepmind小組開發的圍棋程序AlphaGo戰勝職業選手的勁爆消息出來之後,這個帳號名引發了棋迷的關注。之後AlphaGo的共同第一作者Aja Huang發貼說,這個帳號是他本人的,但否認是AlphaGo。對此我們根據deepmind的歷史戰績進行一些推測。
  • 人類一敗塗地?DeepMind推出Agent57,在所有雅達利遊戲上超越人類
    去年,DeepMind 推出的 MuZero 在 51 款雅達利遊戲中實現了超越人類的表現。時隔數月,DeepMind 在這一方向上更進一步,在 57 款雅達利遊戲中全面超越人類,在這一領域尚屬首次。DeepMind 在最新發布的預印本論文和博客中介紹了這一進展。
  • DeepMind 綜述深度強化學習:智能體和人類相似度竟然如此高!
    、到圍棋、再到無限制撲克等領域,AI 的表現都大大超越了專業選手,這一進展引起了眾多認知科學家的關注。這些發展引起了越來越多心理學家、心理語言學家和神經學家的興趣,他們對 AI 發展是否意味著關於人類認知和腦功能的新假設展現出了充分的好奇心。從這個角度來講,AI 中最具吸引力的領域就是深度強化學習。因為它將神經網絡建模與強化學習充分的結合起來,形成了一套從獎懲中學習而非從準確教學中學習的方法。
  • DeepMind詳解新WaveNet:比原來快千倍,語音更自然 | 附論文
    Florian Stimberg, Norman Casagrande, Dominik Grewe, Seb Noury, Sander Dieleman, Erich Elsen, Nal Kalchbrenner, Heiga Zen, Alex Graves, Helen King, Tom Walters, Dan Belov, Demis Hassabis地址:https://deepmind.com
  • 重磅| DeepMind官方確認Master身份:全面回顧AlphaGo的再度出山之旅
    人類數千年的實戰演練進化,計算機卻告訴我們人類全都是錯的。我覺得,甚至沒有一個人沾到圍棋真理的邊。但是我想說,從現在開始,我們棋手將會結合計算機,邁進全新的領域達到全新的境界。新的風暴即將來襲,我將盡我所有的智慧終極一戰!」在 1 月 1 日晚 11 時,Master 轉戰騰訊野狐圍棋,與各路高手展開了新的對局。
  • Deepmind "預測地圖"論文背後:神經科學或將助力深度學習迎來新突破
    對人類神經網絡的理解越來越在左右人工智慧的未來研究,連Deepmind也不例外。2017年10月2日,《NATURE NEUROSCIENCE》發表了Deepmind的一篇《The hippocampus as a predictive map》的論文。這篇論文中,Deepmind通過對主管人類長期記憶行為的「海馬體」(hippocampus)神經元活動的研究,進一步提出了可以轉化為神經網絡架構的「預測圖」理論。