DeepMind 團隊:我們希望AlphaGo 的故事僅僅只是一個開始!

2021-01-16 TechWeb

【TechWeb報導】5月29日消息,隨著人機圍棋大戰的結束,DeepMind團隊也發布博客,公布了AlphaGo的下一步。在公開的博文中,DeepMind團隊稱,我們始終堅信 A.I. 擁有幫助全社會探索新知識的潛能,並讓我們從中受益。

博文中還表示,而 AlphaGo 則讓我們真切的感受到了這一點。對於圍棋選手來說,AlphaGo 更像是獲得靈感的工具,而不僅僅只是對手。通過 AlphaGo 的啟發,棋手們能夠在這項具有 3000 年歷史的遊戲中,嘗試全新的思路與策略。(王蒙)

以下為DeepMind團隊博客原文:

AlphaGo的下一步

Demis Hassabis, DeepMind 聯合創始人兼 CEO

Dave Silver, DeepMind AlphaGo 首席研究員

僅下了三手棋,我們就能清楚認識到這將是一盤非凡的對弈。

中國圍棋大師,世界排名第一的柯潔九段一改以往風格,以三3作為開局。這種開局方式十分罕見,其目的是要在開局階段快速搶佔角部實地。這種下法以往很少被圍棋選手所採用,但卻是 AlphaGo 最喜愛的開局。柯潔也將其使用在了自己的對局當中。

柯潔在首局中深思熟慮的這一手棋,正切合了本次中國烏鎮圍棋峰會的主題――探索圍棋這一古老遊戲的深遠奧秘。在為期 5 天的峰會中,我們有幸見證了這一遊戲的最高水平。

我們始終堅信 A.I. 擁有幫助全社會探索新知識的潛能,並讓我們從中受益。而 AlphaGo 則讓我們真切的感受到了這一點。對於圍棋選手來說,AlphaGo 更像是獲得靈感的工具,而不僅僅只是對手。通過 AlphaGo 的啟發,棋手們能夠在這項具有 3000 年歷史的遊戲中,嘗試全新的思路與策略。

2016 年在首爾戰勝傳奇棋手李世石時,AlphaGo 所弈出的創新著法,給圍棋界帶來了全新的知識。而年初以 Master 身份在網絡上進行的非官方對局,也給包括柯潔在內的許多頂尖棋手帶來了深遠影響。在本周峰會所舉辦的配對賽中,兩位頂尖棋手與 AlphaGo 分別配對,也展示了人類利用 A.I. 在複雜領域中產生全新認知的潛能。

對於 AlphaGo 而言,本周在圍棋誕生之地與世界頂尖棋手舉行的一系列扣人心弦的比賽,已經是它作為一個競技程序所能企及的巔峰。因此,此次圍棋峰會將是 AlphaGo 參加的最後一場賽事。

從現在開始,AlphaGo 的研發團隊將把精力投入到其它重大挑戰中,研發出高級通用算法,為科學家們解決最複雜的問題提供幫助,包括找到新的疾病治療方法、顯著降低能源消耗、發明革命性的新材料等。如果人工智慧能夠在上述領域發現新的知識和策略,那在這些領域的突破將十分可觀。我們已經迫不及待地想看到這一切的發生。

儘管 AlphaGo 將退出競技比賽的舞臺,但這絕不是我們與圍棋界合作的終點。我們非常感激圍棋界在過去幾年中,對我們工作所給予的鼓勵和支持。我們計劃在今年稍晚時候發布最後一篇學術論文,詳細介紹我們在算法效率上所取得的一系列進展,以及應用在其他更全面領域中的可能性。就像第一篇 AlphaGo 論文一樣,我們希望更多的開發者能夠接過接力棒,利用這些全新的進展開發出屬於自己的強大圍棋程序。

我們也在開發一個教學工具――這也是我們在過去一周中收到最多的需求。這個工具將可以展示 AlphaGo 對圍棋落子位置的分析,幫助大家更好地了解這個程序是如何思考的,最終讓職業棋手以及愛好者可以從 AlphaGo 的視角來重新審視圍棋。尤其讓我們感到榮幸的是,柯潔同意成為我們的第一個合作者,和我們一起來分析他與 AlphaGo 的對局。我們很興奮能聽到他的精彩分析,同時也有機會分享 AlphaGo 的自我分析。

在本次圍棋峰會的最後,我們想給全世界棋迷朋友們送上一份禮物。自與李世石的比賽之後,AlphaGo 成為了自己的老師,並完成了百萬次高水準的自我訓練,以不斷提高。我們會公布 50 盤 AlphaGo 自我慢棋對弈的棋譜,我們相信這些棋譜中,包含了許多全新的思路及策略。

我們利用本周圍棋峰會的機會,已經與一些頂尖職業棋手分享了這些棋譜中的一部分。世界冠軍時越九段是這樣評價的:「這是我前所未見的,就像是我想像中來自遙遠未來的棋局一樣。」 世界冠軍古力九段說:「AlphaGo 的自我對弈令人難以置信,我們能從中學到太多。」 我們希望所有的棋手都能嘗試使用這些棋譜中的一些著法。大家現在可以從這裡看到前 10 張棋譜,我們接下來會每天更新 10 張新的棋譜,直到 50 張棋譜全部分享完畢。

圍棋界對 AlphaGo 給予了積極的評價,職業棋手和業餘圍棋愛好者也對 AlphaGo 給圍棋這一古老遊戲帶來的全新視角表示歡迎,他們對 AlphaGo 的反應讓我們十分感動。我們計劃把這些新發現應用到其他新領域,以解決當前我們正面臨的一些最重要最迫切的科學挑戰。我們希望,AlphaGo 的故事僅僅只是一個開始。

往期精彩文章回顧:

柯潔大勝韓國棋手:原來和人類下棋這麼輕鬆快樂

人機大戰AlphaGo 3:0全勝 柯潔落淚 網友:心疼!雖敗猶榮!

柯潔垂敗 微博大V名人卻為此吵翻了 網友:真難看!

- END -

相關焦點

  • DeepMind 推出 AlphaGo 圍棋教學工具,圍棋學習新紀元來啦?
    同時每步棋 AlphaGo 都會給出自己的勝率分析,希望 AlphaGo 對圍棋的獨特理解可以給我們一些啟發。本教學工具使用的版本是 AlphaGo Master。具體信息可以在主頁上看到,工具設有包括中文簡體在內的多個語言。同時,樊麾也從 AlphaGo 的教學中舉了幾個有意思的例子,並進行了幽默地解說。
  • AlphaGo 圍棋教學工具已發布
    在Deepmind所謂的「教學工具」發布之前,小編曾在腦海出現萬千猜想……但今天揭底才知道,原來只是一個平平淡淡的網頁……(建議複製到電腦上打開,因為據有的棋友反映手機打不開,小編這裡實測手機能打開,只是讀取了較長時間)
  • 從AlphaGo到蛋白質摺疊,Deepmind在不斷捅破AI領域的天花板!
    有別於功能應用越來越細分的AI,AGI可簡單理解為我們在各種大片中看到的機器人,具備與人類相近的大腦獨立思考能力的人工智慧。Deepmind最初由三名科學家聯合創辦,就像其創始人兼CEO哈薩比斯(Demis Hassabis)所說的,它的性質更像一個科技研究院而不是創業公司,因為公司一開始並沒有任何產品,而是一直在通過遊戲來研究人工智慧算法。
  • Deepmind新一代AlphaGo Zero自學3天打敗AlphaGo
    今天凌晨,谷歌旗下Deepmind人工智慧團隊發布了一篇轟動AI界的論文,《Mastering the game of Go without human knowledge》(在沒有人類知識的情況下掌握圍棋),一句話總結這篇論文,他們研發的AlphaGo大表哥AlphaGo Zero能夠在沒有人類圍棋對弈數據的情況下
  • AlphaGo背後團隊Deepmind有多牛 核心團隊成員資料介紹
    影片《終結者》系列描繪了一幅「人機衝突」的圖景  可無論如何,對於人工智慧的大跨步發展,其可能帶來的顛覆性,人類必須開始認真考慮了。  從左至右:Deepmind負責人哈薩比斯、李世石與谷歌總裁施密特  於是乎問題就來了——作為孕育巨大變革種子的AlphaGo,其背後到底又有個怎樣牛叉的團隊呢?
  • 深度學習之Google Deepmind的Alphago人工智慧算法技術演變歷程
    最近大家比較關心的圍棋人機大戰(Alphago vs 李世石)中,deep mind基於Nature2016文章的Alphago在5局制的比賽中已經取得了4-1的獲勝。這兩篇文章都是蒙特卡洛搜索樹+DCNN,效果Google的Alphago優於facebook的方法,剛好藉此機會將之前看到的deep mind該領域的文章捋了一下。
  • 不只是AlphaGo,谷歌DeepMind到底是何方神聖?
    我們無法否認AI時代的到來帶來了許多有益的發展。深度學習從非結構化數據中進行學習,以編譯分析報告或執行無人監督的任務。所有這些發展都為不同的公司提供了發揮作用和證明其價值的舞臺。正是這樣,像DeepMind這樣的公司才得以大展身手。沒錯,就是那個開發出戰勝柯潔李世石的AlphaGo的公司,比起下棋,它值得我們了解的還有很多。
  • Google DeepMind 團隊發布新算法,下一個被 AI 虐哭的是誰?
    賽後,DeepMInd 團隊宣布 AlphaGo 退役,但相關研究不會停止。在那之後,AlphaGo 團隊獨孤求敗,淡出江湖。此後, DeepMind 在蛋白質摺疊等方面也做出 AlphaFold 等令人矚目的成就。誰能想到,僅僅淡出了兩年,DeepMInd 團隊帶著 AlphaGo 的後輩——— MuZero 新重出江湖。MuZero 通過自我比賽以及和 AlphaZero 進行比賽,利用多項常規和殘局訓練,實現了算法的升級突破。
  • AlphaGo之後,DeepMind重磅推出AlphaFold:基因序列預測蛋白質結構
    「對於我們來說,這真的是一個關鍵時刻,」DeepMind 聯合創始人兼 CEO Demis Hassabis 表示,「這個項目就像燈塔,這是我們關於人和資源的首次重大投資,用於解決一個根本性的、現實世界的重要問題。」
  • 生物版AlphaGo發威!DeepMind抗疫:預測新冠病毒相關蛋白結構
    他們表示,這些蛋白質結構還尚未被專家研究,希望能夠對抗疫科研作出貢獻。「在共享的蛋白質資料庫中,我們的系統準確地為SARS-CoV-2刺突蛋白提供了預測實驗,這使我們相信,我們對其他蛋白質的模型預測可能是有用的。」DeepMind在博客文章中寫道。
  • Deepmind Nature論文揭示最強AlphaGo Zero
    AlphaGo「退役」了,但Deepmind在圍棋上的探索並沒有停止。今年5月的烏鎮大會的「人機對局」中,中國棋手、世界冠軍柯潔9段以0:3不敵AlphaGo。隨後Deepmind創始人Hassabis宣布,AlphaGo將永久退出競技舞臺,不再進行比賽。
  • Deepmind AMA:關於最強ALphaGo如何煉成的真心話,都在這裡了!
    AMA一般會約定一個時間,並提前若干天在Reddit上收集問題,回答者統一解答。本次Deepmind AMA的回答人是:深層次的增強學習是不穩定和容易遺忘的,自我對局也是不穩定和容易遺忘的,如果沒有一個好的基於模仿的初始化狀態和歷史檢查點,二者結合在一起應該是一個災難...但Zero從零開始,我沒有看到論文中有這部分的內容,你們是怎麼做到的呢?David Silver:在深層增強學習上,AlphaGo Zero與典型的無模式算法(如策略梯度或者Q學習)採用的是完全不同的算法。
  • DeepMind新GNN模型,將谷歌地圖預估到達準確率提升50%!
    你是不是也經歷過這樣的故事?計劃著和女友約會,按照地圖預計的實時路況做準備,可是卻往往不太準時……眼看著上班就要遲到,明明顯示會在10分鐘後到達的公交車,並沒有如期而至……如果您是拼車服務的司機,地圖還會獲取接送時間信息,並依據此來估計價格。
  • 谷歌DeepMind 的可微分神經計算機 DNC 怎麼樣?看 Facebook AI...
    史丹福大學心智、大腦和計算中心主任 Jay McClelland 稱,這項研究將成為人工智慧領域「有趣且重要的裡程碑」。那麼我們究竟該如何看待谷歌 Deepmind 團隊最新發布的可微分神經計算機 DNC 呢?果然,已經有人在知乎上提出這個問題。編者註:該知乎提問中「谷歌deeplearning團隊」實際上應該指的是「谷歌Deepmind團隊」。
  • DeepMind推出蛋白質結構預測算法,大勝人類傳統模型!
    因此,科學家們開始利用AI技術開發深度學習算法,在基因組學數據的基礎上對蛋白質結構進行預測。在此基礎上,AlphaFold誕生了。和以往方法不一樣的是,AlphaFold並未使用已經明確結構的蛋白質3D模型作為模板,而是從頭開始探索預測方法。
  • DeepMind開源AlphaFold,蛋白質預測模型登上《Nature》
    代碼:https://github.com/deepmind/deepmind-research/tree/master/alphafold_casp13模型:https://www.biorxiv.org/content/10.1101/846279v1.full.pdf根據DeepMind的介紹,在預測蛋白質結構的物理性質方面使用了兩種不同的方法來構建預測模型
  • 關於AlphaGo 論文的閱讀筆記
    2016 年 1 月 28 日,Deepmind 公司在 Nature 雜誌發表論文 Mastering the game of Go with deep neural networks and tree search,介紹了 AlphaGo 程序的細節。本文是對這篇論文的閱讀筆記,以及關於人工智慧和圍棋進一步的一些想法。
  • AlphaFold抗疫,DeepMind公布六種新冠病毒蛋白質結構預測結果
    說到算力,不少人提到,希望科技巨頭 DeepMind 也參與到這場行動中。不負眾望,DeepMind 其實早已開始行動,並於昨日公布了他們的最新成果。在昨天發表的博客文章中,DeepMind 表示,他們用 AlohaFold 生成了六種可能與新冠病毒有關的蛋白質結構預測結果,而且已經開放下載。這一結果可能對新冠病毒疫苗研發等工作起到推動作用。
  • 谷歌團隊發布AlphaGo Zero:柯潔稱人類太多餘了
    【中關村在線新聞資訊】10月19日消息,今天谷歌旗下人工智慧團隊DeepMind在今天對外發布了一款全新的AlphaGo程序。這款軟體名為AlphaGo Zero,與之前擊敗了李世石的AlphaGo Master進行對弈,勝率高達100%。