剛剛,那個打敗柯潔、李世石的阿爾法狗背後的男人,獲得2019 ACM...

2020-12-03 36氪

編者按:本文來自微信公眾號「學術頭條」(ID:SciTouTiao),作者:學術君,36氪經授權發布。

美國計算機學會(ACM)今天宣布,將 2019 年 ACM 計算獎授予 AlphaGo 研發團隊領導者 David Silver,以表彰他為計算機遊戲表現帶來的突破性進展。

與「計算機界的諾貝爾獎」圖靈獎不同,ACM 計算獎(ACM Prize in Computing)每年授予在計算機領域裡有突出貢獻的年輕學者。

Silver 目前任倫敦大學學院(UCL)教授、谷歌旗下人工智慧公司 DeepMind 首席科學家。作為深度強化學習領域的領軍人物,Silver 最主要的成就就是領導了 AlphaGo 研發團隊,在圍棋比賽中擊敗了世界冠軍柯潔和李世石。

Silver 巧妙地將深度學習、強化學習、傳統樹搜索算法和大規模計算的思想結合起來,開發出了 AlphaGo 算法。AlphaGo 被認為是人工智慧研究的裡程碑,並被《新科學家》雜誌列為過去十年的十大發現之一。AlphaGo 也是第一個擊敗人類職業圍棋選手、第一個戰勝圍棋世界冠軍的人工智慧機器人。

2016 年 3 月,阿爾法圍棋與圍棋世界冠軍、職業九段棋手李世石進行圍棋人機大戰,以 4 比 1 的總比分獲勝;2016 年末 2017年初,該程序在中國棋類網站上以「大師」(Master)為註冊帳號與中日韓數十位圍棋高手進行快棋對決,連續 60 局無一敗績;2017 年 5 月,在中國烏鎮圍棋峰會上,它與排名世界第一的世界圍棋冠軍柯潔對戰,以 3 比 0 的總比分獲勝。

2017 年 10 月 19 日,在國際學術期刊《自然》(Nature)上發表的一篇研究論文中,Silver 團隊報告新版程序 AlphaGo Zero:從空白狀態學起,在無任何人類輸入的條件下,它能夠迅速自學圍棋,並以 100:0 的戰績擊敗「前輩」。AlphaZero 在西洋棋、圍棋、圍棋等遊戲中都取得了超人的表現,展現了前所未有的遊戲方法的普遍性。

ACM 主席 Cherri M. Pancake 表示:「在人工智慧領域,很少有其他研究人員能像 David Silver 一樣讓人如此興奮。」Infosys 營運長 Pravin Rao 表示:「 David Silver 為深度強化學習做出了基礎性貢獻,從而迅速促進了人工智慧的發展。當電腦能夠在複雜的棋盤遊戲中擊敗世界冠軍時,它已經激發了公眾的想像力,並將年輕的研究人員吸引到機器學習等領域。

重要的是,Silver 和他的同事開發的框架將在未來的許多年裡,為人工智慧的商業和工業實際應用提供貢獻。」ACM 計算獎旨在表彰研究成果產生了深遠影響和廣泛意義的中青年計算機科學家,獎金為 25 萬美元,由印度科技公司印孚瑟斯(Infosys Ltd)捐贈。頒獎儀式將於 2020 年 6 月 20 日在美國舊金山舉行,屆時 Silver 將正式接受獎項。

人工智慧玩遊戲

自上世紀 50 年代以來,教電腦程式與人類或其他計算機進行遊戲比賽,一直是人工智慧研究的核心實踐項目。人類與機器之間的比賽,也一直是衡量人工智慧的標尺。電腦程式通過做出一系列決定,來達到獲勝的目標,這個過程被看作是對人類思維的模擬和挑戰。遊戲比賽也給研究人員提供了很容易量化的結果,比如「電腦遵守規則了嗎?得分了嗎?或者贏了遊戲嗎?」

在這一領域的早期,研究人員開發了一些程序來與人類在跳棋上競爭,而在過去的幾十年裡,又出現了越來越複雜的西洋棋程序。1997 年,ACM 贊助了一場比賽,IBM 的「深藍」(DeepBlue)成為第一臺擊敗西洋棋世界冠軍加裡·卡斯帕羅夫(Gary Kasparov)的電腦程式,這也是一個具有分水嶺意義的時刻。

但對於研究人員來說,目標不僅僅是開發贏得遊戲的程序,而是將遊戲作為開發具有模擬人類智能能力的機器的試金石。2016 年 3 月,全世界數百萬人在電視上觀看了 AlphaGo 擊敗圍棋世界冠軍李世石(Lee Sedol)的比賽。但這僅僅是 David Silver 團隊驚人成就影響的開始。他對深度強化學習的見解已經被應用於很多領域,比如提高英國電網的效率,降低谷歌數據中心的能耗,以及為歐洲航天局設計太空探測器的軌道。」Cherri M. Pancake說道。

Silver 是深度強化學習的最重要的貢獻者之一,在深度強化學習這種工具中,算法通過在交互式環境中反覆試驗來學習,根據運行過程中積累的信息不斷調整,並利用不同數學處理層次的計算模型——人工神經網絡與強化學習策略有效地結合起來,對試錯結果進行評估。該算法不需要對每一個可能的結果進行計算,而是進行預測,從而更有效地執行給定的任務。

阿爾法狗

2500 年前,中國發明了圍棋遊戲,至今仍然流行,尤其是在亞洲。圍棋被認為比象棋要複雜得多,因為棋手可以做出更多潛在的動作,而且遊戲可以有更多的方式進行。Silver 在艾伯塔大學(University of Alberta)攻讀博士學位時,就開始探索開發一種可以掌握圍棋的電腦程式的可能性。Silver 開發 AlphaGo 的關鍵見解,是將深層神經網絡與計算機遊戲中使用的算法 Monte Carlo 樹搜索相結合。

Monte Carlo 樹搜索的一個優點是,在追求遊戲中最佳感知策略的同時,該算法還在不斷研究其他替代方案。2016 年 3 月,AlphaGo 擊敗世界圍棋冠軍李世石被譽為AI裡程碑式的時刻。Silver 和他的同事在 2016 年發表在《自然》雜誌上的論文《用深層神經網絡和樹搜索掌握圍棋遊戲》中發表了支撐 AlphaGo 的基礎技術。

AlphaGo Zero、AlphaZero和AlphaStar

Silver 和他在 DeepMind 的團隊一直在開發新的算法,這些算法極大地提高了計算機遊戲的發展水平,並取得了許多被認為人工智慧系統無法實現的結果。在開發 AlphaGo Zero 算法時,Silver 和他的合作者證明了程序可以在不接觸人類專家遊戲的情況下掌握圍棋。該算法完全通過在沒有任何人類數據或先驗知識的情況下自己來學習,而在進一步的迭代版本中,算法甚至不需要知道規則。

後來,DeepMind 團隊的 AlphaZero 在西洋棋、將棋和圍棋中也獲得了超人的表現。在西洋棋中,AlphaZero 輕鬆擊敗了世界計算機西洋棋冠軍 Stockfish ,這是一個由大師和西洋棋編程專家設計的高性能程序。就在去年,由 Silver 領導的 DeepMind 團隊開發的 AlphaStar ,掌握了多人電子競技遊戲《星際爭霸 II》,該遊戲被視為 AI 學習系統面臨的一項艱巨挑戰。

關於 David Silver

David Silver 是 DeepMind 強化學習研究小組的負責人,也是倫敦大學學院的計算機科學教授。他所在的 Google 子公司 DeepMind 試圖將機器學習和系統神經科學方面的最佳技術結合起來,以構建功強大的通用學習算法。

Silver 分別於 1997 年和 2000 年獲得劍橋大學的學士和碩士學位。1998 年,他和別人共同創立了視頻遊戲公司 Elixir Studios,並在那裡擔任首席技術官兼首席程式設計師。後來 Silver 返回學術界,並於 2009 年獲得了艾伯塔大學的計算機科學博士學位。

2015 年,Silver 和他的同事發表的一篇題為《通過深度強化學習實現人類水平控制》(Human Level Control Through Deep reinforcement learning)的開創性論文中,描述了他們將強化學習與人工神經網絡相結合的方法。該論文發表在《自然》(Nature)雜誌上,被引用了近1萬次,對該領域產生了巨大的影響。

隨後,Silver 和他的同事繼續用新的技術完善這些深度強化學習算法,這些算法仍然是機器學習中最廣泛使用的工具之一。Silver 的眾多榮譽包括:馬文·明克西人工智慧傑出成就獎(2018年)、皇家工程院對英國工程傑出貢獻銀獎(2017年)、門薩基金會人工智慧領域最佳科學發現獎(2017年)。

關於 ACM 計算獎

ACM 計算獎旨在表彰研究成果產生了深遠影響和廣泛意義的中青年計算機科學家。該獎項的獎金為 25 萬美元,資金支持由 Infosys Ltd.提供。ACM 計算獎以前被稱為 ACM Infosys 基金會計算科學獎。ACM 獎獲得者將被邀請參加海德堡桂冠論壇,這是一個年度網絡活動,匯集了來自世界各地的年輕研究人員和 ACM 圖靈獎、阿貝爾獎、菲爾茲獎和奈凡林納獎的獲得者。

關於 ACM

計算機科學協會(ACM)是世界上最大的教育和科學計算機學會,它將計算機教育工作者、研究人員和專業人士聯合起來,以激發對話、共享資源並應對該領域的挑戰。ACM 通過強大的領導力、最高標準的推廣以及對技術卓越的認可,增強了計算機行業的集體聲音。ACM 通過提供終身學習、職業發展和專業網絡的機會來支持其成員的專業成長。

參考資料:https://www.acm.org/media-center/2020/april/acm-prize-2019

相關焦點

  • 剛剛,阿爾法狗背後的那個男人,獲得了2019 ACM 計算獎
    作為深度強化學習領域的領軍人物,Silver 最主要的成就就是領導了 AlphaGo 研發團隊,在圍棋比賽中擊敗了世界冠軍柯潔和李世石。Silver 巧妙地將深度學習、強化學習、傳統樹搜索算法和大規模計算的思想結合起來,開發出了 AlphaGo 算法。
  • 韓媒吐槽柯潔說大話遭阿爾法狗打臉,稱讚李世石為人類贏唯一一局
    而最近人工智慧的代表阿爾法狗就代表人工智慧的大哥大接受了世界第一的圍棋大師柯潔的挑戰。但是,意料之中的是,柯潔並沒有能為人類贏得一局,阿爾法狗的圍棋水平依然是最強的,或者說,人工智慧的計算量根本不是人類能夠匹敵的。在去年的時候,韓國圍棋選手李世石也挑戰了阿爾法狗,當時的阿爾法狗剛剛問世,李世石竟然艱難贏了一局。
  • 李世石退役,真的是因為走不出輸給阿爾法狗的陰影?
    在剛剛過去的11月,圍棋界發生了一件大事,前世界冠軍、韓國棋手李世石宣布結束24年職業生涯正式退役。 這個決定讓無數人感到驚訝,畢竟李世石今年才36歲,還在當打之年。而李世石本人對韓國媒體解釋,自己選擇退役,是因為AI(人工智慧)不可戰勝。
  • 前世界冠軍棋手李世石退役,是因為走不出輸給阿爾法狗的陰影?
    摘要:李世石是唯一贏過AlphaGo的人類棋手。 天下網商記者 張超在剛剛過去的11月,圍棋界發生了一件大事,前世界冠軍、韓國棋手李世石宣布結束24年職業生涯正式退役。
  • 中韓兩國圍棋天才均被「阿爾法狗」打敗,人工智慧獲勝
    「阿爾法狗」,人工智慧的代表「阿爾法狗」其實是AlphaGo的直譯,它是一款由谷歌子公司所研發的一款人工智慧程序。它的出現打破了圍棋比賽結果,它不僅打敗了眾多的職業圍棋手,更是將圍棋界的天才柯潔給打敗了。這款人工智慧程序融入了先進的科學技術,為的就是能夠更深度地去學習。據此前的報導顯示,「阿爾法狗」早在去年的時候,便和韓國最頂級的職業圍棋選手李世石進行過一番比試。
  • 那個AlphaGo背後的男人,獲得2019 ACM計算獎
    美國計算機學會今天宣布,將 2019 年 ACM 計算獎授予 AlphaGo 研發團隊領導者 David Silver,以表彰他為計算機遊戲表現帶來的突破性進展。作為深度強化學習領域的領軍人物,Silver 最主要的成就就是領導了 AlphaGo 研發團隊,在圍棋比賽中擊敗了世界冠軍柯潔和李世石。
  • 柯潔阿爾法狗和李世石 他們的恩怨已經延續幾十年了
    但是當年可能由於網絡沒有現在這麼發達,這件事情好像了解的人不多,至少沒有今天李世石、阿爾法狗和柯潔有這麼多人了解。其實在棋迷圈,當時這件事情已經是一片譁然,世界第一先贏了AI,又在AI升級後,輸給了AI,不過當時人們也沒想那麼多AI以後會怎麼樣的事。
  • 柯潔暗藏絕招應對「阿爾法狗」
    柯潔暗藏絕招應對「阿爾法狗」 柯潔在發布會上。上一次,「阿爾法狗」擊敗了韓國名將李世石;這一次,頂尖棋手柯潔能否為人類挽回一城呢?人機大戰第二季敲定  去年3月,李世石和「阿爾法狗」的人機大戰震動全球,而李世石最終告負使人們意識到,不斷迭代的人工智慧程序,已經開始強勢挑戰人類引以為豪的智力遊戲了。
  • 阿爾法狗就算完虐柯潔,它也只是工具丨鳳凰評論
    這套成功的圍棋程序自一年半前戰勝歐洲冠軍樊麾,一年前戰勝韓國最強棋手李世石,到現在戰勝柯潔,證明了阿爾法狗確實是史上最為成功的圍棋程序。僅此而已。想起去年3月份阿爾法狗與李世石對弈,柯潔曾經年少輕狂地誇下海口,「就算阿法狗戰勝了李世石,但它贏不了我」。
  • 阿爾法狗圍棋世界登頂 柯潔與阿爾法終將一戰
    阿爾法狗圍棋世界登頂,柯潔與阿爾法終將一戰。AlphaGo在中國被戲稱為阿爾法狗,在前些年擊敗了韓國名手李世石成為世界第二大圍棋高手,並且今年6月終於與柯潔進行約戰!雖然上不明確確切的缺戰時間,但是應為最近柯潔敗局連連,在分數上已經超越柯潔成為世界第一!
  • 柯潔對戰阿爾法狗什麼時候?柯潔vsAlphaGo圍棋比賽日期時間
    柯潔對戰阿爾法狗時間什麼時候?相信很多棋友對於這場經常對弈很期待,下文帶來阿爾法狗vs柯潔日期介紹,一起和小編來了解下吧!  柯潔 vs AlphaGo圍棋比賽日期時間介紹:  這場被認為是「人類頂尖棋手與人工智慧程序的終極對抗」,讓人們期待了足足一年有餘。
  • 柯潔:人生看法都因阿爾法狗巨變
    新華社浙江烏鎮電 當今世界圍棋第一人柯潔九段昨日下午在一場波瀾壯闊的亂戰之中因為誤算「突然死亡」,在終極圍棋「人機大戰」三番棋中以0 2落後於計算機圍棋程序阿爾法狗
  • 柯潔5月對戰阿爾法狗,誰將棋開得勝?
    戰火重燃,人機大戰一觸即發 2016年3月,阿爾法狗對戰圍棋世界冠軍、職業九段選手李世石,並以4:1的總比分獲勝,讓阿爾法狗的排名躍居世界第二,僅次於中國棋手柯潔。 隨後,阿爾法狗在臉書上向柯潔下了戰書。DEEPMIND研發工程師拉裡亞·哈德塞爾在社交軟體臉書上表示:「柯潔,準備好了嗎?」
  • 圍棋人機大戰第二季4月烏鎮開打,中國柯潔將挑戰阿爾法狗
    圍棋人機大戰第二季4月烏鎮開打,中國柯潔將挑戰阿爾法狗 自去年李世石挑戰阿爾法狗失敗後,人類一直期待當今圍棋第一人柯潔與阿爾法狗進行一場終極較量。
  • 柯潔vs阿爾法狗結果:2017alphago對陣柯潔誰贏了(最新)
    柯潔vs阿爾法狗結果:2017alphago對陣柯潔誰贏了(最新)  4月10日報導,Google在中國棋院召開發布會,宣布5月23日-27日在烏鎮主辦「中國烏鎮·圍棋峰會」,去年戰勝韓國職業棋手李世石的圍棋人工智慧AlphaGo將挑戰目前世界排名第一的柯潔九段。
  • 棋士柯潔對戰阿爾法狗敗局已定 – So What?
    至此,柯潔前兩盤皆敗,三盤制賽制下敗局已定。「不像是個人,像是一個神」。柯潔在第一場比賽後這樣形容如今比於李世石比賽時更加厲害的升級版AlphaGo。而阿爾法狗的神話沒有被打破,第二場比賽在下午2時之前就提前結束,柯潔盤中認輸,Alphago贏得第二局比賽,也奠定了本次大賽棋士柯潔的敗局。但是,在圍棋上全勝讓人類的人工智慧,確實已經強大到威脅人類了嗎?
  • 柯潔對戰阿爾法狗首場1/4子告負 稱「阿爾法狗越來越像圍棋上帝」
    在剛剛結束的柯潔對戰阿爾法狗(Alphago)比賽中,柯潔以1/4子負於對方,在雙方的三番棋大戰中暫時0-1落後。按照中國圍棋規則,1/4子已經是最小的差距。另外在賽後的採訪中,柯潔認為,Alphago已經接近圍棋上帝。
  • 絕代雙驕,阿爾法狗幫助申真諝達到3800分,柯潔呢?
    意味著他已經超過了當年擊敗李世石的阿爾法狗,「阿爾法狗李」。眾所周知,阿爾法狗是歌(Google)旗下DeepMind公司戴密斯·哈薩比斯領銜的團隊開發的。DeepMind公司認為,擊敗歐洲圍棋冠軍、樊麾二段的阿爾法狗是3144分;擊敗李世石的阿爾法狗李是3739分。3800分,意味著申真諝九段超越了這兩個版本的阿爾法狗?但是,AI的發展真可謂日新月異。
  • 騰訊AI絕藝讓二子打敗柯潔,AI已經無人能擋了嗎?
    2017年5月23日到27日,柯潔與圍棋AI阿爾法狗(AlphaGo)爆發人機大戰,結果人類完敗,AI首先在圍棋界打敗了人類,李世石在2016年3月勝了阿爾法狗一場或許將成為人類戰勝AI的最後一場。 由於最近AI市場的火爆,各大公司紛紛加入AI市場競爭,谷歌、百度、騰訊等公司紛紛進軍AI市場 。
  • 李世石被阿爾法狗擊敗後首次敗給人類
    [摘要]在「人機大戰」輸給「阿爾法狗」之後,李世石一度取得了九連勝,棋力和境界似乎超越了同類。但是,面對古力,李世石最終著陸,兩人也終於在勝率榜上回到了同一起跑線。當然,也有種關係叫「亦敵亦友」,比如古力和李世石,旗鼓相當的兩人頗有幾分惺惺相惜的味道。昨天,第21屆LG杯32強戰,古九段和李九段早早相遇。在此之前,古力與李世石的交鋒紀錄為23勝24負,外加1場沒能分出勝負。賽前抽籤,古力抽到23號,李世石抽到24號,這樣的巧合連老天都快感動得流淚了!古李去年十番棋後,輸掉比賽的古力知恥而後勇,在圍甲賽場雙殺李世石。