剛剛,阿爾法狗背後的那個男人,獲得了2019 ACM 計算獎

2020-11-24 鈦媒體APP

文 | 學術頭條

美國計算機學會(ACM)今天宣布,將 2019 年 ACM 計算獎授予 AlphaGo 研發團隊領導者 David Silver,以表彰他為計算機遊戲表現帶來的突破性進展。

與「計算機界的諾貝爾獎」圖靈獎不同,ACM 計算獎(ACM Prize in Computing)每年授予在計算機領域裡有突出貢獻的年輕學者。

Silver 目前任倫敦大學學院(UCL)教授、谷歌旗下人工智慧公司 DeepMind 首席科學家。作為深度強化學習領域的領軍人物,Silver 最主要的成就就是領導了 AlphaGo 研發團隊,在圍棋比賽中擊敗了世界冠軍柯潔和李世石。

Silver 巧妙地將深度學習、強化學習、傳統樹搜索算法和大規模計算的思想結合起來,開發出了 AlphaGo 算法。AlphaGo 被認為是人工智慧研究的裡程碑,並被《新科學家》雜誌列為過去十年的十大發現之一。

AlphaGo 也是第一個擊敗人類職業圍棋選手、第一個戰勝圍棋世界冠軍的人工智慧機器人。

2016 年 3 月,阿爾法圍棋與圍棋世界冠軍、職業九段棋手李世石進行圍棋人機大戰,以 4 比 1 的總比分獲勝;2016 年末 2017 年初,該程序在中國棋類網站上以「大師」(Master)為註冊帳號與中日韓數十位圍棋高手進行快棋對決,連續 60 局無一敗績;2017 年 5 月,在中國烏鎮圍棋峰會上,它與排名世界第一的世界圍棋冠軍柯潔對戰,以 3 比 0 的總比分獲勝。

2017 年 10 月 19 日,在國際學術期刊《自然》(Nature)上發表的一篇研究論文中,Silver 團隊報告新版程序 AlphaGo Zero:從空白狀態學起,在無任何人類輸入的條件下,它能夠迅速自學圍棋,並以 100:0 的戰績擊敗「前輩」。AlphaZero 在西洋棋、圍棋、圍棋等遊戲中都取得了超人的表現,展現了前所未有的遊戲方法的普遍性。

ACM 主席 Cherri M. Pancake 表示:「在人工智慧領域,很少有其他研究人員能像 David Silver 一樣讓人如此興奮。」

Infosys 營運長 Pravin Rao 表示:「 David Silver 為深度強化學習做出了基礎性貢獻,從而迅速促進了人工智慧的發展。當電腦能夠在複雜的棋盤遊戲中擊敗世界冠軍時,它已經激發了公眾的想像力,並將年輕的研究人員吸引到機器學習等領域。重要的是,Silver 和他的同事開發的框架將在未來的許多年裡,為人工智慧的商業和工業實際應用提供貢獻。」

ACM 計算獎旨在表彰研究成果產生了深遠影響和廣泛意義的中青年計算機科學家,獎金為 25 萬美元,由印度科技公司印孚瑟斯(Infosys Ltd)捐贈。頒獎儀式將於 2020 年 6 月 20 日在美國舊金山舉行,屆時 Silver 將正式接受獎項。

人工智慧玩遊戲

自上世紀 50 年代以來,教電腦程式與人類或其他計算機進行遊戲比賽,一直是人工智慧研究的核心實踐項目。人類與機器之間的比賽,也一直是衡量人工智慧的標尺。

電腦程式通過做出一系列決定,來達到獲勝的目標,這個過程被看作是對人類思維的模擬和挑戰。遊戲比賽也給研究人員提供了很容易量化的結果,比如「電腦遵守規則了嗎?得分了嗎?或者贏了遊戲嗎?」

在這一領域的早期,研究人員開發了一些程序來與人類在跳棋上競爭,而在過去的幾十年裡,又出現了越來越複雜的西洋棋程序。

1997 年,ACM 贊助了一場比賽,IBM 的「深藍」(DeepBlue)成為第一臺擊敗西洋棋世界冠軍加裡·卡斯帕羅夫(Gary Kasparov)的電腦程式,這也是一個具有分水嶺意義的時刻。

但對於研究人員來說,目標不僅僅是開發贏得遊戲的程序,而是將遊戲作為開發具有模擬人類智能能力的機器的試金石。

2016 年 3 月,全世界數百萬人在電視上觀看了 AlphaGo 擊敗圍棋世界冠軍李世石(Lee Sedol)的比賽。但這僅僅是 David Silver 團隊驚人成就影響的開始。他對深度強化學習的見解已經被應用於很多領域,比如提高英國電網的效率,降低谷歌數據中心的能耗,以及為歐洲航天局設計太空探測器的軌道。」Cherri M. Pancake說道。

Silver 是深度強化學習的最重要的貢獻者之一,在深度強化學習這種工具中,算法通過在交互式環境中反覆試驗來學習,根據運行過程中積累的信息不斷調整,並利用不同數學處理層次的計算模型——人工神經網絡與強化學習策略有效地結合起來,對試錯結果進行評估。

該算法不需要對每一個可能的結果進行計算,而是進行預測,從而更有效地執行給定的任務。

阿爾法狗

2500 年前,中國發明了圍棋遊戲,至今仍然流行,尤其是在亞洲。圍棋被認為比象棋要複雜得多,因為棋手可以做出更多潛在的動作,而且遊戲可以有更多的方式進行。

Silver 在艾伯塔大學(University of Alberta)攻讀博士學位時,就開始探索開發一種可以掌握圍棋的電腦程式的可能性。

Silver 開發 AlphaGo 的關鍵見解,是將深層神經網絡與計算機遊戲中使用的算法 Monte Carlo 樹搜索相結合。Monte Carlo 樹搜索的一個優點是,在追求遊戲中最佳感知策略的同時,該算法還在不斷研究其他替代方案。

2016 年 3 月,AlphaGo 擊敗世界圍棋冠軍李世石被譽為AI裡程碑式的時刻。Silver 和他的同事在 2016 年發表在《自然》雜誌上的論文《用深層神經網絡和樹搜索掌握圍棋遊戲》中發表了支撐 AlphaGo 的基礎技術。

AlphaGo Zero、AlphaZero和AlphaStarSilver 和他在 DeepMind 的團隊一直在開發新的算法,這些算法極大地提高了計算機遊戲的發展水平,並取得了許多被認為人工智慧系統無法實現的結果。

在開發 AlphaGo Zero 算法時,Silver 和他的合作者證明了程序可以在不接觸人類專家遊戲的情況下掌握圍棋。該算法完全通過在沒有任何人類數據或先驗知識的情況下自己來學習,而在進一步的迭代版本中,算法甚至不需要知道規則。

後來,DeepMind 團隊的 AlphaZero 在西洋棋、將棋和圍棋中也獲得了超人的表現。在西洋棋中,AlphaZero 輕鬆擊敗了世界計算機西洋棋冠軍 Stockfish ,這是一個由大師和西洋棋編程專家設計的高性能程序。就在去年,由 Silver 領導的 DeepMind 團隊開發的 AlphaStar ,掌握了多人電子競技遊戲《星際爭霸 II》,該遊戲被視為 AI 學習系統面臨的一項艱巨挑戰。

關於 David SilverDavid Silver 是 DeepMind 強化學習研究小組的負責人,也是倫敦大學學院的計算機科學教授。他所在的 Google 子公司 DeepMind 試圖將機器學習和系統神經科學方面的最佳技術結合起來,以構建功強大的通用學習算法。

Silver 分別於 1997 年和 2000 年獲得劍橋大學的學士和碩士學位。1998 年,他和別人共同創立了視頻遊戲公司 Elixir Studios,並在那裡擔任首席技術官兼首席程式設計師。後來 Silver 返回學術界,並於 2009 年獲得了艾伯塔大學的計算機科學博士學位。

2015 年,Silver 和他的同事發表的一篇題為《通過深度強化學習實現人類水平控制》(Human Level Control Through Deep reinforcement learning)的開創性論文中,描述了他們將強化學習與人工神經網絡相結合的方法。該論文發表在《自然》(Nature)雜誌上,被引用了近1萬次,對該領域產生了巨大的影響。

隨後,Silver 和他的同事繼續用新的技術完善這些深度強化學習算法,這些算法仍然是機器學習中最廣泛使用的工具之一。

Silver 的眾多榮譽包括:馬文·明克西人工智慧傑出成就獎(2018年)、皇家工程院對英國工程傑出貢獻銀獎(2017年)、門薩基金會人工智慧領域最佳科學發現獎(2017年)。

關於 ACM 計算獎ACM 計算獎旨在表彰研究成果產生了深遠影響和廣泛意義的中青年計算機科學家。該獎項的獎金為 25 萬美元,資金支持由 Infosys Ltd.提供。ACM 計算獎以前被稱為 ACM Infosys 基金會計算科學獎。ACM 獎獲得者將被邀請參加海德堡桂冠論壇,這是一個年度網絡活動,匯集了來自世界各地的年輕研究人員和 ACM 圖靈獎、阿貝爾獎、菲爾茲獎和奈凡林納獎的獲得者。

關於 ACM計算機科學協會(ACM)是世界上最大的教育和科學計算機學會,它將計算機教育工作者、研究人員和專業人士聯合起來,以激發對話、共享資源並應對該領域的挑戰。ACM 通過強大的領導力、最高標準的推廣以及對技術卓越的認可,增強了計算機行業的集體聲音。ACM 通過提供終身學習、職業發展和專業網絡的機會來支持其成員的專業成長。

參考資料:https://www.acm.org/media-center/2020/april/acm-prize-2019

相關焦點

  • 剛剛,那個打敗柯潔、李世石的阿爾法狗背後的男人,獲得2019 ACM...
    美國計算機學會(ACM)今天宣布,將 2019 年 ACM 計算獎授予 AlphaGo 研發團隊領導者 David Silver,以表彰他為計算機遊戲表現帶來的突破性進展。與「計算機界的諾貝爾獎」圖靈獎不同,ACM 計算獎(ACM Prize in Computing)每年授予在計算機領域裡有突出貢獻的年輕學者。
  • 那個AlphaGo背後的男人,獲得2019 ACM計算獎
    美國計算機學會今天宣布,將 2019 年 ACM 計算獎授予 AlphaGo 研發團隊領導者 David Silver,以表彰他為計算機遊戲表現帶來的突破性進展。與「計算機界的諾貝爾獎」圖靈獎不同,ACM 計算獎每年授予在計算機領域裡有突出貢獻的年輕學者。Silver 目前任倫敦大學學院教授、谷歌旗下人工智慧公司 DeepMind 首席科學家。作為深度強化學習領域的領軍人物,Silver 最主要的成就就是領導了 AlphaGo 研發團隊,在圍棋比賽中擊敗了世界冠軍柯潔和李世石。
  • 「AlphaGo之父」獲最新一屆ACM計算獎
    近日,2019 年 ACM 計算獎頒出,由於在計算機遊戲領域取得突破性進展,「AlphaGo 之父」、DeepMind 首席科學家、倫敦大學學院教授 David Silver 獲得最新一屆的 ACM 計算獎。
  • ACM MM 2020大獎項出爐!南開獲最佳論文獎,西安交大獲最佳學生論文獎
    作者 | 陳大鑫剛剛!第28屆ACM國際多媒體會議(ACM MM)最佳論文獎、最佳學生論文獎、最佳demo獎、 最佳開源軟體獎在內的所有多媒體領域大獎都已出爐。其中最佳論文的一作是來自南開大學Hongru Liang,最佳學生論文的一作是來自西安交大的Wenbo Zheng。
  • ACM 公布軟體系統獎、卡內拉克斯理論與實踐獎、艾倫...
    頭圖 | ACM 官網2020年5月20日,計算機協會(Association for Computing Machinery)宣布了三項著名技術獎的獲得者。這些獲獎者由同行選出,旨在表彰他們為計算機技術創新所做出的貢獻。
  • 2019 ACM博士論文獎公布,MIT學霸吳佳俊獲榮譽提名
    今日,2019 ACM 最佳博士論文獎公布,畢業於特拉維夫大學的 Dor Minzer 獲得該獎項。此外,來自微軟的 Jakub Tarnawski 和出身清華姚班的吳佳俊獲得榮譽提名獎。他的主要研究方向是計算複雜性理論、PCP 和布爾函數分析。
  • 首屆AAAI/ACM SIGAI博士論文獎公布,姚班學霸吳佳俊獲獎
    麻省理工學院博士吳佳俊獲得了2019年AAAI / ACM SIGAI博士論文獎。另外還有兩位博士獲得了runners-Up獎項,分別是畢業於喬治亞理工學院的Aishwarya Agrawal和畢業於愛丁堡大學的董力。
  • 比不過阿爾法狗, 為什麼還要學圍棋?
    日期:2019-04-03 【 來源 : 新民周刊 】 閱讀數:0
  • 2019高德納獎、哥德爾獎公布!阿里達摩院、以色列科學家獲獎
    新智元報導 來源:acm.org編輯:肖琴【新智元導讀】今天,ACM官方公布了2019年高德納獎和哥德爾獎的得主,分別表彰Avi Wigderson對計算隨機性的革命性理解和Irit Dinur對PCP定理的基礎性工作。
  • 葛紅兵|從深藍到阿爾法狗,從暴力計算到仿生智慧
    阿爾法狗的出現,讓筆者也產生類似的擔憂。到筆者開始動筆寫作本文的時候,阿爾法狗已經連贏李世石兩局,而筆者寫作本文的當口,又傳來阿爾法狗贏了第三局。這還不是問題的關鍵,問題的關鍵是,阿爾法狗贏了兩局之後,微博上,關心此事的,幾乎都一邊倒地預測,阿爾法狗會繼續贏下去,人們幾乎是一致性地喪失了對李世石的信心,幾乎是全部認定機器腦將戰勝人腦!
  • 最新 ACM Fellows名單,7位圖靈獎得主上榜,13位華人入圍
    ACM 主席 Gabriele Kotsis 解釋說:「今年,我們挑選 2020 年 Fellows 獲得者的任務有點更具挑戰性,因為我們從世界各地獲得的提名數量創了記錄。2020 年的 ACM Fellows 在許多計算學科中表現卓越。這些人對改變整個行業和我們個人生活的技術做出了關鍵的貢獻。我們完全期待這些新的 ACM Fellows 將繼續在各自領域保持領先地位。」
  • 紀錄片《阿爾法狗》解讀科技背後的人性光芒
    再過幾天,「阿爾法狗」就要與李世石對戰,缺陷已經來不及修復。4月21日,在翠貝卡電影節(Tribeca Film Festival)上,紀錄片《阿爾法狗》(Alpha Go)首次上映,這是翠貝卡電影節上16部全球首映的紀錄長片之一。在《阿爾法狗》裡,人們將看到李世石與「阿爾法狗」之戰的戲劇性內幕,也將體驗到,被人工智慧所替代的感覺到底是怎樣。
  • 北大圖靈班本科生吳克文獲STOC 2020最佳論文獎
    機器之心報導參與:澤南今天,北京大學前沿計算研究中心官方公眾號報導稱,在全球計算機理論頂會 STOC 2020 上,北大本科生吳克文有兩篇論文發表,其中一篇獲得了最佳論文獎。根據北京大學前沿計算研究中心官方公眾號的報導,6 月 25 日,ACM 計算理論年會 STOC 2020 上傳來一條好消息:北京大學信息科學技術學院 16 級圖靈班學生吳克文參與的論文《Improved bounds for the sunflower lemma》榮獲會議最佳論文獎。
  • 葉傑平入選、華人佔4成,2020年ACM傑出科學家榜單出爐
    >7項國際會議及期刊最佳論文獎。此外,崔博士的研究還獲得了獲得國家自然科學二等獎、教育部自然科學一等獎、北京市科技進步一等獎、中國電子學會自然科學一等獎等諸多獎項。2018年,獲得「CCF-IEEE CS青年科學家獎」,以表彰他在網絡表徵學習、社會感知的多媒體計算框架和模型等方面所做出的突出貢獻。
  • 葉傑平入選、華人佔4成,2020年ACM傑出科學家榜單出爐
    目前,在數據挖掘和領域頂會和期刊上發表了論文100多篇,並先後獲得7項國際會議及期刊最佳論文獎。此外,崔博士的研究還獲得了獲得國家自然科學二等獎、教育部自然科學一等獎、北京市科技進步一等獎、中國電子學會自然科學一等獎等諸多獎項。2015年,他獲得ACM中國新星獎。
  • 科學網—一隻「阿爾法狗」的科技徵途
    近日,美國計算機學會(ACM)宣布,將2019年ACM計算獎授予AlphaGo研發團隊領導者David Silver,以表彰他為計算機遊戲表現帶來的突破性進展。 「在專用人工智慧向通用人工智慧發展過程中,AlphaGo是一個重要階段。」北京大學教授、北京智源人工智慧研究院院長黃鐵軍告訴《中國科學報》。
  • 7篇必讀ACM MM 2019論文:圖神經網絡+多媒體
    已於2019年10月21日至25日在法國尼斯舉行。圖神經網絡在多媒體領域應用非常多,本文整理了七篇ACM MM 2019最新GNN相關論文,並附上論文連結供參考——個性化推薦、短視頻推薦、多視頻摘要、基於文本的行人搜索、視頻關係檢測、社區問答(CQA)系統等。來新智元 AI 朋友圈和AI大咖們一起討論吧。
  • 7位圖靈獎得主當選,新晉多位華人,2020 ACM Fellow公布
    他還是 IEEE Fellow(2013)以及 IEEE CEDA President-elect (2018-2019),並將成為 CEDA President (2020-2021)。他累計發表近 300 篇高水平同行評審論文,獲得了 8 個國際會議和學術期刊的最佳論文,包括 ACM Multimedia 2017 最佳論文以及 IEEE Transactions on Multimedia 2020 最佳論文獎等。
  • ACM宣布深度學習三巨頭共同獲得圖靈獎
    【網易智能訊3月28日消息】昨日晚間,ACM(國際計算機學會)宣布,有「深度學習三巨頭」之稱的Yoshua Bengio、Yann LeCun、Geoffrey Hinton共同獲得了2018年的圖靈獎,這是圖靈獎1966年建立以來少有的一年頒獎給三位獲獎者。
  • 李世石退役,真的是因為走不出輸給阿爾法狗的陰影?
    在剛剛過去的11月,圍棋界發生了一件大事,前世界冠軍、韓國棋手李世石宣布結束24年職業生涯正式退役。 這個決定讓無數人感到驚訝,畢竟李世石今年才36歲,還在當打之年。而李世石本人對韓國媒體解釋,自己選擇退役,是因為AI(人工智慧)不可戰勝。