「AlphaGo之父」獲最新一屆ACM計算獎

2020-12-05 騰訊網

近日,2019 年 ACM 計算獎頒出,由於在計算機遊戲領域取得突破性進展,「AlphaGo 之父」、DeepMind 首席科學家、倫敦大學學院教授 David Silver 獲得最新一屆的 ACM 計算獎

David Silver 是深度學習領域的先驅人物,他在人工智慧領域的一系列成績中,又以帶領打造了 AlphaGo 最為人所知:David Silver 通過巧妙地結合深度學習、強化學習、蒙特卡洛搜索樹和大規模計算的思想,開發了 AlphaGo 算法,AlphaGo 戰勝了頂尖的人類棋手,更是被公為人工智慧(AI)研究的一個裡程碑。

(來源:ACM)

根據 ACM 官方報導,最初,AlphaGo 會經過來自人類專業棋手經驗的小範圍訓練,然後,它會通過強化學習來不斷改善性能。AlphaGo 之後, David Silver 和他的團隊創造了更新穎的方法,來實現更高的性能和通用性,AlphaZero 就此誕生。與 AlphaGo 不同,AlphaZero 完全通過與自己玩遊戲來進行學習,不需要任何人類數據或先驗知識(遊戲規則除外)。而且,AlphaZero 同時在西洋棋、將棋和圍棋遊戲中有超過人類的表現,證明了其 AI 算法的通用性。

早在 David Silver 於艾伯塔大學(University of Alberta)攻讀博士學位時,他就開始探索開發一種可以掌握圍棋智慧的電腦程式,這也成為了他後續一直在專注的研究興趣。在 2013 年的 NeurIPS 會議上,Silver 展示了一種算法,它可以在雅達利遊戲中展現達到人類水平的技巧。這個程序學會了在遊戲過程中僅僅通過觀察像素和分數來玩遊戲。

2015 年, David Silver 和他的同事發布開創性論文「Human Level Control Through Deep Reinforcement Learning 」,在這個研究中,他們將強化學習與人工神經網絡相結合,論文發表在 Nature 雜誌上,且至今被引用近 1 萬次,對該領域產生了巨大影響。隨後,Silver 和他的同事繼續用新技術改進這些深度強化學習算法,這些算法仍然是機器學習中應用最廣泛的工具之一。

2016 年 3 月,團隊開發的 AlphaGo 擊敗世界圍棋冠軍李世石,這被被譽為 AI 裡程碑式的時刻。同年,解析 AlphaGo 背後技術的論文 「 Mastering the Game of Go with Deep Neural Networks and Tree Search 」 公開發布在Nature雜誌上。

AlphaGo 和 AlphaZero 之後,DeepMind 的遊戲 AI 探索的另一個重點是徵服《星際爭霸 II》。就在去年,由 Silver 領導的 DeepMind 團隊開發了 AlphaStar,它掌握了多人即時戰略遊戲《星際爭霸 II》,這類遊戲被認為是遊戲 AI 需要攀登的高峰。

現在,在 DeepMind——這家谷歌旗下最星光熠熠的 AI 公司,David Silver 和他的同事仍在尋求將機器學習和神經科學方面的進展進行技術融合,以構建功能強大的通用學習算法。David Silver 在深度強化學習上的諸多工作也已被應用於提高英國電網效率、幫助谷歌數據中心降低功耗、為歐洲航天局策劃太空探測器軌跡等領域。DeepMind 團隊還將繼續推進這些技術,並為其找到更多的應用場景。

-End-

編輯:黃珊

參考:

https://www.acm.org/media-center/2020/april/acm-prize-2019

https://deepmind.com/research/publications/human-level-control-through-deep-reinforcement-learning

https://www.nature.com/articles/nature16961

—— 分享新聞,還能獲得積分兌換好禮哦 ——

相關焦點

  • ACM MM 2020大獎項出爐!南開獲最佳論文獎,西安交大獲最佳學生論文獎
    第28屆ACM國際多媒體會議(ACM MM)最佳論文獎、最佳學生論文獎、最佳demo獎、 最佳開源軟體獎在內的所有多媒體領域大獎都已出爐。其中最佳論文的一作是來自南開大學Hongru Liang,最佳學生論文的一作是來自西安交大的Wenbo Zheng。
  • 剛剛,阿爾法狗背後的那個男人,獲得了2019 ACM 計算獎
    文 | 學術頭條美國計算機學會(ACM)今天宣布,將 2019 年 ACM 計算獎授予 AlphaGo 研發團隊領導者 David Silver,以表彰他為計算機遊戲表現帶來的突破性進展。與「計算機界的諾貝爾獎」圖靈獎不同,ACM 計算獎(ACM Prize in Computing)每年授予在計算機領域裡有突出貢獻的年輕學者。Silver 目前任倫敦大學學院(UCL)教授、谷歌旗下人工智慧公司 DeepMind 首席科學家。
  • 我校研究成果獲ACM SIGSPATIAL 2020「十年影響力「榮譽獎
    我校研究成果獲ACM SIGSPATIAL 2020「十年影響力「榮譽獎 11月3日至6日,第二十八屆ACM SIGSPATIAL
  • 最新 ACM Fellows名單,7位圖靈獎得主上榜,13位華人入圍
    作為全世界計算機領域影響力最大的專業學術組織,ACM 所評選的圖靈獎(A.M. Turing Award)被公認為世界計算機領域的諾貝爾獎。ACM Fellow 設立於 1993 年,是 ACM 授予資深會員之榮譽,表揚表彰在計算和信息技術方面取得傑出成就的前 1% 的 ACM 成員,審查過程十分嚴格,每年遴選一次,由他們的同行提名,並由一個傑出的遴選委員會審查提名。
  • 那個AlphaGo背後的男人,獲得2019 ACM計算獎
    美國計算機學會今天宣布,將 2019 年 ACM 計算獎授予 AlphaGo 研發團隊領導者 David Silver,以表彰他為計算機遊戲表現帶來的突破性進展。與「計算機界的諾貝爾獎」圖靈獎不同,ACM 計算獎每年授予在計算機領域裡有突出貢獻的年輕學者。Silver 目前任倫敦大學學院教授、谷歌旗下人工智慧公司 DeepMind 首席科學家。作為深度強化學習領域的領軍人物,Silver 最主要的成就就是領導了 AlphaGo 研發團隊,在圍棋比賽中擊敗了世界冠軍柯潔和李世石。
  • ACM 公布軟體系統獎、卡內拉克斯理論與實踐獎、艾倫...
    ACM 軟體系統獎ACM 軟體系統獎主要頒發給開發出具有長遠影響力軟體系統的機構或個人,這些影響體現在對概念的貢獻,商業價值或兩者兼有之。軟體系統獎的獎金為 35,000 美元,由 IBM 公司提供資金支持。
  • ACM 宣布三位深度學習之父共同獲得 2018 年圖靈獎
    ,如今神經網絡已經成為計算領域的重要組成部分。人工智慧的進步和興盛在很大程度上歸功於 Bengio、Hinton 和 LeCun 為深度學習最新進展奠定的基礎。這些技術被數十億人使用,任何一個擁有智慧型手機的人都能切實體驗到自然語言處理和計算機視覺方面的進步。除了我們每天使用的產品之外,深度學習的新進展還在醫學、天文學、材料科學等領域為科學家提供了強大的新工具。」
  • 北大圖靈班本科生吳克文獲STOC 2020最佳論文獎
    機器之心報導參與:澤南今天,北京大學前沿計算研究中心官方公眾號報導稱,在全球計算機理論頂會 STOC 2020 上,北大本科生吳克文有兩篇論文發表,其中一篇獲得了最佳論文獎。根據北京大學前沿計算研究中心官方公眾號的報導,6 月 25 日,ACM 計算理論年會 STOC 2020 上傳來一條好消息:北京大學信息科學技術學院 16 級圖靈班學生吳克文參與的論文《Improved bounds for the sunflower lemma》榮獲會議最佳論文獎。
  • 中國稀土之父去世 曾獲最高科學技術獎
    中國科學院院士、2008年度國家最高科學技術獎得主、中國稀土之父、著名物理化學家、無機化學家、教育家徐光憲今天上午不幸去世,享年95歲。徐光憲1920年11月7日出生於浙江省紹興上虞市,1944年畢業於交通大學(西安交大和上海交大前身)化學系,1946年任交通大學化學系助教,1947年赴美留學,1951年獲美國哥倫比亞大學物理化學博士學位,不久回國,到北京大學任教、從事研究。
  • 2019 ACM博士論文獎公布,MIT學霸吳佳俊獲榮譽提名
    複雜性理論致力於將可計算問題分類為可行的和不可行的。PCP 定理(用於概率可檢查證明)建立了能夠將近似問題分類為不可行的框架,表明它們是 NP-hard 問題。2002 年,Subhash Khot 提出了 UGC,這一猜想激發了一系列的研究,並產生了深遠影響。如果該猜想被證明是正確的,則它將解釋整個算法問題大類的複雜性。
  • 首屆AAAI/ACM SIGAI博士論文獎公布,姚班學霸吳佳俊獲獎
    相關連結:https://awards.acm.org/about/2019-doctoral-dissertation 吳佳俊獲獎論文:Learning to See the Physical World
  • 中國粒子加速器之父去世 曾獲國家最高科學技術獎
    中國粒子加速器之父去世 曾獲國家最高科學技術獎 2016-02-21 03:44:56   昨天早晨8點12分,中國科學院院士、國際著名加速器物理學家、2011年度國家最高科學技術獎獲得者
  • 中科大教授陸朝陽獲美國物理學會量子計算獎
    10月6日,美國物理學會(APS)宣布,授予中國科學技術大學陸朝陽教授2021年度「蘭道爾—本內特量子計算獎」(Rolf Landauer and Charles H. Bennett Award in Quantum Computing),表彰他「在光學量子信息科學,特別是在固態量子光源、量子隱形傳態和光量子計算方面的重要貢獻」。
  • AlphaGo 圍棋教學工具已發布
    在Deepmind所謂的「教學工具」發布之前,小編曾在腦海出現萬千猜想……但今天揭底才知道,原來只是一個平平淡淡的網頁……(建議複製到電腦上打開,因為據有的棋友反映手機打不開,小編這裡實測手機能打開,只是讀取了較長時間)https://alphagoteach.deepmind.com
  • 行為經濟學之父獲諾獎 稱要「非理性」花掉獎金
    行為經濟學之父獲諾獎 稱要「非理性」花掉獎金 2017-10-10為調和理論假設與現實的差異,全新研究領域「行為經濟學」應運而生,近年更獲各國政府採用以推行政策。被視為行為經濟學之父、提出「推手理論」的美國經濟學家塞勒對這門學科作出傑出貢獻,9日獲頒本年度諾貝爾經濟學獎。  瑞典皇家科學院形容塞勒是「將經濟學與心理學結合」的先驅,他的研究令經濟學變得更人性化。
  • 「雜交水稻之父」袁隆平獲智利「麥哲倫海峽獎」
    11月16日,智利駐華大使路易斯·施密特·蒙特斯向袁隆平頒發「麥哲倫海峽獎」。當晚,智利駐華大使路易斯·施密特·蒙特斯代表智利政府在長沙向「雜交水稻之父」袁隆平頒發了「麥哲倫海峽獎」。當晚,智利駐華大使路易斯·施密特·蒙特斯代表智利政府在長沙向「雜交水稻之父」袁隆平頒發了「麥哲倫海峽獎」。今年是麥哲倫海峽被發現500周年,也是中國和智利建交50周年。在頒獎現場,路易斯·施密特·蒙特斯還向袁隆平頒發了「中智建交50周年紀念獎章」。
  • 騰訊摘獲最佳長論文獎
    作者 | 陳大鑫近日,RecSys 2020官網公布了本屆最佳長短文論文獎。Recommendations》ACM RecSys(推薦系統會議)是用於介紹推薦系統廣泛領域中的最新研究成果、系統和技術的國際會議。
  • 你知道滑鼠之父是誰嗎?細說60位圖靈獎獲獎者(中)
    圖靈獎(A.M. Turing Award),由美國計算機協會(ACM)於1966年設立,取名來自計算機科學的先驅,這部電影(模仿遊戲)的主角——英國科學家阿蘭·麥席森·圖靈。由於圖靈獎對獲獎條件要求極高,評獎程序又是極嚴,一般每年只獎勵一名計算機科學家,只有極少數年度有兩名合作者或在同一方向作出貢獻的科學家共享此獎。因此它有有「計算機界的諾貝爾獎」之稱。
  • 中國「雜交水稻之父」袁隆平獲諾貝爾和平獎提名
    原標題:中國「雜交水稻之父」袁隆平獲諾貝爾和平獎提名   2014年諾貝爾和平獎提名名單已正式出爐,候選者人數之多再破記錄,達278名。出人意料的是,有兩個人的名字出現在這份名單上,他們是中國「雜交水稻之父」袁隆平、印度「綠色革命始祖」斯瓦米納坦。在歷屆諾貝爾和平獎評選中,實現糧食增產的農學家被提名是沒有先例的。
  • 王中林獲愛因斯坦世界科學獎,被譽為「納米發電機之父」
    新京報訊(記者 張璐)6月14日,2019年度「阿爾伯特·愛因斯坦世界科學獎」(Albert Einstein World Award of Science)揭曉,中國科學院北京納米能源與系統研究所首席科學家、國科大納米學院院長、美國喬治亞理工學院終身講席教授王中林斬獲這一世界性的大獎,成為首位獲此殊榮的華人科學家。