剛剛,阿爾法狗背後的那個男人,獲得了2019 ACM 計算獎

2021-01-16 鈦媒體APP

文 | 學術頭條

美國計算機學會(ACM)今天宣布,將 2019 年 ACM 計算獎授予 AlphaGo 研發團隊領導者 David Silver,以表彰他為計算機遊戲表現帶來的突破性進展。

與「計算機界的諾貝爾獎」圖靈獎不同,ACM 計算獎(ACM Prize in Computing)每年授予在計算機領域裡有突出貢獻的年輕學者。

Silver 目前任倫敦大學學院(UCL)教授、谷歌旗下人工智慧公司 DeepMind 首席科學家。作為深度強化學習領域的領軍人物,Silver 最主要的成就就是領導了 AlphaGo 研發團隊,在圍棋比賽中擊敗了世界冠軍柯潔和李世石。

Silver 巧妙地將深度學習、強化學習、傳統樹搜索算法和大規模計算的思想結合起來,開發出了 AlphaGo 算法。AlphaGo 被認為是人工智慧研究的裡程碑,並被《新科學家》雜誌列為過去十年的十大發現之一。

AlphaGo 也是第一個擊敗人類職業圍棋選手、第一個戰勝圍棋世界冠軍的人工智慧機器人。

2016 年 3 月,阿爾法圍棋與圍棋世界冠軍、職業九段棋手李世石進行圍棋人機大戰,以 4 比 1 的總比分獲勝;2016 年末 2017 年初,該程序在中國棋類網站上以「大師」(Master)為註冊帳號與中日韓數十位圍棋高手進行快棋對決,連續 60 局無一敗績;2017 年 5 月,在中國烏鎮圍棋峰會上,它與排名世界第一的世界圍棋冠軍柯潔對戰,以 3 比 0 的總比分獲勝。

2017 年 10 月 19 日,在國際學術期刊《自然》(Nature)上發表的一篇研究論文中,Silver 團隊報告新版程序 AlphaGo Zero:從空白狀態學起,在無任何人類輸入的條件下,它能夠迅速自學圍棋,並以 100:0 的戰績擊敗「前輩」。AlphaZero 在西洋棋、圍棋、圍棋等遊戲中都取得了超人的表現,展現了前所未有的遊戲方法的普遍性。

ACM 主席 Cherri M. Pancake 表示:「在人工智慧領域,很少有其他研究人員能像 David Silver 一樣讓人如此興奮。」

Infosys 營運長 Pravin Rao 表示:「 David Silver 為深度強化學習做出了基礎性貢獻,從而迅速促進了人工智慧的發展。當電腦能夠在複雜的棋盤遊戲中擊敗世界冠軍時,它已經激發了公眾的想像力,並將年輕的研究人員吸引到機器學習等領域。重要的是,Silver 和他的同事開發的框架將在未來的許多年裡,為人工智慧的商業和工業實際應用提供貢獻。」

ACM 計算獎旨在表彰研究成果產生了深遠影響和廣泛意義的中青年計算機科學家,獎金為 25 萬美元,由印度科技公司印孚瑟斯(Infosys Ltd)捐贈。頒獎儀式將於 2020 年 6 月 20 日在美國舊金山舉行,屆時 Silver 將正式接受獎項。

人工智慧玩遊戲

自上世紀 50 年代以來,教電腦程式與人類或其他計算機進行遊戲比賽,一直是人工智慧研究的核心實踐項目。人類與機器之間的比賽,也一直是衡量人工智慧的標尺。

電腦程式通過做出一系列決定,來達到獲勝的目標,這個過程被看作是對人類思維的模擬和挑戰。遊戲比賽也給研究人員提供了很容易量化的結果,比如「電腦遵守規則了嗎?得分了嗎?或者贏了遊戲嗎?」

在這一領域的早期,研究人員開發了一些程序來與人類在跳棋上競爭,而在過去的幾十年裡,又出現了越來越複雜的西洋棋程序。

1997 年,ACM 贊助了一場比賽,IBM 的「深藍」(DeepBlue)成為第一臺擊敗西洋棋世界冠軍加裡·卡斯帕羅夫(Gary Kasparov)的電腦程式,這也是一個具有分水嶺意義的時刻。

但對於研究人員來說,目標不僅僅是開發贏得遊戲的程序,而是將遊戲作為開發具有模擬人類智能能力的機器的試金石。

2016 年 3 月,全世界數百萬人在電視上觀看了 AlphaGo 擊敗圍棋世界冠軍李世石(Lee Sedol)的比賽。但這僅僅是 David Silver 團隊驚人成就影響的開始。他對深度強化學習的見解已經被應用於很多領域,比如提高英國電網的效率,降低谷歌數據中心的能耗,以及為歐洲航天局設計太空探測器的軌道。」Cherri M. Pancake說道。

Silver 是深度強化學習的最重要的貢獻者之一,在深度強化學習這種工具中,算法通過在交互式環境中反覆試驗來學習,根據運行過程中積累的信息不斷調整,並利用不同數學處理層次的計算模型——人工神經網絡與強化學習策略有效地結合起來,對試錯結果進行評估。

該算法不需要對每一個可能的結果進行計算,而是進行預測,從而更有效地執行給定的任務。

阿爾法狗

2500 年前,中國發明了圍棋遊戲,至今仍然流行,尤其是在亞洲。圍棋被認為比象棋要複雜得多,因為棋手可以做出更多潛在的動作,而且遊戲可以有更多的方式進行。

Silver 在艾伯塔大學(University of Alberta)攻讀博士學位時,就開始探索開發一種可以掌握圍棋的電腦程式的可能性。

Silver 開發 AlphaGo 的關鍵見解,是將深層神經網絡與計算機遊戲中使用的算法 Monte Carlo 樹搜索相結合。Monte Carlo 樹搜索的一個優點是,在追求遊戲中最佳感知策略的同時,該算法還在不斷研究其他替代方案。

2016 年 3 月,AlphaGo 擊敗世界圍棋冠軍李世石被譽為AI裡程碑式的時刻。Silver 和他的同事在 2016 年發表在《自然》雜誌上的論文《用深層神經網絡和樹搜索掌握圍棋遊戲》中發表了支撐 AlphaGo 的基礎技術。

AlphaGo Zero、AlphaZero和AlphaStarSilver 和他在 DeepMind 的團隊一直在開發新的算法,這些算法極大地提高了計算機遊戲的發展水平,並取得了許多被認為人工智慧系統無法實現的結果。

在開發 AlphaGo Zero 算法時,Silver 和他的合作者證明了程序可以在不接觸人類專家遊戲的情況下掌握圍棋。該算法完全通過在沒有任何人類數據或先驗知識的情況下自己來學習,而在進一步的迭代版本中,算法甚至不需要知道規則。

後來,DeepMind 團隊的 AlphaZero 在西洋棋、將棋和圍棋中也獲得了超人的表現。在西洋棋中,AlphaZero 輕鬆擊敗了世界計算機西洋棋冠軍 Stockfish ,這是一個由大師和西洋棋編程專家設計的高性能程序。就在去年,由 Silver 領導的 DeepMind 團隊開發的 AlphaStar ,掌握了多人電子競技遊戲《星際爭霸 II》,該遊戲被視為 AI 學習系統面臨的一項艱巨挑戰。

關於 David SilverDavid Silver 是 DeepMind 強化學習研究小組的負責人,也是倫敦大學學院的計算機科學教授。他所在的 Google 子公司 DeepMind 試圖將機器學習和系統神經科學方面的最佳技術結合起來,以構建功強大的通用學習算法。

Silver 分別於 1997 年和 2000 年獲得劍橋大學的學士和碩士學位。1998 年,他和別人共同創立了視頻遊戲公司 Elixir Studios,並在那裡擔任首席技術官兼首席程式設計師。後來 Silver 返回學術界,並於 2009 年獲得了艾伯塔大學的計算機科學博士學位。

2015 年,Silver 和他的同事發表的一篇題為《通過深度強化學習實現人類水平控制》(Human Level Control Through Deep reinforcement learning)的開創性論文中,描述了他們將強化學習與人工神經網絡相結合的方法。該論文發表在《自然》(Nature)雜誌上,被引用了近1萬次,對該領域產生了巨大的影響。

隨後,Silver 和他的同事繼續用新的技術完善這些深度強化學習算法,這些算法仍然是機器學習中最廣泛使用的工具之一。

Silver 的眾多榮譽包括:馬文·明克西人工智慧傑出成就獎(2018年)、皇家工程院對英國工程傑出貢獻銀獎(2017年)、門薩基金會人工智慧領域最佳科學發現獎(2017年)。

關於 ACM 計算獎ACM 計算獎旨在表彰研究成果產生了深遠影響和廣泛意義的中青年計算機科學家。該獎項的獎金為 25 萬美元,資金支持由 Infosys Ltd.提供。ACM 計算獎以前被稱為 ACM Infosys 基金會計算科學獎。ACM 獎獲得者將被邀請參加海德堡桂冠論壇,這是一個年度網絡活動,匯集了來自世界各地的年輕研究人員和 ACM 圖靈獎、阿貝爾獎、菲爾茲獎和奈凡林納獎的獲得者。

關於 ACM計算機科學協會(ACM)是世界上最大的教育和科學計算機學會,它將計算機教育工作者、研究人員和專業人士聯合起來,以激發對話、共享資源並應對該領域的挑戰。ACM 通過強大的領導力、最高標準的推廣以及對技術卓越的認可,增強了計算機行業的集體聲音。ACM 通過提供終身學習、職業發展和專業網絡的機會來支持其成員的專業成長。

參考資料:https://www.acm.org/media-center/2020/april/acm-prize-2019

相關焦點

  • ACM傑出科學家名單出爐:葉傑平、崔鵬等26位華人學者上榜
    他獲得了2019年IEEE TCBD最佳會議論文獎、2018年IEEE TCGCC最佳雜誌論文獎、2017年IEEE系統期刊年度最佳論文獎以及其他IEEE / ACM會議的6項最佳論文獎。他在ACM計算評論上發表的有關計算機的文章還曾獲得2016年年度最佳計算機獎。 何丙勝
  • 2019年圖靈獎公布!從阿凡達到圖靈獎,皮克斯元老的動畫夢
    【新智元導讀】去年,圖靈獎頒給了熬過寒冬的人;今年,圖靈獎頒給了點亮創意之光的人。史丹福大學計算機圖形學實驗室教授Patrick Hanrahan和計算機科學家、皮克斯動畫工作室聯合創始人Edwin Catmull斬獲圖靈獎!他們的工作對電影製作產生了革命性的影響,並為當今 3D 動畫電影鋪平了道路,一起來了解好萊塢大片背後的這兩個男人。
  • 2019年圖靈獎公布,沒有他們,就沒有《玩具總動員》
    Turing因為對獲獎者的要求極高,圖靈獎一般每年只獎勵一名計算機科學家,在罕見的情況下也會有兩名在相同方向上做出傑出貢獻的科學家獲獎,然而,2019年就是一個例外。獲獎理由ACM提名Patrick M. Hanrahan和Edwin E.
  • 2019年的圖靈獎獲得者,是兩位皮克斯動畫工作室「前員工」
    Catmull 2019 年 ACM A.M. 圖靈獎榮譽,以表彰他們對 3D 計算機圖形學的貢獻,以及這些技術對電影製作和計算機生成圖像(CGI)等應用的革命性影響。兩位大佬,一部 3D 動畫電影史Catmull 於 1974 年在猶他大學獲得計算機科學博士學位。他的導師包括計算機圖形學之父、1988 年 ACM A.M. 圖靈獎獲得者 Ivan Sutherland。
  • 「阿爾法狗」雖然在棋盤上戰勝了人類,但它取勝的利器是模仿人類
    「阿爾法狗」之父、谷歌Deep Mind聯合創始人德米斯·哈薩比斯透露其雄心:最終要用「人工智慧找到各類問題的智慧解決方案」。有觀點指出,一旦各類問題都可以歸結到用人工智慧找到「智慧解決方案」,新一輪由此啟動的創新周期將被迅速開啟。「阿爾法狗」雖然在棋盤上戰勝了人類,但它取勝的關鍵「武器」卻恰恰是模仿人類。
  • 最新圖靈獎頒布!兩位皮克斯「前員工」獲獎,引領計算機技術和電影...
    Catmull 為 2019 年 ACM A.M. 圖靈獎獲得者,以表彰他們對 3D 計算機圖形學的貢獻,以及這些技術對電影製作和計算機生成圖像(computer-generated imagery,CGI)等應用的革命性影響。
  • 從「深藍」到「阿爾法狗」, 人工智慧發展的一大步
    2016年3月15日,谷歌圍棋人工智慧「阿爾法狗」(Alpha Go)與韓國棋手李世石對弈並以4:1的成績獲勝,這場「人機大戰」成為人工智慧史上一座新的裡程碑,也再次為人工智慧技術做了科普——   從「深藍」到「阿爾法狗」,這二十多年的發展似乎也在預示著,人工智慧終將改變人類的生活。
  • DeepMind 首席科學家獲2019 年 ACM 計算獎,智能體Agent57在所有經典Atari 遊戲中吊打人類
    4月1日,美國計算機學會(ACM)宣布,將 2019 年 ACM 計算獎授予 AlphaGo 研發團隊領導者 David Silver,以表彰其在計算機遊戲方面取得突破性進展。Silver 現任倫敦大學學院(UCL)教授、DeepMind 首席科學家。作為深度強化學習領域的領軍人物,Silver 曾領導AlphaGo 團隊,在圍棋比賽中擊敗世界冠軍。
  • 圖靈獎頒給《玩具總動員》打造者 憑什麼?
    改變一個產業,引領一個時代,獲很多次奧斯卡獎,加冕計算機最高領域——圖靈獎。這就是剛剛出爐的2019圖靈獎得主:Edwin E. Catmull艾德·卡特姆,以及Patrick M. Hanrahan派屈克· 漢拉汗。
  • 賈伯斯好友獲圖靈獎,曾打造《玩具總動員》,為計算機圖形學先驅
    改變一個產業,引領一個時代,獲很多次奧斯卡獎,加冕計算機最高領域——圖靈獎。這就是剛剛出爐的2019圖靈獎得主:Edwin E. Catmull艾德·卡特姆,以及Patrick M. Hanrahan派屈克· 漢拉汗。
  • ACM2020傑出會員公布,葉傑平、崔鵬上榜,華人學者佔四成
    曾獲 SIGKDD 最佳應用論文獎,並於今年獲得 WSDM 十年時間檢驗獎。迄今為止,其論文被引用次數達到 5500+。2010 年獲得亞利桑那州立大學計算機科學博士學位,導師為葉傑平教授。他的研究興趣包括機器學習、深度學習、數據挖掘和計算生物學,於 2014 年獲得美國國家科學基金會職業獎。
  • 這位神經科學家獲得2019年《自然》傑出導師獎
    2019年《自然》傑出導師獎(Nature Awards for Mentoring in Science)被授予兩名來自印度的科學家,他們把自己的學生置於競爭和發表論文之上。兩位科學家緊緊心系學生的利益、思想和成就,深受學生愛戴。
  • 柯潔回應華少犀利提問:雖然輸給了阿爾法狗,自己仍是世界第一
    IT之家1月9日消息 早前世界圍棋史上最年輕的七冠王柯潔在一次綜藝中曾談到自己輸給阿爾法狗的這件事,而在最近的媒體採訪中柯潔再度回應了主持人關於自己輸給阿爾法狗的問題。華少對話柯潔時向後者拋出犀利提問:狡滑的成年人會想,我不和阿爾法狗比,我就一直是世界第一,AI能否戰勝人類就永遠是一個世界懸念。
  • 翼方健數首席科學家張霖濤榮獲ACM2020傑出科學家
    來源:時刻頭條ACM(國際計算機協會)剛剛公布了2020年度ACM傑出科學家(Distinguished Member)名單,全球總共64名來自世界頂尖的大學、企業和研究機構的傑出計算機科學家獲此榮譽。
  • 大三生獲最佳短論文獎,清華狂攬信息檢索頂會SIGIR2020多個獎項
    來自清華大學的研究人員獲得最佳論文榮譽提名獎、最佳短論文獎獎項。ACM SIGIR 是信息檢索領域的頂級學術會議,今年是第 43 屆。據統計,SIGIR 2020 會議共收到投稿 1180 篇,接收 340 篇,接收率為 28.8%。
  • 柯潔為什麼輸給阿爾法狗?從人機大戰看人工智慧前世今生
    在這場被稱為「人類頂尖棋手與人工智慧的終極對決」的比賽中,代表人類出戰的是中國年輕人柯潔,他將迎戰谷歌公司的圍棋電腦程式「阿爾法狗」,最終柯潔0:3不敵「阿爾法狗」。在後來的採訪中,柯潔表示,當時「阿爾法狗」下了「令我感到絕望的一步棋」,「我感到渾身都在顫抖」,面對即將以0:3完敗收場的結果,柯潔難以抑制自身的絕望情緒,才會在比賽現場掩面而泣。
  • 2019 WAIC世界人工智慧大會SAIL獎及Top30榜單高光回顧
    作為世界人工智慧大會的最高獎項,卓越人工智慧引領者獎(Super AI Leader,簡稱SAIL獎)2019年8月29日在大會開幕式上正式揭曉:華為、科大訊飛、銀河水滴、阿里巴巴以及年度Top 30榜單,在歷經半年時間、經多輪專家評審後,從近700個國內外角逐SAIL獎的參評項目(涵蓋專家推薦和創新大賽的優勝項目)中脫穎而出,贏得世界人工智慧大會的最高榮譽。
  • 9款樂高套裝獲得了2019年年度玩具獎TOTY Toy Of The Year獎項提名!
    ,這個數字也是2018年樂高所獲得的提名數的兩倍。而在此前的2018年,樂高曾經在5項提名中獲得了其中3項的最終獎項。現在我們就一起來看看這9款樂高套裝及其對應的提名獎項吧:2019 TOTY Specialty Toy of the Year Nominees2019年年度特別玩具獎提名樂高 D2C EXLCUSIVE 75222 星球大戰雲中之城
  • 搞笑諾獎2020:搞笑背後,發人深省
    和往屆一樣,今年的搞笑諾獎,讓人捧腹大笑,又發人深省。比如,川普等九個國家的領導人,因在過去的半年多時間裡,給奮戰在一線的科學家和醫生們頻頻 「上課」,而榮獲醫學教育獎。再比如,5 位廣西人因在 「僱兇殺人」 過程中層層外包,導致酬金從 200 萬降至 10 萬,最終執行人反水,向暗殺對象傳遞信息,而這五位已經入獄的團夥,獲得今年的管理學獎。
  • 奧斯卡|韓國電影《寄生蟲》獲得最佳原創劇本獎
    奧斯卡|韓國電影《寄生蟲》獲得最佳原創劇本獎 澎湃訊 2020-02-10 09:45 來源:澎湃新聞