剛剛,那個打敗柯潔、李世石的阿爾法狗背後的男人,獲得2019 ACM...

2020-12-18 36氪

編者按:本文來自微信公眾號「學術頭條」(ID:SciTouTiao),作者:學術君,36氪經授權發布。

美國計算機學會(ACM)今天宣布,將 2019 年 ACM 計算獎授予 AlphaGo 研發團隊領導者 David Silver,以表彰他為計算機遊戲表現帶來的突破性進展。

與「計算機界的諾貝爾獎」圖靈獎不同,ACM 計算獎(ACM Prize in Computing)每年授予在計算機領域裡有突出貢獻的年輕學者。

Silver 目前任倫敦大學學院(UCL)教授、谷歌旗下人工智慧公司 DeepMind 首席科學家。作為深度強化學習領域的領軍人物,Silver 最主要的成就就是領導了 AlphaGo 研發團隊,在圍棋比賽中擊敗了世界冠軍柯潔和李世石。

Silver 巧妙地將深度學習、強化學習、傳統樹搜索算法和大規模計算的思想結合起來,開發出了 AlphaGo 算法。AlphaGo 被認為是人工智慧研究的裡程碑,並被《新科學家》雜誌列為過去十年的十大發現之一。AlphaGo 也是第一個擊敗人類職業圍棋選手、第一個戰勝圍棋世界冠軍的人工智慧機器人。

2016 年 3 月,阿爾法圍棋與圍棋世界冠軍、職業九段棋手李世石進行圍棋人機大戰,以 4 比 1 的總比分獲勝;2016 年末 2017年初,該程序在中國棋類網站上以「大師」(Master)為註冊帳號與中日韓數十位圍棋高手進行快棋對決,連續 60 局無一敗績;2017 年 5 月,在中國烏鎮圍棋峰會上,它與排名世界第一的世界圍棋冠軍柯潔對戰,以 3 比 0 的總比分獲勝。

2017 年 10 月 19 日,在國際學術期刊《自然》(Nature)上發表的一篇研究論文中,Silver 團隊報告新版程序 AlphaGo Zero:從空白狀態學起,在無任何人類輸入的條件下,它能夠迅速自學圍棋,並以 100:0 的戰績擊敗「前輩」。AlphaZero 在西洋棋、圍棋、圍棋等遊戲中都取得了超人的表現,展現了前所未有的遊戲方法的普遍性。

ACM 主席 Cherri M. Pancake 表示:「在人工智慧領域,很少有其他研究人員能像 David Silver 一樣讓人如此興奮。」Infosys 營運長 Pravin Rao 表示:「 David Silver 為深度強化學習做出了基礎性貢獻,從而迅速促進了人工智慧的發展。當電腦能夠在複雜的棋盤遊戲中擊敗世界冠軍時,它已經激發了公眾的想像力,並將年輕的研究人員吸引到機器學習等領域。

重要的是,Silver 和他的同事開發的框架將在未來的許多年裡,為人工智慧的商業和工業實際應用提供貢獻。」ACM 計算獎旨在表彰研究成果產生了深遠影響和廣泛意義的中青年計算機科學家,獎金為 25 萬美元,由印度科技公司印孚瑟斯(Infosys Ltd)捐贈。頒獎儀式將於 2020 年 6 月 20 日在美國舊金山舉行,屆時 Silver 將正式接受獎項。

人工智慧玩遊戲

自上世紀 50 年代以來,教電腦程式與人類或其他計算機進行遊戲比賽,一直是人工智慧研究的核心實踐項目。人類與機器之間的比賽,也一直是衡量人工智慧的標尺。電腦程式通過做出一系列決定,來達到獲勝的目標,這個過程被看作是對人類思維的模擬和挑戰。遊戲比賽也給研究人員提供了很容易量化的結果,比如「電腦遵守規則了嗎?得分了嗎?或者贏了遊戲嗎?」

在這一領域的早期,研究人員開發了一些程序來與人類在跳棋上競爭,而在過去的幾十年裡,又出現了越來越複雜的西洋棋程序。1997 年,ACM 贊助了一場比賽,IBM 的「深藍」(DeepBlue)成為第一臺擊敗西洋棋世界冠軍加裡·卡斯帕羅夫(Gary Kasparov)的電腦程式,這也是一個具有分水嶺意義的時刻。

但對於研究人員來說,目標不僅僅是開發贏得遊戲的程序,而是將遊戲作為開發具有模擬人類智能能力的機器的試金石。2016 年 3 月,全世界數百萬人在電視上觀看了 AlphaGo 擊敗圍棋世界冠軍李世石(Lee Sedol)的比賽。但這僅僅是 David Silver 團隊驚人成就影響的開始。他對深度強化學習的見解已經被應用於很多領域,比如提高英國電網的效率,降低谷歌數據中心的能耗,以及為歐洲航天局設計太空探測器的軌道。」Cherri M. Pancake說道。

Silver 是深度強化學習的最重要的貢獻者之一,在深度強化學習這種工具中,算法通過在交互式環境中反覆試驗來學習,根據運行過程中積累的信息不斷調整,並利用不同數學處理層次的計算模型——人工神經網絡與強化學習策略有效地結合起來,對試錯結果進行評估。該算法不需要對每一個可能的結果進行計算,而是進行預測,從而更有效地執行給定的任務。

阿爾法狗

2500 年前,中國發明了圍棋遊戲,至今仍然流行,尤其是在亞洲。圍棋被認為比象棋要複雜得多,因為棋手可以做出更多潛在的動作,而且遊戲可以有更多的方式進行。Silver 在艾伯塔大學(University of Alberta)攻讀博士學位時,就開始探索開發一種可以掌握圍棋的電腦程式的可能性。Silver 開發 AlphaGo 的關鍵見解,是將深層神經網絡與計算機遊戲中使用的算法 Monte Carlo 樹搜索相結合。

Monte Carlo 樹搜索的一個優點是,在追求遊戲中最佳感知策略的同時,該算法還在不斷研究其他替代方案。2016 年 3 月,AlphaGo 擊敗世界圍棋冠軍李世石被譽為AI裡程碑式的時刻。Silver 和他的同事在 2016 年發表在《自然》雜誌上的論文《用深層神經網絡和樹搜索掌握圍棋遊戲》中發表了支撐 AlphaGo 的基礎技術。

AlphaGo Zero、AlphaZero和AlphaStar

Silver 和他在 DeepMind 的團隊一直在開發新的算法,這些算法極大地提高了計算機遊戲的發展水平,並取得了許多被認為人工智慧系統無法實現的結果。在開發 AlphaGo Zero 算法時,Silver 和他的合作者證明了程序可以在不接觸人類專家遊戲的情況下掌握圍棋。該算法完全通過在沒有任何人類數據或先驗知識的情況下自己來學習,而在進一步的迭代版本中,算法甚至不需要知道規則。

後來,DeepMind 團隊的 AlphaZero 在西洋棋、將棋和圍棋中也獲得了超人的表現。在西洋棋中,AlphaZero 輕鬆擊敗了世界計算機西洋棋冠軍 Stockfish ,這是一個由大師和西洋棋編程專家設計的高性能程序。就在去年,由 Silver 領導的 DeepMind 團隊開發的 AlphaStar ,掌握了多人電子競技遊戲《星際爭霸 II》,該遊戲被視為 AI 學習系統面臨的一項艱巨挑戰。

關於 David Silver

David Silver 是 DeepMind 強化學習研究小組的負責人,也是倫敦大學學院的計算機科學教授。他所在的 Google 子公司 DeepMind 試圖將機器學習和系統神經科學方面的最佳技術結合起來,以構建功強大的通用學習算法。

Silver 分別於 1997 年和 2000 年獲得劍橋大學的學士和碩士學位。1998 年,他和別人共同創立了視頻遊戲公司 Elixir Studios,並在那裡擔任首席技術官兼首席程式設計師。後來 Silver 返回學術界,並於 2009 年獲得了艾伯塔大學的計算機科學博士學位。

2015 年,Silver 和他的同事發表的一篇題為《通過深度強化學習實現人類水平控制》(Human Level Control Through Deep reinforcement learning)的開創性論文中,描述了他們將強化學習與人工神經網絡相結合的方法。該論文發表在《自然》(Nature)雜誌上,被引用了近1萬次,對該領域產生了巨大的影響。

隨後,Silver 和他的同事繼續用新的技術完善這些深度強化學習算法,這些算法仍然是機器學習中最廣泛使用的工具之一。Silver 的眾多榮譽包括:馬文·明克西人工智慧傑出成就獎(2018年)、皇家工程院對英國工程傑出貢獻銀獎(2017年)、門薩基金會人工智慧領域最佳科學發現獎(2017年)。

關於 ACM 計算獎

ACM 計算獎旨在表彰研究成果產生了深遠影響和廣泛意義的中青年計算機科學家。該獎項的獎金為 25 萬美元,資金支持由 Infosys Ltd.提供。ACM 計算獎以前被稱為 ACM Infosys 基金會計算科學獎。ACM 獎獲得者將被邀請參加海德堡桂冠論壇,這是一個年度網絡活動,匯集了來自世界各地的年輕研究人員和 ACM 圖靈獎、阿貝爾獎、菲爾茲獎和奈凡林納獎的獲得者。

關於 ACM

計算機科學協會(ACM)是世界上最大的教育和科學計算機學會,它將計算機教育工作者、研究人員和專業人士聯合起來,以激發對話、共享資源並應對該領域的挑戰。ACM 通過強大的領導力、最高標準的推廣以及對技術卓越的認可,增強了計算機行業的集體聲音。ACM 通過提供終身學習、職業發展和專業網絡的機會來支持其成員的專業成長。

參考資料:https://www.acm.org/media-center/2020/april/acm-prize-2019

相關焦點

  • 剛剛,阿爾法狗背後的那個男人,獲得了2019 ACM 計算獎
    作為深度強化學習領域的領軍人物,Silver 最主要的成就就是領導了 AlphaGo 研發團隊,在圍棋比賽中擊敗了世界冠軍柯潔和李世石。Silver 巧妙地將深度學習、強化學習、傳統樹搜索算法和大規模計算的思想結合起來,開發出了 AlphaGo 算法。
  • 零封世界第一的「阿爾法狗」,背後還有一位臺灣Master
    此役,當前世界排名第一的中國圍棋選手柯潔與升級版阿爾法狗(AlphaGo)三番棋對弈,均遺憾的以失利而告終。早在去年,阿爾法狗就以4:1的比分擊敗韓國九段棋手李世石,引發世界對人工智慧的熱烈討論。而在前段時間,一位註冊帳號名為「Master」的神秘網絡棋手連挫中日韓多位圍棋名將,豪取60連勝後全身而退。期間,人們對這位神秘棋手的身份眾說紛紜。
  • 柯潔和李世石的「不良行為」
    柯潔和李世石都是當今棋壇風雲人物,雖然後者已經退役,但退役擋不住李世石的光芒。前者退網,但其一言一行依舊讓大家記憶深刻。為了切題,我直接說柯潔和李世石的「不良行為」。有趣的是:三星杯對決,是李世石和邱峻的第二次交手,且李世石在前一年的春蘭杯16強第一次與邱峻交手時就淘汰了邱峻,也就是說兩人並沒有「深仇大恨」,那李世石為何要拒絕與邱峻握手,還是蹺二郎腿對弈呢?說完李世石,現在說一下柯潔。
  • 柯潔VS李世石,滄海橫流,方顯英雄本色
    因而,中韓最頂尖的組合即常昊古力組合和李昌鎬李世石組合形成。在這場比賽中,李世石完勝常昊、三目半險勝古力終結比賽。首次參加農心杯,便終結了比賽,這便是他對自己實力的證明。次年,由於李世石休職,再度缺席農心杯。到了第十二屆農心杯比賽時,李世石以先鋒身份再度來襲,力擒王檄和井山裕太。
  • 人工智慧還是阿爾法狗三代?
    當時的主角就是現如今的圍棋七冠王柯潔,同他對戰的就是人工智慧阿爾法狗。當時一共比賽三盤,但是柯潔沒有一局獲勝,賽後接受採訪,柯潔表示對其心服口服,但事實上真的如此嗎?如今「人狗大戰2.0」戰事或將再起,究竟是怎麼一回事?提到圍棋當中的「人機大戰」,除了柯潔這一把以外,李世石對陣阿爾法狗二代也是頗受代人們關注。
  • 單從圍棋水平來說,柯潔和李世石到底誰更勝一籌?
    單從圍棋水平來說,柯潔和李世石到底誰更勝一籌?,柯潔和李世石哪一個會更勝一籌呢?我感覺應該是柯潔。柯潔的年齡比李世石的年齡小14歲,柯潔現在處於上升時期,他還有很大的發展空間,而李世石現在是在事業的末期發展空間比較小,進步的空間沒有科級的大。
  • 柯潔23歲豪取第八冠 他超越了同期的李昌鎬、李世石嗎?
    剛剛結束的三星杯上,柯潔九段在決賽中2:0乾淨利落地擊敗了韓國第一人申真諝九段,獲得個人第四座三星杯冠軍獎盃,這也是柯潔個人的第八個世界冠軍,追平前輩古力九段,並列成為中國獲得世界冠軍數量最多的棋手。
  • 再戰阿爾法狗,還是棋王柯潔的又一次「不務正業」?
    今日,被譽為"當今圍棋第一人"的柯潔發布微博稱"人狗大戰2.0走起"引發熱議,眾人紛紛猜測究竟是阿爾法狗準備重出江湖?還是柯潔新一輪的"不務正業"?大眾對於柯潔最早的認知,絕大部分源自2017年與"阿爾法狗"那次人類棋王與人工智慧的"人狗大戰",在那次對決中柯潔三番棋全敗,其中第二局被機器評定表現完美。而當時的賽後採訪中,柯潔也表示對"阿爾法狗"心服口服: "我輸了都沒什麼脾氣"。
  • 柯潔送祝福李世石哽咽 「懷念過去有你的日子」
    原來,李世石在近日出演了韓國的一檔綜藝節目《家師父一體》。令李世石感到意外的是,節目中柯潔竟然出現了!柯潔在這段提前錄製的視頻中表示:李世石前輩是一位偉大的棋士,也是我們從小就崇拜的偶像。隨後柯潔又真誠地向李世石說道:「我想念和您下圍棋的時光」。聽到這句話時,李世石的眼中突然泛起了淚光。李世石坦誠柯潔的真心話出乎了他的預料,所以哽咽。
  • 柯潔為什麼輸給阿爾法狗?從人機大戰看人工智慧前世今生
    在這場被稱為「人類頂尖棋手與人工智慧的終極對決」的比賽中,代表人類出戰的是中國年輕人柯潔,他將迎戰谷歌公司的圍棋電腦程式「阿爾法狗」,最終柯潔0:3不敵「阿爾法狗」。在後來的採訪中,柯潔表示,當時「阿爾法狗」下了「令我感到絕望的一步棋」,「我感到渾身都在顫抖」,面對即將以0:3完敗收場的結果,柯潔難以抑制自身的絕望情緒,才會在比賽現場掩面而泣。
  • 三星杯柯潔絕殺李世石 中國棋手再度包攬冠亞軍
    中國棋手柯潔執白第188手中盤戰勝老對手李世石,以2-1的總比分淘汰對手,取得對李世石10勝3負的驕人戰績。就此,中國棋手也提前包攬了本屆三星杯的冠亞軍。另一盤半決賽決勝局的較量,在中國棋手範蘊若和柁嘉熹之間進行。去年中國軍團就曾在三星杯上包攬冠亞軍,今年再度會師決賽,顯示了中國棋手強大的實力。
  • 阿爾法狗改變圍棋,柯潔的霸主地位難做久:應該專心幾年多奪冠了
    其給出的理由是:其一,比如00後小將丁浩,在去年圍甲聯賽中,就獲得了「最有價值棋手」——最重要的是,丁浩最近還保持了對柯潔的四連勝!其二,最近,中國圍棋按年齡分為三組,一是95年前出生的「老年組」;二是95到98年出生的「中年組」;三是98年以後出生的「青年組」。
  • 柯潔下月將戰升級版AlphaGo:人機戰,就是要勝利
    原標題:柯潔:人機戰,就是要勝利   昨天,中國圍棋協會和浙江省體育局攜手Google(谷歌)在中國棋院宣布,三方將聯合主辦「中國烏鎮·圍棋峰會」,屆時「人機大戰2.0」將於5月23日、25日和27日在烏鎮上演——AlphaGo(阿爾法狗)會與來自中國的柯潔九段對弈。
  • 柯潔「不務正業」數次跨界,心有不甘還想再戰阿爾法狗,網友笑了
    相信許多關注人工智慧的網友與觀眾都知道,早前曾在圍棋界掀起了極大風浪的人工智慧阿爾法狗。這「位」憑藉人類科技創造出來的「棋手」不僅讓許多圍棋大師慘敗,甚至連曾經狂攬世界冠軍的柯潔都在它手上遭遇連敗,以至於在後續媒體採訪的時候他對阿爾法狗不得不表示服氣。
  • 斯坦福發2019全球AI報告;音頻驅動面部重構;李世石不敵「韓豆」
    全球AI報告:中國論文數量超美國,但論文影響力低50%斯坦福聯合MIT、哈佛、OpenAI等院校和機構發布了"2019年度AI指數報告"。報告從AI的研究&發展、會議、技術性能、經濟、教育、自動系統、公眾認知、社會學原則、國家戰略和全球AI活力這九個方面分析了2019年AI發展情況。報告指出,中國學者發表的論文AI期刊和會議論文數量已在2006年超過美國,與歐洲數量相當。但在AI領域內論文引用的影響力上,美國比中國高50%。
  • 世界冠軍數李世石VS柯潔為14比7,聶衛平卻稱因這柯潔更厲害
    世界冠軍數李世石VS柯潔為14比7,聶衛平卻稱因這柯潔更厲害
  • 柯潔再負人機大戰 中盤被阿爾法狗贊「表現完美」
    柯潔執白,還是輸了。不過,他似乎實現了第一場賽後發布會中所說的「讓AlphaGo的主機稍微發燙一下」的心願,一度局面十分佔優,被AlphaGo評估為表現「完美」。棋局進行到後半盤時,因為在局部的劫爭轉換中受損較多,柯潔最終中盤投子認輸,與AlphaGo的三番棋比分也變成了0:2。
  • 「阿法狗」讓李世石感到震驚 柯潔:阿法狗贏不了我
    一開局就顯得驚心動魄,李世石執黑先行,第一手棋下在右上角小目,顯得不同尋常,而「阿爾法圍棋」一改人工智慧高速決策的作風,足足「思考」了1分半才在左上角三三落子。一度「阿法狗」處於領先位置,2小時後,李世石優勢逐漸開始明顯。進行到第3個小時,「阿法狗」後發制人,與李世石形成僵持局面,現場氣氛一度十分凝重。之後李世石出現明顯失誤。
  • 柯潔對戰阿爾法狗首局惜敗 柯潔"苦笑"回應:我盡了全力(圖)
    新華社記者 徐昱 攝  原標題:圍棋「人機大戰」首局柯潔惜敗   當今世界圍棋第一人柯潔九段23日下午在這裡執黑289手以四分之一子的微弱劣勢負於計算機圍棋程序「阿爾法圍棋」,在圍棋「人機大戰」三番棋中以0:1落後。   經過大約4個半小時的較量,柯潔遺憾惜敗,而四分之一子已經是在圍棋規則之下最小的差距。
  • AlphaGo戰勝了柯潔,又被誰打敗?不可思議的結果意味著什麼?
    谷歌AlphaGo在3:0完勝李世石後,又在2017年7月迎戰柯潔。這場世紀人機大戰被寄予厚望,結果柯潔遭遇三連敗,淚灑現場。AlphaGo一戰成名,也為人工智慧做了最好的宣傳。從此,人工智慧成為婦孺皆知的熱點話題。