被科學家們譽為「世界壯舉」的AlphaGo Zero, 對普通人來說意味著什麼?

2021-02-15 機器之能

從零開始,這是可以進行「自我學習」的 AlphaGo,也是邁向通用人工智慧的 AlphaGo。

來源 | 衛報、Quartz

整理 | 不定項 高靜宜

編輯 | 宇多田

10 月 19 日凌晨,谷歌人工智慧團隊 DeepMind 在《自然》雜誌上發表了一篇論文,描述了新一款圍棋程序 AlphaGo Zero 從最開始的「臭棋簍子」到業餘棋手,再成長為一個能夠考量每一步棋戰略意義的圍棋大師的過程,而這樣的飛躍僅花費了幾天的時間。

在最初的 10 個小時裡,AlphaGo Zero 發現了一個定式,不久之後,它又掌握了一些特定的棋法。三天後,在經過數百萬盤的自我對抗之後,它的棋藝可以超越人類積累數千年的水平,並以 100 比 0 的成績擊敗李世石版本的 AlphaGo。

AlphaGo Zero 以 100 比 0 的成績擊敗李世乭版本的 AlphaGo

有趣的是,程序在發現某些簡單的棋步之前就已經掌握了一些更為複雜的走法,例如人類棋手通常在早期就能掌握的戰術「徵」。

就是這樣一款程序,被很多圈內人譽為人工智慧領域的「重大進步」,因為輸入遊戲規則之後,它可以在沒有人幫助的情況下,從零開始掌握這門古老的棋盤遊戲。

 

舊版 AlphaGo 的訓練需要成千上萬份人類對弈的棋局數據,但 AlphaGo Zero 可以在沒有這些幫助下完成學習。初始階段,它會把棋子隨機地放在棋盤上,但發現獲勝策略後,它能迅速優化下棋的方式。

 

「它比以前的方法更強大,因為不再需要歷史的棋局數據。可以說,我們已經突破了人類認知的障礙,因為它本身能夠創造知識。」AlphaGo 的首席研究員 David Silver 說。

 

「AlphaGo Zero 發現了一些非常棒的下棋定式,然後超越這些定式並找到一些更加有力的方法。」DeepMind 的執行長 Demis Hassabis 表示,「你可以發現,它能重新發現人類幾千年來積累的知識。」

因此,沒有意外,這篇發表於 Nature 的論文在今天凌晨一公布,除了照例轟動技術圈,早在 5 月與 AlphaGo 交過手並惜敗的柯潔也發來了「感慨式賀電」:

而關心 AlphaGo Zero 的非技術宅與吃瓜網友們的畫風,基本都是這樣的:


也許現在,在看過機器之心純技術乾貨的解析之後,你會對科學家們對 AlphaGo Zero 的看法,以及 AlphaGo 在圍棋以外可以大展身手的領域與可能性更感興趣。

從零開始,這是可以進行「自我學習」的 「圍棋九段」AlphaGo


AlphaGo Zero 從零起步,在對弈中不斷學習逐漸變強

相比於 AlphaGo Zero,人類千百年前對圍棋的探索經驗,只是一個「局部最優解」。

AlphaGo Zero 程序的核心是一組神經元,這些神經元連接在一起組成了一個人工神經網絡。在棋局的每一回合中,神經網絡都會查看棋盤上棋子所處的位置,然後計算出棋子下一步可能移動的方向以及相應的獲勝概率。每盤棋局結束之後,神經網絡都會進行更新,從而在下一次對弈中具備更強大的實力。

 

「AlphaGo Zero 遠勝於此前的版本,不過它只是一個簡單地程序,能夠在訓練數據更少、計算力更小的情況下更快地掌控棋局。如果給它更多的時間,AlphaGo Zero 也可以自己學習圍棋規則」,Silver 這樣表示。

 

David Silver 描述 AlphaGo Zero 是怎樣學習下圍棋的

而謝菲爾德大學神經科學教授 Eleni Vasilaki 表示,這是一項激動人心的壯舉。「這可能意味著,在沒有人類專家參與訓練的情況下,AlphaGo 能夠發現一些絕妙的棋步,在這項比賽中超越人類智能。」不過她也指出,儘管計算機可以在圍棋比賽中擊敗人類,能夠實現複雜、精密的計算,但它們在其他任務中可能還並不具備與人類相匹敵的能力。

「在某些人類很容易就可以完成的任務中,人工智慧經常會失敗。」她說,「就看看那些類人機器人在日常任務中的表現吧,例如行走、跑步和擊球。」

 

卡內基梅隆大學計算機科學家 Tom Mitchell 把 AlphaGo Zero 形容為一項「傑出的工程成就」。他補充說:「它相當於終止了關於人類是否會在圍棋中戰勝計算機的探討。我猜答案是不會。但同時它也開啟了一個新的篇章,即計算機可以教授人類如何更好地進行對弈。」

 

這個想法受到美國圍棋協會主席 Andy Okun 的認可:「我不知道人們的士氣是否會受到計算機變強的影響,不過利用神經網絡軟體對圍棋進行探索也將會是一種樂趣。因為它並不是通過表層理解我們而獲得勝利的,而是發現了更加深層、內在的模式。」

 

讓歷史歸零,這是邁向通用人工智慧的 AlphaGo

 

AlphaGo Zero 讓人類圍棋的歷史經驗成為了「Zero」,標誌著人類向通用型的人工智慧邁出了重要一步。

「對我們來說,AlphaGo 的意義不僅限於圍棋對弈領域,這也是我們開發通用算法的重大進步。」DeepMind 的執行長 Demis Hassabis 說。

 

DeepMind 執行長 Demis Hassabis

《Nature 自然科研》評論稱,AlphaGo Zero 最大的突破是實現了白板理論。與嬰兒的學習模式類似,它可以通過不斷訓練、成長獲得知識和智力。這意味著,AlphaGo Zero 的學習模式也可以被應用解決其他現實問題。

 

從目前來看,大多數 AI 的應用著實「範圍有限」,因為它們只能執行一項特定的任務,比如翻譯語言或識別人臉。但在許多不同的任務中,通用人工智慧都有潛力比人類表現得更好。

 

不過,它也只能完成那些可以在計算機中完全模擬的問題,而駕駛汽車這類任務就超出了這一範圍。

「要得到能夠與人類能力相媲美的人工智慧,我們還有很長的路要走,」Hassabis 說,「在未來十年中,比較現實的是利用人工智慧幫助人類發現新藥物、材料以及破解粒子物理學中的奧秘。」

 

而現在,DeepMind 已經開啟了新的嘗試。

在倫敦,AlphaGo Zero 正在幫助科學家認識蛋白質摺疊,這也有可能給藥物研髮帶來新的進展。「藥物研發、量子化學、材料研發…應用在這些領域都是有可能的,或許我們還能研發出常溫的超導體。」Hassabis 說,「當我還是一個孩子的時候,在讀物理書的時候,就曾想像有一天能夠發現超導體,那是一個聖杯。」

 

不過,DeepMind 表示,新版 AlphaGo 不會像其他項目一樣公布代碼。外部人員可以參考發布在《自然雜誌》上的論文內容。

 

但是業內人士表示,AlphaGo Zero 的「思路」清晰簡潔,很有可能廣泛適用於其他領域。

OpenAI 的人工智慧研究科學家 Tim Salimans 對媒體表示,簡單的、通用的方法在人工智慧研究中具有很大的價值,因為通過細微的修改,它就可能解決其他問題。

 

「我認為,把它稱為『突破性進展』一點也不為過。」Salimans 說,「雖然不能直接應用到其他領域,但是,我們可以把它看到是解決其他問題的第一步。」

大公司:微軟、亞馬遜、阿里、百度、騰訊、英偉達、蘇寧、西門子、浪潮

創業公司:商湯科技、依圖科技、思必馳、竹間智能、三角獸、極限元、雲知聲、奇點機智、景馳科技、思嵐科技、追一科技、海知智能、出門問問、鋼鐵俠科技、體素科技、晶泰科技、波士頓動力

人物報導:吳恩達、陸奇、王永東、黃學東、任小楓、初敏、沈威、肖建雄

自動駕駛:傳統變革、Uber、圖森未來、速騰聚創、馭勢科技、全球汽車AI大會

應用場景:金融、醫療、法律、新零售、網絡安全

商業地理:加拿大、匹茲堡、瑞士

相關焦點

  • AlphaGo若打敗世界冠軍,意味著什麼?
    意味著機器可以思考了嗎?還有什麼問題是機器無法超越人類的?以下為在知乎就「AlphaGo能戰勝李世石嗎?」的提問回答的原文:先直接回答這個問題,下面再分析AlphaGo和人工智慧的未來。我認為AlphaGo這次的比賽打敗李世石比較懸,但是1-2年之內必然完勝人類。
  • 無需人類知識,DeepMind新一代圍棋程序AlphaGo Zero再次登上Nature
    DeepMind 創始人哈薩比斯表示:「Zero 是迄今為止最強大,最具效率,最有通用性的 AlphaGo 版本——我們將見證這項技術很快應用到其他領域當中。」人工智慧研究已經在多個領域取得飛速進展,從語音識別、圖像分類到基因組學和藥物研發。在很多情況下,這些是利用大量人類專業知識和數據的專家系統。但是,人類知識成本太高,未必可靠,或者只是很難獲取。
  • AlphaGo Zero用40天成為世界最強圍棋AI
    棋士柯潔:一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了為了打敗人類圍棋世界冠軍,科學家在訓練上一款AlphaGo時,同時用到了監督式學習(基於上百萬種人類專業選手的下棋步驟)和基於自我對弈的強化學習。那款AlphaGo的訓練過程長達幾個月,用到多臺機器和48個TPU(神經網絡訓練所需的專業晶片)。
  • Breaking 2到底想說什麼?「2小時」對你來說意味著什麼?
    兩小時,對於外賣員來說,可以送4份外賣,他們的每一分鐘都在與時間賽跑。兩小時,對於快遞員來說,可以完成整個管片快件的收件,可以完成上百件快件的打包。兩小時,對於醫生來說,可以完成一臺手術,可以完成對幾名患者的會診。
  • 3D 音效對次世代遊戲來說意味著什麼?
    目前,大多數遊戲的音效系統會讓聲音以「圓圈」的模式分布在玩家周四周。你可以聽到聲音是從前還是從後、從左還是從右傳來。而環繞聲系統,例如7.1聲道這樣的技術可以增強這種聲音來自周遭的感覺。3D音效則是將聲源(可能高達數百個)放置在一個「球形」的空間中,能夠精準地傳遞出聲音的方向,高度和距離。
  • 賞櫻花對日本人來說意味著什麼?
    平時那麼守規矩,對秩序充滿服從性的日本人,到了賞櫻現場之後反而不太願意跟平時一樣守規矩和搞秩序,酒瓶、小吃等也擺放得亂一些,這樣才有脫離現實世界的感覺和味道。若是跟平時一樣,那就不叫賞櫻了。每年三、四月份,是日本櫻花盛開的季節櫻花是日本的國花。
  • 章瑩穎事件中的「暗網」,到底是個怎樣的世界?
    他在主題為綁架入門(Abduction 101)的論壇中瀏覽過「完美的綁架幻想」「如何進行綁架」等話題。於是很多人懷疑因為有這樣的網站存在,才引發了悲劇。但暗網到底是什麼?和我們接觸的那些影視劇中的概念有什麼區別?為什麼提到暗網就會引發人們的厭惡和恐慌?它會一直存在下去嗎?這些你可能關心的問題,也正是本文想要討論的內容。
  • 寶格麗鑽戒一般多少錢,寶格麗b.zero130分鑽戒大概什麼價格
    鑽戒對於我們來說意味著什麼?我們不是經常行走於紅地毯的明星,也不是經常舉辦派對的時尚名媛,鑽戒對於我們普通人而言,代表的是愛情,代表是信仰。我們之所以出入珠寶專櫃,去選擇適合我們的鑽戒,那一定是要訂婚或者要結婚了。所以量力而行選好心儀的鑽戒才是王道。
  • 他們可能走在了製造「超級人類」的路上
    那時,漢克斯·伯格可能還沒有意識到,基於他的發現,幾十年後,世界各地的頂級實驗室會探索一種叫「腦機接口」的東西。普特南曾提出過一個名為「缸中之腦」的假想:如果將大腦浸泡在一個充滿營養液的缸裡,將腦的神經末梢連接在計算機上,這臺計算機不斷向大腦發送信息,包括「感覺」這樣的信息,那麼大腦就會認為自己活在真實的世界裡。《理性,真理與歷史》一書中希拉蕊.
  • 【翻譯】一位職業棋手眼中的AlphaGo的實力
    原文網址:http://kansaikiin.jp/alphago/作者:關西棋院棋士,勝間史朗 七段序言由谷歌開發的圍棋AI「AlphaGo」,擊敗了圍棋的頂尖棋手李世石,這新聞轟動了世界。AlphaGo它是怎麼進行思考的。
  • AlphaGo已下線,AlphaGo Zero從0-1不帶人類尬棋了!
    去年,有個小孩讀遍人世所有的棋譜,辛勤打譜,苦思冥想,棋藝精進,4-1打敗世界冠軍李世石,從此人間無敵手。他的名字叫阿法狗(AlphaGo)。AlphaGo下線了! 而面對阿法元的出現,柯潔回應稱:「一個純淨、純粹自我學習的alphago是最強的…對於alphago的自我進步來講…人類太多餘了。」
  • 柯潔與alphago的三局,棋盤上到底都發生了什麼
    文 | 春光炸裂我作為圍棋國家二級運動員,儘量講清楚柯潔與alphago的三局,棋盤上到底都發生了什麼。
  • 【方言文化】那些汾陽之外的「汾陽」們
    點擊藍色字「汾陽方言」↗️️關注公眾號,解開汾陽話奧秘汾,對於多數外省人來說是個生僻字,因為這個字的起源和唯一含義就是「汾水」這條河流,故而幾乎只在山西的地名裡出現。外地人見到這個字多數會讀半邊,把二聲的 fén 讀成一聲的 fēn,實際上是錯誤的讀音。汾:水。出太原晉陽山,西南入河。從水分聲。
  • 柯潔與Alphago的三局人機大戰,棋盤上到底都發生了什麼?
    本文來源 | 微博:春光乍裂作為圍棋國家二級運動員,儘量講清楚柯潔與alphago的三局,棋盤上到底都發生了什麼。從結果上看,第一局差距最小。但這種差距,有alphago精心控制的因素。何止我,棋局現場的主講人,有「人間阿爾法」之稱的周睿羊九段、坐擁八個世界冠軍的古力九段,也直呼棋局:太複雜了。此時的柯潔,正如祁同偉「勝天半子」的故事,在攀登天人極限的途上,一路把棋局帶入高聳入雲的絕對境地。而當時的直播,柯潔捂住了心臟,誰都不敢輕易解讀這個動作的意義。不敢高聲語,恐驚天上人。
  • 我們已經進入了一個「技術超越神話」的時代
    比如說,20世紀40年代,人類將量子力學運用於固體、晶體之上找到了什麼是導體、什麼是絕緣體的解釋。對導體、絕緣體的解釋,又讓人們引入了一個非常重要的概念——半導體。有了半導體工程,才有了如今發達的信息社會,這些都是量子力學對普通人最重要的貢獻。
  • alphago 50盤自戰棋譜的簡單解讀
    2、在alphago眼裡,外勢沒有人類感覺的那麼重要。我們知道alphago比較喜歡點33,而一般職業棋手認為開局不久點33是虧的,因為對手的棋可以輕鬆拿到厚勢。 但從alphago而言,至少認為這樣做雙方是均勢的。典型如第21局棋譜,一上來就形成了白棋撈實地而黑棋佔大場的格局,從傳統人類的觀點來說,開局白棋有太多子下在二三線,肯定是虧透了。
  • 普通人也可以突圍,只要活成「刀鋒」
    我以前看佛經說,修行路上要「勇猛精進」,還不太理解為什麼要用「勇猛」這麼烈的詞。 後來我發現這個詞太精準了,人這輩子想要成材,明裡暗裡的困難太多了,沒點猛勁真不成。 「刀鋒」是@內環幕僚長 提出的概念,這是我最近常看的一個博主,蠻有料。
  • 「量子」的世界總有一些很獨特的性質,實在是難以讓人理解
    「量子」的世界似乎總是如此不可理喻,其中最有名的就要當屬——「擼小貓的思想實驗」。,這畢竟只是一個思想實驗,薛丁格可不是什麼虐貓狂魔。  當初薛丁格提出這個實驗的目的,就是因為他和愛因斯坦一樣,都是頑固的「量子力學」古典派分子,他們都認為世界是確定的,如果世界看起來不確定,那一定是因為我們對這個世界還不夠了解。薛丁格說,一隻貓是不可能處於「生或者死的疊加狀態」的,所以「量子力學」還不夠完備,還需要接著研究。
  • 看乘風破浪的「老姐姐」們,在帆船上環遊世界
    她們需要的不過是更多被看到被理解,有能證明「我可以」的機會。「姐學」的博大精深,絕不僅僅在娛樂圈裡。姐姐們真正「乘風破浪」的時候,21世紀都還沒到來呢——1989-1990年,英國姑娘特蕾西·愛德華茲召集組建世界上第一支專業全女子帆船賽隊,在頂級環球帆船賽事中成功完賽,證明「女人也能行」。
  • 「暗物質」——一個必須存在,卻又找不到的物質
    可能對於古人們來說我們知道的已經足夠多了,可是人類對茫茫宇宙總是陷入這樣的怪圈——本以為發現得越多就會對這個世界多了一份了解,可是結果總是知道得越多就發現自己更加的無知,就有更多的地方值得去探索。圖解:「暗物質」模擬圖人類是如何發現暗物質的?