被科學家們譽為「世界壯舉」的AlphaGo Zero, 對普通人來說意味著什麼?

2021-01-20 機器之能

從零開始,這是可以進行「自我學習」的 AlphaGo,也是邁向通用人工智慧的 AlphaGo。


來源 | 衛報、Quartz

整理 | 不定項 高靜宜

編輯 | 宇多田


10 月 19 日凌晨,谷歌人工智慧團隊 DeepMind 在《自然》雜誌上發表了一篇論文,描述了新一款圍棋程序 AlphaGo Zero 從最開始的「臭棋簍子」到業餘棋手,再成長為一個能夠考量每一步棋戰略意義的圍棋大師的過程,而這樣的飛躍僅花費了幾天的時間。


在最初的 10 個小時裡,AlphaGo Zero 發現了一個定式,不久之後,它又掌握了一些特定的棋法。三天後,在經過數百萬盤的自我對抗之後,它的棋藝可以超越人類積累數千年的水平,並以 100 比 0 的成績擊敗李世石版本的 AlphaGo。


AlphaGo Zero 以 100 比 0 的成績擊敗李世乭版本的 AlphaGo


有趣的是,程序在發現某些簡單的棋步之前就已經掌握了一些更為複雜的走法,例如人類棋手通常在早期就能掌握的戰術「徵」。


就是這樣一款程序,被很多圈內人譽為人工智慧領域的「重大進步」,因為輸入遊戲規則之後,它可以在沒有人幫助的情況下,從零開始掌握這門古老的棋盤遊戲。

 

舊版 AlphaGo 的訓練需要成千上萬份人類對弈的棋局數據,但 AlphaGo Zero 可以在沒有這些幫助下完成學習。初始階段,它會把棋子隨機地放在棋盤上,但發現獲勝策略後,它能迅速優化下棋的方式。

 

「它比以前的方法更強大,因為不再需要歷史的棋局數據。可以說,我們已經突破了人類認知的障礙,因為它本身能夠創造知識。」AlphaGo 的首席研究員 David Silver 說。

 

「AlphaGo Zero 發現了一些非常棒的下棋定式,然後超越這些定式並找到一些更加有力的方法。」DeepMind 的執行長 Demis Hassabis 表示,「你可以發現,它能重新發現人類幾千年來積累的知識。」


因此,沒有意外,這篇發表於 Nature 的論文在今天凌晨一公布,除了照例轟動技術圈,早在 5 月與 AlphaGo 交過手並惜敗的柯潔也發來了「感慨式賀電」:


而關心 AlphaGo Zero 的非技術宅與吃瓜網友們的畫風,基本都是這樣的:




也許現在,在看過機器之心純技術乾貨的解析之後,你會對科學家們對 AlphaGo Zero 的看法,以及 AlphaGo 在圍棋以外可以大展身手的領域與可能性更感興趣。


從零開始,這是可以進行「自我學習」的 「圍棋九段」AlphaGo


AlphaGo Zero 從零起步,在對弈中不斷學習逐漸變強


相比於 AlphaGo Zero,人類千百年前對圍棋的探索經驗,只是一個「局部最優解」。


AlphaGo Zero 程序的核心是一組神經元,這些神經元連接在一起組成了一個人工神經網絡。在棋局的每一回合中,神經網絡都會查看棋盤上棋子所處的位置,然後計算出棋子下一步可能移動的方向以及相應的獲勝概率。每盤棋局結束之後,神經網絡都會進行更新,從而在下一次對弈中具備更強大的實力。

 

「AlphaGo Zero 遠勝於此前的版本,不過它只是一個簡單地程序,能夠在訓練數據更少、計算力更小的情況下更快地掌控棋局。如果給它更多的時間,AlphaGo Zero 也可以自己學習圍棋規則」,Silver 這樣表示。

 

David Silver 描述 AlphaGo Zero 是怎樣學習下圍棋的


而謝菲爾德大學神經科學教授 Eleni Vasilaki 表示,這是一項激動人心的壯舉。「這可能意味著,在沒有人類專家參與訓練的情況下,AlphaGo 能夠發現一些絕妙的棋步,在這項比賽中超越人類智能。」不過她也指出,儘管計算機可以在圍棋比賽中擊敗人類,能夠實現複雜、精密的計算,但它們在其他任務中可能還並不具備與人類相匹敵的能力。


「在某些人類很容易就可以完成的任務中,人工智慧經常會失敗。」她說,「就看看那些類人機器人在日常任務中的表現吧,例如行走、跑步和擊球。」

 

卡內基梅隆大學計算機科學家 Tom Mitchell 把 AlphaGo Zero 形容為一項「傑出的工程成就」。他補充說:「它相當於終止了關於人類是否會在圍棋中戰勝計算機的探討。我猜答案是不會。但同時它也開啟了一個新的篇章,即計算機可以教授人類如何更好地進行對弈。」

 

這個想法受到美國圍棋協會主席 Andy Okun 的認可:「我不知道人們的士氣是否會受到計算機變強的影響,不過利用神經網絡軟體對圍棋進行探索也將會是一種樂趣。因為它並不是通過表層理解我們而獲得勝利的,而是發現了更加深層、內在的模式。」

 

讓歷史歸零,這是邁向通用人工智慧的 AlphaGo

 

AlphaGo Zero 讓人類圍棋的歷史經驗成為了「Zero」,標誌著人類向通用型的人工智慧邁出了重要一步。


「對我們來說,AlphaGo 的意義不僅限於圍棋對弈領域,這也是我們開發通用算法的重大進步。」DeepMind 的執行長 Demis Hassabis 說。

 

DeepMind 執行長 Demis Hassabis


《Nature 自然科研》評論稱,AlphaGo Zero 最大的突破是實現了白板理論。與嬰兒的學習模式類似,它可以通過不斷訓練、成長獲得知識和智力。這意味著,AlphaGo Zero 的學習模式也可以被應用解決其他現實問題。

 

從目前來看,大多數 AI 的應用著實「範圍有限」,因為它們只能執行一項特定的任務,比如翻譯語言或識別人臉。但在許多不同的任務中,通用人工智慧都有潛力比人類表現得更好。

 

不過,它也只能完成那些可以在計算機中完全模擬的問題,而駕駛汽車這類任務就超出了這一範圍。


「要得到能夠與人類能力相媲美的人工智慧,我們還有很長的路要走,」Hassabis 說,「在未來十年中,比較現實的是利用人工智慧幫助人類發現新藥物、材料以及破解粒子物理學中的奧秘。」

 

而現在,DeepMind 已經開啟了新的嘗試。


在倫敦,AlphaGo Zero 正在幫助科學家認識蛋白質摺疊,這也有可能給藥物研髮帶來新的進展。「藥物研發、量子化學、材料研發…應用在這些領域都是有可能的,或許我們還能研發出常溫的超導體。」Hassabis 說,「當我還是一個孩子的時候,在讀物理書的時候,就曾想像有一天能夠發現超導體,那是一個聖杯。」

 

不過,DeepMind 表示,新版 AlphaGo 不會像其他項目一樣公布代碼。外部人員可以參考發布在《自然雜誌》上的論文內容。

 

但是業內人士表示,AlphaGo Zero 的「思路」清晰簡潔,很有可能廣泛適用於其他領域。


OpenAI 的人工智慧研究科學家 Tim Salimans 對媒體表示,簡單的、通用的方法在人工智慧研究中具有很大的價值,因為通過細微的修改,它就可能解決其他問題。

 

「我認為,把它稱為『突破性進展』一點也不為過。」Salimans 說,「雖然不能直接應用到其他領域,但是,我們可以把它看到是解決其他問題的第一步。」



大公司:微軟、亞馬遜、阿里、百度、騰訊、英偉達、蘇寧、西門子、浪潮


創業公司:商湯科技、依圖科技、思必馳、竹間智能、三角獸、極限元、雲知聲、奇點機智、景馳科技、思嵐科技、追一科技、海知智能、出門問問、鋼鐵俠科技、體素科技、晶泰科技、波士頓動力


人物報導:吳恩達、陸奇、王永東、黃學東、任小楓、初敏、沈威、肖建雄


自動駕駛:傳統變革、Uber、圖森未來、速騰聚創、馭勢科技、全球汽車AI大會


應用場景:金融、醫療、法律、新零售、網絡安全


商業地理:加拿大、匹茲堡、瑞士


相關焦點

  • 被科學家譽為「世界壯舉」的AlphaGo Zero, 對普通人意味著什麼?
    就是這樣一款程序,被很多圈內人譽為人工智慧領域的「重大進步」,因為輸入遊戲規則之後,它可以在沒有人幫助的情況下,從零開始掌握這門古老的棋盤遊戲。舊版 AlphaGo 的訓練需要成千上萬份人類對弈的棋局數據,但 AlphaGo Zero 可以在沒有這些幫助下完成學習。
  • AlphaGo Zero「無師自通」背後的偉大與局限 | 曠視孫劍解讀
    10 月 20 日,曠視科技(Face++)首席科學家孫劍博士接受了多家媒體的群訪,同時對 AlphaGo Zero 的技術升級做了相關闡釋。「偉大」和「局限」是這次群訪的關鍵詞。在孫劍看來,AlphaGo Zero 的技術提升足夠偉大,但在技術轉換落地過程中卻有著眾多局限。
  • AlphaGo Zero用40天成為世界最強圍棋AI
    棋士柯潔:一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了為了打敗人類圍棋世界冠軍,科學家在訓練上一款AlphaGo時,同時用到了監督式學習(基於上百萬種人類專業選手的下棋步驟)和基於自我對弈的強化學習。那款AlphaGo的訓練過程長達幾個月,用到多臺機器和48個TPU(神經網絡訓練所需的專業晶片)。
  • 從「腦機接口」到「金剛狼的皮膚」,7位科學家的科幻之旅
    而身為「藍點」上的主宰,我們正以前所未有的速度邁向未來科幻世界。11月7日,在這顆「藍點」上,騰訊科學WE大會正式舉行。2020,在全球疫情持續的嚴峻形勢下,人們難以跨國面對面交流。但是來自4洲6國的七位全球頂尖科學家,依然突破阻隔,登上騰訊設在全球多個國家的線下演講舞臺,用各自領域內最前沿的科技突破,向「藍點」致敬。
  • 他們可能走在了製造「超級人類」的路上
    那時,漢克斯·伯格可能還沒有意識到,基於他的發現,幾十年後,世界各地的頂級實驗室會探索一種叫「腦機接口」的東西。普特南曾提出過一個名為「缸中之腦」的假想:如果將大腦浸泡在一個充滿營養液的缸裡,將腦的神經末梢連接在計算機上,這臺計算機不斷向大腦發送信息,包括「感覺」這樣的信息,那麼大腦就會認為自己活在真實的世界裡。《理性,真理與歷史》一書中希拉蕊.
  • 如果科學家證實了靈魂的存在,對人類來說意味著什麼?長知識了
    那麼,如果有一天,人們利用現在的科學證明了靈魂是存在的,那麼這對於人類來說意味著什麼呢?首先從哲學角度來說,證明了靈魂的存在,也許有人就對靈魂的去處有了更深的嚮往。人們理解現在世界的角度將會多出一個,也就是另外世界的角度。而這將會重新塑造人的世界觀、價值觀。對於生在世上很痛苦的人來說,將會多一個去處的選擇,生命因此變得脆弱,很多人也許會因此變得不珍惜生命。
  • 別傻了,「Master」是不是AlphaGo根本就不重要
    作者:這兩天,一位神秘高手在圍棋界掀起了「腥風血雨」。從 2016 年 12 月 29 日晚起,一個註冊為「Master」、標註為韓國九段的「網絡棋手」接連在目前最大的兩個網絡圍棋平臺「弈城網」和「野狐網」上挑戰各大高手。至昨天晚間,迫使有「當今圍棋第一人」之稱的柯潔中盤投子後,Master 已經斬獲了 50 連勝,擊敗 15 位世界冠軍。
  • 《寶可夢 劍/盾》被異世界的生物們「入侵」了?
    在遊戲上線不到3 個月的時間裡,《寶可夢》官方宣布將會推出《寶可夢 劍/盾》的全新擴充票內容:「鎧之孤島」以及「冠之雪原」。而據影像內容介紹,這次將會更新加入超過 200 只以往的寶可夢,售價約 174 元,前者預計將於 6 月末推出,後者則預計將在今年秋季推出。「GameFreak 又來騙錢了?」
  • DeepMind 推出 AlphaGo 圍棋教學工具,圍棋學習新紀元來啦?
    除了官網上的簡單介紹,作為 DeepMind 圍棋大使、AlphaGo 的「教練」,樊麾也在其個人微博上宣布「AlphaGo 教學工具終於上線。」他表示,教學工具共有兩萬多個變化,三十七萬多步棋組成,通過 AlphaGo 的視角,分析並建議圍棋開局的諸多下法。
  • 沈向洋離職微軟,意味著什麼?
    來源:愛範兒 作者:吳啟森「離開微軟是我一生中最艱難的決定」,沈向洋如此說到。▲ 沈向洋 圖片來自:GeekWire的確,任誰來說,離開一家自己工作了 23 年的公司,且是唯一一家工作過的公司,都是一件令人輾轉反側的事情。
  • 在「古板遲緩」的晶片產業,一群「寒武紀」們誕生的意義與挑戰
    從幫你對手機相冊裡的自拍與萌寵進行識別分類,再到大幅度提高 Alexa 們(智能助手)與無人駕駛汽車的「平均智商」,「深度學習」這個人工智慧裡的門類,具備了更高級的對「複雜結構」進行自動挖掘的能力。通俗來說,與傳統計算通過固定流程解決「確定」問題不同,深度學習算法需要模擬人腦來解決那些取決於概率的「不確定問題」。
  • 永恆曾經存在,宇宙「大霹靂」後,我們卻被時間局限
    這個點,我個人把它稱為原爆點(ground zero)或零點(zero point)。聰明的科學家,當然會想問──那麼,在這個點之前,是什麼?也就自然得到一個不可思議的答案──在這個點之前,什麼都沒有。這個答案,你可能認為太哲學了。讓我反過來,用數理的方式表達。
  • 那些影響「安防新十年」的世界級科學家們
    (原計劃6月20日開幕,疫情原因延期召開)一名科學家開山立派,最顯著的標誌就是世界級的重大研究方向,能夠與該學者劃上等號,如相對論之於愛因斯坦,神經網絡之於Geoffrey Hinton。安防領域的這些研究方向是什麼?代表人物是誰?沒有人知道標準答案。上一個十年的安防技術創新,混沌、碎片、野蠻生長。
  • 我們已經進入了一個「技術超越神話」的時代
    比如說,20世紀40年代,人類將量子力學運用於固體、晶體之上找到了什麼是導體、什麼是絕緣體的解釋。對導體、絕緣體的解釋,又讓人們引入了一個非常重要的概念——半導體。有了半導體工程,才有了如今發達的信息社會,這些都是量子力學對普通人最重要的貢獻。
  • 它的出現意味著什麼?
    人們在宇宙中發現類似「奧陌陌」的物體,究竟又表明了什麼?今天,就讓我們一起去探索這些謎團。它就是神秘的「奧陌陌」。但大多數科學家認為,引起「奧陌陌」運動變化的原因,很可能只是某種自然現象。一些人通過「谷歌星空」,發現了一個看起來很像「奧陌陌」的東西。這些神秘的星際物體,散布在我們的太陽系中,而這一個是在獵戶座附近發現的。但我們對這個神秘的物體是什麼,還沒有更進一步的了解。
  • 給每一個普通人安利這部9.2分的「成人動畫」
    利用權威,讓員工每天給自己整理桌子,還說什麼「因為你是女人所以要給我端茶送水」。不管別人提出什麼要求,她都會說「Yes」。她就是就是那種「不顧一切,想達成別人期望」的女孩,太在乎別人的看法。「996」「5+2」「白加黑」,咱離社畜之國也不遠了。就是這樣過著「社畜」生活的烈子,有一天隨份子隨出去了 3 萬日元(大概人民幣 1700)。
  • 揭秘《球狀閃電》中的「黑森威懾」與「降維攻擊」
    比如,「球狀閃電」本身,這個概念用在了第一位面壁人泰勒的計劃中——用球狀閃電攻擊人類艦隊,從而創造出一支量子幽靈艦隊。而在《球狀閃電》的高潮部分中,我們還可以看到「黑森威懾」和「降維攻擊」的影子。中方研製出了能夠摧毀電子晶片的宏聚變武器,林雲的強行實驗摧毀了全國三分之一的電子晶片,這也意味著三分之一的國土失去了國防。這似乎是給原本戰局不利的中方雪上加霜,但是當真相對外界披露時,全世界都被驚呆,尤其是發達國家幾乎被嚇到脫水。這是為何?因為中方只要再引爆少量的這類宏聚變武器,就能摧毀全世界的電子晶片,這也就意味著把地球這塊大硬碟格式化,全世界瞬間被拉回到農業時代。
  • 變態「三角戀」?世界知識、大腦和計算是AGI的新「三駕馬車」
    【新智元導讀】「冰鎮椅子」和「彩虹蕉」見過沒?反正神經網絡要淚奔了。近年來,吃數據的人工智慧狹隘性日益凸顯,而來自舊金山的科學家們,認為智能來源於歸納偏差,他們試圖通過已知的世界屬性、大腦的物理結構和算法來構建一種新的世界模型。看到下面這個場景,你會想到啥?
  • 「我非常意外,簡直驚呆了!」科學家發現金星或存有生命
    今年9月14日,英國的卡迪夫大學的天文學教授格裡夫斯和其團隊在《自然天文學》上發表的一篇論文指出,在金星強酸性的雲層中探測到磷化氫,這種氣體被認為是一種潛在的「生命跡象」近期,科學家們發表論文表示,在金星的雲層中發現了磷化氫(phosphine,分子式為PH 3)的蹤跡,並證實它的存在。
  • 「基因剪刀」發明者獲得諾貝爾化學獎,華裔科學家張鋒無緣該獎項
    回到兩位獲獎科學家身上, 卡彭蒂耶是一名知名微生物學家,現在就職於德國柏林馬克斯・普朗克的病原學研究室,杜德納則是美國生物學家,在加州大學伯克利分校擔任化學和分子生物學與細胞生物學教授。可以說,卡彭蒂耶就是科學家中的「灰姑娘」。