人工智慧裡程碑:新AlphaGo Zero橫空出世,徹底擺脫人類

2021-01-18 華爾街見聞

摘要:谷歌人工智慧團隊DeepMind宣布,新版AlphaGo——AlphaGo Zero可以只在了解比賽的規則,且沒有人類指導的情況下自我學習。短短3天,AlphaGo Zero就完勝曾擊敗世界冠軍李世石的AlphaGo。

打敗目前人類圍棋最高水平選手才過去不久,DeepMind團隊又宣布了一個在AI歷史上具有裡程碑式意義的重磅消息:新版AlphaGo可以徹底擺脫人類的知識。

10月18日,谷歌人工智慧團隊DeepMind團隊在期刊《Nature》上發表論文,宣布新版AlphaGo——AlphaGo Zero可以在沒有人類指導的情況下學習。

我們在這裡介紹一種僅基於強化學習(reinforcement learning)的算法,沒有超越遊戲規則的人類數據、指導或領域知識。

也就是說,AlphaGo Zero就像人類初學者一樣,只是了解比賽的規則和比賽的最終目標來自我學習。而作為首個擊敗人類圍棋冠軍的程序,之前版本的AlphaGo是通過分析人類圍棋高手的數千棋局來學習,並在自我對弈中不斷強化。

AlphaGo Zero學到的圍棋知識(圖片來源:DeepMind 論文)

此次的亮點在於,AlphaGo Zero無需人類指導就能讓自己成為自己的老師,並且訓練的時間更短。

短短3天時間,AlphaGo Zero不但從頭開始學習了圍棋,並且擊敗了先前版本的AlphaGo。在與擊敗世界冠軍李世石的AlphaGo對弈中,AlphaGo Zero以100:0的比分完勝。

AlphaGo Zero在擊敗AlphaGo Lee之前,進行了了490萬次自我對弈;而AlphaGo Lee的訓練時間則是數月。

團隊甚至表示,僅僅40天後,AlphaGo Zero已經可以在與最先進版本的AlphaGo對弈中獲得90%的勝率了。

AlphaGo Zero和先前版本AlphaGo的表現比較(圖片來源:DeepMind 論文)

此次AlphaGo Zero的出現不僅僅意味著圍棋上的成功,還意味著距離通過創建通用算法來解決科學中的難題又進了一步。

目前深度學習需要大量數據,而數據的獲得成本高昂且難度十分大,有了這項技術後,人類今後將有可能解決更大的挑戰,給人類生活帶來根本性的變化。

DeepMind執行長Demis Hassabis承認,以運用這個技術解決實際生活中的許多問題。範圍可以包括預測蛋白質分子的形狀,這也是新藥研發過重的重要一環;還可以設計新材料和進行氣候建模。

相關焦點

  • 柯潔回應新版本AlphaGo問世:人類太多餘了
    對此,柯潔回應稱:「一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了。」哈薩比斯與學習大量人類棋譜起步的前代AlphaGo不同,AlphaGo Zero是從「嬰兒般的白紙」開始,通過3天數百萬盤自我對弈,走完了人類千年的圍棋歷史,並探索出了不少橫空出世的招法。
  • 阿爾法狗再進化AlphaGo Zero橫空出世 無師自學40天就可打敗柯潔
    阿爾法狗再進化AlphaGo Zero橫空出世 無師自學40天就可打敗柯潔  Evelyn Zhang • 2017-10
  • 谷歌團隊發布AlphaGo Zero:柯潔稱人類太多餘了
    谷歌團隊發布AlphaGo Zero:柯潔稱人類太多餘了(圖片來自於推特)在這款軟體發出之後,柯潔也對這款軟體發表了自己的看法,他認為:「一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了。」之所以柯潔會這樣說,主要是因為AlphaGo Zero的練習主要是通過自我對弈在三十天之內發展起來的。
  • AlphaGo Zero完全自學吊打老狗,人類數據沒用了?
    在阿爾法元之前,阿爾法狗家族幾次戰勝人類圍棋冠軍,都是從利用人類經驗開始的。他們的勝利建立在計算機海量學習人類棋譜的基礎之上,阿爾法狗再通過強化學習的監督學習進行幾個月的自我訓練。而阿爾法元則完全擺脫人類先驗經驗,除規則外,完全不藉助人類數據,從第一場遊戲開始,自我學習。
  • AlphaGo將應用於谷歌翻譯 炒股機器人橫空出世
    日前,關於人工智慧有兩條新聞值得關注,一是谷歌宣布將把AlphaGo技術應用於谷歌翻譯,二是中國一家證券公司開發的A股機器人,經過三個月的時間,以24.06%(年化96%)的累計收益率戰勝了98%的用戶,炒股機器人橫空出世……  AlphaGo將應用於谷歌翻譯
  • AlphaGo Zero用40天成為世界最強圍棋AI
    棋士柯潔:一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了李喆:完全拋開人類圍棋知識,去年論文裡提到的許多特徵和rollout全部去掉,兩個神經網絡合為一個,只給定棋盤、棋子和規則。
  • AlphaGo Zero橫空出世,人機圍棋大戰正式收官:以後不會再有這樣的...
    17年10月19日,DeepMind今天發布新版本AlphaGo程序,經過三天的訓練,該系統能夠擊敗AlphaGo Lee,後者是去年擊敗了韓國選手李世石,勝率是100比0。經過大約40天的訓練後,AlphaGo Zero完勝AlphaGo Master。在今天的新聞中,我們注意到,DeepMind這篇最新的Nature,名字簡單直接:《不使用人類知識掌握圍棋》。
  • 打敗李世石的AlphaGo,被弟弟AlphaGo Zero打敗了,成績是0-100
    人工智慧的一項重要目標,是在沒有任何先驗知識的前提下,通過完全的自學,在極具挑戰的領域,達到超人的境地。去年,阿法狗(AlphaGo)代表人工智慧在圍棋領域首次戰勝了人類的世界冠軍,但其棋藝的精進,是建立在計算機通過海量的歷史棋譜學習參悟人類棋藝的基礎之上,進而自我訓練,實現超越。
  • AlphaGo Zero橫空出世,從零學習造恐怖記錄【附83盤棋譜】
    該論文稱,在數百萬局自我對弈後,隨著程序訓練的進行,AlphaGo Zero獨立發現了人類用幾千年才總結出來的圍棋規則,還建立了新的戰略,為這個古老的遊戲帶來新見解。        AlphaGo Lee是AlphaGo Zero的「前輩」。
  • 打敗李世乭的AlphaGo,被弟弟AlphaGo Zero打敗了,成績是0-100-虎嗅網
    人工智慧的一項重要目標,是在沒有任何先驗知識的前提下,通過完全的自學,在極具挑戰的領域,達到超人的境地。去年,阿法狗(AlphaGo)代表人工智慧在圍棋領域首次戰勝了人類的世界冠軍,但其棋藝的精進,是建立在計算機通過海量的歷史棋譜學習參悟人類棋藝的基礎之上,進而自我訓練,實現超越。
  • 能贏AlphaGo的只有它自己 柯潔回應新版問世:人類太多餘了
    谷歌人工智慧團隊DeepMind團隊在國際學術期刊《自然》(Nature)上發表論文,宣布新版AlphaGo——AlphaGo Zero可以在沒有人類指導的情況下學習,其水平超過此前所有AlphaGo(阿爾法狗)。
  • 關於「AlphaGo zero擊敗AlphaGo」的改寫題|18北師大新傳專碩真題
    《自然》雜誌也在社交平臺上表示,隨著程序訓練的進行,AlphaGo Zero獨立發現了人類用幾千年才總結出來的圍棋規律,還建立了新的戰略,為這個古老的遊戲帶來新見解。在此報導裡,最觸動人的點在於,AlphaGo已經打敗了人類世界冠軍,但它還是需要人類的輔助進行圍棋學習,並未完全打破人類的神話。但新研發的AlphaGo Zero完全跳脫了人類的教學輔助,自學成才,甚至打敗了AlphaGo,這更令人感到恐慌。
  • 【話題】AlphaGo Zero!圍棋之神真來了……
    與阿爾法狗不同,阿爾法元不再學習人類棋譜,而是在掌握基本規則後,通過左右互博,僅僅40天時間,即成為碾壓Master的人工智慧。美國的兩位棋手在《自然》雜誌對阿爾法元的棋局做了點評:它的開局和收關與職業棋手的下法並無區別,這說明,人類在圍棋上幾千年的智慧結晶,看起來並非全錯,阿爾法元的中盤看起來則非常詭異,著法比阿爾法狗左右互搏時使出的怪招更加不可思議。
  • zero 絕藝解說alphago - CSDN
    李昕教授長期專注於製造業大數據研究,他認為,這個研究最有意義的一點在於,證明了人工智慧在某些領域,也許可以擺脫對人類經驗和輔助的依賴。「人工智慧的一大難點就是,需要大量人力對數據樣本進行標註,而阿爾法元則證明,人工智慧可以通過『無監督數據(unsupervised data)』,也就是人類未標註的數據,來解決問題。」
  • 人工智慧從0到1:阿法零AlphaGo Zero無師自通100-0完爆阿法狗AlphaGo
    深度神經網絡強大的特徵提取能力以及尋找更優解的能力,擺脫對人類經驗和輔助的依賴,從應用角度,以後可能不再需要耗費人工去為AI的產品做大量的前期準備工作,類似的深度強化學習算法或許能更容易地被廣泛應用到其他人類缺乏了解或是缺乏大量標註數據的領域——無監督學習未來之路,這也許是阿法零的最偉大的創新(novelty),搞不好會誕生一個圖靈獎。
  • AlphaGo Zero問世 柯潔說人類多餘了
    曾有科學家預言,在未來一百年或者一千年以後,毀滅地球的不是外星人,而是人工智慧13年前,威爾史密斯主演的科幻電影《我,機器人》,就是對這一觀點的最好詮釋。人工智慧由人類所創造,在諸多方面要比人類更具優勢,是否他們會取代人類,成為主宰地球的下一代統治者?這一預想似乎要比2012瑪雅預言的世界末日,聽上去靠譜的多。
  • 阿爾法狗0-100慘敗,新版AlphaGo Zero百戰百勝,AI顛覆性飛躍
    2016年,橫空出世的阿爾法狗(AlphaGo)以4:1的成績擊敗了圍棋世界冠軍、職業九段棋手李世石,後來又在網絡上與中日韓圍棋高手交戰,60場比賽無一失利。2017年5月,它再與排名世界第一、我國著名圍棋選手柯潔對戰,結果3比0完勝。
  • 徹底擺脫人類,比戰勝柯潔還厲害的AlphaGo要來了
    AlphaGo Zero完全不依賴於人類數據,因此,這一系統的成功也是朝向人工智慧研究長期以來的目標——創造出在沒有人類輸入的條件下,在最具挑戰性的領域實現超越人類能力的算法——邁進的一大步。這也是為什麼接下來我們要介紹的這篇論文如此重要——它不僅是很多人期盼已久的技術報告,也是人工智慧一個新的技術節點。在未來,它將得到很多引用,成為無數AI產業和服務的基礎。迄今最強大的圍棋程序:不使用人類的知識DeepMind這篇最新的Nature,有一個樸素的名字——《不使用人類知識掌握圍棋》。
  • 人工智慧和算法已在象棋和圍棋等領域上擊敗人類
    這對科技和人工智慧來說,是個短暫而又難忘的裡程碑。 隨著圖靈機的發展,西洋棋被視作衡量計算機智能的基準,它幾乎包含了無數種排列組合的方式,西洋棋比賽比宇宙中肉眼可見的原子數量要多得多。計算機要想打敗人類,不僅需要計算能力,還需要能計算出每一步作用的重要算法。 然而,在不到二十年的時間裡,計算機就在西洋棋比賽中遠超人類。
  • 人類知識多餘?Deepmind新一代AlphaGo Zero自學3天打敗AlphaGo
    今天凌晨,谷歌旗下Deepmind人工智慧團隊發布了一篇轟動AI界的論文,《Mastering the game of Go without human knowledge》(在沒有人類知識的情況下掌握圍棋),一句話總結這篇論文,他們研發的AlphaGo大表哥AlphaGo Zero能夠在沒有人類圍棋對弈數據的情況下