三天100:0絕殺「前輩」,AlphaGo Zero為什麼能這麼厲害?

2021-01-20 新浪科技

首先,AlphaGo Zero僅用棋盤上的黑白子作為輸入,而前代則包括了小部分人工設計的特徵輸入。


其次,AlphaGo Zero僅用了單一的神經網絡。在此前的版本中,AlphaGo用到了「策略網絡」來選擇下一步棋的走法,以及使用「價值網絡」來預測每一步棋後的贏家。而在新的版本中,這兩個神經網絡合二為一,從而讓它能得到更高效的訓練和評估。


第三,AlphaGo Zero並不使用快速、隨機的走子方法。在此前的版本中,AlphaGo用的是快速走子方法,來預測哪個玩家會從當前的局面中贏得比賽。相反,新版本依靠的是其高質量的神經網絡來評估下棋的局勢。


所有這些差異,都提高了系統的表現,使其更為普適。不過,是算法上的變化使得系統更為強大和高效。


僅僅自我對弈3天後,AlphaGo Zero就以100:0完勝了此前擊敗世界冠軍李世乭的AlphaGo版本。自我對弈40天後,AlphaGo Zero變得更為強大,超過了此前擊敗當今第一人柯潔的「大師」版AlphaGo。


通過數百萬次自我對弈,AlphaGo從零開始掌握了圍棋,在短短幾天內就積累起了人類幾千年才有的知識。AlphaGo Zero也發現了新的知識,發展出打破常規的策略和新招,與它在對戰李世乭和柯潔時創造的那些交相輝映,卻又更勝一籌。


這些創造性的時刻給了我們信心:人工智慧會成為人類智慧的增強器,幫助我們解決人類正在面臨的一些嚴峻挑戰 。


儘管才剛剛發展起來,AlphaGo Zero已經走出了通向上述目標的關鍵一步。如果類似的技術可以應用在其他結構性問題,比如蛋白質摺疊、減少能耗和尋找新材料上,就能創造出有益於社會的突破。


(本文綜合自新浪科技、澎湃新聞)


相關焦點

  • 打敗李世乭的AlphaGo,被弟弟AlphaGo Zero打敗了,成績是0-100-虎嗅網
    今年,他的弟弟只靠一副棋盤和黑白兩子,沒看過一個棋譜,也沒有一個人指點,從零開始,自娛自樂,自己參悟,100-0打敗哥哥 AlphaGo 。他的名字叫 AlphaGo Zero(阿法元) 。自學三天,100-0擊潰阿法狗
  • 打敗李世石的AlphaGo,被弟弟AlphaGo Zero打敗了,成績是0-100
    今年,他的弟弟只靠一副棋盤和黑白兩子,沒看過一個棋譜,也沒有一個人指點,從零開始,自娛自樂,自己參悟,100-0打敗哥哥阿法狗。他的名字叫阿法元。DeepMind這項偉大的突破,今天以Mastering the game of Go without human knowledge為題,發表於Nature,引起轟動。知社特邀國內外幾位人工智慧專家,給予深度解析和點評。
  • AlphaGo Zero橫空出世,從零學習造恐怖記錄【附83盤棋譜】
    10月19日凌晨,在國際學術期刊Nature上發表的一篇研究論文中,谷歌下屬公司Deepmind報告新版程序AlphaGo Zero:從空白狀態學起,在無任何人類輸入的條件下,它能夠迅速自學圍棋,並以100
  • 再進化版本AlphaGo Zero以100:0完勝
    再進化版本AlphaGo Zero以100:0完勝 如今,說起由谷歌旗下團隊DeepMind所開發的人工智慧(AI)AlphaGo,你的頭腦當中會回想起什麼呢?是它在16年3月與圍棋高手李世石的一戰成名,還是化身「Master」在30秒快棋戰當中連克數十名世界級高手,亦或是今年5月份讓柯傑連負三局進而崩潰的強橫實力?
  • 谷歌發布AlphaGo Zero 100:0擊潰AlphaGo
    經過3天的訓練,AlphaGo Zero以100:0的戰績完勝AlphaGo。DeepMind執行長傑米斯•哈薩比斯(Demis Hassabis)表示,「它學遊戲僅僅是通過跟自己玩,從完全的隨機玩遊戲開始,在玩的過程中,它很快就超過了人類的水平,並以100比0的戰績擊敗了上一代AlphaGo。AlphaGo項目負責人戴維•西爾弗(David Silver)補充稱:「我們不以任何方式使用人類數據,就可以讓它從一塊白板創造知識。」
  • 人工智慧從0到1:阿法零AlphaGo Zero無師自通100-0完爆阿法狗AlphaGo
    4圖4頁PDF)簡介:人工智慧從0到1:阿法零AlphaGo Zero無師自通100-0完爆阿法狗AlphaGo(1769字)。公號由秦隴紀發起,未覆蓋各領域科普及簡化,期待大家參與~】 人工智慧從0到1:阿法零AlphaGo Zero無師自通100-0完爆阿法狗AlphaGo(1736字)2016年底AlphaGo阿法狗4-1打敗世界冠軍Lee Sedol
  • 谷歌團隊發布AlphaGo Zero:柯潔稱人類太多餘了
    這款軟體名為AlphaGo Zero,與之前擊敗了李世石的AlphaGo Master進行對弈,勝率高達100%。谷歌團隊發布AlphaGo Zero:柯潔稱人類太多餘了(圖片來自於推特)在這款軟體發出之後,柯潔也對這款軟體發表了自己的看法,他認為:「一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了。」
  • 【話題】AlphaGo Zero!圍棋之神真來了……
    在對陣曾贏下韓國棋手李世石那版的AlphaGo時,AlphaGo Zero取得了100比0的壓倒性戰績,這真是棋藝高超啊……圍棋之神真來了文|體壇周報記者 謝銳比Alpha Go還要厲害得多的人工智慧誕生了,它便是阿爾法元Alpha Go Zero。
  • NBA1秒以內的5大絕殺,利拉德0.9秒絕殺墊底,榜首絕殺僅需0.1秒
    NBA1秒以內的5大絕殺,利拉德0.9秒絕殺墊底,榜首絕殺僅需0.1秒5.利拉德0.9秒絕殺火箭2014年5月3日,火箭在首輪與開拓者相遇。在G6開始前,火箭以2-3落後開拓者,屬實被逼到了絕境。在投中最後一個三分之前,巴恩斯此前三分2投0中。當時陷入絕境的獨行俠選擇放手一搏讓巴恩斯來投這一球,最終巴恩斯做到了。0.5秒完成了對灰熊的絕殺,要知道當時獨行俠還落後2分,投中這球屬實是不容易。3.「老魚」費舍爾0.4秒絕殺火箭2004年5月14,在馬刺與湖人的G5系列賽中。
  • AlphaGo Zero用40天成為世界最強圍棋AI
    棋士柯潔:一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了這款新程序名叫AlphaGo Zero,以100比0的戰績打敗了它的前任(在2016年3月的錦標賽中,其前任打敗了圍棋冠軍Lee Sedol)。人工智慧的最大挑戰是研發一種能從零開始、以超人類的水平學習複雜概念的算法。為了打敗人類圍棋世界冠軍,科學家在訓練上一款AlphaGo時,同時用到了監督式學習(基於上百萬種人類專業選手的下棋步驟)和基於自我對弈的強化學習。
  • 柯潔回應新版本AlphaGo問世:人類太多餘了
    網易科技訊10月19日消息,DeepMind今天發布了一款新版本的AlphaGo程序,經過三天的訓練,該系統能夠擊敗AlphaGo Lee,後者是去年擊敗了韓國選手李世石(Lee Sedol)的DeepMind軟體,勝率是100
  • 自學高手AlphaGo Zero 100:0戰勝李世石
    今年5月,以3:0的比分贏下中國棋手柯潔後,AlphaGo宣布退役,但DeepMind公司並沒有停下研究的腳步。倫敦當地時間10月18日,DeepMind團隊公布了最強版AlphaGo ,代號AlphaGo Zero。AlphaGo Zero的水平已經超過所有版本的AlphaGo。
  • 中國蛙王0.12秒絕殺,女神劉湘0.32秒絕殺!日本巨星轟破亞洲紀錄
    首先是在男子100米蛙泳決賽當中,中國蛙王閆子貝強勢出戰,他的對手包括了荷蘭的卡明佳和哈薩克斯坦的巴蘭丁,以及保加利亞的謝馬諾維奇。最終閆子貝有著相當出色的發揮,他以58秒83的成績,力壓卡明佳奪冠,卡明佳的成績是58秒95,僅僅落後於閆子貝0.12秒。在兩人撞線的時候,閆子貝更快了一點點,幾乎就是以一隻手的距離絕殺了對手。
  • AlphaGo Zero問世 柯潔說人類多餘了
    AlphaGo Zero輕而易舉地打敗了它的兩個「前輩」,而且是以絕對碾壓的比分。當初打敗李世石的AlphaGo Lee,跟它的百局對弈比分是100:0,打敗柯潔的AlphaGo Master,在它手下贏了11盤,但也輸了89盤。
  • 新版AlphaGo Zero100:0完爆舊「狗」:3天走完人類千年棋史
    經過短短3天的自我訓練,AlphaGo Zero(最新人工智慧圍棋程序)就強勢打敗了此前戰勝李世石的舊版AlphaGo,戰績100
  • AlphaGo Zero完全自學吊打老狗,人類數據沒用了?
    與之前幾個版本的阿爾法狗不同,阿爾法元除了解圍棋規則外,完全不依靠棋譜和人類數據,從零開始「自學成才」,成為全世界最厲害的(人工智慧)圍棋手。1完爆對手,阿爾法元有多厲害?自學三天,自博490萬局棋後,阿爾法元以100:0的壓倒性優勢打敗曾戰勝韓國棋手李世石的AlphaGoLee;訓練二十一天後,阿爾法元再次戰勝擊敗世界圍棋冠軍柯潔的AlphaGo Master;四十多天後,經過2900多萬次自玩遊戲,阿爾法元超過此前AlphaGo的所有版本,殺到黑白世界屍橫遍野,成為世界上最厲害的圍棋程序。
  • 【雅思乾貨】除了「zero」外,數字「0」還有這些奇奇怪怪的花式讀法....
    >在電話號碼中0讀zero都是常規操作了,但它有時候居然還叫「oh」!在一串數字中,比如1070可以讀作one zero seven zero,也可以讀作one oh seven oh,在電話號碼中0讀「oh」是非常常見的用法。
  • zero 絕藝解說alphago - CSDN
    面對無師自通碾壓一切前輩的AlphaGo Zero,柯潔說出了這樣一句話。這麼說大家都能理解了吧。  即將加入加州伯克利的馬毅教授  熬夜讀完AlphaGo zero的Nature論文,深有感觸:我們一生與多少簡單而又有效的想法失之交臂,是因為我們或者過早認為這些想法不值得去做或者沒有能力或毅力正確而徹底地實現它們?這篇論文可以說沒有提出任何新的方法和模型——方法可以說比以前的更簡單「粗暴」。
  • AlphaGo Zero你也來造一隻,PyTorch實現五臟俱全| 附代碼
    如果能培育這樣一隻AI,即便自己不會下棋,也可以很驕傲吧。於是,來自巴黎的少年Dylan Djian (簡稱小笛) ,就照著狗零的論文去實現了一下。 = []8        self.parent = parent9        self.move = move部署 (Rollout)第一步是PUCT (多項式上置信樹) 算法,選擇能讓PUCT函數 (下圖) 的某個變體 (Variant) 最大化,的走法。
  • 能贏AlphaGo的只有它自己 柯潔回應新版問世:人類太多餘了
    對此,柯潔回應稱:「一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了。」2016 年在 AlphaGo 和李世石的對戰後,人工智慧進入大眾的視野,今年5月27日,中國棋手柯潔與人工智慧「阿爾法圍棋」(AlphaGo)展開三番棋比賽的終局對決。