最強「新狗」AlphaGo Zero發布 柯潔:對於它的自我進步來講,人類太...

2020-12-07 觀察者網

北京時間今天(10月19日)凌晨,谷歌旗下的DeepMind團隊公布了進化後的最強版AlphaGo ,代號AlphaGo Zero。AlphaGo曾打敗了中國頂尖棋手柯潔,而AlphaGo Zero經過3天的訓練,就以100:0的比分完勝AlphaGo。這條消息點燃了中國圍棋界,連柯潔也發微博感嘆:對於AlphaGo的自我進步來講,人類太多餘了……

谷歌今天發布的這款名為AlphaGo Zero有多厲害?據「快科技」網站文章的介紹,它的系統可以通過自我對弈進行學習,它利用了一種名為強化學習的技術。在不斷訓練的過程中,這套系統開始靠自己的能力學會圍棋中的一些高級概念。

經過3天的訓練後,這套系統已經可以擊敗AlphaGo Lee,也就是去年擊敗韓國頂尖棋手李世石的那套系統,而且比分高達100比0。經過40天訓練後,它總計運行了大約2900萬次自我對弈,使得AlphaGo Zero得以擊敗AlphaGo Master(今年早些時候擊敗世界冠軍柯潔的系統),比分為89比11。

AlphaGo之父戴密斯·哈薩比斯(Demis Hassabis)

與學習大量人類棋譜起步的前代AlphaGo不同,AlphaGo Zero是從「嬰兒般的白紙」開始,通過3天數百萬盤自我對弈,走完了人類千年的圍棋歷史,並探索出了不少橫空出世的招法。

值得注意的是,雖然AlphaGo Zero在幾周的訓練期間學會了一些關鍵概念,但該系統學習的方法與人類有所不同。另外,AlphaGo Zero也比前幾代系統更加節能,AlphaGo Lee需要使用幾臺機器和48個谷歌TPU機器學習加速晶片。其上一代AlphaGo Fan則要用到176個GPU晶片。AlphaGo Zero只需要使用一臺配有4個TPU的機器即可。

DeepMind團隊創始人David Silver介紹AlphaGo Zero說,這款程序超越了過去所有的AlphaGo版本,目前是世界上最大強大的圍棋程序。

視頻截圖,下同

它的學習不使用人類數據,而是自我學習,完全從零開始。之所以它能比向人類數據學習的程序效果更好,是因為它每次對弈的「陪練」都被校準為與它持平的水平,它的「陪練」從非常基礎的水平開始,逐漸上升為非常高的水平。

David Silver還說,人們一般認為機器學習就是大數據和海量計算,但是他們在AlphaGo Zero的研究中發現,算法比所謂計算或數據可用性更重要。

以下是完整視頻:

DeepMind聯合創始人和總裁David Silver介紹新版阿法狗。 (視頻自騰訊)

相關焦點

  • 谷歌團隊發布AlphaGo Zero:柯潔稱人類太多餘了
    【中關村在線新聞資訊】10月19日消息,今天谷歌旗下人工智慧團隊DeepMind在今天對外發布了一款全新的AlphaGo程序。這款軟體名為AlphaGo Zero,與之前擊敗了李世石的AlphaGo Master進行對弈,勝率高達100%。
  • 能贏AlphaGo的只有它自己 柯潔回應新版問世:人類太多餘了
    對此,柯潔回應稱:「一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了。」2016 年在 AlphaGo 和李世石的對戰後,人工智慧進入大眾的視野,今年5月27日,中國棋手柯潔與人工智慧「阿爾法圍棋」(AlphaGo)展開三番棋比賽的終局對決。
  • 柯潔回應新版本AlphaGo問世:人類太多餘了
    經過大約40天的訓練(約2900萬場自玩遊戲),AlphaGo Zero擊敗了AlphaGo Master(今年早些時候擊敗了世界冠軍柯潔)。對此,柯潔回應稱:「一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了。」
  • 柯潔終結41連勝圍棋AI:稱其實力遠超初代AlphaGo
    人類AI圍棋之爭,還在繼續。今年5月底,人機圍棋大戰終極對決,最終世界排名第一的柯潔九段和AlphaGo的圍棋終極人機大戰以0:3完敗。賽後,柯潔在接受採訪時直言,AlphaGo太完美,看不到任何勝利的希望。
  • AlphaGo Zero用40天成為世界最強圍棋AI
    AlphaGo的論文發布早就有預告,有預兆,並非突如其來,石破天驚……但當它就這樣出現,糊在小編臉上,還是顯得那麼讓人震撼……論文摘要在另一篇置頂文已經有了,這裡只是略微補全一些周邊信息。棋士柯潔:一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了
  • 新阿爾法狗震動圍棋界:棋手的傷感人類的幸運,勝負並非全部
    關註裡有「哀嘆」:柯潔說,「人類太多餘了。」古力評,「我們的傷感,人類的進步!」也有戲談:唐韋星稱,「準備努力賺錢,以後買下DeepMind,讓AlphaGo Zero給我做陪練。」Deepmind公司提供19日下午,圍棋國手江鑄久九段告訴澎湃新聞,他最期待的是看AlphaGo Zero的新棋譜,它自我對弈的,它與其他AlphaGo對弈的,他想看看有哪些新招數,會有哪些啟發。他曾試著打開這些剛被公布的棋譜,但可能網絡上訪問的人太多,他沒能打開。
  • 【話題】AlphaGo Zero!圍棋之神真來了……
    阿爾法元完全從零開始,不需要任何歷史棋譜的指引,更不需要參考人類任何的先驗知識,完全靠自己強化學習和參悟, 棋藝增長遠超阿爾法狗,百戰百勝,擊潰阿法爾狗100比0。自我對弈40天後,Alpha Go Zero變得更為強大,超過了此前擊敗當今圍棋第一人柯潔的Master亦即Alpha Go2.0版。
  • AlphaGo Zero問世 柯潔說人類多餘了
    就在今天,谷歌旗下的創業公司DeepMind又發布了最新產品AlphaGo Zero。沒錯,就是之前接連打敗圍棋世界冠軍,李世石九段和柯潔九段的那個阿爾法狗的終極版。阿爾法狗項目首席研究員大衛·席爾瓦(不是在曼聯踢球的那位)說,AlphaGo Zero是目前世界上最強大的圍棋程序,超越以往所有阿爾法狗的舊版本。
  • AlphaGo Zero橫空出世!自學成才碾壓所有棋手成為世界第一
    >開啟一個新的紀元——AI紀元《紐約客》最新一期雜誌封面,由基庫·詹森(R.>差不多了別忘了Master曾以3:0擊敗當時世界第一的柯潔。人類啊,也不過爾爾。對此,人類中最優秀的棋士、世界第一的柯潔在當時回應道:「一個純淨、純粹自我學習的AlphaGo是最強的。
  • AlphaGo又有了令人「恐怖」的新版本
    不過「圍棋上帝」也有被虐的時候,昨天谷歌旗下人工智慧研究部門DeepMind發布了新版AlphaGo,它可以完全靠自己學習圍棋,更為恐怖的是經過40天訓練後,它就可以擊敗AlphaGo Master(擊敗柯潔的系統),比分為89比11。
  • 柯潔被AlphaGo打哭後「復出」再戰AI:人機大戰來了
    憑藉智英賽首輪力克樸廷桓的完美發揮,柯潔時隔八天,以3629分反超對手重回第一寶座。韓國名將樸廷桓則以3628分退居第二。 ????12月26日,首屆新奧杯世界圍棋公開賽五番棋決賽決勝局在廊坊新新繹七修酒店戰罷。柯潔執黑3/4子險勝彭立堯,以3-2奪得新奧杯冠軍,同時獲得個人第五個世界冠軍。至此,柯潔以20歲146天超越了李昌鎬奪得第五個世界冠軍時21歲295天的紀錄。
  • 新版AlphaGo Zero100:0完爆舊「狗」:3天走完人類千年棋史
    倫敦當地時間10月18日,AlphaGo再次登上世界頂級科學雜誌——《自然》。現在,AlphaGo Zero是我們最強版本,它提升了很多。AlphaGo Zero的水平已經超過之前所有版本的AlphaGo。Zero提高了計算效率,並且沒有使用到任何人類圍棋數據。
  • AlphaGo Zero橫空出世,從零學習造恐怖記錄【附83盤棋譜】
    ,它能夠迅速自學圍棋,並以100:0的戰績擊敗「前輩」。        該論文稱,在數百萬局自我對弈後,隨著程序訓練的進行,AlphaGo Zero獨立發現了人類用幾千年才總結出來的圍棋規則,還建立了新的戰略,為這個古老的遊戲帶來新見解。        AlphaGo Lee是AlphaGo Zero的「前輩」。
  • AlphaGo Zero橫空出世,人機圍棋大戰正式收官:以後不會再有這樣的...
    最終柯潔負於AlphaGo,與此同時,阿爾法圍棋團隊宣布阿爾法圍棋將不再參加圍棋比賽。17年10月19日,DeepMind今天發布新版本AlphaGo程序,經過三天的訓練,該系統能夠擊敗AlphaGo Lee,後者是去年擊敗了韓國選手李世石,勝率是100比0。經過大約40天的訓練後,AlphaGo Zero完勝AlphaGo Master。
  • 關於「AlphaGo zero擊敗AlphaGo」的改寫題|18北師大新傳專碩真題
    此前被AlphaGo擊敗的世界知名圍棋選手柯潔今早在社交平臺上表示:「一個純淨純粹自我學習的AlphaGo是最強的.....對於AlphaGo的自我進步來講.....人類太多餘了。"那麼,經過升級的AlphaGo Zero到底是如做到「長江後浪推前浪」的呢?
  • 把柯潔虐哭的阿法狗被「新一代」Alpha Go Zero虐死,人工智慧也太可怕了!
    就連我們的傲嬌星人柯潔老師,在與「地球最強狗狗」對決的過程中,也被狠狠「虐」了一把,心有不甘地留下男兒淚,不得不跑到廁所調整心情,由衷感嘆人工智慧的強大。 姓名:AlphaGo(Fan,Lee,Master,Zero)1.
  • 柯潔終結AI「符合預期」41連勝:若當初第一個與alphago對弈的是我
    【文/觀察者網 周遠方】昨夜,「半狗」柯潔贏了一隻41連勝的「小狗」,輾轉難眠…… 他在今天(18日)凌晨0時23分發微博感嘆: 一個AI滿地走的時代...除了alphago以外,這個暱稱為「符合預期」的AI尤其強,實力應該已經遠超當時與李世石對弈的alphago了吧?...
  • 阿爾法狗再進化AlphaGo Zero橫空出世 無師自學40天就可打敗柯潔
    - 僅僅36小時後,AlphaGo Zero靠著自我學習,就摸索出所有基本且重要的圍棋知識,達到了與李世石九段對戰的AlphaGo v18的相同水平。- 30天後,不斷進步的AlphaGo Zero達到了Master的水平。Master即年初在網上達成60連勝的AlphaGo版本。
  • 柯潔大勝韓國棋手 AlphaGo對於人類棋手的改變已經開始了嗎?
    「下過和沒下過的差別很大的,只不過是收穫多少的問題,他們比其他人更加直觀地模仿AlphaGo的下法,所以有進步是很正常的。」  之後,在更多的比賽中,我們還將繼續見證AI圍棋給人類棋手帶來的影響。
  • 柯潔首度還原對戰阿爾法狗,人工智慧將超越人類智能?
    在人工智慧極速發展的今天,機器能替代的不僅僅是傳統重複性的機械動作,而是模擬人類思考。去年,一場轟動全球的阿爾法狗圍棋挑戰賽拉開帷幕。在戰勝了韓國圍棋高手李世石後,中國圍棋少年天才柯潔,迎來了世紀人機大戰。