谷歌高層拜會聶衛平。
據@央視CCTV5報導,谷歌旗下Deepmind公司近日在德國慕尼黑的DLD創新大會上正式宣布,將推出真正的2.0版AlphaGo。
新版「阿法狗」將正式摒棄人類棋譜,只靠計算機自身深度學習的方式成長——即探索「深度學習」方式的極限,臻至「圍棋之神」的境界。
2.0版的AlphaGo,將通過數學模型下的自我對局和深度學習,下出真正屬於人工智慧(AI)的圍棋。
柯潔微博。
在2017年開年,化身Master的阿法狗風捲殘雲完成60勝,唯一一場平局還是因為對弈者掉線。
當時「棋聖」聶衛平就表示:「圍棋遠不像我們想像的那麼簡單,還有巨大的空間等著我們人類去挖掘。阿法狗也好,Master也罷,都是『圍棋上帝』派來給人類引路的。」
而柯潔則說他一夜無眠,「人類千年的實戰演練進化,計算機卻告訴我們,人類全都是錯的……」
既然人類的圍棋智慧如今落入下風,那麼人工智慧會帶來怎麼樣的圍棋變革呢?
DeepMind公司其實早已有過設想——拋棄人類棋譜套路,走AI自己的路。
阿法狗之父:哈薩比斯
該公司創始人哈薩比斯此前在一次採訪中曾透露,他們的團隊正在嘗試訓練一個沒有學習過人類棋譜的人工智慧。
而當Master大殺四方後,也有外界猜測,Master是否也未曾研習人類棋譜。
但無論是人類套路還是自成一派,阿法狗更可怕的還是它的學習能力。
在2015年10月,阿法狗在與歐洲冠軍樊麾的對弈中就在公平的情況下以5比0完勝。樊麾在接受媒體採訪時認為,阿法狗的可怕在於「從不犯錯」。
聶衛平和Master對弈。
在樊麾與阿法狗的五盤大戰棋譜被放上網絡後,就有不少圍棋業餘高手在網絡上發表評論,其中不少人認為樊麾這次的棋下得並不出色。
但當時《自然》雜誌就寫道,「人類在下棋時有一個劣勢,在長時間比賽後,他們會犯錯,但機器不會。而且人類或許一年能玩1000局,但機器一天就能玩100萬局。」
「圍棋AI的學習能力非常強大,就像當初『深藍』第一次輸給了卡斯帕羅夫,但不到一年第二次對弈就贏了比賽。」
韓國棋院給阿法狗頒發名譽九段證書。
據《自然》雜誌介紹,阿法狗的核心是兩種不同的深度神經網絡:「策略網絡」(policy network)和 「值網絡」(value network)。它們的任務在於合作「挑選」出那些比較有前途的棋步,拋棄明顯的差棋。
更恐怖的是它的「進化」深度學習能力,用了2000萬局的對子對弈進行訓練,每一次都能提升棋力。