北京時間12月11日晚間,Deepmind公司在自己官網上線了AlphaGo教學工具,旨在幫助公眾用新的、啟發性的方式下圍棋。
這樣的舉措,也進一步兌現了Deepmind在烏鎮人機大戰結束時的承諾:與全世界圍棋愛好者共同分享AlphaGo的數據。
AlphaGo的啟蒙老師、歐洲圍棋冠軍樊麾在微博上透露:「AlphaGo教學工具共有兩萬多個變化,三十七萬多步棋組成,通過AlphaGo的視角,分析並建議圍棋開局的諸多下法。同時每步棋AlphaGo都會給出自己的勝率分析,希望AlphaGo對圍棋的獨特理解可以給我們一些啟發。」
隨後,當今世界圍棋第一人柯潔轉發此條微博,並評論到:「重新學圍棋。」
據樊麾介紹,此次公布的教學工具使用的版本是 AlphaGo Master。工具設有包括中文簡體在內的多個語言。
另據DeepMind官網介紹,教學工具分析了近期圍棋歷史裡6000個最受歡迎的開局,使用了231000盤人類數據,以及75盤 AlphaGo與人類對弈的數據。
除了柯潔外,多位國內世界圍棋冠軍多對AlphaGo教學工具上線都表達了自己的看法。世界圍棋冠軍、職業九段棋手常昊認為:「教學工具不一定是標準答案,更多的是給予了我們無限的思考空間。」曾為烏鎮人機大戰選手之一、職業九段棋手周睿羊則表示:「定式什麼的還是不要隨便學了,看到工具一些高級下法之後感覺到又可以起飛了。」
今年5月份,在烏鎮結束了與柯潔的對弈後,DeepMind宣布AlphaGo退役,此後它和人類將以其他形式互動,回饋人類。10月份,DeepMind公布了最強版AlphaGo,代號AlphaGo Zero。它的獨門秘籍,是「自學成才」。而且,是從一張白紙開始,零基礎學習,在短短3天內,成為頂級高手,並以100:0的比分戰勝了曾贏下韓國棋手李世石的AlphaGo。12月份,DeepMind又給人類帶來驚喜,AlphaGo Zero能從零基礎開始強化學習,24小時之內擊敗了此前最強的西洋棋、日本將棋和圍棋人工智慧程序,由此前專攻一項技能走向多種技能「通殺」。