阿爾法狗再進化:100:0碾壓舊版 阿爾法狗再進化,10月19日谷歌旗下人工智慧研究部門DeepMind發布了新版AlphaGo(阿爾法狗)軟體,它可以完全靠自己學習圍棋 這款名為AlphaGo Zero的系統可以通過自我對弈進行學習,它利用了一種名為強化學習的技術。
熱點背景
導讀經過3天的訓練後,這套系統已經可以擊敗AlphaGo Lee,也就是去年擊敗韓國頂尖棋手李世石的那套系統,而且比分高達100比0。經過40天訓練後,它總計運行了大約2900萬次自我對弈,使得AlphaGo Zero得以擊敗AlphaGo Master(今年早些時候擊敗世界冠軍柯潔的系統),比分為89比11。