阿爾法狗再進化 自我學習提升棋藝擊敗舊版 阿爾法狗再進化,10月19日谷歌旗下人工智慧研究部門DeepMind發布了新版AlphaGo(阿爾法狗)軟體,它可以完全靠自己學習圍棋 這款名為AlphaGo Zero的系統可以通過自我對弈進行學習,它利用了一種名為強化學習的技術。
熱點背景
導讀經過3天的訓練後,這套系統已經可以擊敗AlphaGo Lee,也就是去年擊敗韓國頂尖棋手李世石的那套系統,而且比分高達100比0。經過40天訓練後,它總計運行了大約2900萬次自我對弈,使得AlphaGo Zero得以擊敗AlphaGo Master(今年早些時候擊敗世界冠軍柯潔的系統),比分為89比11。
熱點關注
「阿爾法狗」再進化:「自學」3天高分贏過舊版 2017-10-19 13:35:47
10月19日消息,谷歌旗下人工智慧研究部門DeepMind發布了新版AlphaGo(阿爾法狗)軟體,它可以完全靠自己學習圍棋。這款名為AlphaGo Zero的系統可以通過自我對弈進行學習,它利用了一種名為強化學習的技術。在不斷訓練的過程中,這套系統開始靠自己的能力學會圍棋中的一些高級概念。
經過3天的訓練後,這套系統已經可以擊敗AlphaGo Lee,也就是去年擊敗韓國頂尖棋手李世石的那套系統,而且比分高達100比0。經過40天訓練後,它總計運行了大約2900萬次自我對弈,使得AlphaGo Zero得以擊敗AlphaGo Master(今年早些時候擊敗世界冠軍柯潔的系統),比分為89比11。