阿爾法狗被碾壓!再進化版本AlphaGo Zero以100:0完勝 如今,說起由谷歌旗下團隊DeepMind所開發的人工智慧(AI)AlphaGo,你的頭腦當中會回想起什麼呢?是它在16年3月與圍棋高手李世石的一戰成名,還是化身「Master」在30秒快棋戰當中連克數十名世界級高手,亦或是今年5月份讓柯傑連負三局進而崩潰的強橫實力?不可否認,當戰勝這個星球上最強大的圍棋棋士時,實際上它就已經成為了真正意義上的「全場最佳」,而正當我們興奮地想要看看它究竟能夠制霸多久時,今早卻突然傳來「噩耗」,AlphaGo敗了,並且敗的是如此的慘!
阿爾法狗被碾壓!再進化版本AlphaGo Zero以100:0完勝
「零號機」的又一次勝利!
在今天凌晨才剛剛出版的《自然》雜誌上,DeepMind團隊詳細介紹了他們在2016年擊敗李世石的AlphaGo,因為它是史上第一個在圍棋項目上擊敗人類的機器,這毫無疑問是人工智慧技術方面一座新的裡程碑。而在這之後,他們又開發出了新一代的人工智慧:AlphaGo Zero。
那麼這個新版本的AlphaGo究竟有多厲害呢?一組數據足以證明!據了解打敗李世石的AlphaGo用了3000萬盤比賽作為訓練數據,而AlphaGo Zero則只用了490萬盤比賽數據。經過3天的訓練,AlphaGo Zero就以100:0的比分完勝對陣李世石的那版AlphaGo。此時它對陣AlphaGo Master的成績為壓倒性的89:11,Master則是上面提到打敗柯潔的版本;而經過40天的自我對弈之後,它最終以100戰全勝的成績全面超越了AlphaGo Master。
阿爾法狗被碾壓!再進化版本AlphaGo Zero以100:0完勝
結果表明,具體到不同技術的效果,人工智慧在這一領域仍有很多學習的空間。AlphaGo Master使用了很多與AlphaGo Zero相同的開發技術,但它需要首先利用人類的數據進行訓練,隨後才切換成自我對弈。
值得注意的是,雖然AlphaGo Zero在幾周的訓練期間學會了一些關鍵概念,但該系統學習的方法與人類有所不同。另外,AlphaGo Zero也比前幾代系統更加節能,AlphaGo Lee需要使用幾臺機器和48個谷歌TPU機器學習加速晶片。其上一代AlphaGo Fan則要用到176個GPU晶片。AlphaGo Zero只需要使用一臺配有4個TPU的機器即可
阿爾法狗被碾壓!再進化版本AlphaGo Zero以100:0完勝