查爾星港獨家整理報導,轉載請註明出處!
北京時間19日,AlphaGo 再次登上《自然》雜誌。這次谷歌 DeepMind 團隊帶來的是最新版 AlphaGo ,它的代號為「AlphaGo Zero」。我們都知道 AlphaGo 曾打敗圍棋世界冠軍,它是God,是神,是史上最強的圍棋「選手」,但這次公布的 AlphaGo Zero 卻更為兇悍:憑藉新型的強化學習技術, AlphaGo Zero 以100:0的比分擊敗了之前的世界冠軍 AlphaGo。
AlphaGo Zero 拋棄了此前 AlphaGo 基於人類圍棋比賽的訓練方式,完全「自學成才」,通過隨機下棋的方式來自己學習圍棋。「不使用人工數據或人工專長,我們就可以真正突破人類知識的限制,」DeepMind 公司首席研究員、倫敦大學學院教授大衛·西爾佛(David Silver)說,「它能運用基本原理自行創造知識。」
Zero 100:0 AlphaGo,AlphaGo 18次擊敗李世石,如果以1Go為戰力數值的話,求解柯潔有幾Go?
那麼問題來了,《星際爭霸2》作為 DeepMind 的下一個挑戰對手,RTS版本的「AlphaGo」能否通過這樣自我學習的方式打敗星際爭霸2呢?從谷歌目前的測試AI連簡單電腦都難以擊敗,進而無奈開放《星際爭霸2》研究環境與調度暴雪天梯戰報來看,這項新型強化學習技術或許還難以在星際爭霸2項目上實現。
今日 AlphaGo Zero 團隊的其中一研發人員也談到了關於《星際爭霸2》的問題,這位名為 Julian Schrittwieser 的 AlphaGo 創造者代表在 Reddit 上進行了網友答問活動。
網友:你們覺得圍棋與《星際爭霸II》誰的研究難度更大?最大的潛在技術障礙是什麼?我們期待的正式更新什麼時候能出來?
Julian Schrittwieser:我們開放《星際爭霸II》的研究環境才過了幾個星期,所以現在還處於早期階段。星際爭霸的行動空間毫無疑問要比圍棋更具挑戰性,而且需要觀測的空間也要大得多。從技術角度而言,我認為最大的難點區別就是圍棋是一個處於在完全的信息展示環境下的遊戲,而星際爭霸由於有著戰爭迷霧,所以信息情報並不完美。
依照研究人員所說,《星際爭霸II》的AI尚處在早期階段,它的研發難度比圍棋更大。而在 AlphaGo Zero 誕生後,我們希望谷歌能以此為契機,在《星際爭霸II》AI研究上再做突破。