AlphaGo Zero創造者:星際爭霸2比圍棋更具挑戰性

2020-12-07 網易娛樂

查爾星港獨家整理報導，轉載請註明出處！

北京時間19日，AlphaGo 再次登上《自然》雜誌。這次谷歌 DeepMind 團隊帶來的是最新版 AlphaGo ，它的代號為「AlphaGo Zero」。我們都知道 AlphaGo 曾打敗圍棋世界冠軍，它是God，是神，是史上最強的圍棋「選手」，但這次公布的 AlphaGo Zero 卻更為兇悍：憑藉新型的強化學習技術， AlphaGo Zero 以100:0的比分擊敗了之前的世界冠軍 AlphaGo。

AlphaGo Zero 拋棄了此前 AlphaGo 基於人類圍棋比賽的訓練方式，完全「自學成才」，通過隨機下棋的方式來自己學習圍棋。「不使用人工數據或人工專長，我們就可以真正突破人類知識的限制，」DeepMind 公司首席研究員、倫敦大學學院教授大衛·西爾佛（David Silver）說，「它能運用基本原理自行創造知識。」

Zero 100:0 AlphaGo，AlphaGo 18次擊敗李世石，如果以1Go為戰力數值的話，求解柯潔有幾Go？

那麼問題來了，《星際爭霸2》作為 DeepMind 的下一個挑戰對手，RTS版本的「AlphaGo」能否通過這樣自我學習的方式打敗星際爭霸2呢？從谷歌目前的測試AI連簡單電腦都難以擊敗，進而無奈開放《星際爭霸2》研究環境與調度暴雪天梯戰報來看，這項新型強化學習技術或許還難以在星際爭霸2項目上實現。

今日 AlphaGo Zero 團隊的其中一研發人員也談到了關於《星際爭霸2》的問題，這位名為 Julian Schrittwieser 的 AlphaGo 創造者代表在 Reddit 上進行了網友答問活動。

網友：你們覺得圍棋與《星際爭霸II》誰的研究難度更大？最大的潛在技術障礙是什麼？我們期待的正式更新什麼時候能出來？

Julian Schrittwieser：我們開放《星際爭霸II》的研究環境才過了幾個星期，所以現在還處於早期階段。星際爭霸的行動空間毫無疑問要比圍棋更具挑戰性，而且需要觀測的空間也要大得多。從技術角度而言，我認為最大的難點區別就是圍棋是一個處於在完全的信息展示環境下的遊戲，而星際爭霸由於有著戰爭迷霧，所以信息情報並不完美。

依照研究人員所說，《星際爭霸II》的AI尚處在早期階段，它的研發難度比圍棋更大。而在 AlphaGo Zero 誕生後，我們希望谷歌能以此為契機，在《星際爭霸II》AI研究上再做突破。

相關焦點

為了培養AlphaGo二代暴雪想把《星際爭霸2》變成AI實驗室

「圍棋上帝」AlphaGo 在戰勝柯潔之後便宣布退役，成為圍棋界難以逾越的一座高峰。而其締造者 DeepMind 公司早就為人工智慧準備了下一個目標：《星際爭霸 2》（StarCraft）。
AlphaGo挑戰人類《星際爭霸2》:必遭暴虐

在 AlphaGo 戰勝了韓國圍棋棋手李世石後，DeepMind 創始人戴密斯·哈薩比斯（Demis Hassabis）就曾表示將研究以人工智慧與人類玩其他遊戲，例如即時戰略遊戲《星際爭霸》。不過目前看來，DeepMind AI要跟人類比賽打《星際爭霸》這事，還是有點兒懸。
棋跡:少年AlphaGo Zero的圍棋成長之路

AlphaGo Zero在無圍棋知識輸入的前提下達到如此高度，可以說離通用智能又近了一步。大道至簡。對於AlphaGo，最簡潔的，就是最美的。在與人「實戰」領域的應用，AlphaGo為人工智慧隊加了一分，但在同樣備受矚目的星際爭霸遊戲中，人類用人腦的智慧扳回了一局。
「一邊倒」的人機對抗:《星際爭霸》比圍棋難在哪?

這一次它的對手不是圍棋，而是《星際爭霸》。前段時間，韓國首爾世宗大學官方舉辦了世界首屆人類與星際爭霸AI的對抗賽，代表人類出戰的是前《星際爭霸》項目職業選手：Stork(宋炳具)，與之對抗的對手則是四個不同的AI，韓國世宗大學金正中教授組織開發的「MJ Bot」，以及來自澳洲的「ZZZK」，挪威的「TSCMO」和Facebook開發的Cherry Pi。
星際爭霸2人類1:10輸給AI!DeepMind 「AlphaStar」進化神速

在 AlphaGo 在 2017 年圍棋大獲全勝之後，DeepMind 開始對外宣布，團隊正在著手讓人工智慧徵服星際爭霸 2，這款遊戲對人工智慧在處理複雜任務上的成功提出了"重大挑戰"。而除了棋類遊戲以外，DeepMind 比較感興趣的，就是遊戲星際爭霸 2。繼圍棋之後，DeepMind 為什麼要選擇星際爭霸 2 這款遊戲為下一個目標呢？星際爭霸 2 是由美國著名遊戲公司暴雪娛樂（Blizzard Entertainment）推出的一款以星際戰爭為題材的即時戰略遊戲。
繼AlphaGo圍棋戰勝柯潔,AlphaStar大勝人類星際玩家

谷歌DeepMind的AlphaGo繼谷歌DeepMind的AlphaGo戰勝人類的世界圍棋冠軍柯潔、李世石之後，時隔兩年，DeepMind人工智慧再升級，推出最新AI程序AlphaStar，挑戰暴雪的經典遊戲《星際爭霸
最強版阿爾法狗已停止進一步強化締造者稱正著手星際爭霸

該團隊成員稱，公司內部已經停止了AlphaGo的強化研究，他們正著手開發星際爭霸。他們嘗試了很多方法來解決，如給程序灌輸更多的圍棋知識或人類元知識。這一次他們的解決方法是讓系統的算法變得更加條理化，使用更少的知識，更多地依賴強化學習來生成更高質量的解決方案。從最終結果看，效果還不錯。 AlphaGo Zero更多依靠強化學習算法，而不是人類數據的方法，也引發了算法和數據之間哪個更重要的討論。
AlphaGo Zero用40天成為世界最強圍棋AI

棋士柯潔：一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了李喆：完全拋開人類圍棋知識，去年論文裡提到的許多特徵和rollout全部去掉，兩個神經網絡合為一個，只給定棋盤、棋子和規則。
AlphaGo 圍棋教學工具已發布

2. 所有盤面都有AlphaGo評估的勝率，以及AlphaGo推薦的下法。3. 所有AlphaGo的勝率與推薦下法，AlphaGo都思考將近10分鐘(1000萬次模擬)。4. 每一個開局變化，AlphaGo都固定延伸20步棋。加上AlphaGo的下法，整個教學工具約有2萬個分支變化，37萬個盤面。
阿爾法狗大戰星際爭霸2?明早凌晨兩點的直播你不可錯過!

它是DeepMind Al推出的人工智慧系統，曾經於2016年3月以4比1的比分擊敗了世界圍棋冠軍職業九段棋手李世石，隨後又以3比0的比分擊敗了世界排名第一的圍棋冠軍柯潔。雖然不能說阿爾法狗的智能超過了人類，但是至少在最考驗智能的圍棋項目中，人類已經不是敵手。星際爭霸2是誰？
【話題】AlphaGo Zero!圍棋之神真來了……

阿爾法元完全從零開始，不需要任何歷史棋譜的指引，更不需要參考人類任何的先驗知識，完全靠自己強化學習和參悟, 棋藝增長遠超阿爾法狗，百戰百勝，擊潰阿法爾狗100比0。升級後的神經網絡與搜索網絡結合成一個更強的新版本Alpha Go Zero，如此往復循環。每過一輪，系統的表現就提高一點點，自我對弈的質量也提高一點點。神經網絡越來越準確，Alpha Go Zero的版本也越來越強。這種技術比此前所有版本的Alpha Go都更為強大。
Deepmind新一代AlphaGo Zero自學3天打敗AlphaGo

的基本原理，DeepMind聯合創始人兼CEO Demis Hassabis表示：「AlphaGo Zero是我們項目中最強大的版本，它展示了我們在更少的計算能力，而且完全不使用人類數據的情況下可以取得如此大的進展。」
《星際爭霸2》淪陷人類被AI血洗

1997年，「深藍」在西洋棋上擊敗人類冠軍卡斯帕羅夫的時候，人們說來一盤圍棋啊，結果有了AlphaGo橫掃人類頂尖高手李世石、柯潔。這時候，有人說來一盤「星際」啊……結果，還不到三年，《星際爭霸2》又被AI拿下，而且人類輸得幾乎體無完膚！
《星際爭霸2》暴雪嘉年華看點回顧:未來更精彩

根據麥克·莫汗的介紹，雖然《虛空之遺》是《星際爭霸2》最後一個資料片，但暴雪仍然會在以後繼續支持《星際爭霸2》，除了開發其他一些新的內容外，暴雪將會繼續延續星際2的故事，甚至是推出RTS迷你戰役這樣全新的玩法。麥克·莫汗介紹，RTS迷你戰役將會是未來《星際爭霸2》的核心競爭力，相比平時緊張激烈的對戰模式，RTS迷你戰役將會更加休閒，甚至是怪隊友。
「黑客帝國」離我們更近了人類玩星際2輸給AI

這個人工智慧已經在圍棋領域上戰勝了現今棋壇第一的柯潔。而現在它的兄弟AlphaStar在《星際爭霸2》遊戲中將兩名知名選手斬於馬下，接下來又是同樣的劇情，最新的世界冠軍——芬蘭選手Serral將在2月15日出戰AlphaStar。
星際爭霸2停更付費內容,RTS類電競涼涼

10月16日，暴雪突然發布了一則關於《星際爭霸2》停止更新付費內容的藍貼。藍貼中提及之後將不會再製作額外付費內容，如指揮官或是戰爭寶箱等，僅提供賽季更新與必要的平衡性調整。如今，大眾化遊戲與強社交屬性手遊正極速擴張市場。反觀《星際2》，作為一款硬核端遊項目，用戶卻呈現出流失的態勢。
《星際爭霸2》SCV厲害嗎 SCV介紹

導讀星際爭霸2這款遊戲中是有很多的角色供玩家們選擇，SCV在人族中是一種生存、適應、建築能力都比較強勁的兵種
微信團隊開源圍棋AI技術PhoenixGo,復現AlphaGo Zero論文

本文介紹了騰訊微信翻譯團隊開源的人工智慧圍棋項目 PhoenixGo，該項目是對 DeepMindAlphaGo Zero論文《Mastering the game of Go without human knowledge》的實現。
谷歌團隊發布AlphaGo Zero:柯潔稱人類太多餘了

谷歌團隊發布AlphaGo Zero：柯潔稱人類太多餘了（圖片來自於推特）在這款軟體發出之後，柯潔也對這款軟體發表了自己的看法，他認為：「一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了。」之所以柯潔會這樣說，主要是因為AlphaGo Zero的練習主要是通過自我對弈在三十天之內發展起來的。
《星際爭霸2》中那些型男角色,酷!

《星際爭霸2》中那些型男角色，酷！在《星際爭霸2》遊戲中有著許許多多的男性角色，這些「型男」各具特色，有的以堅強的個性而聞名，有的具有非常鮮明的正義感而備受尊重，還有的純粹以一張俊男臉迷倒萬千少女，一起來看看都有誰吧！

AlphaGo Zero創造者:星際爭霸2比圍棋更具挑戰性

相關焦點

為了培養AlphaGo二代 暴雪想把《星際爭霸2》變成AI實驗室

AlphaGo挑戰人類《星際爭霸2》:必遭暴虐

棋跡:少年AlphaGo Zero的圍棋成長之路

「一邊倒」的人機對抗:《星際爭霸》比圍棋難在哪?

星際爭霸2人類1:10輸給AI!DeepMind 「AlphaStar」進化神速

繼AlphaGo圍棋戰勝柯潔,AlphaStar大勝人類星際玩家

最強版阿爾法狗已停止進一步強化 締造者稱正著手星際爭霸

AlphaGo Zero用40天成為世界最強圍棋AI

AlphaGo 圍棋教學工具已發布

阿爾法狗大戰星際爭霸2?明早凌晨兩點的直播你不可錯過!

【話題】AlphaGo Zero!圍棋之神真來了……

Deepmind新一代AlphaGo Zero自學3天打敗AlphaGo

《星際爭霸2》淪陷 人類被AI血洗

《星際爭霸2》暴雪嘉年華看點回顧:未來更精彩

「黑客帝國」離我們更近了 人類玩星際2輸給AI

星際爭霸2停更付費內容,RTS類電競涼涼

《星際爭霸2》SCV厲害嗎 SCV介紹

微信團隊開源圍棋AI技術PhoenixGo,復現AlphaGo Zero論文

谷歌團隊發布AlphaGo Zero:柯潔稱人類太多餘了

《星際爭霸2》中那些型男角色,酷!

為了培養AlphaGo二代暴雪想把《星際爭霸2》變成AI實驗室

最強版阿爾法狗已停止進一步強化締造者稱正著手星際爭霸

《星際爭霸2》淪陷人類被AI血洗

「黑客帝國」離我們更近了人類玩星際2輸給AI