最強版阿爾法狗已停止進一步強化締造者稱正著手星際爭霸

2021-01-16 觀察者網

澎湃新聞10月20日報導，DeepMind公司10月18日新發布的最強版阿爾法狗（AlphaGo Zero）僅用3天時間，490萬盤自我對弈的訓練數據，一臺機器和4個TPU就打敗了戰勝過韓國棋手李世石對弈的AlphaGo。該團隊成員稱，公司內部已經停止了AlphaGo的強化研究，他們正著手開發星際爭霸。

AlphaGo項目首席研究員，大衛·席爾瓦澎湃新聞視頻截圖

僅用3天時間，490萬盤自我對弈的訓練數據，一臺機器和4個TPU就打敗了戰勝過韓國棋手李世石對弈的AlphaGo，DeepMind公司10月18日新發布的最強版AlphaGo Zero技驚四座。

在最新的論文和官方博客中，DeepMind聯合創始人兼CEO 、AlphaGo之父戴密斯·哈薩比斯（Demis Hassabis）和AlphaGo團隊負責人大衛·席爾瓦（Dave Sliver）將AlphaGo Zero的成功歸咎於強化學習的升級。這一次，他們僅採用單一的神經網絡，綜合了策略網絡和價值網絡兩種此前用的方法，在不用人類棋譜的情況下，完成了上所述的成就。

10月19日，大衛·席爾瓦與團隊另一成員 Julian Schrittwieser 代表 AlphaGo ，在問答新聞社區Reddit上回答了網友的提問。

在問答過程中，席爾瓦透露，目前，DeepMind內部已經停止了強化 AlphaGo 的積極研究，但仍保留了研究試驗臺，以供 DeepMind 人員驗證新思路和新算法。至於未來是否會開源給全球開發者共享。席爾瓦表示，DeepMind之前已經開源了大量的代碼，但過程一直非常複雜。不幸的是，AlphaGo 項目的代碼庫更加複雜，甚至可以說複雜的過分了。

值得一提的是，據兩位成員透露，在開發AlphaGo的過程中，DeepMind團隊遇到的最大困難是在與李世石比賽期間出現的。當時，團隊意識到 AlphaGo 偶爾會受到錯覺（delusion）的影響。即對弈中，會持續多次系統地誤解當前的棋局。他們嘗試了很多方法來解決，如給程序灌輸更多的圍棋知識或人類元知識。這一次他們的解決方法是讓系統的算法變得更加條理化，使用更少的知識，更多地依賴強化學習來生成更高質量的解決方案。從最終結果看，效果還不錯。

AlphaGo Zero更多依靠強化學習算法，而不是人類數據的方法，也引發了算法和數據之間哪個更重要的討論。在Julian Schrittwieser看來，目前算法仍然比數據更重要，只要看看 AlphaGo Zero 比之前幾個版本的訓練效率高出那麼多就能理解。但這也表明，未來，數據在訓練效率上的重要性還會有很大的提升。

DeepMind與暴雪合作打造的圖形界面，將把《星際爭霸 2》簡化成基本的視覺圖形圖源：鎢絲科技

另外，網友還特別關心了DeepMind星際爭霸人工智慧的開發進度，Julian Schrittwieser回答道：「我們宣布開放星際爭霸 2 環境剛過去幾個星期，所以現在還處於早期階段。星際爭霸的行動空間確實要比圍棋更具挑戰性，因為其觀察空間要遠大於圍棋。從技術上講，我認為兩者最大的區別之一在於圍棋是一種完美信息博弈，而星際爭霸因為有戰爭迷霧，屬於不完美信息博弈。」

在問答中，也有網友將DeepMind的人工智慧與Facebook的研究做比較，兩者究竟誰更勝一籌。對於這個問題，席爾瓦說：「Facebook 更關注監督學習，它能產生當時性能最優的模型；而我們更關注強化學習，因為我們相信它最終會超越人類已有的知識而進一步取得提升。我們最近的結果實際上表明，只有監督學習確實可實現令人驚嘆的表現，但強化學習絕對是超越人類水平的關鍵。」

澎湃新聞記者/王心馨

相關焦點

阿爾法狗大戰星際爭霸2?明早凌晨兩點的直播你不可錯過!

阿爾法狗是誰？它是DeepMind Al推出的人工智慧系統，曾經於2016年3月以4比1的比分擊敗了世界圍棋冠軍職業九段棋手李世石，隨後又以3比0的比分擊敗了世界排名第一的圍棋冠軍柯潔。雖然不能說阿爾法狗的智能超過了人類，但是至少在最考驗智能的圍棋項目中，人類已經不是敵手。
《星際爭霸》重製版已登陸國服暴雪戰網

穿越20年的暴雪即時戰略(RTS)經典之作《星際爭霸：重製版》從8月30日起將正式入駐國服暴雪戰網。還記得曾經的宿舍大戰嗎?還記得戰役裡波瀾壯闊的艾爾之戰嗎?還記得飛龍甩尾、矩陣閃電這樣的極限操作嗎?《星際爭霸》作為一款誕生於20年前的經典之作，承載了那個時代關於遊戲、電競太多的回憶。20年過去，《星際爭霸》重製歸來，再次將我們帶回那個恢弘史詩的太空世界。
《星際爭霸3》後期時是不是人族最強?

其實星際3大後期哪個種族更強這個問題，是很難回答的，前提和背景有偏差，種族的優劣勢也會出現很大的偏差。所以說我們要先在分析一下前提，主要是選手實力和地圖。事實上星際爭霸是不平衡的，長時間維持三族相對平衡的態勢，地圖有很重要的作用。對於普通玩家來說，人族在大後期，應該是最難玩的一個種族。原因是人族在中期使用mm的時候容錯率比較低，而中後期使用機械化的時候，節奏總是很被動的。是一個以防守反擊接擴張的思路進行，如果沒有特別好的節奏機會強行推進，很容易被出其不意地一波吃掉。
玩家請願不要停止《星際爭霸2》更新:暴雪無動於衷

《星際爭霸2》推出已經10年了了，而暴雪也是做了一個決定，停止對它的更新。雖說在這樣的一個大時間點，但暴雪並沒有給喜歡這款遊戲的玩家帶來好消息，相反給出的公告稱，《星際爭霸2》將停止付費內容更新，僅保留必要的PVP平衡性調整。
《星際爭霸》重製版同步國服?官方:只是BUG

【17173玩家頻道整理】在今年3月份，暴雪正式公布經典的RTS遊戲《星際爭霸》將進行高清重製，重製後的遊戲將支持寬屏解析度和4K，音樂和畫面都進行了重繪。重製版遊戲還將更新了對話和語音，增加了暴雪好友與配對系統（包括區域網+戰網），對於星際粉絲們可謂一大好消息。
AlphaGo Zero創造者:星際爭霸2比圍棋更具挑戰性

這次谷歌 DeepMind 團隊帶來的是最新版 AlphaGo ，它的代號為「AlphaGo Zero」。我們都知道 AlphaGo 曾打敗圍棋世界冠軍，它是God，是神，是史上最強的圍棋「選手」，但這次公布的 AlphaGo Zero 卻更為兇悍：憑藉新型的強化學習技術， AlphaGo Zero 以100:0的比分擊敗了之前的世界冠軍 AlphaGo。
體量大十倍,Facebook開源史上最大星際爭霸AI研究數據集

在 AlphaGo 徵服圍棋之後，即時戰略遊戲《星際爭霸》已經成為各家科技巨頭與大學的下一個目標。Facebook 在這一方面的研究似乎正處於領先地位。7 月初，田淵棟等人開源了基於星際爭霸的人工智慧遊戲平臺（參見：Facebook 開源遊戲平臺 ELF，簡化版《星際爭霸》完美測試人工智慧）。
「一邊倒」的人機對抗:《星際爭霸》比圍棋難在哪?

該程序從2011年開發至今已經多次亮相，而且獲獎無數，被譽為現今韓國最好的「星際爭霸AI」。當現階段最強電腦AI碰上前職業選手，有人猜測二者會殺得難解難分。尤其是在看過了AlphaGo在圍棋上的強勢之後，有人反而覺得電腦的勝算會更高一點。但是比賽的結果卻相當的「平淡」，第一局和MJ的比賽，Stork祭出空投戰術，拿到場面優勢之後順手就拆了對手老家。
老版《星際爭霸戰》「史巴克」去世享年83歲

老版《星際爭霸戰》「史巴克」去世享年83歲 2015-02-28 09:50:04來源：中國新聞網作者：責任編輯：何路曼　　中新網2月28日電據「中央社」報導，當地時間27日，曾主演《星際爭霸戰》(或譯《星艦迷航記》)影集和電影中尖耳大副史巴克(Spock)的83歲演員倫納德·尼莫伊 (Leonard Nimoy)過世，其他星艦演員表示哀悼。　　據報導，尼莫伊的妻子已證實其死訊。尼莫伊晚年一直受慢性阻塞性肺病(COPD)所苦。
星際科普:《虛空之遺》新單位的演變(人族篇)|星際爭霸2|星際爭霸2...

女武神在《星際爭霸2》中的模型其實早已有之，雖然沒能被最終加入到《星際爭霸2》的遊戲中，但通過修改後變成了《虛空之遺》的人族新單位解放者加入到了對戰模式中。不過當《星際爭霸2》Beta版測試開始後，女妖的駕駛者最終被確定為女性。
魔獸爭霸3機制比圍棋還簡單?阿爾法狗能否輕鬆戰勝war3玩家?

魔獸爭霸3一直是即時戰略類遊戲的神作，因為小地圖作戰模式與英雄體系的加入，使得魔獸的微操與多線操作要求更加複雜，對於玩家精力的消耗非常恐怖，因為被不少想要要入坑即時戰略遊戲的玩家拒之門外。不過，如果拿wai3與圍棋對比，這兩款遊戲誰的難度會更高呢？
《星際爭霸:重製版》初體驗

今日（8月30日），《星際爭霸：重製版》正式登陸國服暴雪戰網，售價98元。今年，距離《星際爭霸》發售已經過去20年，暴雪終於為我們製作出了簡體中文版。然而這20年，遊戲界早已發生了翻天覆地的變化，電競項目已沿著娛樂化、簡單化之路越走越遠，這時的你可能還記得「show me the money」，但還有時間、有心力，還玩得動複雜的《星際爭霸》嗎？不管買《星際爭霸：重製版》是為了補票，還是為了信仰，別著急，老K先帶你簡單了解一下重製版長啥樣。看看暴雪到底是誠意滿滿，還是炒冷飯？
《星際爭霸:重製版》:二十年情懷不容錯過,鬼迷心竅才不體驗

《星際爭霸：重製版》要來了，2017年3月26日，暴雪在韓國首爾舉辦的《星際爭霸》發售19周年紀念活動「我愛《星際爭霸》」上，正式宣布將會推出《星際爭霸：重製版》。重製後的《星際爭霸》命名為《星際爭霸：重製版》，重製版將會帶來高解析度畫質，同時還會加上升級版的戰網服務系統。
暴雪官網發新招募信息新作或是FPS版《星際爭霸》

原標題：暴雪官網發新招募信息新作或是FPS版《星際爭霸》　　根據暴雪官網發布的最新招募信息顯示，他們的下一個FPS新作將主打PvP，與此同時，暴雪還將擴展《暗黑破壞神》系列團隊規模。
數據帝追蹤三年《星際爭霸2》抗韓英雄榜浮出水面

【遊久網10月25日消息】　　說起《星際爭霸2》職業選手的實力，相信絕大多數玩家都會認為韓國選手實力最強，更有人認為韓國的星際2水平強如中國的桌球，其他國家的選手累感不愛。
星際爭霸重製版:劇情全中文語音!對中國玩家友好的一款RTS遊戲

封鎖了IP之後，遊戲人氣一落千丈，加上《絕地求生》的強勢登場，這款遊戲已是涼涼的狀態，現如今只能依靠騰訊挽救。無論怎樣，也不能傷害玩家的心。如果能做到一視同仁，互相尊重，那麼這款遊戲我們會誓死追隨，這就是國人玩家一顆單純的心。雖然有些遊戲不盡人意，卻不乏一些對玩家十分親切的遊戲。
《星際爭霸》官方重製版神族繪圖放出

《星際爭霸》官方重製版神族繪圖放出發布時間：2017-06-04 09:02:54.0光明網想必粉絲們都已經知道暴雪正在重製《星際爭霸》，上周五，星際重製團隊放出了一張蟲族在遊戲中勝利的重製繪圖畫作，大家應該感受到高清刺蛇的猙獰了。
科學網—一隻「阿爾法狗」的科技徵途

棋手起手就有361種落子選擇。理論上，如果不考慮限制條件，棋盤狀態共有3的361次方種，下法共有361階乘種選擇，這個數字大約是10的768次方，幾乎是無窮大。要知道人類已知宇宙中的原子數量，也不過是10的80次方。」
星際爭霸自編地圖為基礎開發《RTD計劃》Steam降價51%

【17173新聞報導，轉載請註明出處】據悉，星際爭霸人氣自編地圖為基礎開發的《Project RTD》（暫譯：RTD計劃）開始了Steam的一周特惠活動。此次活動將進行到4月7日為止，原來賣35元的Demo版，目前只賣17元，降價幅度高達51%。對此，開發商兼發行商NGELGAMES表示，在全球受新冠肺炎疫情影響的如今，希望玩家們能在家裡安全地玩遊戲。據悉，玩家在Demo版中可以體驗普通賽和友誼賽，Demo版的遊戲記錄，在購買正式版時也會得以繼承。
小狗居然有爪子星際爭霸重製後更新了這些內容

【17173編譯，轉載請註明出處】暴雪在《星際爭霸》20周年慶之前爆出了高清重製版的消息，讓許多粉絲都為之興奮，甚至許多退役的職業選手都表示願意嘗試回歸。而暴雪對於星際爭霸重製後的藝術設計有著非常明確的願景，主要原則是忠於原版。

最強版阿爾法狗已停止進一步強化 締造者稱正著手星際爭霸

相關焦點

阿爾法狗大戰星際爭霸2?明早凌晨兩點的直播你不可錯過!

《星際爭霸》重製版已登陸國服暴雪戰網

《星際爭霸3》後期時是不是人族最強?

玩家請願不要停止《星際爭霸2》更新:暴雪無動於衷

《星際爭霸》重製版同步國服?官方:只是BUG

AlphaGo Zero創造者:星際爭霸2比圍棋更具挑戰性

體量大十倍,Facebook開源史上最大星際爭霸AI研究數據集

「一邊倒」的人機對抗:《星際爭霸》比圍棋難在哪?

老版《星際爭霸戰》「史巴克」去世 享年83歲

星際科普:《虛空之遺》新單位的演變(人族篇)|星際爭霸2|星際爭霸2...

魔獸爭霸3機制比圍棋還簡單?阿爾法狗能否輕鬆戰勝war3玩家?

《星際爭霸:重製版》初體驗

《星際爭霸:重製版》:二十年情懷不容錯過,鬼迷心竅才不體驗

暴雪官網發新招募信息 新作或是FPS版《星際爭霸》

數據帝追蹤三年 《星際爭霸2》抗韓英雄榜浮出水面

星際爭霸重製版:劇情全中文語音!對中國玩家友好的一款RTS遊戲

《星際爭霸》官方重製版神族繪圖放出

科學網—一隻「阿爾法狗」的科技徵途

星際爭霸自編地圖為基礎開發 《RTD計劃》Steam降價51%

小狗居然有爪子 星際爭霸重製後更新了這些內容

最強版阿爾法狗已停止進一步強化締造者稱正著手星際爭霸

老版《星際爭霸戰》「史巴克」去世享年83歲

暴雪官網發新招募信息新作或是FPS版《星際爭霸》

數據帝追蹤三年《星際爭霸2》抗韓英雄榜浮出水面

星際爭霸自編地圖為基礎開發《RTD計劃》Steam降價51%

小狗居然有爪子星際爭霸重製後更新了這些內容