最強版阿爾法狗已停止進一步強化 締造者稱正著手星際爭霸

2021-01-16 觀察者網

澎湃新聞10月20日報導,DeepMind公司10月18日新發布的最強版阿爾法狗(AlphaGo Zero)僅用3天時間,490萬盤自我對弈的訓練數據,一臺機器和4個TPU就打敗了戰勝過韓國棋手李世石對弈的AlphaGo。該團隊成員稱,公司內部已經停止了AlphaGo的強化研究,他們正著手開發星際爭霸。

AlphaGo項目首席研究員,大衛·席爾瓦  澎湃新聞視頻截圖

僅用3天時間,490萬盤自我對弈的訓練數據,一臺機器和4個TPU就打敗了戰勝過韓國棋手李世石對弈的AlphaGo,DeepMind公司10月18日新發布的最強版AlphaGo Zero技驚四座。

在最新的論文和官方博客中,DeepMind聯合創始人兼CEO 、AlphaGo之父戴密斯·哈薩比斯(Demis Hassabis)和AlphaGo團隊負責人大衛·席爾瓦(Dave Sliver) 將AlphaGo Zero的成功歸咎於強化學習的升級。這一次,他們僅採用單一的神經網絡,綜合了策略網絡和價值網絡兩種此前用的方法,在不用人類棋譜的情況下,完成了上所述的成就。

10月19日,大衛·席爾瓦與團隊另一成員 Julian Schrittwieser 代表 AlphaGo ,在問答新聞社區Reddit上回答了網友的提問。

在問答過程中,席爾瓦透露,目前,DeepMind內部已經停止了強化 AlphaGo 的積極研究,但仍保留了研究試驗臺,以供 DeepMind 人員驗證新思路和新算法。至於未來是否會開源給全球開發者共享。席爾瓦表示,DeepMind之前已經開源了大量的代碼,但過程一直非常複雜。不幸的是,AlphaGo 項目的代碼庫更加複雜,甚至可以說複雜的過分了。

值得一提的是,據兩位成員透露,在開發AlphaGo的過程中,DeepMind團隊遇到的最大困難是在與李世石比賽期間出現的。當時,團隊意識到 AlphaGo 偶爾會受到錯覺(delusion)的影響。即對弈中,會持續多次系統地誤解當前的棋局。他們嘗試了很多方法來解決,如給程序灌輸更多的圍棋知識或人類元知識。這一次他們的解決方法是讓系統的算法變得更加條理化,使用更少的知識,更多地依賴強化學習來生成更高質量的解決方案。從最終結果看,效果還不錯。

AlphaGo Zero更多依靠強化學習算法,而不是人類數據的方法,也引發了算法和數據之間哪個更重要的討論。在Julian Schrittwieser看來,目前算法仍然比數據更重要,只要看看 AlphaGo Zero 比之前幾個版本的訓練效率高出那麼多就能理解。但這也表明,未來,數據在訓練效率上的重要性還會有很大的提升。

DeepMind與暴雪合作打造的圖形界面,將把《星際爭霸 2》簡化成基本的視覺圖形  圖源:鎢絲科技

另外,網友還特別關心了DeepMind星際爭霸人工智慧的開發進度,Julian Schrittwieser回答道:「我們宣布開放星際爭霸 2 環境剛過去幾個星期,所以現在還處於早期階段。星際爭霸的行動空間確實要比圍棋更具挑戰性,因為其觀察空間要遠大於圍棋。從技術上講,我認為兩者最大的區別之一在於圍棋是一種完美信息博弈,而星際爭霸因為有戰爭迷霧,屬於不完美信息博弈。」

在問答中,也有網友將DeepMind的人工智慧與Facebook的研究做比較,兩者究竟誰更勝一籌。對於這個問題,席爾瓦說:「Facebook 更關注監督學習,它能產生當時性能最優的模型;而我們更關注強化學習,因為我們相信它最終會超越人類已有的知識而進一步取得提升。我們最近的結果實際上表明,只有監督學習確實可實現令人驚嘆的表現,但強化學習絕對是超越人類水平的關鍵。」

澎湃新聞記者/王心馨

相關焦點

  • 阿爾法狗大戰星際爭霸2?明早凌晨兩點的直播你不可錯過!
    阿爾法狗是誰?它是DeepMind Al推出的人工智慧系統,曾經於2016年3月以4比1的比分擊敗了世界圍棋冠軍職業九段棋手李世石,隨後又以3比0的比分擊敗了世界排名第一的圍棋冠軍柯潔。雖然不能說阿爾法狗的智能超過了人類,但是至少在最考驗智能的圍棋項目中,人類已經不是敵手。
  • 《星際爭霸》重製版已登陸國服暴雪戰網
    穿越20年的暴雪即時戰略(RTS)經典之作《星際爭霸:重製版》從8月30日起將正式入駐國服暴雪戰網。還記得曾經的宿舍大戰嗎?還記得戰役裡波瀾壯闊的艾爾之戰嗎?還記得飛龍甩尾、矩陣閃電這樣的極限操作嗎?《星際爭霸》作為一款誕生於20年前的經典之作,承載了那個時代關於遊戲、電競太多的回憶。20年過去,《星際爭霸》重製歸來,再次將我們帶回那個恢弘史詩的太空世界。
  • 《星際爭霸3》後期時是不是人族最強?
    其實星際3大後期哪個種族更強這個問題,是很難回答的,前提和背景有偏差,種族的優劣勢也會出現很大的偏差。所以說我們要先在分析一下前提,主要是選手實力和地圖。事實上星際爭霸是不平衡的,長時間維持三族相對平衡的態勢,地圖有很重要的作用。對於普通玩家來說,人族在大後期,應該是最難玩的一個種族。原因是人族在中期使用mm的時候容錯率比較低,而中後期使用機械化的時候,節奏總是很被動的。是一個以防守反擊接擴張的思路進行,如果沒有特別好的節奏機會強行推進,很容易被出其不意地一波吃掉。
  • 玩家請願不要停止《星際爭霸2》更新:暴雪無動於衷
    《星際爭霸2》推出已經10年了了,而暴雪也是做了一個決定,停止對它的更新。雖說在這樣的一個大時間點,但暴雪並沒有給喜歡這款遊戲的玩家帶來好消息,相反給出的公告稱,《星際爭霸2》將停止付費內容更新,僅保留必要的PVP平衡性調整。
  • 《星際爭霸》重製版同步國服?官方:只是BUG
    【17173玩家頻道整理】在今年3月份,暴雪正式公布經典的RTS遊戲《星際爭霸》將進行高清重製,重製後的遊戲將支持寬屏解析度和4K,音樂和畫面都進行了重繪。重製版遊戲還將更新了對話和語音,增加了暴雪好友與配對系統(包括區域網+戰網),對於星際粉絲們可謂一大好消息。
  • AlphaGo Zero創造者:星際爭霸2比圍棋更具挑戰性
    這次谷歌 DeepMind 團隊帶來的是最新版 AlphaGo ,它的代號為「AlphaGo Zero」。我們都知道 AlphaGo 曾打敗圍棋世界冠軍,它是God,是神,是史上最強的圍棋「選手」,但這次公布的 AlphaGo Zero 卻更為兇悍:憑藉新型的強化學習技術, AlphaGo Zero 以100:0的比分擊敗了之前的世界冠軍 AlphaGo。
  • 體量大十倍,Facebook開源史上最大星際爭霸AI研究數據集
    在 AlphaGo 徵服圍棋之後,即時戰略遊戲《星際爭霸》已經成為各家科技巨頭與大學的下一個目標。Facebook 在這一方面的研究似乎正處於領先地位。7 月初,田淵棟等人開源了基於星際爭霸的人工智慧遊戲平臺(參見:Facebook 開源遊戲平臺 ELF,簡化版《星際爭霸》完美測試人工智慧)。
  • 「一邊倒」的人機對抗:《星際爭霸》比圍棋難在哪?
    該程序從2011年開發至今已經多次亮相,而且獲獎無數,被譽為現今韓國最好的「星際爭霸AI」。當現階段最強電腦AI碰上前職業選手,有人猜測二者會殺得難解難分。尤其是在看過了AlphaGo在圍棋上的強勢之後,有人反而覺得電腦的勝算會更高一點。但是比賽的結果卻相當的「平淡」,第一局和MJ的比賽,Stork祭出空投戰術,拿到場面優勢之後順手就拆了對手老家。
  • 老版《星際爭霸戰》「史巴克」去世 享年83歲
    老版《星際爭霸戰》「史巴克」去世 享年83歲 2015-02-28 09:50:04來源:中國新聞網作者:責任編輯:何路曼   中新網2月28日電 據「中央社」報導,當地時間27日,曾主演《星際爭霸戰》(或譯《星艦迷航記》)影集和電影中尖耳大副史巴克(Spock)的83歲演員倫納德·尼莫伊 (Leonard Nimoy)過世,其他星艦演員表示哀悼。  據報導,尼莫伊的妻子已證實其死訊。尼莫伊晚年一直受慢性阻塞性肺病(COPD)所苦。
  • 星際科普:《虛空之遺》新單位的演變(人族篇)|星際爭霸2|星際爭霸2...
    女武神在《星際爭霸2》中的模型其實早已有之,雖然沒能被最終加入到《星際爭霸2》的遊戲中,但通過修改後變成了《虛空之遺》的人族新單位解放者加入到了對戰模式中。不過當《星際爭霸2》Beta版測試開始後,女妖的駕駛者最終被確定為女性。
  • 魔獸爭霸3機制比圍棋還簡單?阿爾法狗能否輕鬆戰勝war3玩家?
    魔獸爭霸3一直是即時戰略類遊戲的神作,因為小地圖作戰模式與英雄體系的加入,使得魔獸的微操與多線操作要求更加複雜,對於玩家精力的消耗非常恐怖,因為被不少想要要入坑即時戰略遊戲的玩家拒之門外。不過,如果拿wai3與圍棋對比,這兩款遊戲誰的難度會更高呢?
  • 《星際爭霸:重製版》初體驗
    今日(8月30日),《星際爭霸:重製版》正式登陸國服暴雪戰網,售價98元。今年,距離《星際爭霸》發售已經過去20年,暴雪終於為我們製作出了簡體中文版。然而這20年,遊戲界早已發生了翻天覆地的變化,電競項目已沿著娛樂化、簡單化之路越走越遠,這時的你可能還記得「show me the money」,但還有時間、有心力,還玩得動複雜的《星際爭霸》嗎?不管買《星際爭霸:重製版》是為了補票,還是為了信仰,別著急,老K先帶你簡單了解一下重製版長啥樣。看看暴雪到底是誠意滿滿,還是炒冷飯?
  • 《星際爭霸:重製版》:二十年情懷不容錯過,鬼迷心竅才不體驗
    《星際爭霸:重製版》要來了,2017年3月26日,暴雪在韓國首爾舉辦的《星際爭霸》發售19周年紀念活動「我愛《星際爭霸》」上,正式宣布將會推出《星際爭霸:重製版》。重製後的《星際爭霸》命名為《星際爭霸:重製版》,重製版將會帶來高解析度畫質,同時還會加上升級版的戰網服務系統。
  • 暴雪官網發新招募信息 新作或是FPS版《星際爭霸》
    原標題:暴雪官網發新招募信息 新作或是FPS版《星際爭霸》   根據暴雪官網發布的最新招募信息顯示,他們的下一個FPS新作將主打PvP,與此同時,暴雪還將擴展《暗黑破壞神》系列團隊規模。
  • 數據帝追蹤三年 《星際爭霸2》抗韓英雄榜浮出水面
    【遊久網10月25日消息】  說起《星際爭霸2》職業選手的實力,相信絕大多數玩家都會認為韓國選手實力最強,更有人認為韓國的星際2水平強如中國的桌球,其他國家的選手累感不愛。
  • 星際爭霸重製版:劇情全中文語音!對中國玩家友好的一款RTS遊戲
    封鎖了IP之後,遊戲人氣一落千丈,加上《絕地求生》的強勢登場,這款遊戲已是涼涼的狀態,現如今只能依靠騰訊挽救。無論怎樣,也不能傷害玩家的心。如果能做到一視同仁,互相尊重,那麼這款遊戲我們會誓死追隨,這就是國人玩家一顆單純的心。雖然有些遊戲不盡人意,卻不乏一些對玩家十分親切的遊戲。
  • 《星際爭霸》官方重製版神族繪圖放出
    《星際爭霸》官方重製版神族繪圖放出 發布時間:2017-06-04 09:02:54.0光明網       想必粉絲們都已經知道暴雪正在重製《星際爭霸》,上周五,星際重製團隊放出了一張蟲族在遊戲中勝利的重製繪圖畫作,大家應該感受到高清刺蛇的猙獰了。
  • 科學網—一隻「阿爾法狗」的科技徵途
    棋手起手就有361種落子選擇。理論上,如果不考慮限制條件,棋盤狀態共有3的361次方種,下法共有361階乘種選擇,這個數字大約是10的768次方,幾乎是無窮大。要知道人類已知宇宙中的原子數量,也不過是10的80次方。」
  • 星際爭霸自編地圖為基礎開發 《RTD計劃》Steam降價51%
    【17173新聞報導,轉載請註明出處】據悉,星際爭霸人氣自編地圖為基礎開發的《Project RTD》(暫譯:RTD計劃)開始了Steam的一周特惠活動。此次活動將進行到4月7日為止,原來賣35元的Demo版,目前只賣17元,降價幅度高達51%。對此,開發商兼發行商NGELGAMES表示,在全球受新冠肺炎疫情影響的如今,希望玩家們能在家裡安全地玩遊戲。據悉,玩家在Demo版中可以體驗普通賽和友誼賽,Demo版的遊戲記錄,在購買正式版時也會得以繼承。
  • 小狗居然有爪子 星際爭霸重製後更新了這些內容
    【17173編譯,轉載請註明出處】暴雪在《星際爭霸》20周年慶之前爆出了高清重製版的消息,讓許多粉絲都為之興奮,甚至許多退役的職業選手都表示願意嘗試回歸。而暴雪對於星際爭霸重製後的藝術設計有著非常明確的願景,主要原則是忠於原版。