《自然》發布新研究:DeepMind推MuZero程序,無規則條件下掌握圍棋...

2020-12-26 東方財富網

原標題:《自然》發布新研究:DeepMind推MuZero程序,無規則條件下掌握圍棋,象棋等

  人工智慧公司DeepMind在2016年推出AlphaGo,這是第一個在圍棋中擊敗人類的人工智慧(AI)程序。兩年後,它的繼任者-AlphaZero-從零開始學習圍棋,西洋棋和將棋。而在頂級科學期刊《自然》雜誌今天凌晨發布的論文中,DeepMind擬定MuZero模型程序,這是在追求通用算法方面邁出的重要一步。由於MuZero能夠在未知環境中計劃獲勝策略,因此無需掌握規則即可掌握圍棋象棋,將棋和Atari的知識

(文章來源:鈦媒體)

(責任編輯:DF537)

相關焦點

  • 陳經:Deepmind這次搞定西洋棋,只用了四個小時
    【文/ 觀察者網專欄作者 陳經】 2017年12月6號,Deepmind扔出了一篇論文《Mastering Chess and Shogi by Self-Play with a General Reinenforcement Learning Algorithm》,聲稱從AlphaGo Zero發展來的新程序AlphaZero又零基礎自學,只用4個小時和2
  • 終極版AlphaGo,DeepMind新算法MuZero作者解讀
    所有一切不過是統計MuZero是一種機器學習算法,因此自然要先了解它是如何使用神經網絡的。簡單來說,該算法使用了AlphaGo和AlphaZero的策略網絡和值網絡:策略和值的直觀含義如下:策略p(s,a)表示在狀態s時所有可能的動作a分布,據此可以估計最優的動作。類比人類玩家,該策略相當於快速瀏覽遊戲時擬採取的可能動作。
  • AlphaFold抗疫,DeepMind公布六種新冠病毒蛋白質結構預測結果
    DeepMind 開放的新冠病毒蛋白質結構預測結果下載連結:https://storage.googleapis.com/deepmind-com-v3-datasets/alphafold-covid19/structures_4_3_2020.zip為什麼要用深度學習預測新冠病毒蛋白結構?
  • 下圍棋的DeepMind成了「藥神」,這事兒和你我都有關
    以新冠為例,科學家一直在試圖研究新冠病毒表面的刺突蛋白是如何與人類細胞中的受體相互作用的。而像老年痴呆症這種由錯誤摺疊的蛋白質引起的疾病,人們一旦看清了蛋白質的結構,就能在現有的藥物中快速匹配治療或者嘗試新的療法。
  • DeepMind開源薛丁格方程求解程序:從量子力學原理出發,TensorFlow...
    在構造FermiNet之初,研究人員就把泡利不相容原理作為第一性原理引入神經網絡。在FermiNet中,每個電子都有單獨的信息流。不僅如此,他們將網絡每一層所有流平均化,然後傳遞給下一層的每一流。這樣,這些流就具有正確的反對稱性要求。而且在FermiNet行列式中的每個元素都包含所有電子,效率遠遠超出波函數只有單個電子的情況。
  • DeepMind破解蛋白質摺疊難題
    我們都知道,DeepMind以戰勝人類而著名,在西洋棋,圍棋,星際爭霸II和老式的Atari經典遊戲中都佔據了上風。但超人遊戲從來都不是主要目標,遊戲為程序提供了訓練場,一旦程序足夠強大,就可以解決現實世界中的問題!
  • DeepMind 星際爭霸AI登刊Nature!RTS遊戲已被AI攻克?
    AlphaStar是有史以來第一個在無限制條件下達到主流電競頂級水準的AI。在今年一月擊敗了兩位星際爭霸2世界頂尖水準玩家後,DeepMind著眼於使AI在完整競技環境下達到業內認可的宗師水準。2019年10月30日,Google DeepMind關於AlphaStar的論文發表在了《Nature》雜誌上[1]。
  • 業界 | DeepMind遊戲AI又有新突破,與智能體、人類合作都不在話下
    ,介紹了其在遊戲智能體方面的新進展。交互式 CTF 遊戲瀏覽器,具有程序生成的室內和戶外環境中的遊戲。下載地址:https://deepmind.com/documents/224/capture_the_flag.pdf摘要:
  • 再創新高:DeepMind一年燒掉6.5億美元,谷歌卻揮手免除15億債務
    這家公司因其大量研究成果被社區所熟知,比如打敗圍棋世界冠軍的 AlphaGo、預測蛋白質結構的 AlphaFold 2 等等。DeepMind 以在圍棋領域戰勝最強人類的 AlphaGo 開始廣為人們所知,2017 年 5 月,當時的世界第一選手柯潔在人機大戰中 0 比 3 落敗。
  • DeepMind團隊進行全面解讀
    提問:你們發了AlphaGo論文之後,網友們說裡邊的算法實現起來不難,但很難達到你們那個訓練量;在計算機下象棋的圈子裡,開發者們也沒少複製其他程序的算法。你認為算法和數據哪個更重要?Julian Schrittwieser:我認為還是算法更重要,比較一下新AlphaGo Zero和之前論文中的版本,新版效率有多高就知道了。另外,我認為我們在數據效率方面還能有更多提升。
  • DeepMind創始人自述:我們的算法可以橫掃一切棋類博弈
    Alphago的研發團隊是谷歌新近收購的英國人工智慧公司Deepmind,關於Deepmind,國內人工智慧圈人士都有所耳聞,但熟悉者恐怕不多。這究竟是一家什麼樣的公司?這樣來理解人工智慧,你就會發現它是一個非常自然的東西。我們致力於研究強人工智慧(AGI),它可以自動將非結構化信息轉換成可以直接利用的知識。
  • DeepMind如何助谷歌成為最強AI公司?
    而近來,AlphaGo的人生又像開掛了一般,攻勢愈加強烈,從脫胎換骨到新一代「AlphaGo Zero」,還在今年年初《星際爭霸2》大賽中以5:2優秀戰績戰勝了職業電競選手,一路深入到「敵方水晶」,暢通無阻,捷報連連。隨著「AlphaGo」的名聲響遍全球,與「AlphaGo」的爭論也隨之而來。AlphaGo究竟是怎樣誕生的?
  • 剛剛,DeepMind團隊進行了全面解讀
    David Silver:我們已經不再主動研究如何讓AlphaGo變得更強,但它仍然是所有DeepMind同仁的研究測試平臺,用於嘗試新的想法和算法。 提問:與圍棋相比,《星際2》有多難?AI打星際什時候能有新進展?
  • 生物學50年難題被DeepMind解決了,蛋白質版「阿法狗」預測結構準確...
    △圖源:Deepmind兩年前,上一版本的AlphaFold便已經取得了裡程碑的突破,但是,仍然沒有完全解決蛋白質摺疊問題。而這次AlphaFold 2,則更進一步。這一巨大的突破,直接引爆了全網,Nature、Science紛紛報導,生物屆和AI大牛們也紛紛祝賀。
  • 電腦程式ZEN比「深藍」更深 它或是圍棋終結者
    日媒稱ZEN曾受讓四子擊敗過武宮正樹九段,中國部分業餘棋界的高手日前下載該軟體,並測試後認為:以電腦圍棋「漲棋」的速度,五年之內很可能還會「給職業棋手帶來麻煩」。  裘新5段是一位IT從業者,骨灰級的遊戲製作人,在他日前的微博介紹中,記載了與電腦ZEN交戰的始末——「我抱著蔑視的心態和它下了4盤,第一盤優勢下一大意,居然被屠大龍!第二盤全面保守防守,居然輸半目!
  • 谷歌與DeepMind的矛盾,或爆發於利益、終結於權屬
    此後,DeepMind Health開始與倫敦皇家自由醫院的研究團隊合作,研發一個名為「Streams」的行動應用程式。「這款應用程式是為醫生和護士診斷急性腎損傷而設計的。除此之外,我們還在開發另一款名為Hark的應用,專注於臨床任務管理。」DeepMind當時對外發布了相關說明。
  • DeepMind開腦洞用桌遊訓練AI,7人博弈模型勝率可達32.5%
    早在2016年,DeepMind研發的AlphaGo就曾在圍棋對弈中擊敗韓國國手李世石。近些年來,還有一些研究用西洋棋、撲克等遊戲訓練AI模型。現有研究中用到的圍棋、西洋棋、撲克等遊戲都是雙人參與的零和博弈遊戲。在現實中,人類往往通過更多人的協作完成任務。
  • 獨家|專訪田淵棟:AlphaGo之後,研究智能圍棋還有什麼意義?
    另一方面,聯繫到後面那個問題(目前你的研究團隊,對圍棋AI的研究進展到何種地步?相比AlphaGo如何。),我們這邊在開源之後就先放在那兒了,可能等到以後我們有新想法再拿過來試一試。我們這邊是七八十人的研究機構,要讓我們花二十人做圍棋,這個是不可能的。我們這邊都是很有名的研究員,這些研究員每個人都有自己的方向,像計算機視覺和自然語言處理等等,不可能把自己的方向放棄掉來專門(搞圍棋)。
  • 擔心自己照片被Deepfake利用?試試波士頓大學這項新研究
    然而,有了這樣的開源攻擊模型,上傳的照片不再成為問題,deepfake 無法直接拿它做換臉。近日,來自波士頓大學的研究者在一篇論文中介紹了 deepfake 新研究,看論文標題與效果,似乎只要輸入我們的圖片,deepfake 換臉模型就不能再拿我們的圖片作為素材製作小視頻。