關於「AlphaGo zero擊敗AlphaGo」的改寫題|18北師大新傳專碩真題

2020-12-03 胡師姐北大新傳考研

2018年 北京師範大學新傳專碩334

改寫題

根據材料,改寫標題,完成:

140字簡訊,600字以內評論。

▼ 材料:

從0開始學,阿爾法元完勝阿爾法狗

中青在線訊(中國青年報·中青在線記者張茜)10月18日,《自然》雜誌網站公布的論文顯示,此前戰勝人類圍棋世界冠軍的電腦程式AlphaGo的開發團隊又出力作——新程序AlphaGo Zero(阿爾法元)不依靠人類指導和經驗,僅憑自身算法強化學習,就以100:0的戰績擊敗了AlphaGo(阿爾法狗)。

此消息給世人帶來了不小的震動。此前被AlphaGo擊敗的世界知名圍棋選手柯潔今早在社交平臺上表示:「一個純淨純粹自我學習的AlphaGo是最強的.....對於AlphaGo的自我進步來講.....人類太多餘了。"

那麼,經過升級的AlphaGo Zero到底是如做到「長江後浪推前浪」的呢?

人工智慧的最大挑戰是研發一種能從零開始、以超人類的水平學習複雜概念的算法。

《自然》雜誌的公開消息稱,為了打敗人類圍棋世界冠軍,科學家在訓練上一款AlphaGo時,同時用到了監督式學習(基於上百萬種人類專業選手的下棋步驟)和基於自我對弈的強化學習。此前那款AlphaGo的訓練過程長達幾個月,用到多臺機器和48個TPU(神經網絡訓練所需的專業晶片)。

而在最新發表的論文中,作者David Silver,Julian Schrittwieser,Karen Simonyan,Demis Hassabis等在介紹AlphaGo Zero時表示,它的學習從零開始,且單純基於與自己的對弈。人類的輸入沒有超出遊戲規則以外的任何指導、數據以及內部知識。

AlphaGo Zero僅用到一張神經網絡,這張網絡經過訓練,專門預測程序自身的棋步和棋局的贏家,在每次自我對弈中進步。新程序只使用一臺機器和4個TPU。

通過幾天的訓練——包括近500萬局自我對弈——AlphaGo Zero便能夠超越人類並打敗所有之前的AlphaGo版本。

David Silver團隊在其公司DeepMind網站中總結道,AlphaGo Zero相比與AlphaGo的更強大之處恰恰在於:「它再也不會受到人類經驗的限制,而是可以不斷向世界上最強的圍棋手——也就是它自己學習到非既定的能力。」

《自然》雜誌也在社交平臺上表示,隨著程序訓練的進行,AlphaGo Zero獨立發現了人類用幾千年才總結出來的圍棋規律,還建立了新的戰略,為這個古老的遊戲帶來新見解。

答題思路

寫簡訊的時候,要把最關鍵的信息、最重要的事情、最新的進展放在開頭處,即「AlphaGo Zero大敗AlphaGo」,同時確保整篇消息的要素(Who When Where What Why How)齊全即可。

寫評論的時候,首先要確定自己評論的立足點,對同一個事件進行評論的切入口有很多,但將其中最具爭議、最觸動人的焦點立為評論切口更為合適。在此報導裡,最觸動人的點在於,AlphaGo已經打敗了人類世界冠軍,但它還是需要人類的輔助進行圍棋學習,並未完全打破人類的神話。但新研發的AlphaGo Zero完全跳脫了人類的教學輔助,自學成才,甚至打敗了AlphaGo,這更令人感到恐慌。

參考答案

▼ 簡訊:

阿爾法元無師自通,阿爾法狗一敗塗地

2017年10月18日,刊登於《自然》雜誌網站的論文顯示,阿爾法狗研發團隊的新作,阿爾法元,以100:0的戰績大敗阿爾法狗。

阿爾法狗和阿爾法元都是學習圍棋的人工智慧機器人。阿爾法狗曾戰勝世界圍棋冠軍,此次大敗,是因為阿爾法元突破了人類自身經驗的限制,僅僅通過自我對弈就完成了圍棋強化學習,而阿爾法狗當年同時接受了監督式學習、自我對弈的強化學習。

▼ 評論:

阿爾法元的勝利,

並非是吹響了技術戰勝人類的號角

阿爾法元從零到一、無師自通、自學成才,並且打敗了之前的AlphaGo,令不少人瞠目結舌,令悲觀主義者惴惴不安——人類的地位前所未有地遭到了技術的挑戰,更有甚者產生了「黑客帝國」式的擔憂。但事實並非如此。

首先,阿爾法元並未擺脫人類的技術設定。雖然相比阿爾法狗,阿爾法元進步了很多,簡單來看它是通過自我強化學習的大獲成功的。但深究起來,它的構成是人類製造的,它的神經算法是人類賦予的,它的學習過程依舊需要1臺機器和4個TPU的輔助,它的圍棋操作規則依然是人類輸入的。它的成功,並非是在不需要任何基礎設施的基礎上,實現從無到有的自我組裝、自我進化。它只是相比阿爾法狗,被人類掣肘的更少、耗費的成本更小,但這不等於擺脫了人類。

其次,人工智慧的層層突破、自我進化,目前也只是體現在圍棋領域。一方面,並未有證據表明,在任何有特定規則的領域,人工智慧都能夠實現這種進化;也並未有證據表明,在沒有特定規則的領域,人工智慧依然能實現這種進化。另一方面,相比更多繁雜的知識,圍棋的規則已然十分簡單,其準入門檻並不高,幼齡學生也可以參與學習,在簡單領域適用未必在複雜領域也適用;而且人類世界的知識浩如煙海、汗牛充棟,圍棋只是九牛一毛,從極端個案推廣到整個人類領域,未免不合適。

再次,從宏觀的視角來看,這不過是一個正反饋循環的學習過程。人類通過不斷學習、研究,研發了新的科技,新的科技又賦予了人類新的知識,人類便可以再次從新的知識中學習。固然,人類不可忽視整個過程的副作用,也不可忽視微觀視角下的看法,但若過度分斤掰兩,反而會顧此失彼。這個正反饋循環之所以能夠成立,也是因為科學家們承認自己的無知,並未陷入憂思而無法自拔,反而願意向未知進行學習;承認無知正是西方國家開啟新紀元、不斷進步並逐步領先於世界的核心,「承認無知」的心態對今天的人類也具有十分重要的意義。

人類並不會和自己研發出來的汽車、火車、高鐵、飛機比賽奔跑,並且視之為愚蠢的行為,更不會感到自卑或悲觀於技術的領先;同理,人類也不必和自己研發出來的人工智慧一較圍棋技能的高低,也不必因此而放大憂思。時刻保持辯證、冷靜的眼光,才是面對新事新物的應有之義。

相關焦點

  • 谷歌團隊發布AlphaGo Zero:柯潔稱人類太多餘了
    這款軟體名為AlphaGo Zero,與之前擊敗了李世石的AlphaGo Master進行對弈,勝率高達100%。谷歌團隊發布AlphaGo Zero:柯潔稱人類太多餘了(圖片來自於推特)在這款軟體發出之後,柯潔也對這款軟體發表了自己的看法,他認為:「一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了。」
  • 柯潔回應新版本AlphaGo問世:人類太多餘了
    網易科技訊10月19日消息,DeepMind今天發布了一款新版本的AlphaGo程序,經過三天的訓練,該系統能夠擊敗AlphaGo Lee,後者是去年擊敗了韓國選手李世石(Lee Sedol)的DeepMind軟體,勝率是100
  • 能贏AlphaGo的只有它自己 柯潔回應新版問世:人類太多餘了
    對此,柯潔回應稱:「一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了。」2016 年在 AlphaGo 和李世石的對戰後,人工智慧進入大眾的視野,今年5月27日,中國棋手柯潔與人工智慧「阿爾法圍棋」(AlphaGo)展開三番棋比賽的終局對決。
  • AlphaGo Zero用40天成為世界最強圍棋AI
    棋士柯潔:一個純淨、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了這款新程序名叫AlphaGo Zero,以100比0的戰績打敗了它的前任(在2016年3月的錦標賽中,其前任打敗了圍棋冠軍Lee Sedol)。人工智慧的最大挑戰是研發一種能從零開始、以超人類的水平學習複雜概念的算法。為了打敗人類圍棋世界冠軍,科學家在訓練上一款AlphaGo時,同時用到了監督式學習(基於上百萬種人類專業選手的下棋步驟)和基於自我對弈的強化學習。
  • AlphaGo 圍棋教學工具已發布
    在Deepmind所謂的「教學工具」發布之前,小編曾在腦海出現萬千猜想……但今天揭底才知道,原來只是一個平平淡淡的網頁……(建議複製到電腦上打開,因為據有的棋友反映手機打不開,小編這裡實測手機能打開,只是讀取了較長時間)https://alphagoteach.deepmind.com
  • 柯潔終結AI「符合預期」41連勝:若當初第一個與alphago對弈的是我
    【文/觀察者網 周遠方】昨夜,「半狗」柯潔贏了一隻41連勝的「小狗」,輾轉難眠…… 他在今天(18日)凌晨0時23分發微博感嘆: 一個AI滿地走的時代...除了alphago以外,這個暱稱為「符合預期」的AI尤其強,實力應該已經遠超當時與李世石對弈的alphago了吧?...
  • 紮根理論|19北師大新傳專碩真題解析04
    2019年 北京師範大學新傳專碩334名詞解釋4紮根理論答題思路 對於研究方法的學習,即,理解過後,直接背就是了,這樣在考場上就不會出錯。紮根理論要明確其提出者、淵源、建構程序,同時還要了解對它的評價。
  • 【話題】AlphaGo Zero!圍棋之神真來了……
    2016年3月,第一次「人機大戰」,Alpha Go1.0版4比1擊敗14個世界冠軍獲得者李世石九段;自我對弈40天後,Alpha Go Zero變得更為強大,超過了此前擊敗當今圍棋第一人柯潔的Master亦即Alpha Go2.0版。
  • 2019年金融專碩部分院校回憶版真題匯總
    3、貨幣供給量決定因素   三、計算題   1、β等於1.6,市場預期收益率12%無風險利率7%,然後WXYZ項目投資收益率分別是14%15%17%18%問選哪個,為什麼   2、淨利潤200萬,期初資產2000萬,負債權益比0.25,留存比率0.6,求以期初,期末的資產和權益算內部收益率   3、全權益公司權益640
  • 新版Alphago棋風更穩健
    alphago再過一萬年也不可能窮盡所有圍棋的定式。這次比賽其實不是人機大戰,而是人類使用電腦作為工具探索新的東西,就像哈勃望遠鏡讓人類發現新的領域一樣。人工智慧可以幫助專家以更快的速度解決問題。本次比賽的目的也不是alphago還是棋手贏,最終還是人類贏。祝柯潔好運。」來源:網易科技
  • 2020安徽大學新傳考研真題深度分析
    (實務課、評論押題、實務批改、模擬考,公眾號推送)簡析:新聞評析,採訪提綱,消息改寫,評論寫作,都是常規化的題目,只要格式書寫正確,一個基本分數其實可以得到的,然後關於原材料都是今年熱門事件,垃圾分類、免疫愛滋病基因等,這也啟示我們對於時事熱點要時刻保持關注。
  • 說服理論的提出和發展結合新情況論述|20北師大新傳學碩真題解析
    2020北師大新傳學碩829真題 論述題1說服理論的提出和發展結合新情況論述 答題思路 說服理論屬於霍夫蘭的基本理論,對於提出部分較為基礎,但要說服理論的發展部分可能思考不夠完善,或者複習準備不夠充分,略有難度。
  • ...再次進化,AlphaGo Zero 這次擊敗了戰勝柯潔的 AlphaGo Master
    經過 3 天的訓練後,AlphaGo Zero 能夠擊敗 AlphaGo Lee,而後者是去年擊敗韓國選手李世石的 DeepMind 軟體。經過大約 40 天 2900 萬場自玩遊戲的訓練後,AlphaGo Zero 擊敗了 AlphaGo Master,後者在今年早些時候擊敗了圍棋世界冠軍柯潔。研究結果表明,在不同技術的有效性方面,AI 領域還有很多有待研究的地方。
  • 2021年北師大347應用心理學專業碩士MAP諮詢方向考研真題分析
    2020年12月27日,上午十一點三十分鐘,今年的北師大應用心理學專業碩士考研初試正式落下了帷幕。購買了師兄的高分筆記或者是押題卷的同學是不是感覺十分的驚喜呢?怎麼會在考場上遇到原題呢?緣分就是這麼的奇妙,師兄就是這麼的神奇。那麼2021年北師大MAP的真題到底如何呢?接下來,讓我們走進2021年北師大347應用心理學專業碩士MAP真題分析!
  • 柯潔感嘆AlphaGo可怕:讓三子!如先捅三刀(圖)
    柯潔寫到:「早就聽說新版alphago的強大....但...讓...讓三個?我的天,這個差距有多大呢?簡單的解釋一下就是一人一手輪流下的圍棋,對手連續讓你下三步...又像武林高手對決讓你先捅三刀一樣...我到底是在和一個怎樣可怕的對手下棋...」  2016年底,神秘的Master在網上颳起一陣圍棋旋風。以60勝0敗的戰績橫掃一眾圍棋頂尖高手,其中柯潔也3次落敗。
  • 2021心理學考研|西南大學專碩347真題分析
    下面,文都比鄰的教研老師十一老師為大家深度解讀2021西南大學專碩347考研真題的分值分布、出題特點、學科剖析及備考建議,快來查收吧!整體來看,西南大學心理學專碩2021初試試題題型與分值分布未發生較大變化,依舊是名詞解釋、簡答、應用分析和論述題的配置。
  • 敘述發展傳播學的發展歷史以及主要觀點︱20北大新傳專碩真題解析
    2020北大新傳專碩334真題 簡答題1敘述發展傳播學的發展歷史以及主要觀點答題思路 特別特別接觸的一道題這在胡師姐傳播學藍皮書裡有詳細的梳理,字數也和一道論述題的字數差不多,可以完全照搬,答案如正文。參考答案發展傳播學是施拉姆於20世紀60年代提出的。
  • AlphaGo Zero你也來造一隻,PyTorch實現五臟俱全| 附代碼
    planes)1314        self.conv2 = nn.Conv2d(planes, planes, kernel_size=3,15                        stride=stride, padding=1, bias=False)16        self.bn2 = nn.BatchNorm2d(planes)1718
  • 柯潔終結41連勝圍棋AI:稱其實力遠超初代AlphaGo
    前不久,《自然》雜誌刊登了谷歌DeepMind團隊的新成果,名為AlphaZero的人工智慧程序完全靠自我對弈學習下棋,不依賴人類圍棋經驗,僅訓練3天就戰勝了AlphaGo Lee,比分100:0,後者就是戰敗李世石的那套。經過40天訓練後,Alpha Zero又以89:11戰勝了Alpha Master,即橫掃柯潔的那套。
  • 關於AlphaGo 論文的閱讀筆記
    本文是對這篇論文的閱讀筆記,以及關於人工智慧和圍棋進一步的一些想法。 聲明:我是數學 PhD 和軟體工程師,但不是人工智慧領域的專家。我也不會下圍棋。 一、 AlphaGo 總體上由兩個神經網絡構成,以下我把它們簡單稱為「兩個大腦」,這並非原文中的提法,只是我的一個比喻。