2018年 北京師範大學新傳專碩334
改寫題
根據材料,改寫標題,完成:
140字簡訊,600字以內評論。
▼ 材料:
從0開始學,阿爾法元完勝阿爾法狗
中青在線訊(中國青年報·中青在線記者張茜)10月18日,《自然》雜誌網站公布的論文顯示,此前戰勝人類圍棋世界冠軍的電腦程式AlphaGo的開發團隊又出力作——新程序AlphaGo Zero(阿爾法元)不依靠人類指導和經驗,僅憑自身算法強化學習,就以100:0的戰績擊敗了AlphaGo(阿爾法狗)。
此消息給世人帶來了不小的震動。此前被AlphaGo擊敗的世界知名圍棋選手柯潔今早在社交平臺上表示:「一個純淨純粹自我學習的AlphaGo是最強的.....對於AlphaGo的自我進步來講.....人類太多餘了。"
那麼,經過升級的AlphaGo Zero到底是如做到「長江後浪推前浪」的呢?
人工智慧的最大挑戰是研發一種能從零開始、以超人類的水平學習複雜概念的算法。
《自然》雜誌的公開消息稱,為了打敗人類圍棋世界冠軍,科學家在訓練上一款AlphaGo時,同時用到了監督式學習(基於上百萬種人類專業選手的下棋步驟)和基於自我對弈的強化學習。此前那款AlphaGo的訓練過程長達幾個月,用到多臺機器和48個TPU(神經網絡訓練所需的專業晶片)。
而在最新發表的論文中,作者David Silver,Julian Schrittwieser,Karen Simonyan,Demis Hassabis等在介紹AlphaGo Zero時表示,它的學習從零開始,且單純基於與自己的對弈。人類的輸入沒有超出遊戲規則以外的任何指導、數據以及內部知識。
AlphaGo Zero僅用到一張神經網絡,這張網絡經過訓練,專門預測程序自身的棋步和棋局的贏家,在每次自我對弈中進步。新程序只使用一臺機器和4個TPU。
通過幾天的訓練——包括近500萬局自我對弈——AlphaGo Zero便能夠超越人類並打敗所有之前的AlphaGo版本。
David Silver團隊在其公司DeepMind網站中總結道,AlphaGo Zero相比與AlphaGo的更強大之處恰恰在於:「它再也不會受到人類經驗的限制,而是可以不斷向世界上最強的圍棋手——也就是它自己學習到非既定的能力。」
《自然》雜誌也在社交平臺上表示,隨著程序訓練的進行,AlphaGo Zero獨立發現了人類用幾千年才總結出來的圍棋規律,還建立了新的戰略,為這個古老的遊戲帶來新見解。
答題思路
寫簡訊的時候,要把最關鍵的信息、最重要的事情、最新的進展放在開頭處,即「AlphaGo Zero大敗AlphaGo」,同時確保整篇消息的要素(Who When Where What Why How)齊全即可。
寫評論的時候,首先要確定自己評論的立足點,對同一個事件進行評論的切入口有很多,但將其中最具爭議、最觸動人的焦點立為評論切口更為合適。在此報導裡,最觸動人的點在於,AlphaGo已經打敗了人類世界冠軍,但它還是需要人類的輔助進行圍棋學習,並未完全打破人類的神話。但新研發的AlphaGo Zero完全跳脫了人類的教學輔助,自學成才,甚至打敗了AlphaGo,這更令人感到恐慌。
參考答案
▼ 簡訊:
阿爾法元無師自通,阿爾法狗一敗塗地
2017年10月18日,刊登於《自然》雜誌網站的論文顯示,阿爾法狗研發團隊的新作,阿爾法元,以100:0的戰績大敗阿爾法狗。
阿爾法狗和阿爾法元都是學習圍棋的人工智慧機器人。阿爾法狗曾戰勝世界圍棋冠軍,此次大敗,是因為阿爾法元突破了人類自身經驗的限制,僅僅通過自我對弈就完成了圍棋強化學習,而阿爾法狗當年同時接受了監督式學習、自我對弈的強化學習。
▼ 評論:
阿爾法元的勝利,
並非是吹響了技術戰勝人類的號角
阿爾法元從零到一、無師自通、自學成才,並且打敗了之前的AlphaGo,令不少人瞠目結舌,令悲觀主義者惴惴不安——人類的地位前所未有地遭到了技術的挑戰,更有甚者產生了「黑客帝國」式的擔憂。但事實並非如此。
首先,阿爾法元並未擺脫人類的技術設定。雖然相比阿爾法狗,阿爾法元進步了很多,簡單來看它是通過自我強化學習的大獲成功的。但深究起來,它的構成是人類製造的,它的神經算法是人類賦予的,它的學習過程依舊需要1臺機器和4個TPU的輔助,它的圍棋操作規則依然是人類輸入的。它的成功,並非是在不需要任何基礎設施的基礎上,實現從無到有的自我組裝、自我進化。它只是相比阿爾法狗,被人類掣肘的更少、耗費的成本更小,但這不等於擺脫了人類。
其次,人工智慧的層層突破、自我進化,目前也只是體現在圍棋領域。一方面,並未有證據表明,在任何有特定規則的領域,人工智慧都能夠實現這種進化;也並未有證據表明,在沒有特定規則的領域,人工智慧依然能實現這種進化。另一方面,相比更多繁雜的知識,圍棋的規則已然十分簡單,其準入門檻並不高,幼齡學生也可以參與學習,在簡單領域適用未必在複雜領域也適用;而且人類世界的知識浩如煙海、汗牛充棟,圍棋只是九牛一毛,從極端個案推廣到整個人類領域,未免不合適。
再次,從宏觀的視角來看,這不過是一個正反饋循環的學習過程。人類通過不斷學習、研究,研發了新的科技,新的科技又賦予了人類新的知識,人類便可以再次從新的知識中學習。固然,人類不可忽視整個過程的副作用,也不可忽視微觀視角下的看法,但若過度分斤掰兩,反而會顧此失彼。這個正反饋循環之所以能夠成立,也是因為科學家們承認自己的無知,並未陷入憂思而無法自拔,反而願意向未知進行學習;承認無知正是西方國家開啟新紀元、不斷進步並逐步領先於世界的核心,「承認無知」的心態對今天的人類也具有十分重要的意義。
人類並不會和自己研發出來的汽車、火車、高鐵、飛機比賽奔跑,並且視之為愚蠢的行為,更不會感到自卑或悲觀於技術的領先;同理,人類也不必和自己研發出來的人工智慧一較圍棋技能的高低,也不必因此而放大憂思。時刻保持辯證、冷靜的眼光,才是面對新事新物的應有之義。