什麼是深度學習?竟能讓Alphago戰勝頂級的職業圍棋選手!

2020-12-06 小林科技城

對於人工智慧,大家對其早已不在陌生,從起初的科幻電影,到如今步入生活。計算機技術已經取得了長足的進步,雖然到目前為止,還沒有一臺電腦能產生「自我」的意識。但是自 2006 年以來,機器學習領域,取得了突破性的進展。圖靈試驗,不在那麼可望而不可及了。至於技術手段,不僅僅依賴於雲計算對大數據的並行處理能力,而且依賴於算法。這個算法便是深度學習Deep Learning。藉助於 Deep Learning 算法,人類終於找到了如何處理「抽象概念」這個艱難問題的方法。

而深度學習是指學習樣本數據的內在規律和表達層次,這些在學習過程中獲得的信息對諸如文字,圖像和聲音等數據的解釋有很大的幫助。它的最終目的是讓機器能夠像人一樣具有分析學習能力,像人一樣能夠別文字、圖像和聲音等數據。 深度學習是一個復非常雜的機器學習算法,在語音和圖像識別方面取得了非常可觀的效果,遠遠超過了先前相關技術。深度學習在搜索技術,數據挖掘,機器學習,機器翻譯,自然語言處理,多媒體學習,語音,推薦和個性化技術,以及其他相關領域都取得了很多成果。深度學習使機器模仿視聽和思考等人類的活動,解決了很多複雜的模式識別難題,使得人工智慧相關技術取得了很大進步。

深度學習是一類模式分析方法的統稱,就具體研究內容而言,主要涉及三類方法:

(1)基於卷積運算的神經網絡系統,即卷積神經網絡(CNN)。

(2)基於多層神經元的自編碼神經網絡,包括自編碼( Auto encoder)以及近年來受到廣泛關注的稀疏編碼兩類( Sparse Coding)。

(3)以多層自編碼神經網絡的方式進行預訓練,進而結合鑑別信息進一步優化神經網絡權值的深度置信網絡(DBN)。

通過多層處理,逐漸將初始的「低層」特徵表示轉化為「高層」特徵表示後,用「簡單模型」即可完成複雜的分類等學習任務。由此可將深度學習理解為進行「特徵學習」(feature learning)或「表示學習」(representation learning)。

以往在機器學習用於現實任務時,描述樣本的特徵通常需由人類專家來設計,這成為「特徵工程」(feature engineering)。眾所周知,特徵的好壞對泛化性能有至關重要的影響,人類專家設計出好特徵也並非易事;特徵學習(表徵學習)則通過機器學習技術自身來產生好特徵,這使機器學習向「全自動數據分析」又前進了一步。

近年來,研究人員也逐漸將這幾類方法結合起來,如對原本是以有監督學習為基礎的卷積神經網絡結合自編碼神經網絡進行無監督的預訓練,進而利用鑑別信息微調網絡參數形成的卷積深度置信網絡。與傳統的學習方法相比,深度學習方法預設了更多的模型參數,因此模型訓練難度更大,根據統計學習的一般規律知道,模型參數越多,需要參與訓練的數據量也越大。

那麼擁有深度學習能力的阿爾法圍棋是怎樣學習的呢,首先「阿爾法圍棋」的技術架構是深度學習神經網絡中的CNN架構(兩種落子策略——「監督學習」「強化學習」和一個局面評估策略)及蒙特卡羅搜索樹。其中,三種策略的神經網絡架構基本相同,環環相扣。

首先,「阿爾法圍棋」純粹地學習人類下棋經驗,觀察人類選手如何落子,不涉及對優劣的判斷。這招落子策略被稱為「監督學習」。接下來,「阿爾法圍棋」通過和自己下棋來進行「強化學習」,學習如何找到最佳對應落子,最終贏棋。最後,「阿爾法圍棋」跳出具體步驟來「看」整盤棋,也就是局面評估策略。

有了以上三個深度學習策略,「阿爾法圍棋」再引入蒙特卡羅搜索樹,以減少預測對手下一步棋的難度和複雜性。蒙特卡羅搜索樹並不是一種算法,而是對一類隨機算法的特性的概括。舉例來說:假如筐裡有100個蘋果,隨機拿一個,再隨機拿一個跟它相比,留下大的。這樣,每拿一次,留下的蘋果都比上次大。拿的次數越多,挑出的蘋果就可能越大,但除非拿100次,否則無法確定挑出了最大的那個。這就是蒙特卡羅搜索樹。當然只擁有這些是不可能使得阿爾法圍棋成為頂尖的圍棋高手,這時的阿爾法圍棋只能算做一個「嬰兒」,此後便是通過「大數據」進行學習,通過無數的圍棋棋局來掌握種我們人類暫時無法理解的規律,形成阿爾法圍棋自身的圍棋風格。

由於時間原因,關於深度學習的表述過於淺顯,望專業人士勿噴!

相關焦點

  • AlphaGo是如何戰勝圍棋高手的?深度學習告訴你
    AlphaGo是如何戰勝圍棋高手的?深度學習告訴你 工程師黃明星 發表於 2018-07-15 07:28:00 AlphaGo(阿爾法狗)戰勝了柯潔,人工智慧贏了,贏家仍然是人類!
  • 1:4輸給谷歌AlphaGo圍棋AI 李世石:人工智慧不可戰勝
    1997年IBM的深藍計算機戰勝了西洋棋冠軍,20年後的2016年穀歌的圍棋AI程序「AlphaGo」戰勝了圍棋九段高手李世石,五局比賽人類只贏得了一局,沒想到這就是人類的巔峰了。本月19日,韓國傳奇選手李世石正式向韓國圍棋協會提交辭呈,結束了自己的職業生涯,12歲進入圍棋界,36歲的李世石在24年的徵戰中戰勝了多位人類頂級棋手,先後拿下了韓國國內32個冠軍、18個國際冠軍。
  • 不敵韓國圍棋人工智慧,戰勝過AlphaGo的人退役了
    機器之能 以下文章來源於機器之心 ,作者Synced退役賽的最後一局,李世石回到了自己的家鄉。對戰之地距離李世石的出生地飛禽島 40 多公裡,他曾在飛禽島度過了他的童年時光,也是在這裡決定成為職業圍棋選手。
  • DeepMind 推出 AlphaGo 圍棋教學工具,圍棋學習新紀元來啦?
    雷鋒網 AI 科技評論消息,北京時間 12 月 11 日晚,DeepMind 在 twitter 上宣布推出圍棋教學工具 AlphaGo Teach。上圖中,標有白圈的黑子表示上一手,虛線圓圈表示 AlphaGo 下一步可能的走法,實線圓圈表示人類選手下一步可能的走法,圓圈中的數字表示 AlphaGo 評估的黑子勝率。
  • 深度學習筆記:深度學習——AlphaGo阿爾法狗
    阿爾法狗(AlphaGo)是第一個擊敗人類職業圍棋選手、第一個戰勝圍棋世界冠軍的人工智慧程序。它主要的原理就是深度學習。2016年3月,AlphaGo與圍棋世界冠軍、職業九段棋手李世石進行圍棋人機大戰,以4比1的總比分獲勝;2016年末2017年初,AlphaGo在中國棋類網站上以「大師」(Master)為註冊帳號與中日韓數十位圍棋高手進行快棋對決,連續60局無一敗績;2017年5月,在中國烏鎮圍棋峰會上,AlphaGo與排名世界第一的世界圍棋冠軍柯潔對戰,以3比0的總比分獲勝
  • 圍棋人機大戰一周年:被AlphaGo改變的世界
    在圍棋的人機大戰中,頂級人類選手完敗給人工智慧。人工智慧一戰成名,李世乭留下落寞側影。為AlphaGo落子的黃士傑一年後回憶說:「當時我代表AlphaGo下棋,必須保持冷靜」。從那時起到現在,人類始終生活在一個被AlphaGo改變的世界。一年回望站在圍棋人機大戰一周年的節點上,該如何回顧過去、展望未來呢?
  • 繼AlphaGo圍棋戰勝柯潔,AlphaStar大勝人類星際玩家
    谷歌DeepMind的AlphaGo繼谷歌DeepMind的AlphaGo戰勝人類的世界圍棋冠軍柯潔、李世石之後,時隔兩年,DeepMind人工智慧再升級,推出最新AI程序AlphaStar,挑戰暴雪的經典遊戲《星際爭霸
  • AlphaGo 為什麼能戰勝人類?
    這場生生奪走一周眼球的人機圍棋大戰,人們最想追問的是,AlphaGo為什麼能戰勝人類? 賽前,無論是職業棋手還是科技界,並不看好機器勝利 機器贏了人類,這個結果讓無數人感到吃驚與意外。在這場比賽開始前,很多職業棋手認為 AlphaGo 不可能贏得比賽。棋聖聶衛平在賽前下定論認為:電腦和人下圍棋,百分之百是人贏。
  • 阿爾法狗之後的圍棋世界
    在阿法狗之前,很多圍棋ai也走出人類所不能理解的變化和對定式的改變,但人類認為那是ai水平不足,並不足以採信,但由於阿法狗的無敵戰績,現在職業棋手已經對這些新的變化非常認可並且推崇,目前職業比賽裡,狗狗流的下法已經非常普遍,而且喜歡走狗狗流的棋手,戰績一般還都不錯。現在幾乎每三盤職業比賽裡,都能看到一盤狗狗改良版的三三定式。
  • AlphaGo再度升級 AlphaGoZero100:0戰勝AlphaGo
    在前段時間人工智慧AlphaGo在國際圍棋賽上擊敗了人類的頂級圍棋選手,讓人工智慧走進了人們的視線,最近AlphaGo有進行了升級完成了AlphaGo Zero。這個AlphaGo Zero究竟怎麼樣?小編和大家一起看看吧。  在前不久,人工智慧AlphaGo在圍棋上戰勝多位人類頂尖棋手的消息吸引了人們的關注。
  • 柯潔對戰阿爾法狗什麼時候?柯潔vsAlphaGo圍棋比賽日期時間
    柯潔對戰阿爾法狗時間什麼時候?相信很多棋友對於這場經常對弈很期待,下文帶來阿爾法狗vs柯潔日期介紹,一起和小編來了解下吧!  柯潔 vs AlphaGo圍棋比賽日期時間介紹:  這場被認為是「人類頂尖棋手與人工智慧程序的終極對抗」,讓人們期待了足足一年有餘。
  • AlphaGo 圍棋教學工具已發布
    在Deepmind所謂的「教學工具」發布之前,小編曾在腦海出現萬千猜想……但今天揭底才知道,原來只是一個平平淡淡的網頁……(建議複製到電腦上打開,因為據有的棋友反映手機打不開,小編這裡實測手機能打開,只是讀取了較長時間)
  • 兩戰告捷 騰訊的圍棋AI「絕藝」是如何煉成的?
    「電聖戰」是圍棋AI實力的「檢測站」。按照慣例,獲得UEC冠亞軍的AI將與人類頂尖職業選手一決高下。  最終,「絕藝」戰勝了日本新銳棋手一力遼七段。同時,UEC賽事的亞軍「DeepZenGo」也戰勝了一力遼。這也是5屆電聖戰賽事以來,AI第一次完勝職業棋手。
  • AlphaGo在世界圍棋界戰無不勝,人工智慧真這麼厲害?我看不是!
    阿爾法圍棋(AlphaGo)是一個人工智慧圍棋機器人,是由谷歌旗下的公司團隊開發的,其工作原理是「深度學習」。因兩次戰敗世界圍棋冠軍而成名,目前在圍棋界「獨孤求敗」,風頭一時無人能及。2016年3月,AlphaGo與圍棋世界冠軍李世石進行人機大戰,以4:1獲勝;2017年5月,阿爾法狗與排名世界第一的圍棋冠軍柯潔對戰,以3:0獲勝;從此,圍棋界公認AlphaGo的祺力已經超過人類職業圍棋頂尖水平。當前世界排名第一的圍棋冠軍柯潔表示,」在他看來阿爾法圍棋就是圍棋上帝,能夠打敗一切「。
  • AlphaGo是如何學會下圍棋的
    在大多數公認的智力遊戲中,機器已經戰勝了最優秀的人類,包括西洋棋、拼字遊戲、黑白棋等等。但是圍棋----這個有著2500年的歷史,比象棋複雜得多的遊戲,即使是面對最先進的計算機系統,頂尖棋手們也能保持優勢。
  • 圍棋人機大戰第二季柯潔VS阿爾法狗AlphaGo比賽時間地點
    柯潔是中國圍棋職業九段棋手,他也是圍棋等級分排名世界第一。  此次人機終極大戰中,代表人類出戰的是目前排名世界第一的職業圍棋九段選手柯潔,而代表機器一方的則是AlphaGo的2.0版本。區別於和李世石對戰的AlphaGo1.0,這次對戰柯潔的AlphaGo2.0採用了新的算法模型。此前,該版本曾化名Master,以在線對弈的形式擊敗了包括柯潔在內的所有選手,60戰而無一敗。
  • AlphaGo已能體會圍棋之美
    一時間,李世石以一種「民族英雄」的形象登上了報紙和電視的頭版頭條,所有的報導都在極力渲染這次比賽的重大意義,「從沒有見過這麼多媒體如此關心一個圍棋選手和圍棋比賽」,一位跑了15年圍棋的韓國記者告訴騰訊科技。
  • 人工智慧首次戰勝職業玩家
    人工智慧轉戰德州撲克 首次戰勝人類職業玩家  近日,加拿大和捷克幾位科學家的一篇題為《DeepStack:無限注德撲的專業級人工智慧玩家》的論文中,介紹了一種能在一對一無限注(任何人在任何時候可下任何數目籌碼)德州撲克中擊敗人類玩家的新算法DeepStack。
  • 境外媒體:人機大戰AlphaGO再勝李世石 連贏兩局
    香港《東方日報》網站3月9日報導,3月9日是谷歌自主研發的一款圍棋人工智慧程序AlphaGO與韓國九段頂尖圍棋高手李世石的世界挑戰賽的第一天,被喻為機器人與人類之間的一場人機世界大戰。首局谷歌AlphaGo戰勝李世石。
  • AlphaGo Zero用40天成為世界最強圍棋AI
    ZM-GO  | 周末圍棋 弈路伴你 點名關注