對於人工智慧,大家對其早已不在陌生,從起初的科幻電影,到如今步入生活。計算機技術已經取得了長足的進步,雖然到目前為止,還沒有一臺電腦能產生「自我」的意識。但是自 2006 年以來,機器學習領域,取得了突破性的進展。圖靈試驗,不在那麼可望而不可及了。至於技術手段,不僅僅依賴於雲計算對大數據的並行處理能力,而且依賴於算法。這個算法便是深度學習Deep Learning。藉助於 Deep Learning 算法,人類終於找到了如何處理「抽象概念」這個艱難問題的方法。
而深度學習是指學習樣本數據的內在規律和表達層次,這些在學習過程中獲得的信息對諸如文字,圖像和聲音等數據的解釋有很大的幫助。它的最終目的是讓機器能夠像人一樣具有分析學習能力,像人一樣能夠別文字、圖像和聲音等數據。 深度學習是一個復非常雜的機器學習算法,在語音和圖像識別方面取得了非常可觀的效果,遠遠超過了先前相關技術。深度學習在搜索技術,數據挖掘,機器學習,機器翻譯,自然語言處理,多媒體學習,語音,推薦和個性化技術,以及其他相關領域都取得了很多成果。深度學習使機器模仿視聽和思考等人類的活動,解決了很多複雜的模式識別難題,使得人工智慧相關技術取得了很大進步。
深度學習是一類模式分析方法的統稱,就具體研究內容而言,主要涉及三類方法:
(1)基於卷積運算的神經網絡系統,即卷積神經網絡(CNN)。
(2)基於多層神經元的自編碼神經網絡,包括自編碼( Auto encoder)以及近年來受到廣泛關注的稀疏編碼兩類( Sparse Coding)。
(3)以多層自編碼神經網絡的方式進行預訓練,進而結合鑑別信息進一步優化神經網絡權值的深度置信網絡(DBN)。
通過多層處理,逐漸將初始的「低層」特徵表示轉化為「高層」特徵表示後,用「簡單模型」即可完成複雜的分類等學習任務。由此可將深度學習理解為進行「特徵學習」(feature learning)或「表示學習」(representation learning)。
以往在機器學習用於現實任務時,描述樣本的特徵通常需由人類專家來設計,這成為「特徵工程」(feature engineering)。眾所周知,特徵的好壞對泛化性能有至關重要的影響,人類專家設計出好特徵也並非易事;特徵學習(表徵學習)則通過機器學習技術自身來產生好特徵,這使機器學習向「全自動數據分析」又前進了一步。
近年來,研究人員也逐漸將這幾類方法結合起來,如對原本是以有監督學習為基礎的卷積神經網絡結合自編碼神經網絡進行無監督的預訓練,進而利用鑑別信息微調網絡參數形成的卷積深度置信網絡。與傳統的學習方法相比,深度學習方法預設了更多的模型參數,因此模型訓練難度更大,根據統計學習的一般規律知道,模型參數越多,需要參與訓練的數據量也越大。
那麼擁有深度學習能力的阿爾法圍棋是怎樣學習的呢,首先「阿爾法圍棋」的技術架構是深度學習神經網絡中的CNN架構(兩種落子策略——「監督學習」「強化學習」和一個局面評估策略)及蒙特卡羅搜索樹。其中,三種策略的神經網絡架構基本相同,環環相扣。
首先,「阿爾法圍棋」純粹地學習人類下棋經驗,觀察人類選手如何落子,不涉及對優劣的判斷。這招落子策略被稱為「監督學習」。接下來,「阿爾法圍棋」通過和自己下棋來進行「強化學習」,學習如何找到最佳對應落子,最終贏棋。最後,「阿爾法圍棋」跳出具體步驟來「看」整盤棋,也就是局面評估策略。
有了以上三個深度學習策略,「阿爾法圍棋」再引入蒙特卡羅搜索樹,以減少預測對手下一步棋的難度和複雜性。蒙特卡羅搜索樹並不是一種算法,而是對一類隨機算法的特性的概括。舉例來說:假如筐裡有100個蘋果,隨機拿一個,再隨機拿一個跟它相比,留下大的。這樣,每拿一次,留下的蘋果都比上次大。拿的次數越多,挑出的蘋果就可能越大,但除非拿100次,否則無法確定挑出了最大的那個。這就是蒙特卡羅搜索樹。當然只擁有這些是不可能使得阿爾法圍棋成為頂尖的圍棋高手,這時的阿爾法圍棋只能算做一個「嬰兒」,此後便是通過「大數據」進行學習,通過無數的圍棋棋局來掌握種我們人類暫時無法理解的規律,形成阿爾法圍棋自身的圍棋風格。
由於時間原因,關於深度學習的表述過於淺顯,望專業人士勿噴!