重磅乾貨,第一時間送達
如今強化學習越來越流行,其影響力和熱度也逐漸有趕超深度學習的趨勢!今天給大家介紹一本被稱為強化學習的「聖經」,即 RichardS.Sutton 的經典圖書:《強化學習導論》(第二版)。
作者 Richard S. Sutton 就職於加拿大 iCORE 大學計算機科學系,是強化學習領域的專家。Sutton 是強化學習領域巨擘,在 temporal difference learning, policy gradient methods, the Dyna architecture 等方面都有重大貢獻。自 2003 年起,Sutton 就出任 iCORE 大學計算機科學系的教授,在這裡他領導了強化學習和人工智慧實驗室(RLAI)。
這本書的官網為:
http://incompleteideas.net/sutton/book/the-book-2nd.html
該書總共有 445 頁,包含了三大部分,分別是:
第一部分:列表(Tabular)解決法
第二部分:近似求解法
第三部分:更進一步
其中,第一部分列表(Tabular)解決法,包含了本書的 2-8 章。描述了強化學習算法幾乎所有的核心的概念,介紹了解決有限馬爾科夫決策問題的三類基本方法:動態編程,蒙特卡洛方法、時序差分學習等。
第二部分近似求解法,包含了本書的 9-13 章。將擴展第一部分中介紹的列表法以應用於任意大的狀態空間。
第三部分更進一步,包含了本書的 14-17 章。討論一個強化學習應用的採樣過程,和一些未來的強化學習研究的活躍前沿。
完整的目錄如下:
好消息,這本書的 Python 代碼實現在 GitHub 上開源了。地址為:
https://github.com/JaeDukSeo/reinforcement-learning-an-introduction
為了節約大家的時間,目前小編愛碼士已經將《強化學習導論》第二版的電子版 PDF 整理打包好了,需要的請自行下載。獲取步驟如下:
1. 掃描下方二維碼關注 "程式設計師愛碼士" 公眾號
2. 公眾號後臺回復關鍵詞:強化學習導論