▲點擊上方 雷鋒網 關注
AI 研習社獲得官方授權,漢化翻譯 2019 加州大學伯克利分校 CS285 《深度強化學習》課程,今天正式上線中英雙語字幕版課程啦!
友情提示:本文篇幅較長,提前收藏分享給小夥伴吧~
索引
課程介紹
課後資料
課程截圖
譯者評價
先修要求
課程大綱
相關材料
課程介紹
本課程是好評如潮的 2018 加州大學伯克利分校 CS294-112 《深度強化學習》課程 新版,依舊是由 Sergey Levine 老師授課,基本覆蓋了強化學習的主要內容和前沿的研究話題,通過理論到應用例子的講述,以及五次作業的實踐練習對經典算法的復現,可以讓學生達到在強化學習領域的入門研究水平。重點是在研習社你可以免費觀看中英雙語字幕!
第一講已經新鮮出爐,我們來一睹為快——
第一講
課程介紹和概覽
上手視頻約 5 分鐘
翻譯 | 侯言旭 李東達 陳晨 宋克凡
校對 審核 | 醬番梨 唐裡
壓制 後期 | 醬番梨
這門課程的譯者會持續招募,
感興趣的小夥伴可以添加「研習社小學妹」報名翻譯哦!
備註「285報名翻譯」即可
與此同時,AI 研習社喊你加入UC 伯克利 CS 285 這門課程學習小組,和上萬名熱愛學習的小夥伴們,一起研習海外經典課程。
掃描上方小程序二維碼,加入285課程小組,截圖發送給字幕君或者研習社小學妹如下,PC端和手機端截圖都可,我們將你拉入285課程討論微信群
PPT:CS285 加州大學伯克利分校第一講至第二十一講(AI 研習社整理)
下載地址:https://www.yanxishe.com/resourceDetail/1118
課程截圖
@侯言旭
終於學完了 CS285 的課程,被 Sergey 老師圈粉了。Sergey 老師對於強化學習的理解非常深入,同時他的研究態度為給我們提供了很好的榜樣,他主要致力於強化學習泛化性以及落地問題的研究,從他的課程中不僅僅學到了知識本身,更學到了什麼樣的研究才是真正有意義的。此課程後面部分更強調解決強化學習在實際場景中的應用並提出的一些新方法和思路,從不同角度去嘗試解決目前強化學習落地所面臨的挑戰,相比其他課程可能更加深入和前沿。看到雷鋒字幕組翻譯 CS285,遂加入字幕組希望把最優質的學習資源分享給更多的朋友們。@李東達
相比其他機器學習課程,如果橫向比較的話,個人覺得沒有什麼可比性,畢竟大家關注的點不一樣的。像Andrew和Hinton的課程講的是機器學習理論本身,有的是講機器學習在計算機視覺或者是自然語言處理等具體問題上的應用。如果縱向比較的話,和以往的課程相比,這個課程更系統,更全面。像Silver的課程就比較簡單,而且就講了幾個重點;像DeepMind的課程關注點是深度學習在RL上的應用。 自己聽的時候更多是走馬觀花,對細節問題可能會有所遺漏。翻譯的時候,哪怕只有一段也需要對前後的細節有深入的了解和掌握。這次翻譯285課程自己的語言能力得到了很大的鍛鍊!@常滔
我自己也是剛剛接觸到深度強化學習,也一直在看各種學校的公開課。AI研習社提供了一個很好的平臺,第一時間把課程翻譯上線,我收益了很多,因此我也希望自己能夠投身到翻譯工作中去,把最新的課程儘快的翻譯好提供給廣大用戶。相比David silver那種基礎課來說,課程涵蓋的比較全面,也基本上提及了深度強化學習的前沿工作,對基礎的要求也比較高。我覺得學了這門課可以很快的對強化學習的各種工作進展有個大概的了解,對學習者來說也是一個巨大的挑戰,花費的精力比較長,同時收穫也是巨大的。@王宇
我當時學強化學習的時候是看的David Sliver的課程,那時字幕感覺翻譯的不太好,學著蠻吃力,靠著前人總結的學習筆記挺過來的。當時看到雷鋒字幕組翻譯的 CS294 課程,覺得翻譯的非常贊,所以也想加入進來,一起做些能幫助其他人學習的事吧。傳統的機器學習比較著重分類的應用,強化學習主要是序列決策的,David的課主要講強化學習的理論。285這門課我感覺側重點是深度學習和強化學習的融合,這部分也是我想學習的。@陳晨
一般高校的這種公開課要比在線的慕課系統和詳細,同時時間也會更長,難度也會更大一些,當然收穫也會更多。強化學習是機器自主學習,或者是適用於真實應用場景的主要實現途徑,所以這門課的主題還是很前沿,同時內容也是比較完整的。這次參與翻譯既能夠加強理解,也能助益他人,很好的事情。@藍愚
先修要求
想要學習伯克利大學 CS 285 《深度強化學習》這門課程,學生需要先學習 CS189 或者其他同等學歷課程。本課程將假定學生掌握強化學習、數值優化和機器學習的相關背景知識。
如果你對上述主題不是非常了解,那麼需要自主學習補充以下知識點:
課程大綱
第一講:課程介紹和概覽
第二講:針對行為的監督學習
第三講:TensorFlow 和神經網絡簡述
第四講:強化學習簡介
第五講:策略梯度
第六講:Actor-Critic 算法
第七講:價值函數
第八講:深度強化學習之Q函數
第九講:高級策略梯度
第十一講:基於模型的規劃
第十一講:基於模型的強化學習
第十二講:基於模型的策略學習
第十三講:變分推斷和生成模型
第十四講:強化學習對控制的概率推斷
第十五講:逆向強化學習
第十六講:遷移學習與多任務學習
第十七講:分布式強化學習
第十八講:探索(上)
第十九講:探索(下)
第二十講:元學習
第二十一講:信息理論,開放性問題探討
相關材料
有關強化學習與 MDP 的介紹資料:
CS188 EdX 課程,從馬爾可夫決策過程 I 開始:http://ai.berkeley.edu/home.html
Richard S. Sutton 與 Andrew G. Barto 的《強化學習導論》,第三章和第四章:http://incompleteideas.net/book/the-book-2nd.html
有關 MDP 的介紹,請參閱吳恩達的論文《Shaping and policy search in Reinforcement learning》:http://rll.berkeley.edu/deeprlcourse/docs/ng-thesis.pdf
David Silver 的課程:http://rll.berkeley.edu/deeprlcourse/#related-materials
有關機器學習和神經網絡的介紹性資料,請參閱:
Andrej Karpathy 的課程:http://cs231n.github.io/
Geoff Hinton 的 Coursera 課程:https://www.coursera.org/learn/neural-networks
吳恩達的 Coursera 課程:https://www.coursera.org/learn/machine-learning/
Yaser Abu-Mostafa 的課程:https://work.caltech.edu/telecourse.html
閱讀原文跳轉觀看課程