獨家 | 強化學習必看!UC 伯克利 CS 285 雙語字幕課程今日正式上線

2021-02-21 雷鋒網

▲點擊上方雷鋒網關注

AI 研習社獲得官方授權，漢化翻譯 2019 加州大學伯克利分校 CS285 《深度強化學習》課程，今天正式上線中英雙語字幕版課程啦！

友情提示：本文篇幅較長，提前收藏分享給小夥伴吧~

索引

課程介紹

課後資料

課程截圖

譯者評價

先修要求

課程大綱

相關材料

課程介紹

本課程是好評如潮的 2018 加州大學伯克利分校 CS294-112 《深度強化學習》課程新版，依舊是由 Sergey Levine 老師授課，基本覆蓋了強化學習的主要內容和前沿的研究話題，通過理論到應用例子的講述，以及五次作業的實踐練習對經典算法的復現，可以讓學生達到在強化學習領域的入門研究水平。重點是在研習社你可以免費觀看中英雙語字幕！

第一講已經新鮮出爐，我們來一睹為快——

第一講

課程介紹和概覽

上手視頻約 5 分鐘

翻譯 | 侯言旭李東達陳晨宋克凡

校對審核 | 醬番梨唐裡

壓制後期 | 醬番梨

這門課程的譯者會持續招募，

感興趣的小夥伴可以添加「研習社小學妹」報名翻譯哦！

備註「285報名翻譯」即可

與此同時，AI 研習社喊你加入UC 伯克利 CS 285 這門課程學習小組，和上萬名熱愛學習的小夥伴們，一起研習海外經典課程。

掃描上方小程序二維碼，加入285課程小組，截圖發送給字幕君或者研習社小學妹如下，PC端和手機端截圖都可，我們將你拉入285課程討論微信群

PPT：CS285 加州大學伯克利分校第一講至第二十一講（AI 研習社整理）

下載地址：https://www.yanxishe.com/resourceDetail/1118

課程截圖

CS285，從事強化學習相關工作人員必聽課程。課程由淺入深，內容覆蓋廣泛，緊跟科研前沿。強烈建議刷課後作業，對理解算法非常有幫助！

@侯言旭

終於學完了 CS285 的課程，被 Sergey 老師圈粉了。Sergey 老師對於強化學習的理解非常深入，同時他的研究態度為給我們提供了很好的榜樣，他主要致力於強化學習泛化性以及落地問題的研究，從他的課程中不僅僅學到了知識本身，更學到了什麼樣的研究才是真正有意義的。此課程後面部分更強調解決強化學習在實際場景中的應用並提出的一些新方法和思路，從不同角度去嘗試解決目前強化學習落地所面臨的挑戰，相比其他課程可能更加深入和前沿。看到雷鋒字幕組翻譯 CS285，遂加入字幕組希望把最優質的學習資源分享給更多的朋友們。

@李東達

相比其他機器學習課程，如果橫向比較的話，個人覺得沒有什麼可比性，畢竟大家關注的點不一樣的。像Andrew和Hinton的課程講的是機器學習理論本身，有的是講機器學習在計算機視覺或者是自然語言處理等具體問題上的應用。如果縱向比較的話，和以往的課程相比，這個課程更系統，更全面。像Silver的課程就比較簡單，而且就講了幾個重點；像DeepMind的課程關注點是深度學習在RL上的應用。自己聽的時候更多是走馬觀花，對細節問題可能會有所遺漏。翻譯的時候，哪怕只有一段也需要對前後的細節有深入的了解和掌握。這次翻譯285課程自己的語言能力得到了很大的鍛鍊！

@常滔

我自己也是剛剛接觸到深度強化學習，也一直在看各種學校的公開課。AI研習社提供了一個很好的平臺，第一時間把課程翻譯上線，我收益了很多，因此我也希望自己能夠投身到翻譯工作中去，把最新的課程儘快的翻譯好提供給廣大用戶。相比David silver那種基礎課來說，課程涵蓋的比較全面，也基本上提及了深度強化學習的前沿工作，對基礎的要求也比較高。我覺得學了這門課可以很快的對強化學習的各種工作進展有個大概的了解，對學習者來說也是一個巨大的挑戰，花費的精力比較長，同時收穫也是巨大的。

@王宇

我當時學強化學習的時候是看的David Sliver的課程，那時字幕感覺翻譯的不太好，學著蠻吃力，靠著前人總結的學習筆記挺過來的。當時看到雷鋒字幕組翻譯的 CS294 課程，覺得翻譯的非常贊，所以也想加入進來，一起做些能幫助其他人學習的事吧。傳統的機器學習比較著重分類的應用，強化學習主要是序列決策的，David的課主要講強化學習的理論。285這門課我感覺側重點是深度學習和強化學習的融合，這部分也是我想學習的。

@陳晨

一般高校的這種公開課要比在線的慕課系統和詳細，同時時間也會更長，難度也會更大一些，當然收穫也會更多。強化學習是機器自主學習，或者是適用於真實應用場景的主要實現途徑，所以這門課的主題還是很前沿，同時內容也是比較完整的。這次參與翻譯既能夠加強理解，也能助益他人，很好的事情。

@藍愚

先修要求

想要學習伯克利大學 CS 285 《深度強化學習》這門課程，學生需要先學習 CS189 或者其他同等學歷課程。本課程將假定學生掌握強化學習、數值優化和機器學習的相關背景知識。

如果你對上述主題不是非常了解，那麼需要自主學習補充以下知識點：

課程大綱

第一講：課程介紹和概覽

第二講：針對行為的監督學習

第三講：TensorFlow 和神經網絡簡述

第四講：強化學習簡介

第五講：策略梯度

第六講：Actor-Critic 算法

第七講：價值函數

第八講：深度強化學習之Q函數

第九講：高級策略梯度

第十一講：基於模型的規劃

第十一講：基於模型的強化學習

第十二講：基於模型的策略學習

第十三講：變分推斷和生成模型

第十四講：強化學習對控制的概率推斷

第十五講：逆向強化學習

第十六講：遷移學習與多任務學習

第十七講：分布式強化學習

第十八講：探索（上）

第十九講：探索（下）

第二十講：元學習

第二十一講：信息理論，開放性問題探討

相關材料

有關強化學習與 MDP 的介紹資料：

CS188 EdX 課程，從馬爾可夫決策過程 I 開始：http://ai.berkeley.edu/home.html

Richard S. Sutton 與 Andrew G. Barto 的《強化學習導論》，第三章和第四章：http://incompleteideas.net/book/the-book-2nd.html

有關 MDP 的介紹，請參閱吳恩達的論文《Shaping and policy search in Reinforcement learning》：http://rll.berkeley.edu/deeprlcourse/docs/ng-thesis.pdf

David Silver 的課程：http://rll.berkeley.edu/deeprlcourse/#related-materials

有關機器學習和神經網絡的介紹性資料，請參閱：

Andrej Karpathy 的課程：http://cs231n.github.io/

Geoff Hinton 的 Coursera 課程：https://www.coursera.org/learn/neural-networks

吳恩達的 Coursera 課程：https://www.coursera.org/learn/machine-learning/

Yaser Abu-Mostafa 的課程：https://work.caltech.edu/telecourse.html

閱讀原文跳轉觀看課程

相關焦點

重磅 | 伯克利《深度無監督學習》今日開課!雙語字幕獨家上線!

AI 研習社獲得官方授權，伯克利 CS 294-158 《深度無監督學習》中英字幕版，等了好久，今天終於正式上線啦！翻譯 | 張美旋韓旭字幕 | 醬番梨看完是不是不夠過癮！自監督學習的進步已經開始縮小監督表示學習和非監督表示學習之間的差距，本課程將涵蓋這些主題的理論基礎以及它們的新應用。論文涉及GAN、VAE、降噪、自回歸、強化學習、自監督學習等等，課程歷時15周完成。
UC伯克利出品,深度強化學習最新課程已上線

作者：杜偉、小舟主題涵蓋深度強化學習領域的方方面面，UC 伯克利 CS 285 2020 秋季課程視頻放出。當地時間 10 月 11 日，UC 伯克利電氣工程與計算機科學系（EECS）助理教授 Sergey Levine 在推特上宣布，他講授的 CS285 深度強化學習（RL）課程已經放出了部分視頻，並表示之後每周會實時更新後續課程。
UC伯克利最新深度強化學習課程上線,視頻已上傳到B站

乾明發自凹非寺量子位報導 | 公眾號 QbitAI又有新的AI學習資源上線了。這次是來自UC伯克利的秋季課程：Deep Reinforcement Learning，課程代號CS 285，講解內容為深度強化學習。授課教授，依舊是獲得學生好評不斷的Sergey Levine教授。這次課程上線後，多名網友強烈推薦大家學這門課。
伯克利《深度強化學習》更新 | 第十三講:利用模仿優化控制器學習...

AI 研習社獲得官方授權，漢化翻譯伯克利 CS 294-112 《深度強化學習》，今天更新至第十三講啦~我們先來一睹為快——第十三講：利用模仿優化控制器學習策略上手視頻約 5 分鐘翻譯 | 郭瑋王明輝張璐
資源 | UC Berkeley CS 294深度強化學習課程(附視頻、學習資料)

本文主要介紹了課程中的強化學習主題，涉及深度強化學習的基本理論與前沿挑戰。CS294 深度強化學習 2017 年秋季課程的所有資源已經放出。該課程為各位讀者提供了強化學習的進階資源，且廣泛涉及深度強化學習的基本理論與前沿挑戰。本文介紹了該課程主要討論的強化學習主題，讀者可根據興趣愛好與背景知識選擇不同部分的課程。
【官方授權】2018 秋季伯克利大學 CS 294-112 《深度強化學習...

AI 研習社獲得官方授權，漢化翻譯伯克利大學 CS 294-112 《深度強化學習》，於本周四（2018 年 12 月 20 日）正式上線中文字幕版。伯克利大學 CS 294-112 《深度強化學習》為官方開源最新版本，由伯克利大學該門課程授課講師 Sergey Levine 授權 AI 研習社翻譯。
UC Berkeley CS 294深度強化學習課程(附視頻與PPT)

該課程為各位讀者提供了強化學習的進階資源，且廣泛涉及深度強化學習的基本理論與前沿挑戰。本文介紹了該課程主要討論的強化學習主題，讀者可根據興趣愛好與背景知識選擇不同部分的課程。請注意，UC Berkeley 的 CS 294 並未被歸類為在線開放課程，所有視頻的使用權僅限個人學習。知識背景本課程要求具有 CS 189 或同等學力。
CS231n 2017 今天正式開課!雙語字幕版獨家上線!

雷鋒網：CS231n 2017雙語字幕版獨家上線！哈哈哈，距離斯坦福計算機視覺課程結束5個月，2017春季CS231n中文版終於上線了，課程中文版已經在AI慕課學院（mooc.ai ）發布（ free free free ），11月10日正式開課，預計持續12周！無法科學上網看到原視頻的同學，現在可以在國內看到完整流暢的中文版視頻了。
李飛飛CS231n2017課程雙語字幕版上線 !(附課程連結)

CS231n 2017雙語字幕版上線！正式開課！距離斯坦福計算機視覺課程結束5個月，2017春季CS231n中文版終於上線了，課程中文版已經在AI慕課學院（mooc.ai ）發布，11月10日正式開課，預計持續12周！
斯坦福CS330 2019秋季課程視頻全新上線,專注多任務與元學習

今天，該課程的系列教學視頻終於上線了！今日，史丹福大學助理教授 Chelsea Finn 發推表示其主講的 CS330 深度多任務和元學習系列課程視頻可以線上觀看了。CS330 系列課程視頻連結：https://www.youtube.com/playlist?
開學三周了快補課:伯克利CS 294深度強化學習課,有視頻有課件

學習慄發自凹非寺量子位出品 | 公眾號 QbitAI△ 開學了，終於可以名正言順地學習了
edX 提供中文字幕的課程清單,獻給愛收藏的你!

edX為多門國際課程提供中文字幕，讓更多中國學員能夠無障礙學習。以下是提供中文字幕的國際英文課程列表，文末附有中文字幕使用貼士。——生命的秘密https://www.edx.org/course/introduction-biology-secret-life-mitx-7-00x-2加州大學伯克利分校學術寫作與商務寫作https://www.edx.org/course/academic-business-writing-uc-berkeleyx-colwri2
伯克利Fall2018最新CS294:深度強化學習課程

【導讀】伯克利在秋季學期開設了《深度強化學習課程》，有6名老師和28節課程，是想學習強化學習的讀者不可錯過的一門課程。致力於移動機器人的深度強化學習研究。 https://people.eecs.berkeley.edu/~gregoryk/Michael Chang，加州大學伯克利分校博士生。研究興趣是歸納偏見和算法約束。http://mbchang.github.io/Kate Rakelly，加州大學伯克利分校博士生。研究興趣在於視覺識別和機器人技術的交叉。
【最全解析】留美學CS 選卡耐基梅隆還是加州伯克利?

，更專注於EE專業課程學習的學生。computer science and engineering (CSE)：CSE學生則在完成基礎學習後，更專注cs課程的學習。從上述對比中可以看出在本科階段，卡耐基梅隆大學對cs技術的跨學科應用十分重視，在本科階段cs專業分別與其他專業相結合。對生物計算機、計算機音樂存儲、電腦遊戲、電腦卡通等計算機科學與藝術相互融合的學生比較適合卡耐基梅隆大學。
UC Berkeley-18-最新深度強化學習課程(中英字幕)

相似課程 Geoff Hinton on Coursera：https://www.coursera.org/course/neuralnets Andrew Ng on Coursera：https://www.coursera.org
David Silver深度強化學習課程 - 中文字幕 | 共同學習 #05

AlphaGo 底層核心技術包括深度學習（deep learning）、強化學習（reinforcement learning），和蒙特卡洛搜索樹（Monte Carlo tree search）。在這門強化學習的課程中，Silver 博士從簡介、馬爾科夫決策過程（Markov Decision Processes）、免模型預測（Model-free Prediction）、免模型控制（Model-free Control）、值函數近似（Value Function Approximation）、策略梯度算法（Policy Gradient）、集成學習和計劃（Integrating
重磅| AI 第一高校 CMU 的「神經網絡 NLP」課,中英字幕獨家上線!

AI 研習社獲得官方授權，漢化翻譯卡耐基梅隆大學的11-747神經網絡自然語言處理（2019春季），今天正式上線中英雙語字幕版課程啦！好消息是，我們又獲得了卡耐基梅隆大學另外一門課程的的官方授權，並且成功組織志願者對該課程進行了翻譯，中英雙語版字幕今天終於上線啦！
David Silver深度強化學習課程 - 中文字幕 | 共同學習 #03

AlphaGo 底層核心技術包括深度學習（deep learning）、強化學習（reinforcement learning），和蒙特卡洛搜索樹（Monte Carlo tree search）。在這門強化學習的課程中，Silver 博士從簡介、馬爾科夫決策過程（Markov Decision Processes）、免模型預測（Model-free Prediction）、免模型控制（Model-free Control）、值函數近似（Value Function Approximation）、策略梯度算法（Policy Gradient）、集成學習和計劃（Integrating
【資源】斯坦福CS231n 2017春季課程全公開,視頻+PPT+英文字幕

今年的CS231n Spring的instructors 是李飛飛、Justin Johnson和Serena Yeung，並邀請 Ian Goodfellow 等人講解GAN等重要主題。最近史丹福大學公開了該課程的全部視頻（配備英文）、slides等全部課程資料，新智元帶來介紹。
獨家| CMU 2018 秋季《深度學習導論》中文字幕版今日上線!

AI 研習社獲得官方授權，漢化翻譯CMU 2018 秋季《深度學習導論》課程，今日正式上線中文字幕版。本課程包含全面的概念描述，它幫助我們理解了深度學習的基礎知識。神經網絡玻爾茲曼機第二十講訓練 Hopfield 網絡隨機 Hopfield 網絡第二十一講受限玻爾茲曼機深度玻爾茲曼機第二十二講強化學習第一部分第二十三講強化學習第二部分第二十四講感恩節假期第二十五講

獨家 | 強化學習必看!UC 伯克利 CS 285 雙語字幕課程今日正式上線

相關焦點

重磅 | 伯克利《深度無監督學習》今日開課!雙語字幕獨家上線!

UC伯克利出品,深度強化學習最新課程已上線

UC伯克利最新深度強化學習課程上線,視頻已上傳到B站

伯克利《深度強化學習》更新 | 第十三講:利用模仿優化控制器學習...

資源 | UC Berkeley CS 294深度強化學習課程(附視頻、學習資料)

【官方授權】2018 秋季伯克利大學 CS 294-112 《深度強化學習...

UC Berkeley CS 294深度強化學習課程(附視頻與PPT)

CS231n 2017 今天正式開課!雙語字幕版獨家上線!

李飛飛CS231n2017課程雙語字幕版上線 !(附課程連結)

斯坦福CS330 2019秋季課程視頻全新上線,專注多任務與元學習

開學三周了快補課:伯克利CS 294深度強化學習課,有視頻有課件

edX 提供中文字幕的課程清單,獻給愛收藏的你!

伯克利Fall2018最新CS294:深度強化學習課程

【最全解析】留美學CS 選卡耐基梅隆還是加州伯克利?

UC Berkeley-18-最新深度強化學習課程(中英字幕)

David Silver深度強化學習課程 - 中文字幕 | 共同學習 #05

重磅| AI 第一高校 CMU 的「神經網絡 NLP」課,中英字幕獨家上線!

David Silver深度強化學習課程 - 中文字幕 | 共同學習 #03

【資源】斯坦福CS231n 2017春季課程全公開,視頻+PPT+英文字幕

獨家| CMU 2018 秋季《深度學習導論》中文字幕版今日上線!