歷時3年,清華大學iDLab實驗室打造《強化學習和控制》課程及講義!

2021-01-15 網易

2021-01-10 17:45:43　來源: AI科技評論

舉報

　　官網：http://www.neurondance.com/

　　來源：http://www.idlab-tsinghua.com/

　　作者：清華大學 iDLab實驗室

　　iDLab實驗室

實驗室主頁：http://www.idlab-tsinghua.com/thulab/labweb/index.html

　　The Intelligent Driving Laboratory (iDLAB) is a part of the School of Vehicle and Mobility (SVM) at Tsinghua University. This lab focuses on advanced automatic control and machine learning algorithms, and their applications on autonomous driving, connected vehicles, driver assistance and driver behavior analysis, etc. Our research interests are loosely divided into four categories: (1) Perception, decision and control for autonomous vehicles and driver assistance systems; (2) Reinforcement learning and optimal control; (3) Distributed estimation, learning and control; and (4) Large-scale optimization and control of eco-automation and electrified powertrain. We have achieved a series of important research results and peer-reviewed publications publicly available through this website.

　　書籍簡介

　　《Reinforcement learning and control》撰寫從2018年啟動，至今已歷三年，目的是為清華大學開設的同名研究生課程「強化學習與控制」，準備英文授課講義。

　　最新版本的前5章已上傳iDLab課題組網站，歡迎大家下載分享。

下載地址：http://www.idlab-tsinghua.com/thulab/labweb/publications.html?typeId=3&_types=

　　一、內容簡介

　　汽車的智能化變革促使整個行業發生了翻天覆地的變化，自動駕駛、雲控協同、駕駛輔助等一系列新技術如雨後春筍般湧現，它們在提升地面車輛行駛性能的同時，也為解決交通事故、排放汙染、城市擁堵等問題提供了一條可行的途徑。近年隨著機器學習和自動控制的融合發展，以模仿人類大腦學習機制為原理的強化學習（RL，Reinforcement Learning）技術迅速進入人們的視野，它為大規模複雜系統的學習及動態系統的高實時在線控制提供了一套極具前景的解決方案。

　　圖2 強化學習型自動駕駛框架

　　但是該方法的工程應用尚屬於起步階段。一個重要的原因是該方法既具有理論學習的複雜度，又具有工程實踐的挑戰性。理論上，它隸屬於統計學習和最優控制領域的交叉結合部，涉及的數理基礎較深，涵蓋面較廣，難以學習本質機理。實踐上，入門者不易短期內熟練掌握關聯的編程工具，而且若對算法原理不熟悉，難以對代碼進行工程化調整，不能發揮算法的應有性能。為應對上述挑戰，《Reinforcement Learning and Control》一書面向工程應用領域的科研人員和技術開發者，按照原理剖析、主流算法、典型示例三位一體的原則，逐一介紹該方法在動態系統的學習和控制領域的理論和應用，涉及馬爾科夫決策、蒙特卡洛學習、時序差分學習、函數近似、策略梯度學習、近似動態規劃、深度強化學習等知識點。

　　二、內容提要

　　全書總共包括11章。依次介紹RL概況及基礎知識，免模型學習的蒙特卡洛法及時序差分法，帶模型學習的動態規劃法，間接型及直接型RL，無窮時域及有限時域的近似動態規劃，深度強化學習和RL的各類拾遺。

　　樣稿展示

　　作者簡介

　　李升波，清華大學車輛與運載學院副院長、長聘教授、博導。研究領域：智能汽車與駕駛輔助、強化學習、最優控制等。主參編《Applied Methods and Techniques for Mechatronic Systems: Modeling,Identification and Control》、《AAC: Optimization, Controland Diagnosis》、《Road Vehicle Automation 3》和《Cooperative Intelligent Transport Systems: Towards High-level AutomatedDriving》等英文學術專著4部，《地面車輛原理》等中文譯著1部。

　　實驗室官網：http://www.neurondance.com/

　　實驗室社區：http://deeprl.neurondance.com/

　　由於微信公眾號試行亂序推送，您可能不再能準時收到AI科技評論的推送。為了第一時間收到AI科技評論的報導，請將「AI科技評論」設為星標帳號，以及常點文末右下角的「在看」。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺「網易號」用戶上傳並發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關焦點

清華大學要打造中文開放在線課程平臺

據清華大學副校長袁駟介紹，「學堂在線」平臺是基於edX發布的OpenEdX開源課程創建系統建立的，但不是edX的中文鏡像，而是希望打造成具有中國特色的中文MOOC平臺，能夠引進更多的中國大學優質課程資源。
清華大學發布大規模開放在線課程平臺「學堂在線」

中新社北京10月10日電 (記者馬海燕)清華大學10日在京發布大規模開放在線課程平臺「學堂在線」。北京大學、香港理工大學、臺灣新竹清華大學等10餘所重點高校代表齊聚一堂，表示將共同努力將其打造為全球首屈一指的中文大規模在線教育平臺。　　隨著「學堂在線」的正式發布，清華大學的「電路原理」、「中國建築史」等五門課程，麻省理工學院的「電路原理」、北京大學的「計算機輔助翻譯原理與實踐」課程作為第一批上線課程在該平臺開放選課。
散發材料之二:清華大學研究生創新性人才培養的思路和舉措 - 中華...

清華大學（2011年2月25日）各位記者，大家好：　　下面我來介紹一下清華大學研究生創新性人才培養的思路和舉措。　　「十二五」時期是我國從「窮國辦大教育」轉向「大國辦強教育」的階段，「由大到強」的轉變既是全國教育事業面臨的難點，也是清華大學面臨的主要問題。
2021年天津市成人自學考試課程使用教材十一

點擊查看:2021年天津市成人自學考試課程使用教材匯總2021年天津市成人自學考試課程使用教材十一序號課程代碼課程名稱3040799電子商務概論電子商務概論程大為中國財政經濟出版社20163050816數字系統設計與PLD應用技術ＥＤＡ技術及其應用周振超馮暖清華大學出版社
一起上清華 | 清華大學課程向社會免費開放

【MBA中國網訊】2月3日，清華大學校長邱勇在「2020全校師生同一堂課」上宣布：「清華肩負社會責任，在疫情期間，學校決定把清華負責的學堂在線上的1600餘門慕課課程免費向全社會開放。」2013年，清華大學發起成立世界第一個中文慕課平臺學堂在線。
學習:清華大學所有課程免費向公眾開放

◆導語◆學習是，給大腦進食，補充營養，清華大學作為國內一流高等學府，這次面對全國疫情，向公眾免費開放，預計開放周期至2月16日，在這近兩周的時間，希望讀友們可以好好利用這次學習機會，安排好自己的居家學習計劃。
廣東新興:強化「四大效應」實施重點人才工程

凌豐集團與華南理工大學夏琴香教授合作組建金屬材料研究小組，聘請了3名教授為公司顧問。萬事泰集團引進了日本東京大學博士李凌瀚，聘請了3名教授為研究院專家顧問。溫氏集團組織實施「打造國家級畜禽疾病防控領軍人才平臺」項目，形成一支院士引領、專家匯集、技術領先、素質優良的畜禽疾病防控領軍人才隊伍。
機器人專業解析:培養方向/核心課程/實驗室/就業前景/留學申請

#實驗室分類以我們學校的實驗室為例，主要分為四類：第一類是Perception and Cognitive Robotics，主要研究機器人的感知，涉及到機器學習和深度強化學習等智能方法，培養大家的編程能力和算法能力，如果你是CS出身，或者以後想從事算法或者計算機方面的工作的話，可以去報這個方面的實驗室。
優必選雪梨 AI 研究院何詩怡:基於課程學習的強化多標籤圖像分類...

雷鋒網 AI 科技評論按：與單標籤圖像分類相比，多標籤圖像分類是一種更符合真實世界客觀規律的方法，尤其在圖像和視頻的語義標註，基於內容的圖像檢索等領域有著廣泛的應用
江蘇大學18門課程獲首批國家級一流本科課程

本課程融合「線上線下」教學，通過中國大學MOOC平臺（愛課程網）串聯創業計劃知識學習和創業計劃實踐技能訓練，打造創業計劃制定能力培養的「第二課堂」，從而建立新型的師生關係和同學關係，積極採用基於線上線下教學結合的協作式學習、研討式學習和體驗式學習等教學方法，引導大學生更多地從「教中學」轉向「做中學」「做中創」「創中悟」。
B站學強化學習?港中文周博磊變身up主,中文課程已上線

周博磊老師博士畢業於麻省理工學院，現任香港中文大學信息工程系助理教授，研究方向主要為機器感知和決策，重點是通過學習可解釋、結構化的表徵，使機器能夠在複雜的環境中感知、推理和行動。除了直播和課程視頻之外，周博磊還會同步更新課程的代碼，使用的程式語言為 Python，深度學習框架則是 TensorFlow 和 PyTorch 皆可（PyTorch 為主）。
2020清華大學免費直播公開課課程一覽(附觀看入口)

3月2日-8日課程：　　周一　　我們為什麼要重視體育　　主講嘉賓：清華大學體育部副主任胡凱　　開課時間：3月2日(周一) 20:00-21:00　　課程介紹：講座以老師的職業經歷和教學經歷為指導，講述大學生為何要重視體育鍛鍊
福布斯2021年十大最佳人工智慧和數據科學碩士課程,清華大學入選

一些世界上最好的以技術主導聞名的學院和大學都提供了這些學科的專業碩士學位課程。近日，福布斯網站發布了一份「2021 年十大最佳人工智慧和數據科學碩士項目」榜單，榜單作者是政府和公司的戰略商業和技術顧問 Bernard Marr，這也是最佳數據科學「本科課程」列表的後續文章。
清華大學馮珺:當強化學習遇見自然語言處理有哪些奇妙的化學反應?|...

雷鋒網AI科技評論按：隨著強化學習在機器人和遊戲 AI 等領域的成功，該方法也引起了越來越多的關注。在近期雷鋒網GAIR大講堂上，來自清華大學計算機系的博士生馮珺，為大家介紹了如何利用強化學習技術，更好地解決自然語言處理中的兩個經典任務：關係抽取和文本分類。本文根據視頻直播分享整理而成，內容若有疏漏，以原視頻嘉賓所講為準。
資料| Python強化學習實戰:應用OpenAI Gym和TensorFlow精通強化...

《Python強化學習實戰：應用OpenAI Gym和TensorFlow精通強化學習和深度強化學習》共13章，主要包括強化學習的各種要素，即智能體、環境、策略和模型以及相應平臺和庫；Anaconda、Docker、OpenAIGym、Universe和TensorFlow等安裝配置；馬爾可夫鏈和馬爾可夫過程及其與強化學習問題建模之間的關係，動態規劃的基本概念；蒙特卡羅方法以及不同類型的蒙特卡羅預測和控制方法
回顧 | 清華大學電子工程系2019年大事記

課程改革全面梳理了電子信息學科知識構架，構建起了覆蓋兩個一級學科的全新課程體系，推出了10門專業核心課和核心課系列教材並已正式出版了3門核心課教材。2018-2019年，我系舉辦了一系列教學改革研討會和核心課程師資培訓班，共有來自國內96所高校的218位教師代表參加。
專題| 深度強化學習綜述:從AlphaGo背後的力量到學習資源分享(附...

特別地，我們將在 23 節中列舉一系列關於強化學習的資源，包括圖書、在線課程、教程、會議、期刊、研討會乃至博客等。如果非要選擇唯一一個推薦的強化學習的資源，那麼應該是 Sutton 教授的強化學習書（RL Book，Sutton and Barto，2017，第二版正在編輯中）。
...深度強化學習綜述:從AlphaGo背後的力量到學習資源分享(附論文)

特別地，我們將在 23 節中列舉一系列關於強化學習的資源，包括圖書、在線課程、教程、會議、期刊、研討會乃至博客等。如果非要選擇唯一一個推薦的強化學習的資源，那麼應該是 Sutton 教授的強化學習書（RL Book，Sutton and Barto，2017，第二版正在編輯中）。
【聚焦2020計劃】清華大學材料學院:築巢引鳳,廣開賢路,建設世界一...

●通訊員郭藝博萬春磊李素鳳「材料學院竭力打造一流的師資隊伍，建設一流的教學和研究平臺，提供一流的教育計劃，吸引和資助優秀的青年學子來院學習深造，著力培養學生的創新能力、綜合實力和國際視野。」材料學院院長林元華表示。
清華大學在線課程本周課表公開記得來上課

計算機系特獎學長：科研小白入門指南主講嘉賓：清華大學計算機系2016級本科生，2019年清華大學本科生特等獎學金獲得者高天宇開課時間：3月10日（周二）20:00-21:00課程介紹：作為剛剛熟悉大學校園的本科生，你也許對「科研」既陌生又憧憬。那麼，科研距離本科生到底有多遠？

歷時3年,清華大學iDLab實驗室打造《強化學習和控制》課程及講義!

相關焦點

清華大學要打造中文開放在線課程平臺

清華大學發布大規模開放在線課程平臺「學堂在線」

散發材料之二:清華大學研究生創新性人才培養的思路和舉措 - 中華...

2021年天津市成人自學考試課程使用教材十一

一起上清華 | 清華大學課程向社會免費開放

學習:清華大學所有課程免費向公眾開放

廣東新興:強化「四大效應」實施重點人才工程

機器人專業解析:培養方向/核心課程/實驗室/就業前景/留學申請

優必選雪梨 AI 研究院何詩怡:基於課程學習的強化多標籤圖像分類...

江蘇大學18門課程獲首批國家級一流本科課程

B站學強化學習?港中文周博磊變身up主,中文課程已上線

2020清華大學免費直播公開課課程一覽(附觀看入口)

福布斯2021年十大最佳人工智慧和數據科學碩士課程,清華大學入選

清華大學馮珺:當強化學習遇見自然語言處理有哪些奇妙的化學反應?|...

資料| Python強化學習實戰:應用OpenAI Gym和TensorFlow精通強化...

回顧 | 清華大學電子工程系2019年大事記

專題| 深度強化學習綜述:從AlphaGo背後的力量到學習資源分享(附...

...深度強化學習綜述:從AlphaGo背後的力量到學習資源分享(附論文)

【聚焦2020計劃】清華大學材料學院:築巢引鳳,廣開賢路,建設世界一...

清華大學在線課程本周課表公開 記得來上課

清華大學在線課程本周課表公開記得來上課