官網:http://www.neurondance.com/
來源:http://www.idlab-tsinghua.com/
作者:清華大學 iDLab實驗室
1
iDLab實驗室
實驗室主頁:http://www.idlab-tsinghua.com/thulab/labweb/index.html
The Intelligent Driving Laboratory (iDLAB) is a part of the School of Vehicle and Mobility (SVM) at Tsinghua University. This lab focuses on advanced automatic control and machine learning algorithms, and their applications on autonomous driving, connected vehicles, driver assistance and driver behavior analysis, etc. Our research interests are loosely divided into four categories: (1) Perception, decision and control for autonomous vehicles and driver assistance systems; (2) Reinforcement learning and optimal control; (3) Distributed estimation, learning and control; and (4) Large-scale optimization and control of eco-automation and electrified powertrain. We have achieved a series of important research results and peer-reviewed publications publicly available through this website.
2
書籍簡介
《Reinforcement learning and control》撰寫從2018年啟動,至今已歷三年,目的是為清華大學開設的同名研究生課程「強化學習與控制」,準備英文授課講義。
最新版本的前5章已上傳iDLab課題組網站,歡迎大家下載分享。
下載地址:http://www.idlab-tsinghua.com/thulab/labweb/publications.html?typeId=3&_types=
一、內容簡介
汽車的智能化變革促使整個行業發生了翻天覆地的變化,自動駕駛、雲控協同、駕駛輔助等一系列新技術如雨後春筍般湧現,它們在提升地面車輛行駛性能的同時,也為解決交通事故、排放汙染、城市擁堵等問題提供了一條可行的途徑。近年隨著機器學習和自動控制的融合發展,以模仿人類大腦學習機制為原理的強化學習(RL,Reinforcement Learning)技術迅速進入人們的視野,它為大規模複雜系統的學習及動態系統的高實時在線控制提供了一套極具前景的解決方案。
圖2 強化學習型自動駕駛框架
但是該方法的工程應用尚屬於起步階段。一個重要的原因是該方法既具有理論學習的複雜度,又具有工程實踐的挑戰性。理論上,它隸屬於統計學習和最優控制領域的交叉結合部,涉及的數理基礎較深,涵蓋面較廣,難以學習本質機理。實踐上,入門者不易短期內熟練掌握關聯的編程工具,而且若對算法原理不熟悉,難以對代碼進行工程化調整,不能發揮算法的應有性能。為應對上述挑戰,《Reinforcement Learning and Control》一書面向工程應用領域的科研人員和技術開發者,按照原理剖析、主流算法、典型示例三位一體的原則,逐一介紹該方法在動態系統的學習和控制領域的理論和應用,涉及馬爾科夫決策、蒙特卡洛學習、時序差分學習、函數近似、策略梯度學習、近似動態規劃、深度強化學習等知識點。
二、內容提要
全書總共包括11章。依次介紹RL概況及基礎知識,免模型學習的蒙特卡洛法及時序差分法,帶模型學習的動態規劃法,間接型及直接型RL,無窮時域及有限時域的近似動態規劃,深度強化學習和RL的各類拾遺。
樣稿展示
3
作者簡介
李升波,清華大學車輛與運載學院副院長、長聘教授、博導。研究領域:智能汽車與駕駛輔助、強化學習、最優控制等。主參編《Applied Methods and Techniques for Mechatronic Systems: Modeling,Identification and Control》、《AAC: Optimization, Controland Diagnosis》、《Road Vehicle Automation 3》和《Cooperative Intelligent Transport Systems: Towards High-level AutomatedDriving》等英文學術專著4部,《地面車輛原理》等中文譯著1部。
實驗室官網:http://www.neurondance.com/
實驗室社區:http://deeprl.neurondance.com/
由於微信公眾號試行亂序推送,您可能不再能準時收到AI科技評論的推送。為了第一時間收到AI科技評論的報導, 請將「AI科技評論」設為星標帳號,以及常點文末右下角的「在看」。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺「網易號」用戶上傳並發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.