今晚8點直播:因果強化學習|因果科學與Causal AI讀書會

2020-12-10 騰訊網

今晚8點,「因果科學與Causal AI」讀書會將進行第十期的線上論文分享,主題是「因果強化學習」,將由劍橋大學在讀博士陸超超、清華大學在讀博士張卓婧來進行分享,本次內容將在集智俱樂部B站直播。

主題背景簡介

近些年來,在遊戲領域強化學習取得了巨大的進展,已經能夠打敗人類最頂級的玩家。但在現實生活中,我們卻罕見強化學習的成功應用。帶著這種疑惑,在本次讀書會上,我們將探訪機器學習中一個全新的領域——因果強化學習。因果強化學習不僅可以為傳統強化學習中那些棘手的問題提供一種新的解決方案,更重要的是,它還為通用人工智慧提供一種解決思路。隱藏在因果強化學習背後的哲學理念是迷人的:回顧科學發展的歷史,人類也是走著相似的道路。具體來說,人類是在不斷地與自然交互探索的過程中總結經驗和規律,然後利用這些經驗和規律更好地指導下一次與自然的交互探索,以此來不斷地發展進步。因果強化學習就是在模仿人類的這種行為:智能體在於環境的交互過程中學習和發現其因果關係,然後利用學到的因果關係來優化自己的策略以指導下一步的交互。正是由於這個原因,因果強化學習可以被視為一種通用的學習算法,在現實生活中有著廣泛的應用,比如:計算機視覺、機器人、生物醫藥、健康醫療、推薦系統,自動駕駛,金融、社會學等等。

大綱

Introduction to Causal RL

Brief Intro to RL and Causality

Motivation

Key Concepts

Challenges

Confoundings

Counterfactuals

Causal Representation Learning

Artificial General Intelligence

Applications

Computer Vision

Healthcare/Medicine

Self-driving

Recommendation Systems

Paper Reading

Causality for RL [1-3]

RL for Causality [4-5]

Discussion

主講人介紹

陸超超:劍橋大學在讀博士,研究方向為因果強化學習。

張卓婧:清華大學在讀博士,研究興趣是因果強化學習。

參考文獻

[1] Dudik, M., Langford, J., Li, L. Doubly robust policy evaluation and learning. In Proceedings of 28th International Conference on Machine Learning. 2011.

[2] Bareinboim, E., Forney, A., Pearl, J. Bandits with Unobserved Confounders: A Causal Approach. In Proceedings of the 28th Annual Conference on Neural Information Processing Systems, 2015.

[3] Zhang, J., Bareinboim, E. Designing Optimal Dynamic Treatment Regimes: A Causal Reinforcement Learning Approach. In Proceedings of the 37th International Conference on Machine Learning. 2020.

[4] Khalil, Elias, et al. "Learning combinatorial optimization algorithms over graphs." Advances in Neural Information Processing Systems. 2017.

[5] Zhu, Shengyu, Ignavier Ng, and Zhitang Chen. "Causal discovery with reinforcement learning." arXiv preprint arXiv:1906.04477 (2019).

[6] Lu et al. "Deconfounding reinforcement learning in observational settings." arXiv preprint arXiv:1812.10576

[7] Schoelkopf, Bernhard. "Causality for machinine learning." arXiv preprint arXiv:1911.10500

[8] Buesing et al. "Woulda, coulda, shoulda: Counterfactually-guided policy search." arXiv preprint arXiv:1811.06272

[9] de Haan et al. "Causal confusion in imitation learning." arXiv preprint arXiv: 1905.11979

直播信息與報名方式

直播時間:今天(11月29日) 20:00-23:00

直播地址:集智俱樂部 B 站直播間

關注B站主播「集智俱樂部」

不錯過每一場集智重磅直播

直播地址:

https://live.bilibili.com/8091531

直播時間 :20:00-22:00

關於讀書會內容介紹的更新

集智俱樂部聯合智源社區發起了因果科學與Causal AI讀書會受到了因果科學領域一線科研工作者的廣泛認可,我們也深深的感受到了青年科學工作者推動該領域發展的熱情。目前因果科學與Causal AI讀書會已經有220+的朋友報名,其中碩博的比例接近80%。

在讀書會中的參與者以科研工作者居多,清華大學、北京大學、國防科技大學、浙江大學、復旦大學、中山大學等國內高校的學生居多,也有許多一線網際網路包括谷歌X、FackBook、滴滴、騰訊、阿里、拼多多等大廠的工程師也參與其中。

時間:9月20日起,每周日晚19:00-21:00,持續約2-3個月

模式:線上閉門讀書會;收費-退款的保證金模式;讀書會成員認領解讀論文

費用:299/人

相關焦點

  • 因果關係是通向強AI的階梯or作用被誇大?
    因果關係在機器學習領域最新研究和應用因果關係與解決遷移學習、弱監督學習、強化學習當前,因果關係在機器學習上已經有了不少進展,包括如何理解以及解決遷移學習、弱監督學習、和強化學習問題。張坤表示,他所在的團隊在這三類問題上都有涉獵,也做出了一些值得思考的結果。
  • 薛丁格的佛與深度學習中的因果
    深度學習中的因果菩薩畏因,眾生畏果。NIPS 2017上,Ali Rahimi開撕,現在的深度學習是重果不重因的鍊金術,Yann LeCun則反駁說:如果你吃了一個雞蛋覺得味道不錯,何必知道是哪個母雞下的呢?!(原話不是這樣的,這是筆者蹩腳的翻譯)。
  • 雅思寫作:因果關係表達的乾貨總結
    雅思寫作考試中,因果關係的表達常常難倒很多考生。本文中,筆者精選雅思常考話題,將雅思寫作中因果關係表達的乾貨做了詳盡整理,希望對大家備考雅思有幫助。 雅思大作文中有一類題目是因果關係類,具體包括三小類:cause and effect、cause and solution、problem and solution。這三小類問題也可以穿起來,即針對某個topic的cause—effect (即problem) – solution。 無論哪種題目,寫明因果關係很重要。
  • 量子力學能顛覆因果順序嗎 ?
    本文由微信公眾號環球科學ScientificAmerican授權轉載。原標題:量子力學殺死了因果順序?
  • 反事實推理、特徵分離,「因果表示學習」的最新研究都在講什麼?
    因果推理(Causal inference)是根據影響發生的條件得出因果關係結論的過程,是研究如何更加科學地識別變量間的因果關係(Causality)。在因果關係中,原因對結果負有部分責任,而結果又部分取決於原因。客觀事物普遍存在著內在的因果聯繫,人們只有弄清事物發展變化的前因後果,才能全面地、本質地認識事物。
  • 論文速遞-新冠死亡率的辛普森悖論,因果推斷的一個例子
    而這正是因果推斷要去衡量的。這在因果推斷中被定義為Total causal effect(TCE),計算公式為:在新冠的例子中,該式的含義是,如果義大利和中國具有相同的人口結構和抗疫措施,死亡率會是多少?根據Pearl提出的do-calcuscus,可以通過觀察數據估算出該數值為義大利和中國的整體死亡率之差4.3%-2.3%=2%。
  • 響應號召,集智俱樂部學術年會線上舉辦,一起因果糾纏!
    報名B站直播 如何開發對數據變化具有穩定性和魯棒性的學習模型,對於學術研究和實際應用都是至關重要的。因果推斷是一種強有力的統計建模工具,用於解釋和穩定學習。在這次分享中,崔鵬老師著重於因果推理和穩定學習,旨在從觀察數據中探索因果知識,以提高機器學習算法的解釋性和穩定性。
  • 集智俱樂部學術年會:5場主題報告+3場分論壇,一起因果糾纏!
    因果推斷是一種強有力的統計建模工具,用於解釋和穩定學習。在這次分享中,崔鵬老師著重於因果推理和穩定學習,旨在從觀察數據中探索因果知識,以提高機器學習算法的解釋性和穩定性。  個人簡介:崔鵬,清華大學副教授,研究方向包括大數據環境下的因果推理與穩定預測、網絡表徵學習,及其在金融科技、智慧醫療及社交網絡等場景中的應用。
  • 何為因果?學佛人為什麼要深信因果呢?
    何為因果?  因果,是佛法基本定律,主張今生的善惡業,可以引生未來世的善惡果報反作用到自身,謂因緣和果報,根據佛教輪迴之說,種什麼因,受什麼果;善有善報,惡有惡報。意為會有什麼結果就會有什麼原因。學佛人為什麼要深信因果呢?  學佛的人,大約都以為自己是相信因果的。但捫心自問:我們對因果究竟信到什麼程度?是「深信不疑」的「信」,還是「寧信其有,不信其無」的信呢?  對於學佛者而言,深信業果是非常重要的。無明煩惱為什麼會使我們流轉生死?造作惡業為什麼會使生命感得苦果?
  • 一場因果革命,Judea Pearl最新力作《為什麼》中文版發布
    圖註:Judea Pearl然而,當前統計機器學習主要關注對表徵的擬合,尋找的是變量之間的相關性,而非潛在的因果性。這樣的認識會使科學研究停留在較淺的關聯層面,導致模型的魯棒性和可解釋性喪失,阻斷了進一步探究幹預變量,以及反事實推斷(即假設某一變量完全相反而其他變量不變時,該變量對結果的影響)的能力。
  • 因果是歷劫的定數
    人總是伴有不斷追求的理想,需要付出努力不斷地學習,也有離開家到很遠的地方工作,這些都經歷以後發現自己並不快樂、而且也沒有取得令自己滿意的進步。我們要靜下心來認真思考:自己到底喜歡或需要什麼?自己適合或做什麼更有意義呢?
  • 佛說「因果不可改」,究竟什麼是因果?
    它們分別是:「因果不可改,智慧不可賜,真法不可說,無緣不能度。」其它三樣還好說點,為什麼說因果不可改?究竟什麼是因果?佛陀在世時,曾經遇到一位非常富有的貴婦,這位貴婦剛剛失去了自己的孩子。當時佛陀剛好經過,她於是求佛陀,救活自己的孩子。佛陀沉思片刻,便要求她做到一件事情,如果做到了這件事情,便可以救活他的孩子。貴婦救子心切,於是答應了佛陀的要求。
  • 論侵權法上的因果關係
    但令人遺憾的是,因果關係問題目前仍然是一個遠未解決的難題;本文從世界兩大法系代表理論之比較,我國目前民法因果關係理論的現狀及其發展、因果關係的證明,融會相關哲學觀點論述侵權法上的因果關係。  一、世界兩大法系因果關係學說之比較  (一)大陸法系因果關係學說  大陸法系,以德國、法國、日本為代表。他們將因果關係區分為責任構成因果與責任範圍因果關係,責任構成因果關係性質上討論的是侵權責任的構成問題,而對於責任範圍因果關係則屬於損害賠償責任範圍問題。
  • 「萬法皆空因果不空」,感情的背叛逃不開因果,也許這是宿命
    有人說命運掌握在自己手中,他們會找各種科學依據來證明,人世間是不存在命運的,一切都要靠自己的努力。網絡上也有這樣一個小故事。徒弟問師傅說道:師傅,你相信命運嗎?師傅說道:你把右手展開,在緊緊地握住!史蒂芬.霍金等偉大科學家也表示過,科學的盡頭,就是神學。以上是我分析的宿命論,僅供參考,下面是佛界因果論!在佛界,有一句響噹噹的話,你肯定如雷貫耳,那就是。佛曰:萬法皆空,因果不空!
  • 清華大學崔鵬:探索因果推理和機器學習的共同基礎
    因此,近期很多研究方向的工作都或多或少地與因果推理有所結合。在11月27日由智源舉辦的 NeurIPS 2020中國預講會上,來自清華大學計算機科學與技術系的崔鵬副教授發表了主題為「穩定學習:發掘因果推理和機器學習的共同基礎」的演講,崔老師表示,「我們將站在機器學習的角度,探討如何看待因果推理。」
  • 不昧因果
    ,下座後,眾僧都已散去,獨有一老人站著不走。老人回答說:「我不是人,實是野狐,迦葉佛時曾是這裡的住持,當時有學人問我:『大修行人還落因果否?』我回答說:『不落因果。』因此便墮野狐身五百世,無法脫身,因仰慕禪師的修為,特請禪師慈悲開示。」百丈禪師默許了。於是老人合掌問道:「請問禪師,大修行人還落因果否?」百丈禪師答道:「不昧因果。」老人言下大悟,即禮謝道:「今承和尚代語,令我超脫狐身,乞和尚以亡僧禮送。」便消失了。
  • 因果?如何正確看待?
    以下觀點僅個人看法,請多多諒解曾經的方塊,對於科學深信不疑,對於宗教,佔卜等嗤之以鼻。可是當我經歷一些事之後,我才明白很多東西不能夠一槍打死,不能夠走火入魔,但要心存敬畏。隨著死亡,思想和軀體都消失了,生不帶來死不帶去,因果是附著於身體和人的思想,身體和思想消逝了,又怎麼讓無實體的因果留存呢?就算是下一世,那也是一副新軀體和一副新的價值觀,那個時候整個人都是新的。那麼因果在現世如何體現呢?
  • 因為超然於因果,才能走出因果
    這也是人之常情,畢竟也不能讓自己忍氣吞聲,白受欺負與委屈,但是還有一種人,他們會選擇以德報怨,就是你傷害了我,我不計較,你怎麼待我,是我的因果,而我怎麼對你,是我的修養。為什麼說別人怎麼待你,是你的因果?佛家講究三世因果,萬法皆空,因果不空,然而世人不信輪迴,所以造業無邊。
  • 2015公考行測之因果關係對可能性的推理
    一、混淆點造成的困擾 因果是事物的一種本質聯繫,作為科學論證的手段常常出現在考試當中,可能性推理的題幹往往以因果關係的形式呈現。然而,可能性推理作為行測考察的一種類型,本質考察大家對題幹分析理解、漏洞排查、加強削弱題幹的能力。所以在考試當中,常常有考生把這兩者當做一回事,做題時就給自己帶來了些許困擾。
  • 萬法皆空,因果不空。這句話對嗎?佛學裡的佛還受因果嗎
    無論你是學佛的人,還是不學佛的人,對因果其實都不陌生。因果並不是你信就有,不信就沒有。因果可以說滲透在我們,每一個人工作生活的方方面面,同時也是整個物質世界,及形而上一切世界的基本規律。另一方面,因果通三世,你怎知道別人前幾世,又做了什麼呢?好人遭難,也許是重罪輕報。壞人得意,也許是厚福薄施。總之,因果延續,前果後因,無限循環,為十方一切世界之成因,亦是十方一切世界之普遍規律。關於娑婆世界的因果,在這裡並不是討論的重點,今天說的是在學人實修,由凡入聖的過程中,究竟有沒有因果在起作用?