耿直:統計學中的因果推斷問題(Causal Inference)

2021-03-02 數據派THU

注釋:

[1] Holland P W. Statistics and causal inference. J. Am. Statist. Ass. , 1986, 81:945-970.

[2] Pearl J. Causality: Models, Reasoning, and Inference. 2nd ed. Cambridge: Cambridge University Press, 2009.

[3] Spirtes P, Glymour C, Scheines R. Causation, Prediction, and Search. 2nd ed. New York: MIT Press, 2000.

[4] Guyon I, Aliferis C, Cooper G, et al. Causation and prediction challenge. Proceed. J. Mach. Learn, Res. 2008, 3.

[5] Freedman D. From association to causation: Some remarks on the history of statistics, Statistical Science, 1999, 14:243-258.

[6] Greenland S, Robins J M, Pearl J. Confounding, and collapsibility in

causal inference. Statistical Science, 1999, 14:29-46.

[7] Ju C, Geng Z, Criteria for surrogate endpoints based on causal distributions, J. Royal Statist. Soc. B, 2010, 72:129-142.

[8] Heckman J J. Econometric causality. Internat. Statist. Review, 2008, 76:1-27.

[9] http://jmlr.csail.mit.edu/papers/topic/causality.html.

相關焦點

  • Causal Inference
    現實中遇到的很多問題實際上是因果問題,而不是預測。因果問題分為兩種:一種是 causal inference,比如給定兩個變量 X、Y,希望找到一個衡量它們之間因果關係的參數 theta;另一種是 causal discovery,即給定一組變量,找到他們之間的因果關係。對於後面這種 causal discovery,notes 裡面說它在統計上是不可能的。
  • 因果推斷簡介之二:Rubin Causal Model (RCM) 和隨機化試驗
    研究方向是因果推斷。關鍵詞:Donald Rubin; RCM; 可識別性; 因果推斷; 因果識別; 平均因果作用; 隨機化試驗因果推斷用的最多的模型是 Rubin Causal Model (RCM; Rubin 1978) 和 Causal Diagram (Pearl 1995)。
  • 因果推斷簡介之四:因果推斷簡介之四:觀察性研究,可忽略性和傾向得分
    在一般的有區組(blocking)的隨機化試驗中,更一般的可忽略性 Z⊥{Y(1),Y(0)}|X 成立,因為只有在給定協變量 X 後,處理的分配機制才是完全隨機化的。比如,男性和女性中,接受處理的比例不同,但是這個比例是事先給定的。在傳統的農業和工業試驗中,由於隨機化,可忽略性一般是能夠得到保證的;因此在這些領域談論因果推斷是沒有太大問題的。
  • 因果科學與 Causal AI 系列讀書會 | 眾包出書
    Judea Pearl 認為當下正在進行一場改變數據科學的新革命 --- 」因果革命「。因果革命和以數據為中心的第一次數據科學革命,也就是大數據革命(涉及機器學習,深度學習及其應用,例如Alpha-Go、語音識別、機器翻譯、自動駕駛等等 )的不同之處在於,它以科學為中心,涉及從數據到政策、可解釋性、機制的泛化,再到一些社會科學中的歸因和公平性問題,甚至哲學中的創造性和自由意志 。
  • ...因果助力CV、NLP和認知神經科學 | 因果科學與Causal AI讀書會
    文章通過對這種現象進行了因果建模,並將後門調整巧妙運用到了NLP中,從而使得法院觀點生成模型能夠消除數據生成帶來的混淆偏差。在這篇論文綜述中,作者回顧了知神經科學背景下的因果關係概念,並回顧了從數據中推斷因果關係的現有方法。因果推理是一項頗有野心又異常艱巨的任務,在認知神經科學中尤其具有挑戰性。在文章中,作者從各個方面詳細討論當前兩個主要困難:幹預數據的稀缺性和尋找正確變量的挑戰,主張將分布魯棒性作為解決這些問題的指導原則。
  • 為機器學習插上因果推理的翅膀:這是一本系統的因果推理開源書
    書籍開源地址:https://www.hsph.harvard.edu/miguel-hernan/causal-inference-book/哈佛大學生物統計學和流行病學教授他們表示目前因果推理相關的材料大部分都分散在多個學科的期刊上,或者存在各種技術文章中。他們希望這本書能幫助各種對因果推斷感興趣的讀者,不論是流行病學家、統計學家、社會科學學家還是計算機科學家。這本書主要分為三部分,它們的難度依次遞增:不帶模型的因果推理、帶模型的因果推理、複雜長跨度數據的因果推理。
  • 因果推斷簡介之五:因果圖 (Causal Diagram)
    研究方向是因果推斷。在下一節圖模型結構的學習中,我們會看到,只有在一些假定和特殊情形下,我們可以從觀測數據確定 「原因」 和「結果」。用一個 DAG 連表示變量之間的關係,並不是最近才有的。圖模型也並不是 Judea Pearl 發明的。但是,早期將圖模型作為因果推斷的工具,成果並不深刻,大家也不太清楚僅僅憑一個圖,怎麼能講清楚因果關係。
  • 因果科學入門讀什麼書?Y. Bengio博士候選人的研讀路徑推薦
    本次,集智俱樂部也圍繞其中推薦的2本書籍,組織了深度精讀的讀書會,新的讀書會將著重介紹如何計算幹預分布,如何從觀察和幹預數據中推斷因果模型,以及因果思想如何產生用於經典機器學習問題。非常適合有機器學習背景,希望深入學習研究因果科學的基礎知識和重要模型方法,尋求解決相關研究問題的朋友參加。歡迎參加!
  • 『因果關係』英文研究熱點知識圖譜
    ,今天我們利用Web of Science核心合集資料庫,對『因果關係』英文研究成果進行分析,並繪製了研究熱點知識圖譜,以饗讀者。圖1所示:因果關係研究成果發文時間分布情況,由圖可以看出,因果關係研究方向的英文成果呈現出顯著的遞增趨勢,業已成為當前一個重要的研究熱點。
  • 北大經院工作坊第181場 | 潛在非線性因子模型下的因果推斷(計量...
    北大經院工作坊第181場 | 潛在非線性因子模型下的因果推斷(計量、金融和大數據分析工作坊) 2020-12-07 22:22 來源:澎湃新聞·澎湃號·政務
  • 科學家建立神經網絡環路連接的推斷基礎
    科學家建立神經網絡環路連接的推斷基礎 作者:小柯機器人 發布時間:2020/9/9 17:27:54 美國德克薩斯大學Ila R.
  • ※洞觀社科※專欄32|Daniel Little:社會科學中的因果解釋
    在自然科學中,覆蓋律法則是最常用的解釋模型,但在社會科學中適用有限。社會科學主要通過識別因果關係、構建因果解釋追尋我們的目標。 本次引介Daniel Little為社會科學哲學和方法論研究貢獻的一篇重要文獻,文章重點介紹了因果解釋的形上學基礎、解釋類型、解釋方法以及與社會理論之間的關係。 本文來源於Little, D. . (1996).
  • 活動報名 | 因果科學與Casual AI讀書會
    因果革命和以數據為中心的第一次數據科學革命,也就是大數據革命(涉及機器學習,深度學習及其應用,例如Alpha-Go、語音識別、機器翻譯、自動駕駛等等 )的不同之處在於,它以科學為中心,涉及從數據到政策、可解釋性、機制的泛化,再到一些社會科學中的歸因和公平性問題,甚至哲學中的創造性和自由意志 。可以說, 因果革命徹底改變了科學家處理因果問題的方式,形成了一門新學科—因果科學。
  • Stata講座:因果推斷中的雙重差分法開講
    主講嘉賓是中央財經大學社會發展學院王存同教授,講座題目為《因果推斷中的雙重差分法》。來自全國多所高校及科研機構的10596多名師生及研究者觀看了本場直播。本次講座王老師為大家帶來了因果推斷模型中的雙重差分法(DID)的介紹。因果推斷模型與方法是現代社會科學研究者利用計量模型發表高水平實證論文的核心利器,其中雙    重差分法(DID)佔有舉足輕重的地位。
  • 《因果科學周刊》第4期:因果賦能推薦系統
    因果科學社區歡迎您加入! 因果科學社區願景:回答因果問題是各個領域迫切的需求,當前許多不同領域(例如 AI 和統計學)都在使用因果推理,但是他們所使用的語言和模型各不相同,導致這些領域科學家之間溝通交流困難。
  • 周日北大統計案例實務課程--耿直教授講座
    北大統計案例實務課程--耿直教授講座演講主題:因果推斷演講嘉賓:耿直教授演講時間:2020/4/26 18:30-21:30
  • 周曉華:因果推斷的數學基礎和在醫學中的應用
    這些都是因果推斷的問題。事實上,僅僅依靠數據,我們是無法回答上述問題的。很多時候,數據生成機制對觀測者是未知的,因此我們只能觀察到相關性。因果性在相關性的基礎上更進一步:相關性可以由觀察到的變量聯合分布來描述,而對於因果性的分析需要知道數據的生成機制,或者條件改變時變量分布的變化。如何用數學語言來描述進行因果分析呢?
  • 因果階梯與Do-演算:怎樣完美地證明吸菸致癌?
    導語通過手工推導,我們可以解決包含少量變量的因果推理問題,但對於現實中有幾十個或者上百個結點的因果圖,當前業界還需要一個可以自動化進行因果推理的演算應用框架。本文整理自中科院計算所在讀博士李奉治在集智-凱風研讀營的分享,介紹Judea Pearl的因果理論,以及Do-演算在因果推斷領域的應用前景。李奉治 | 作者鄧一雪 | 編輯1. 從吸菸致癌談起
  • 問卷數據的因果關係推斷 —工具變量模型在SPSS, R及Mplus中的實現
    問卷研究存在的問題:endogeneity bias 內生性問題關於內生性問題的描述,比較早看到的是2010年Antonakis等人的一篇文章:On making causal claims: A review and recommendations (Antonakis et
  • Stata免費講座|因果推斷中的雙重差分法
    它被廣泛地應用於統計學、經濟學、生物學、醫藥學、社會學、人口學等一系列學科的研究,功能十分強大。  今年7-8月,由武漢大學經濟與管理學院聯合Stata中國授權代理北京天演融智軟體有限公司,舉辦了第二屆「Stata洞察數據科學研討會」活動,活動期間為大家安排了3場專題講座和一場研討會,受到大家的廣泛好評。