耿直:統計學中的因果推斷問題(Causal Inference)

2021-02-20 數據派THU

注釋:

[1] Holland P W. Statistics and causal inference. J. Am. Statist. Ass. , 1986, 81:945-970.

[2] Pearl J. Causality: Models, Reasoning, and Inference. 2nd ed. Cambridge: Cambridge University Press, 2009.

[3] Spirtes P, Glymour C, Scheines R. Causation, Prediction, and Search. 2nd ed. New York: MIT Press, 2000.

[4] Guyon I, Aliferis C, Cooper G, et al. Causation and prediction challenge. Proceed. J. Mach. Learn, Res. 2008, 3.

[5] Freedman D. From association to causation: Some remarks on the history of statistics, Statistical Science, 1999, 14:243-258.

[6] Greenland S, Robins J M, Pearl J. Confounding, and collapsibility in

causal inference. Statistical Science, 1999, 14:29-46.

[7] Ju C, Geng Z, Criteria for surrogate endpoints based on causal distributions, J. Royal Statist. Soc. B, 2010, 72:129-142.

[8] Heckman J J. Econometric causality. Internat. Statist. Review, 2008, 76:1-27.

[9] http://jmlr.csail.mit.edu/papers/topic/causality.html.

相關焦點

  • 因果推斷領域新書(附PDF):Causal Inference: What If
    因果推斷是當今機器學習領域炙手可熱的研究方向,而圖靈獎得主貝葉斯網絡之父 Judea Pearl 的著作《為什麼》更是讓該領域的知識得以普及。而在2020年末,由哈佛大學公共衛生學院的 Miguel Hernan 與 Jamie Robins 教授合作完成的因果推斷領域的新書 Causal Inference: What If,更是詳細全面地闡述了因果推斷領域的基本概念與背後的理論基礎。
  • Causal Inference
    現實中遇到的很多問題實際上是因果問題,而不是預測。因果問題分為兩種:一種是 causal inference,比如給定兩個變量 X、Y,希望找到一個衡量它們之間因果關係的參數 theta;另一種是 causal discovery,即給定一組變量,找到他們之間的因果關係。對於後面這種 causal discovery,notes 裡面說它在統計上是不可能的。
  • 哈佛大學Hernan教授《因果推斷:What If》新書,311頁講解因果效應(附下載)
    harvard.edu/miguel-hernan/causal-inference-book/在本書中,我們強調需要足夠認真對待因果問題,才能明確表述它,我們還區別了數據和因果推斷假設的不同作用。一旦建立了這些基礎,因果推斷就必然變得不那麼隨意,這有助於防止混淆。
  • The 2019 International Causal Inference Conference
    Time: May 11 - 12, 2019Venue: Lecture Hall, Jiayibing Building, Jingchunyuan 82, BICMRDescription:The goal of causal
  • 周日直播:因果助力CV、NLP和認知神經科學 | 因果科學與Causal AI...
    文章通過對這種現象進行了因果建模,並將後門調整巧妙運用到了NLP中,從而使得法院觀點生成模型能夠消除數據生成帶來的混淆偏差。在這篇論文綜述中,作者回顧了知神經科學背景下的因果關係概念,並回顧了從數據中推斷因果關係的現有方法。因果推理是一項頗有野心又異常艱巨的任務,在認知神經科學中尤其具有挑戰性。在文章中,作者從各個方面詳細討論當前兩個主要困難:幹預數據的稀缺性和尋找正確變量的挑戰,主張將分布魯棒性作為解決這些問題的指導原則。
  • 哈佛教授新書《因果推理》開放下載!311頁暢享閱讀
    本書介紹的標題——「走向不那麼隨意的因果推理」反映了本書作者的選擇:這本書幫助科學家生成和分析數據、做出明確的因果推斷,包括因果問題和數據分析的假設。不幸的是,科學文獻被研究所困擾,在這些研究中,很多因果問題往往沒有被明確說明,研究者無法證實的假設也沒有公布。這種對因果推理的隨意態度導致了科學研究中存在著大量的混亂之處。
  • 搞懂因果推斷中內生性問題解決方法必讀的書籍和文獻已搜集好!
    8.廣義合成控制法gsynth, Stata運行程序release,9.廣義合成控制法gsynth, 基於交互固定效應的因果推斷,10.再談合成控制法SCM, 幫你尋找因果推斷控制組,11.合成控制法什麼鬼? 因果推斷的前沿方法指南關於面板數據模型,1.面板數據方法免費課程, 文章, 數據和代碼全在這裡, 優秀學人好好收藏學習!
  • 『因果關係』英文研究熱點知識圖譜
    ,今天我們利用Web of Science核心合集資料庫,對『因果關係』英文研究成果進行分析,並繪製了研究熱點知識圖譜,以饗讀者。圖1所示:因果關係研究成果發文時間分布情況,由圖可以看出,因果關係研究方向的英文成果呈現出顯著的遞增趨勢,業已成為當前一個重要的研究熱點。
  • Stata講座:因果推斷中的雙重差分法開講
    主講嘉賓是中央財經大學社會發展學院王存同教授,講座題目為《因果推斷中的雙重差分法》。來自全國多所高校及科研機構的10596多名師生及研究者觀看了本場直播。本次講座王老師為大家帶來了因果推斷模型中的雙重差分法(DID)的介紹。因果推斷模型與方法是現代社會科學研究者利用計量模型發表高水平實證論文的核心利器,其中雙    重差分法(DID)佔有舉足輕重的地位。
  • 因果階梯與Do-演算:怎樣完美地證明吸菸致癌?
    導語通過手工推導,我們可以解決包含少量變量的因果推理問題,但對於現實中有幾十個或者上百個結點的因果圖,當前業界還需要一個可以自動化進行因果推理的演算應用框架。本文整理自中科院計算所在讀博士李奉治在集智-凱風研讀營的分享,介紹Judea Pearl的因果理論,以及Do-演算在因果推斷領域的應用前景。李奉治 | 作者鄧一雪 | 編輯1. 從吸菸致癌談起
  • 作為因果科學家的神經系統:因果編碼
    Johnson-Laird, Naive causality: A mental model theory of causal meaning and reasoning, Cognit. Sci. 25, 565 (2001). [9] W. J. Ma and M.
  • 貝葉斯MS-VAR的Granger因果關係和狀態推斷
    Matthieu Droumaguet,  Anders Warne and Tomasz WozniakGranger Causality and regime inference在向量自回歸(VAR)中,如果y方程中x的滯後係數聯合為零,則x不會導致y。其他參數時間序列模型也被用來研究基於一步預報的Granger因果關係,包括向量自回歸滑動平均(VARMA)、logistic平滑轉移向量自回歸(LST-VAR)和一些廣義自回歸條件異方差(GARCH)模型。
  • Nature子刊:反事實推斷幫模型識別罕見病,躋身專家水平
    機器學習的研究和努力依然沒有觸及問題的本質。正如圖靈獎獲得者、貝葉斯網絡之父 Judea Pearl 所言,機器學習不過是在擬合數據和概率分布曲線,而變量的內在因果關係並未得到足夠的重視。如果要真正解決科學問題,甚至開發真正意義上的智能機器,因果關係是必然要邁過的一道坎。
  • 2020年上海市統計學研究生暑期學校招生簡章
    申請者需點擊「閱讀原文」下載附件:2020年上海市統計學研究生暑期學校報名表.docx。填寫報名表相關內容並籤名後,識別下方二維碼上傳至問卷中。14:00-17:00因果推斷:混雜因素、替代指標、因果網絡耿直貝葉斯統計7月9日08:30-11:30Objective Bayesian Analysis孫東初14:00-17:00Bayesian Models for Complex Data Analysis
  • 跨媒體因果推斷
    跨媒體智能的主要基礎理論問題是借鑑生物的跨媒體信息表達和處理機理,實現智能感知和認知並做出決策。本論壇將從跨媒體智能的抽象歸納、演繹推理及因果推斷等方面,討論跨媒體大數據表徵與推理、分析因果計算的前沿理論和方法、探索跨媒體因果推斷的未來發展趨勢,並暢想未來的創新應用方向。
  • 「深度」AB測試中的因果推斷——隨機化分流
    本文作者詳細的介紹了在統計推斷中對A/B模型的應用。上一篇文章「「深度」A/B測試中的因果推斷——潛在結果模型」中我們介紹了用於A/B測試因果推斷的潛在結果模型,現在我們來看看在統計推斷中如何應用這個模型,對試驗的因果效果進行估計。
  • 因果發現:如何讓算法成為複雜系統中的「福爾摩斯」?
    何謂因果發現因果推斷中,通常假設因果圖是已知的,即我們知道變量之間可能存在怎樣的因果關係,只是需要通過自然實驗或觀察數據,來判斷因果關係是否成立。例如某人聲稱窮人吸菸多,而窮人患肺癌的比例更高,而這意味著「吸菸多的人患肺癌多」不能支持「吸菸引起肺癌」,這就是一個已知的因果鏈條。然而真實世界中,類似的因果鏈條,往往並不是先驗知識。尋找因果關係,傳統的方法是通過隨機對照實驗。但是這種實驗方式在實際問題中可能涉及到一些倫理問題,並且通常需要花費大量的人力和物力。
  • 『因果推斷』主要英文期刊推薦
    很多小夥伴在問,如何快速地獲取最新的『因果推斷』相關研究成果,小編的建議就是有針對性地選擇幾本經常刊發『因果推斷』理論、方法與應用的期刊,跟蹤期刊最新的文章
  • 論文中對數據進行統計學處理時需要注意的問題
    進行科研論文寫作,通常需要對取得的數據進行統計學處理。達晉編譯提醒大家,對此需要注意以下的問題。一、對基線資料進行統計學分析。搜集資料應嚴密遵守隨機抽樣設計,保證樣本從同質的總體中隨機抽取,除了對比因素外,其他可能影響結果的因素應儘可能齊同或基本接近,以保證組間的齊同可比性。因此,應對樣本的基線資料進行統計學分析,以證明組間的齊同可比性。二、選擇正確的統計檢驗方法。研究目的不同、設計方法不同、資料類型不同,選用的統計檢驗方法則不同。
  • 統計學的實質是什麼?--寫給所有將要或者正在學習統計學的朋友們
    ,通過搜索、整理、分析、描述數據等手段,以達到推斷所測對象的本質,甚至預測對象未來的一門綜合性科學。統計概率論確實是數學的一部分,統計學也非常倚重於概率學。但是,統計學並非概率學。一方面,概率論只是基於總體層面進行理論推到和運算,是數學演算和分析,並不涉及樣本及基於樣本推斷總體的邏輯思維。另外一方面,現代統計學誕生的時間比概率論理論早了半個世紀。概率論還在發展萌芽中時,現代統計學就藉助其基本樸素的思想----發生可能性發展了現代統計學的統計推斷思想。