因果推斷簡介之五:因果圖 (Causal Diagram)

2021-02-20 學術苑

本文素材由小編整理髮布。所發內容僅供學習、交流之目的。版權歸原作者所有,如對版權有異議,請後臺聯繫,議定合作或刪除。點擊文末閱讀原文查看原網頁。

推文編輯:林毅

關於作者

丁鵬

2004-2011 年在北京大學概率統計系學習,獲得學士和碩士學位;2011-2015 年在哈佛大學統計系學習,獲得博士學位;2015 年在哈佛大學流行病學系做博士後;2016 年加入伯克利統計系任教。研究方向是因果推斷。

這部分介紹 Judea Pearl 於 1995 年發表在 Biometrika 上的工作 「Causal diagrams for empirical research」,這篇文章是 Biometrika 創刊一百多年來少有的討論文章,Sir David Cox,Guido Imbens, Donald Rubin 和 James Robins 等人都對文章作了討論。由於 Judea Pearl 最近剛獲得了圖靈獎,我想他的工作會引起更多的關注(事實上計算機界早就已經過度的關注了)。

一 有向無環圖和 do 算子

為了避免過多圖論的術語,這裡僅僅需要知道有向圖中 「父親」 和「後代」的概念:有向箭頭上遊的變量是 「父親」,下遊的變量是「後代」。在一個有向無環圖(Directed Acyclic Graph;DAG)中,記所有的節點集合為=(X1,…,Xp)。這裡用 P(⋅) 表示連續變量的密度函數和離散變量的概率函數。有兩種觀點看待一個 DAG:一是將其看成表示條件獨立性的模型;二是將其看成一個數據生成機制。當然,本質上這兩種觀點是一樣的。在第一種觀點下,給定 DAG 中某個節點的「父親」 節點,它與其所有的非 「後代」 都獨立。根據全概公式和條件獨立性,DAG 中變量的聯合分布可以有如下的遞歸分解:

例子:在 Figure 1 中,聯合分布可以分解成為

P(X1,X2,X3,X4,X5,X6,Xi,Xj)=

P(X1(X2)P(X3∣X1)⋅P(X5∣X2)P(X4∣X1,X2)P(Xi∣X3,X4)⋅P(X6∣Xi)P(Xj∣X4,X5,X6).

如果將 DAG 看成一個數據生成機制,那麼它和下面的非參數結構方程模型是等價的:

注意,這個聯立方程組是 「三角的」(triangular)或者「遞歸的」(recursive),因為 DAG 中沒有環,方程組中也就沒有反饋。計量經濟學中的聯立方程組模型 (simultaneous equation model: SEM),並不在這個討論的框架下。DAG 用於描述數據的生成機制,而不常用於描述系統均衡時的狀態;後者主要是 SEM 的目的。這樣描述變量聯合分布或者數據生成機制的模型,被稱為「圖模型」 或者「貝葉斯網絡」(Bayesian network)。

顯然,一個有向無環圖唯一地決定了一個聯合分布;反過來,一個聯合分布不能唯一地決定有向無環圖。反過來的結論不成立,對我們的實踐有很重要的意義,比如 Figure 2 中的兩個有向無環圖,原因和結果不同,圖的結構也不同;但是,我們觀測到的聯合分布P(X1,X2)可以有兩種分解 P(X1)P(X2∣X1)和 P(X2)P(X1∣X2)。因此,我們從觀測變量的聯合分布,很難確定 「原因」 和「結果」。在下一節圖模型結構的學習中,我們會看到,只有在一些假定和特殊情形下,我們可以從觀測數據確定 「原因」 和「結果」。

用一個 DAG 連表示變量之間的關係,並不是最近才有的。圖模型也並不是 Judea Pearl 發明的。但是,早期將圖模型作為因果推斷的工具,成果並不深刻,大家也不太清楚僅僅憑一個圖,怎麼能講清楚因果關係。教育、心理和社會學中常用的結構方程模型(structural equation model: SEM),就是早期的嘗試;甚至可以說 SEM 是因果圖的先驅。(注意,這裡出現的兩個 SEM 表示不同的模型!)

在 Figure 2 (1) 中,有 P(X2=x2∣X1=x1) = P(X2=x2∣do(X1)=x1)。由於 X1是 X2的 「原因」,「條件」 和「幹預」X1,對應的 X2的分布相同。但是在 Figure 2 (2) 中,有 P(X2=x2∣X1=x1) ≠ P(X2=x2∣do(X1) = x1)=P(X2=x2)。由於 X1是 X2的 「結果」,「條件」(或者「給定」)「結果」,「原因」 的分布不再等於他的邊緣分布,但是人為的 「幹預」「結果」X1,並不影響「原因」X2 的分布。

根據 do 算子,便可以定義因果作用。比如二值的變量 $Z$ 對於 $Y$ 的平均因果作用定義為

ACE(Z→Y)=E{Y∣do(Z)=1}–E{Y∣do(Z)=0}

上面 do 算子下的期望,分別對應 do 算子下的分布。這樣在 do 算子下定義的因果模型,被已故計量經濟學家 Halbert White 稱為 Pearl Causal Model (PCM; White and Chalak 2009)。Pearl 在其書中寫到:

「I must take the opportunity to acknowledge four colleagues who saw clarity shining through the do(x) operator before it gained popularity: Steffen Lauritzen, David Freedman, James Robins and Philip David. Phil showed special courage in pringting my paper in Biometrika, the journal founded by causality’s worst adversary – Karl Pearson.」 (Pearl, 2000)

在上面的敘述中,如果整個 DAG 的結構已知且所有的變量都可觀測,那麼我們可以根據上面 do 算子的公式算出任意變量之間的因果作用。但是,在絕大多數的實際問題中,我們既不知道整個 DAG 的結構,也不能將所有的變量觀測到。因此,僅僅有上面的公式是不夠的。

下面,我將介紹 Judea Pearl 提出的 「後門準則」(backdoor criterion)和「前門準則」(frontdoor criterion)。這兩個準則的意義在於:(1)某些研究中,即使 DAG 中的某些變量不可觀測,我們依然可以從觀測數據中估計出某些因果作用;(2)這兩個準則有助於我們鑑別「混雜變量」 和設計觀察性研究。

下面的討論中,「可識別性」 這個概念將被頻繁的使用。因果推斷中的識別性,和傳統統計中的識別性定義是一致的。統計中,如果兩個不同的模型參數,對應不同的觀測數據的分布,那麼我們稱模型的參數可以識別。這裡,如果因果作用可以用觀測數據的分布唯一的表示,那麼我們稱因果作用是可以識別的。

前門準則和後門準則,都涉及了 d 分離(d-seperation)的概念。

定義(d 分離): 設 X,Y,Z 是 DAG 中不相交的節點集合,π 為一條連接 X 中某節點到 Y 中某節點的路徑 (不管方向)。如果路徑 π 上某節點滿足如下的條件:

1.在路徑 π上,w 點處為 V 結構 (或稱衝撞點,collider),且 w 及其後代不在 Z 中;

2.在路徑 π 上,w 點處不是 V 結構,且 w 在 Z 中,

那麼稱 Z 阻斷 (block) 了路徑 π。進一步,如果 Z 阻斷了 X 到 Y 的所有路徑,那麼稱 Z d 分離 X 和 Y,記為 (X⊥Y|Z)G。

下面介紹 Pearl (1995) 的主要工作:後門準則和前門準則。

從上面可以看出,上面的後門準則和可忽略性假定下 ACE 的識別公式一樣:都是用 ZZ 做調整 (adjustment),先分層再加權求和。這條結論在 Rosenbaum and Rubin (1983) 之後提出,且流行病學家也都用這樣的調整方法控制混雜因素,因此對很多統計學家和流行病學家來說並不新奇。比較新穎的結論是下面的前門準則。

前門準則:在 DAG 中,稱節點的集合 Z 相對於有序對 (X,Y) 滿足前門準則,如果

1.Z 切斷了所有 X 到 Y 的直接路徑;

2.X 到 Z 沒有後門路徑;

3.所有 Z 到 Y 的後門路徑都被 X 阻斷。

此時,如果 P(x,z)>0,則 X 到 Y 的因果作用可識別,為

證明:Figure 3 (b) 中蘊含了條件獨立性,將在推導中用到:Z⊥U|X,Y⊥X|(Z,U)。

這個前門路徑看似很難理解,證明似乎很不直觀,恰似變魔術。但是它其實是很顯然的,在前門路徑的 DAG 中,我們有:(1)X 對 Z 的因果作用可識別,因為 Y 阻斷了它們之間的後門路徑;(2)Z 對 Y 的因果作用可識別,因為 X 阻斷了他們的後門路徑;(3)X 對 Y 的作用,僅僅通過 Z 而產生。這三點蘊含著 X 對 Y 的因果作用可識別—這樣看來,這個結論就不奇怪了!

Pearl 在書中講了一個非常有趣的例子,來說明前門準則的用處。

例子:我們關心吸菸 X和肺癌 Y之間的因果關係。由於一個潛在的不可觀測的基因 U 的存在,吸菸和肺癌之間有一條 「活」 的後門路徑,因此不藉助其他的條件,我們無法識別吸菸與肺癌的因果關係。如果我們有這樣的知識 「吸菸 X 僅僅通過肺部煙焦油的含量 Z 來影響肺癌 Y 」,那麼吸菸對肺癌的因果作用就可以估計出來了。不過,這裡需要兩個條件,也就是在證明中使用的兩個條件獨立性,他們表明:(1)吸菸 X  和肺部煙焦油的含量 Z  之間沒有「活」 的後門路徑(或者沒有混雜因素);(2)吸菸 X 對肺癌 Y 的作用僅僅來源於吸菸 X 對肺部煙焦油 Z 的作用,或者說,吸菸 X 對肺癌 Y 沒有「直接作用」。

例子:在 Figure 1 的 DAG 中,(Xi,Xj) 之間的後門路徑被 {X3,X4} 或者 {X4,X5} 阻斷,而前門路徑被 X6 阻斷。上面的兩個準則表明,要識別從 Xi到 Xj 的因果作用,我們不需要觀測到所有的變量,只需要觀測到切斷後門路徑或者前門路徑的變量即可

三 回到 Yule-Simpson’s Paradox

在第一節中,我們看到了經典的 Yule-Simpson’s Paradox。記 T 為處理(吃藥與否);Y 為結果(存活與否), X 是用於分層的變量(在最開始的例子中, X 是性別;在這裡我們先將 X 簡單地看成某個用於分層的變量)。悖論存在,是因為 T 和 Y 正相關;但是按照 X 的值分層後, T 和 Y 負相關。分,還是不分?—–這是一個問題!這在實際應用是非常重要的問題。

不過,僅僅從 「相關」(association)的角度討論這個問題,是沒有答案的。從 「因果」 (causation)的角度來看,才能有確切的回答。解釋 Yule-Simpson’s Paradox,算是因果圖的第一個重要應用。

下面,我將以上面的 Figure 4 中的四個圖為例說明,三個變量之間的關係的複雜性。

圖(a):根據後門準則, X 阻斷了 T 到 Y 的後門路徑,因此,根據 X 做調整可以得到 T 對 Y 的因果作用。如果實際問題符合圖(a),那麼我們需要用調整後的估計量。

圖(b):X 是 T 的 「後代」 且是 Y 的「父親」。很多地方稱,此時 X 處於 T 到 Y 的因果路徑上。直觀的看,如果忽略 X,那麼 T 和 Y 之間的相關性就是  T 對  Y 的因果作用,因為 T 和 Y 之間的後門路徑被空集阻斷,我們無須調整。如果此時我們用 X 進行調整,那麼得到的是 T 到 Y 的「直接作用」。不過,什麼是「直接作用」,我們將會在後面討論;這裡只是給一個形象的名字。

圖(c):和圖(b)相同, T 和 Y 之間的相關性就是因果作用。但是,複雜性在於 X 和 Y 之間有一個共同的但是不可觀測的原因 U。此時,不調整的相關性,是一個因果關係的度量。但是,如果我們用 X 進行調整,那麼給定 X 後,T 和 U 相關,T 和 Y 之間的後門路徑被打通,我們得到的估計量不再具有因果的含義。這種現象發生的原因是,(T,U,X) 之間形成了一個 V 結構:雖然 T 和 U 之間是獨立的,但是給定 X 之後,T 和 U 不再獨立。

圖(d):這個圖常常被 Judea Pearl 用來批評 Donald Rubin,因為它存在一個有趣的 M 結構。在這個圖中,由於 V 結構的存在,T 和 Y 之間的後門路徑被空集阻斷,因此 T 和 Y 之間的相關性就是因果性。但是由於 M 結構的存在,當我們用 X 進行調整的時候, U 和 W 之間打開了一條 「通路」(它們不再獨立),因此 T 和 Y 之間的後門路徑被打通,此時 T 和 Y 之間的相關性不再具有因果的含義。

我個人認為,因果圖是揭開 Yule-Simpson’s Paradox 神秘面紗的有力工具。正如 Judea Pearl 在他的書中寫到,不用因果的語言來描述這個問題,我們是講不清楚這個悖論的。當然,因果的語言不止因果圖,Judea Pearl 的解釋始終不能得到 Donald Rubin 的認可。

四 討論

用一個圖來描述變量之間的因果關係,是很自然和直觀的事情。但是,這並不意味著 Pearl 的理論是老嫗能解的。事實上,這套基於 DAG 的因果推斷的語言,比傳統的 Neyman-Rubin 模型要晦澀很多。DAG 在描述因果關係的時候,常常基於很多暗含的假定而並不明說,這也是 DAG 並沒有被大家完全接受的原因。傳統的因果推斷的語言,開始於 Jerzy Neyman 的博士論文;Donald Rubin 發展這套 「潛在結果」 的語言,並將它和缺失數據的理論聯繫在一起,成為統計界更多使用的語言。

在實際中,人們對於圖模型的批評從未中斷。主要的問題集中在如下的方面:

1.現實的問題,是否能用一個有向無環圖表示?大多數生物學家看到 DAG 的反應是 「能不能用圖表示反饋?」 的確,DAG 作為一種簡化的模型,在複雜系統中可能不完全適用。要想將 DAG 推廣到動態的系統,或者時間序列中,還有待研究。

2.Pearl 引入的 do 算子,是他在因果推斷領域最主要的貢獻。所謂 「do」,就是 「幹預」,Pearl 認為幹預就是從系統之外人為的控制某些變量。但是,這依賴於一個假定:幹預某些變量並不會引起 DAG 中其他結構的變化。這個假定常常會受到質疑,但是質疑歸質疑,Pearl 的這個假定雖然看似很強,但根據觀測數據卻不可檢驗。這種質疑並不是 Pearl 的理論獨有的缺陷,這事實上是一切研究的缺陷。比如,我們用完全隨機化試驗來研究處理的作用,我們要想將實驗推廣到觀察性的數據或者更大的人群中去,也必須用到一些不可驗證的假定。

3.很多人看了 Pearl 的理論後就嘲笑他:難道我們可以在 DAG 中幹預 「性別」?確實,離開了實際的背景,幹預性別似乎是不太合理的。那這個時候,根據 Pearl 的 do 算子得到的因果作用意味著什麼呢?可以從幾個方面回答這個問題。

· 很多問題,我們不能談論 「幹預性別」,也不能談論「性別」 的「因果作用」。「性別」的特性是「協變量」(covariate),對於這類變量(如身高、膚色等),談論因果作用不合適,因為我們不能想像出一個可能的「實驗」,幹預這些變量。

· 上面的回答基於 「實驗學派」(experimentalists』)的觀點,認為不可幹預,就沒有「因果」。但是,如果認為只要有數據的生成機制,就有因果關係,那麼算出性別的因果作用也不奇怪。(計量經就學一直有爭議,以 Joshua Angrist、Guido Imbens 等為首的「實驗派」,和以 James Heckman 為首的「結構方程模型」 派,有過很激烈的討論。)

· 有些問題中性別的因果作用是良好定義的。比如,我們可以人工的修改應聘者簡歷上的名字(隨機的使用男性和女性名字),便可以研究性別對於求職的影響,是否存在性別歧視等等(已有研究使用過這種實驗設計)。

一個更為嚴重的問題是,實際工作中,我們很難得到一個完整的 DAG,用於闡述變量之間的因果關係或者數據生成機制,使得 DAG 的應用受到的巨大的阻礙。不過,從觀測數據學習 DAG 的結構,確實是一個很有趣且重要的問題,這留待下回分解。

在結束時,留些一些思考的問題:

在何種意義下,後門準則的條件,等價於可忽略性,即 X⊥Y(x)|Z?

在第一節的 Yule-Simpson’s Paradox 中,我們最終選擇調整的估計量,還是不調整的估計量?

學術苑是以「互助問答」為特色的學術研究公共品提供平臺,匯聚國際國內頂尖經管學術大咖、聚焦於實證論文寫作與發表,另有文獻薦讀、一周一薦和相關學術培訓等輔助板塊,致力於為訂閱者提供更為全面的服務。

平臺現擬推出全新模塊,該模塊旨在徵集經典外文實證文章的原創翻譯,誠摯邀請您為平臺賜稿,與我們一同提升學術服務能力,提高平臺公眾號推文質量。稿件主題主要為與實證研究相關的計量方法和應用,其他相關經濟學主題的原創翻譯稿件也十分歡迎。

相關焦點

  • 因果推斷簡介之二:Rubin Causal Model (RCM) 和隨機化試驗
    研究方向是因果推斷。關鍵詞:Donald Rubin; RCM; 可識別性; 因果推斷; 因果識別; 平均因果作用; 隨機化試驗因果推斷用的最多的模型是 Rubin Causal Model (RCM; Rubin 1978) 和 Causal Diagram (Pearl 1995)。
  • 因果推斷簡介之四:因果推斷簡介之四:觀察性研究,可忽略性和傾向得分
    正如 Jerzy Neyman 本人所說 「without randomization an experiment has little value irrespective of the subsequent treatment(沒有隨機化的試驗價值很小)」,人們對於觀察性研究中的因果推斷總是抱著強烈的懷疑態度。我們經常聽到這樣的聲音:統計就不是用來研究因果關係的!
  • 因果科學與 Causal AI 系列讀書會 | 眾包出書
    簡介:Judea Pearl 的學生 Elias Eareinboim 親自介紹了 Pearl 的因果之梯Schölkopf, Bernhard. "Causality for machine learning." arXiv preprint arXiv:1911.10500 (2019).
  • 賽爾原創 因果關係分析方法簡介
    這種方法是在觀測數據中試圖尋找能像隨機實驗方法一樣滿足因果推斷條件的情形來進行觀測數據上的因果推斷(Shadish et al., 2002; Campbell and Stanley, 2015; Thyer, 2012)。第三類方法是聯合模型方法,大致上又分為圖模型方法和虛擬事實模型方法。這種方法在一些假設的前提下自動對聯合概率分布進行估計來從非實驗數據或者觀測數據中推斷因果。
  • ※洞觀社科※專欄32|Daniel Little:社會科學中的因果解釋
    社會科學主要通過識別因果關係、構建因果解釋追尋我們的目標。 本次引介Daniel Little為社會科學哲學和方法論研究貢獻的一篇重要文獻,文章重點介紹了因果解釋的形上學基礎、解釋類型、解釋方法以及與社會理論之間的關係。 本文來源於Little, D. . (1996).
  • ...因果助力CV、NLP和認知神經科學 | 因果科學與Causal AI讀書會
    文章通過對這種現象進行了因果建模,並將後門調整巧妙運用到了NLP中,從而使得法院觀點生成模型能夠消除數據生成帶來的混淆偏差。在這篇論文綜述中,作者回顧了知神經科學背景下的因果關係概念,並回顧了從數據中推斷因果關係的現有方法。因果推理是一項頗有野心又異常艱巨的任務,在認知神經科學中尤其具有挑戰性。在文章中,作者從各個方面詳細討論當前兩個主要困難:幹預數據的稀缺性和尋找正確變量的挑戰,主張將分布魯棒性作為解決這些問題的指導原則。
  • Causal Inference
    因果問題分為兩種:一種是 causal inference,比如給定兩個變量 X、Y,希望找到一個衡量它們之間因果關係的參數 theta;另一種是 causal discovery,即給定一組變量,找到他們之間的因果關係。對於後面這種 causal discovery,notes 裡面說它在統計上是不可能的。
  • 活動報名 | 因果科學與Casual AI讀書會
    因果革命和以數據為中心的第一次數據科學革命,也就是大數據革命(涉及機器學習,深度學習及其應用,例如Alpha-Go、語音識別、機器翻譯、自動駕駛等等 )的不同之處在於,它以科學為中心,涉及從數據到政策、可解釋性、機制的泛化,再到一些社會科學中的歸因和公平性問題,甚至哲學中的創造性和自由意志 。可以說, 因果革命徹底改變了科學家處理因果問題的方式,形成了一門新學科—因果科學。
  • AI研習丨專題:因果推斷與因果性學習研究進展
    以圖1為例,吸菸、黃牙都與肺癌具有較強的相關關係,然而只有吸菸才是肺癌的原因,也只有戒菸才能降低肺癌的發病概率,而把牙齒洗白則不能降低肺癌的發病概率。探索和推斷事物間的因果關係,是數據科學中的一個核心問題,正受到國內外同行的廣泛關注。現有因果關係的研究集中在因果推斷及因果性學習兩個方面。因果推斷的目標是發現變量/事物背後的因果關係。隨機控制實驗是發現因果關係的傳統方法。
  • 『因果關係』英文研究熱點知識圖譜
    圖1所示:因果關係研究成果發文時間分布情況,由圖可以看出,因果關係研究方向的英文成果呈現出顯著的遞增趨勢,業已成為當前一個重要的研究熱點。圖1 發文量年份分布表1所示:因果關係英文研究成果前20位高頻關鍵詞分布,可以看出因果推斷、因果關係分別以516、451次出現次數位列第一和第二位
  • 北大經院工作坊第181場 | 潛在非線性因子模型下的因果推斷(計量...
    北大經院工作坊第181場 | 潛在非線性因子模型下的因果推斷(計量、金融和大數據分析工作坊) 2020-12-07 22:22 來源:澎湃新聞·澎湃號·政務
  • 《因果科學周刊》第4期:因果賦能推薦系統
    本期作者:侯茹 閆和東 陳晗曦 龔鶴揚 陳天豪 楊二茶 因果科學社區簡介:它是由集智俱樂部、智源社區共同推動,面向因果科學領域的垂直型學術討論社區,目的是促進因果科學專業人士和興趣愛好者們的交流和合作,推進因果科學學術、產業生態的建設和落地,孕育新一代因果科學領域的學術專家和產業創新者。
  • 為機器學習插上因果推理的翅膀:這是一本系統的因果推理開源書
    機器之心整理參與:曉坤、思源因果推理一直被視為深度學習中缺失的部分,除了「執果索因」的貝葉斯定理,我們很少有方法能對因果關係進行建模。他們表示目前因果推理相關的材料大部分都分散在多個學科的期刊上,或者存在各種技術文章中。他們希望這本書能幫助各種對因果推斷感興趣的讀者,不論是流行病學家、統計學家、社會科學學家還是計算機科學家。這本書主要分為三部分,它們的難度依次遞增:不帶模型的因果推理、帶模型的因果推理、複雜長跨度數據的因果推理。
  • 周曉華:因果推斷的數學基礎和在醫學中的應用
    這些都是因果推斷的問題。事實上,僅僅依靠數據,我們是無法回答上述問題的。很多時候,數據生成機制對觀測者是未知的,因此我們只能觀察到相關性。因果性在相關性的基礎上更進一步:相關性可以由觀察到的變量聯合分布來描述,而對於因果性的分析需要知道數據的生成機制,或者條件改變時變量分布的變化。如何用數學語言來描述進行因果分析呢?
  • 耿直:統計學中的因果推斷問題(Causal Inference)
    Statistics and causal inference. J. Am. Statist. Ass. , 1986, 81:945-970.[2] Pearl J. Causality: Models, Reasoning, and Inference. 2nd ed. Cambridge: Cambridge University Press, 2009.
  • Bengio講授因果表示學習,Mila博士因果推理導論開課了
    機器之心報導編輯:陳萍因果推理導論在線課程開課了,對於熱衷因果推理的小夥伴,你準備好了嗎?>課程主頁:https://www.bradyneal.com/causal-inference-course此外,該課程整合了來自許多不同領域的見解,如流行病學、經濟學、政治學和機器學習等,這些領域都利用到了因果推理。在學習這門課程之前,需要注意一點:雖然這門課程是從機器學習的角度編寫的,但該課程是為那些對學習因果關係感興趣的人準備的,在課程設置上假設學生在本科階段上過概率論課程或有同等經驗。
  • Stata講座:因果推斷中的雙重差分法開講
    本次講座王老師為大家帶來了因果推斷模型中的雙重差分法(DID)的介紹。因果推斷模型與方法是現代社會科學研究者利用計量模型發表高水平實證論文的核心利器,其中雙    重差分法(DID)佔有舉足輕重的地位。
  • 問卷數據的因果關係推斷 —工具變量模型在SPSS, R及Mplus中的實現
    al., 2010);這篇文章中作者比較全面的解釋了什麼是因果推斷,以及如何進行正確的因果推理:1.1 什麼是因果因果推斷必須滿足三個條件:即因在前果在後,X與Y存在相關,XY的關係不能被其它因變量解釋。
  • 因果推斷書單-4本中文科普書 8本英文書
    書中提出的因果階梯,以及圖模型,指出了我們只有在假設了因果模型之後才收集數據,在我們陳述了我們希望回答的科學問題之後,收集並評估數據才是有意義的。書中介紹了包括斷點和匹配等幾種分析方法,指出因果推斷是每個人都可以掌握的,大數據時代的必要技能。好書推薦-《結果與原因的經濟學》極簡因果推斷教程3 《別拿相關當因果》:閱讀難度介於前兩本之間,但內容更加全面。
  • 因果科學入門讀什麼書?Y. Bengio博士候選人的研讀路徑推薦
    雖然「因果推斷」一詞在其他書籍中可能並未包括因果發現,但在本書中不僅包含了因果發現,而且還佔了很大的比重,與此同時它仍然為能夠提供關於結構因果模型(SCM)的良好基礎。>Brady Neal:這本書可能是很多人了解因果推斷的的第一本書,也是認為是最好的一本。