科普書4本
1《為什麼》 :對於很多人,了解因果推斷,都是來自於這本書。書中提出的因果階梯,以及圖模型,指出了我們只有在假設了因果模型之後才收集數據,在我們陳述了我們希望回答的科學問題之後,收集並評估數據才是有意義的。
年度必讀書-《為什麼:關於因果關係的新科學》
2 《結果與原因的經濟學》:相對《為什麼》更加簡明易懂,通過生活中必不可少的教育和醫療相關的例子,說明搞清楚因果關係的重要性,之後指出了因果推斷必需的三步:
1,搞清楚原因,結果分別是什麼?
2,質疑是不是巧合,是否存在混雜因素或逆向因果關係?
3,通過調整形成「可比較」的組,用最貼切的值替換反事實的結果。
書中介紹了包括斷點和匹配等幾種分析方法,指出因果推斷是每個人都可以掌握的,大數據時代的必要技能。
好書推薦-《結果與原因的經濟學》極簡因果推斷教程
3 《別拿相關當因果》:閱讀難度介於前兩本之間,但內容更加全面。書中詳述了觀察法,實驗法,計算法三種評估因果關係的方法,討論了因果分析中的解釋及評價指標,包括 強度,特異性,一致性,時間間隔,劑量,可信度與連貫性與可類比性。書中指出,因果關係的解釋分為實體層面和統計層面。前者是關於某個具體事件的因果關係,而後者是可以用來預測未來事件的知識,或者是可以用來在普遍意義上(比如針對整個人口群體的政策)改變事件發展進程的知識。
寫給普通人的因果邏輯入門書-《別拿相關當因果!》
4 《如何創造可信的AI》:作者Gary Marcus是NYU的認知心理學教授,是一位光率很高的一位AI懷疑論者。書中指出:因果聯繫的判定對我們認識和理解世界有奠基作用,如果想創造可信的,魯棒的AI,必須要深入研究因果推斷,並將因果關係放在下一代AI系統的基石位置上。
關注「AI鴻溝」-讀《如何創造可信的AI》
英文版:
1 哲學相關
Causation:A very short introduction
牛津系列書,自亞里斯多德和休謨談起,對比他們論述的因果有何不足。從形上學和認知論的角度,討論因果關系所蘊涵的哲學問題。短小精悍,不需要任何技術背景
Causality
全面的討論因果相關的哲學理論,以及由此生出的科學探索。書中對因果關係的哲學解釋,分為了兩類,每類三種,第一類是產生差異,分別對應反事實,幹預和概率因果;後一類是基於過程的,分別是因果機制,從原因到結果的流程,以及信息傳遞。書中還提到多元因果。書中對於每個話題,講解都淺白易懂,同時列出了詳盡的閱讀清單,供感興趣的讀者進一步學習。
Actual Causality
書中針對因果推斷中,存在的由於所指稱的對象是群體還是個體,由此引出的概率上的不確定性,定義了」事實上的因果關係「這一概念,並指出這一概念對於司法,醫療等領域應用因果關係,更為適合。作為一本哲學家寫的書,書中不止有文字論述,還包含量化的公式,是一本較為難懂的書。
3 教科書-適合想系統化學習的讀者
Causality: Model, Reasoning, and Inference by Pearl(2009)
Peral 的經典教科書,對於因果推斷的圖建模及其背後的統計知識,進行了詳盡的介紹。
The handbook of graphical models(2018)
因果推斷讀書會中的很多內容,來自於對這本書部分章節的講述。書中對圖模型,從計算機科學,經濟學,電子工程等多個領域,進行了介紹。
下載:https://www.google.com/url?q=https%3A%2F%2Fstat.ethz.ch%2F~maathuis%2Fpapers%2FHandbook.pdf&sa=D&sntz=1&usg=AFQjCNFlo1KJ87pzROuKiB4KXojfpcEL1A
Elements-of-Causal-Inference-Foundations-and-Learning-Algorithms
在上述三本因果推斷的教科書中,相對來說,最簡單易懂的一本。書中介紹了因果推斷在機器學習中的應用,以及使用機器學習的方法,來判定因果關係。該書出版社提供免費下載版,同時有配套的notebook代碼,可以迅速上手。
http://web.math.ku.dk/~peters/elements.html
DoWhy 是微軟推出的針對因果推斷的python包,功能全面,且上手相對容易的工具。下面的連結包含了對該python包的詳細介紹,以及使用案例。
https://github.com/microsoft/dowhy
4 經濟相關
Mastering Metrics: The Path from Cause to Effect
在經濟學和金融學中,應用因果推斷。對於學習如何使用因果推斷,解決實際問題,給出了具體案例和應用指南,即使和經濟學相關的讀者入門,也適合想要將因果推斷應用到經濟問題中的跨學科研究者。
5 醫療相關
Epidemiology by design
流行病學中,往往存在將相關錯當成因果的例子。這本書講述了如何講因果推斷,例如潛在結果,反事實推斷等方法,應用到健康領域,內容包括如何設計實驗,分析數據。
更多閱讀
從信息傳遞的視角看因果關係
因果推斷讓大數據更有溫度
因果學習的三個層次