因果推理「三問」:是什麼?為什麼需要?如何使用?|內生性|因果關係|...

2021-01-09 網易

  譯者:AI研習社(聽風1996)

  作為一名經濟學博士,我致力於尋找某些變量之間的因果關係,用來完成我的論文。因果關係強大到可以讓人們有足夠的信心去做決策、防止損失、求解最優解等。在本文中,我將討論什麼是因果關係,為什麼需要發現因果關係,以及進行因果推理的常用技巧。

  1. 什麼是因果關係?

  因果關係描述的是兩個變量之間的關係,即一個變量如何誘發另一個變量的發生。它比相關關係要強得多,因為相關關係只是描述兩個變量之間的共同運動模式。通過繪製散點圖,可以很容易地觀察到兩個連續變量的相關性。對於分類變量,我們可以繪製柱狀圖來觀察其關係。要知道兩個連續變量之間的確切相關性,我們可以使用皮爾遜相關公式。皮爾遜(Pearson)的相關性介於-1和1之間,絕對值越大表示相關性越強。正相關意味著兩個變量在同一方向共同運動,反之亦然。

  但對於因果關係,要把握的關係就要複雜得多。為了知道變量A是否引起了變量B的發生,即幹預A是否引起了結果B,我們需要保持所有其他變量不變,以隔離和量化幹預的效果。我們需要控制的其他變量稱為混雜變量,即與幹預和結果都相關的變量:

  

  有關混淆變量的例子

  在上圖中,我舉了一個混淆變量,其中年齡與戒菸率和致死率都是正相關的。年齡越大,死亡率越高,但吸菸率越低。如果我們在估計吸菸對死亡率的影響時沒有控制年齡,我們可能會觀察到吸菸會減少死亡率這樣荒謬結果。我們不能在這裡得出因果關係,因為我們沒有控制所有混雜變量。關於這個例子的更多細節,你可以閱讀我討論 "辛普森悖論 "的文章:

  所謂的「辛普森悖論」

  在得出因果效應的結論時,我們需要記住的另一個因素是選擇偏差。為了隔離治療效果,我們需要確保治療組單位是在人群中隨機選擇的。這樣,我們在治療後觀察到的差異不是因為其他因素,而是因為治療。舉個例子,當一家超市想估計提供優惠券對提高整體銷售額的影響時。如果超市只把優惠券傳遞給在店裡購物的顧客(幹預組),發現他們比沒有收到優惠券的顧客(對照組)購買了更多的商品,那麼市場由於選擇偏差而無法在此處得出因果關係。沒有將顧客隨機選擇到治療組中。他們之所以在這裡,是因為他們在超市購物,這表明與對照組相比,即使沒有優惠券,他們也更可能從超市購買商品。比較來自治療組和對照組的結果變量在這裡將毫無意義。

  為什麼要估計因果關係?

  得到因果關係是如此複雜的,何必還要呢?我們為什麼不直接使用相關性呢?我們知道相關性在進行預測時是有用的。如果我們知道變量A與變量B有很強的相關性,那麼知道變量A的值就可以幫助我們預測變量B的值。在業務環境中,我們可以利用相關性來預測給哪些客戶群體做促銷,這樣我們就可以根據客戶過去的行為和其他客戶特徵來提高轉化率。但是,即使是最準確的預測模型,也不能得出結論,當你觀察到客戶轉化率提高了,就是因為促銷。我們需要設計實驗或進行準實驗研究,才能得出因果關係並量化幹預效果。在這個例子中,因果推理可以告訴你,提供促銷活動是否增加了客戶轉化率,以及增加了多少。因此,與相關性相比,因果關係能給決策者更多的指導和信心。

  如何進行因果推斷?1、不同的幹預效應

  估計因果效應與估計你的利益結果變量的幹預效應是一樣的。根據具體的研究或業務問題,可以選擇不同的治療效果進行估計。假設Y是結果變量,其中Y?是沒有幹預的結果,Y¹是有幹預的結果。T為虛擬變量,表示單位i是在幹預組(T=1)還是對照組(T=0):

  

  平均而言,幹預組和對照組之間的結果變量有何不同?

  平均幹預效應

  

  平均而言,幹預組中的單位在接受和不接受幹預的情況下,結果變量的差異是什麼?

  平均幹預效果

  在這裡,E(Y¹|T=1)是幹預組單位的預期結果,它是可觀察的。然而,E(Y?|T=1)是不可觀察的,因為它是假設的。一個單位只能有Y?和Y¹這兩種結果中的一種,這取決於這個單位所在的組別。如果這個單位已經接受了幹預,我們可以觀察Y¹,並使用不同的技術來估計Y?這個反事實變量。我將在後面討論不同的技術。

  

  條件平均幹預效果

  條件平均幹預效果是應用某些條件x來估計ATE。在某些情況下,幹預會對不同的子組產生不同的影響,並且ATE可以為零,因為這些效果被抵消了。CATE可以用於估計子組之間的異質效應。

  

  個體幹預效果

  個體幹預效應與CATE相同,應用的條件是單位是單位 i。

  2,假設

  如上所述,在聲明因果關係之前,需要採取許多措施。在進行因果推斷時,請記住以下假設:

  

1、單位i接受幹預不會影響其他單位的結果,即無網絡效應。 2、如果單位i在幹預組中,其接受的幹預與幹預組中的所有其他單位一樣,即只有一個種幹預類型。

3、工作流程

  因果推理最大的挑戰是,我們只能觀察到每個單位i的Y¹或Y?,我們永遠無法完美測量每個單位i的幹預效果,為了應對這個問題,我們需要為幹預組找到完美的對照組,使兩組之間唯一的區別就是幹預。這可以通過運行隨機化實驗或在隨機化不切實際的情況下尋找匹配的幹預組和對照組(準實驗)來實現。以下是我認為有用的工作流程:

  

  隨機對照試驗(RCT)

  如果總能隨機分出幹預組和對照組,生活就會輕鬆很多! 隨機分配幹預後,我們可以分別估計治療組和對照組的結果變量,其差異就是平均治療效果(ATE)。由於單位是隨機選入幹預組的,所以幹預組和對照組的單位之間唯一的區別就是是否接受過幹預。因此,結果變量的差異就是幹預的效果。但是,有時由於網絡效應或技術問題,無法將幹預組和對照組隨機化。或者把用戶分成兩組成本太高。例如,在估計促銷活動的效果時,如果將部分用戶排除在促銷活動之外,會對用戶的滿意度產生負面影響。在這種情況下,我們可以進行準實驗,也就是不依賴隨機分配的實驗。

  差異(DID):

  DID通常是在對照組和幹預組之間存在已存在差異時使用的。但是,我們認為幹預組和對照組的結果變量增長趨勢沒有顯著差異(平行趨勢假設)。也就是說,按照下表的定義,兩組在結果變量上的差異在治療前後是相同的,d_post=d_pre:

  

  幹預組的結果差異為d_t,定義為Y(1,1)-Y(1,0),對照組的結果差異為d_c,定義為Y(0,1)-Y(0,0)。d_t和d_c之間的差值為DID,即幹預效果,如下圖所示。

  

  DID = d_t-d_c=(Y(1,1)-Y(1,0))-(Y(0,1)-Y(0,0))
平行趨勢假設是一個很強的假設,當違背這個假設的時候,DID估計就會出現偏差。

  匹配

  儘管不可能進行隨機實驗,但我們可以找到完美匹配的幹預組,在不進行幹預的情況下量化結果變量。我們可以根據interests特徵構建一個人工對照組。例如,我們可以在一個城市給予促銷活動,並與其他沒有促銷活動的城市進行結果變量的比較。這些城市除了促銷活動外,其他因素都是相似的。這就像一個橫向比較。

  我們可以使用的另一種方法是時間序列比較,這叫做switch-back檢驗。例如,我們可以選擇一個城市,在一周內給出促銷活動,然後將結果變量與最近一段時間沒有促銷活動的這個城市進行比較。差異將是促銷的效果。

  這些技術在面對網絡效應時相當有用。使用橫向比較或時間序列比較,我們不需要把一個市場分成不同的群體。因此,我們不需要擔心同一市場中群體之間的溢出效應。在對整個市場進行比較時,必須確保對照組和幹預組市場之間的唯一差異是幹預。

  內生性

  當獨立變量X(幹預)與回歸中的誤差項相關,從而使估計結果(幹預對結果變量Y的影響)產生偏差時,就會產生內生性。引起內生性的方式有三種:

  

  處理內生性問題總是很麻煩。除了包括所有混淆變量和引入一些隨機化外,回歸不連續和工具變量是解決內生性問題的另外兩種方法。

  1、回歸不連續

  回歸不連續是在一個分界點測量幹預效果。用一個例子會更容易理解。假設我們想估計發放獎學金對學生成績的影響。簡單地估計有獎學金和沒有獎學金的學生之間的成績差異,會因為內生性而使估計結果出現偏差。獲得獎學金的學生即使沒有獎學金,也更有可能獲得更好的成績。如果我們有一個給獎學金的臨接點,我們可以利用回歸不連續來估計獎學金的效應。例如,如果我們給成績高於80分的學生發放獎學金,那麼我們就可以估計成績接近80分的學生的成績差異。這背後的直覺是,在影響成績的其他特徵方面,得到79分的學生很可能與得到81分的學生相似。對於成績在79到81之間的學生來說,被分配到幹預組(有獎學金)和對照組(沒有獎學金)是大致隨機的。因此,我們只能看這個子人群的成績差異來估計治療效果。更多詳情請查看維基百科頁面。

  2、工具變量

  工具變量指的是與自變量X高度相關,但與因變量Y不直接相關的變量,它們的關係就像下圖。

  

  工具變量

  由於工具變量與結果變量並不直接相關,如果改變工具變量引起結果變量的變化,那一定是幹預變量的原因。例如,在估計教育對未來收入的影響時,常用的工具變量是父母的教育水平。父母的教育水平與孩子的教育水平高度相關,而與孩子的收入並不直接相關。為具體的研究問題尋找工具變量是很困難的,它需要對相關文獻和領域知識有充分的了解。在得到工具變量後,我們可以用2SLS回歸來檢驗這個工具變量是否好用,如果好用,處理效果如何。詳情請參考維基百科頁面。

  這些就是因果推理的what、why和how。希望本文可以幫助你總結基本概念和技術,感謝您的閱讀。

  AI研習社是AI學術青年和AI開發者技術交流的在線社區。我們與高校、學術機構和產業界合作,通過提供學習、實戰和求職服務,為AI學術青年和開發者的交流互助和職業發展打造一站式平臺,致力成為中國最大的科技創新人才聚集地。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺「網易號」用戶上傳並發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關焦點

  • 因果推理「三問」:是什麼?為什麼需要?如何使用?
    在本文中,我將討論什麼是因果關係,為什麼需要發現因果關係,以及進行因果推理的常用技巧。1. 什麼是因果關係?因果關係描述的是兩個變量之間的關係,即一個變量如何誘發另一個變量的發生。它比相關關係要強得多,因為相關關係只是描述兩個變量之間的共同運動模式。通過繪製散點圖,可以很容易地觀察到兩個連續變量的相關性。對於分類變量,我們可以繪製柱狀圖來觀察其關係。
  • 劉曉蕾:實證研究中如何確定因果關係
    圍繞「實證研究中如何確定因果關係」這個問題,劉老師循循善誘,依次講了「實證研究的目的」、「確定因果關係的重要性及難題」,最後針對這些問題給出了常用的幾個方法。以下為筆記正文:為什麼因果關係重要為了回答這個問題,我們首先要弄明白實證研究的目的是什麼?
  • 看因果深度學習如何教AI人工智慧去問為什麼
    但是許多AI研究人員認為,需要更多的工作來理解因果關係,而不僅僅是相關性。現場因果深度學習(對確定某件事發生的原因很有用)仍處於起步階段,並且自動化比神經網絡困難得多。許多AI都是關於在大量數據中查找隱藏模式的。全球IT服務公司L&T Infotech的執行副總裁兼首席數據分析官Soumendra Mohanty說:「顯然,這方面將我們帶向了「什麼」,但很少有人去理解「為什麼」。
  • 從哲學上看,因果關係為什麼很難確定?
    日常生活中,沒有人能完全避開「因果關係」這個概念。例如,當人問出「為什麼問題」(why question)多半想尋求的就是因果說明:為什麼會有潮汐?為什麼太陽會東升西落?這些問題不只是格式類似,它們都在為想要說明的現象尋求一個因果上的說明。如果要給出正確的因果說明,得知道什麼是因果,換句話說,我們需要好的因果分析理論,用以分析事件之間的因果關係。
  • 隨機分配是什麼, 為什麼重要, 對因果關係影響幾何?
    如何用統計方法建立因果關係?這是個很難回答的問題。統計檢驗可以確定一種效應是否具有統計學上的顯著性,但不能確定實驗是否導致這種效果。在這篇文章中,學習如何在實驗中使用隨機分配來幫助你識別因果關係。相關性、因果關係和混雜關係作為科學方法的一個關鍵組成部分,實驗通常在對照組和一個或多個實驗組之間建立對比。其目的是確定實驗組和對照組之間的差異是否具有統計學上的顯著性。
  • 從「相關關係與因果關係」到「用事實解釋事實」的錯誤
    之前發布了《三條最基本的簡單邏輯》(http://tieba.baidu.com/p/5335472137),最後舉的第三條基本的簡單邏輯是「不得因果跳躍」,這是關於因果關係的邏輯。西醫的理論可能是解釋糖的什麼成分與牙的什麼成分發生化學變化,從而最終呈現出蛀牙的結果。中醫則是提出了陰陽五行理論予以解釋,即五行對應五臟、五竅、五味等。由此可見,統計數據只能提供不同現象之間在數據上的相關關係,但相關關係的背後是否具有因果關係,這是需要科學理論提供解釋的。
  • 搞懂因果推斷中內生性問題解決方法必讀的書籍和文獻已搜集好!
    11.AER上因果關係確立, 敏感性檢驗, 異質性分析和跨數據使用經典文章,12.第二篇因果推斷經典,工作中斷對工人隨後生產效率的影響?39.逐年PSM匹配後再DID識別因果的實證範文, 這就是逐年PSM-DID的操作範式!40.用事件研究法進行因果識別如何做? 有什麼好處? 與DID結合起來潛力無窮!41.Abadie半參數雙重差分DID估計量, 使你的平行趨勢假設更加可信!42.彈性DID, DID的終極大法, 關於DID各方法總結太贊了!
  • 相關不等於因果,深度學習讓AI問出「十萬個為什麼」
    全球IT服務公司L&T Infotech的執行副總裁兼首席數據分析官蘇門德拉·莫漢蒂(Soumendra Mohanty)表示,「顯然,這能使我們能了解到『是什麼』,但卻很少能理解『為什麼』」。  這個區別的影響是很大的。建造人工智慧的最終目的是訓練AI回答為什麼這個因素會影響那個因素,這就是許多研究人員現在將注意力轉向這兒的原因。
  • Python實現固定效應回歸模型實現因果關係推斷
    眾所周知,「相關並不意味著因果關係」。 我要告訴你,相關可以表示因果關係,但需要一定條件。 這些條件已在計量經濟學文獻中被廣泛討論。 在本文中,我將以一種易於理解的方式對其進行總結。 我將解釋如果不滿足這些條件為什麼標準的普通最小二乘(OLS)無法確定因果關係。 然後,我將介紹可以提供有效解決方案的固定效應(FE)模型。
  • 貝葉斯之父Judea Pearl推薦:機器學習因果推理的7個有用工具
    這種層次結構及其所包含的形式限制解釋了為什麼基於關聯的機器學習系統無法推理動作、實驗和因果解釋。結構因果模型結構因果模型(SCM)結合了圖形建模、結構方程、反事實和介入邏輯。我們可以使用這些工具正式表達因果問題,以圖解和代數形式編纂我們現有的知識,然後利用數據來估計答案。
  • 因果關係都是幻覺,休謨才是「不確定性」的鼻祖
    但是休謨認為,人們看到了兩個事實,一個是太陽曬,一個是石頭熱,雖然太陽曬在前,石頭熱在後,但是如何確認太陽曬就是石頭熱的原因,我們看到了這兩個事實,但沒有看到因果這樣的概念,也沒有看到客觀世界有因和果。人們通常認為的因果關係只是一系列類似現象的多次重複,多次看到太陽曬在前,石頭熱之後出現,於是就把這在前的現象稱為原因,在後的現象稱為結果。
  • 《原因與結果的經濟學》:學會因果邏輯推理,做複雜世界的明白人
    這裡面包含了我們最熟悉的因果關係,就是因為什麼什麼,所以什麼什麼。但是在「破窗理論」裡,這些因果關係真的成立麼?我們該如何判斷諸如此類模稜兩可的因果關係的真偽呢?這裡推薦一本書---《原因與結果的經濟學》,只要你能掌握裡面的「因果邏輯推理」方法,就能輕鬆判定生活裡那些表面上看似很有道理,實則毫無關係的因果邏輯了。
  • 哈佛教授新書《因果推理》開放下載!311頁暢享閱讀
    書籍介紹:走向不那麼隨意的因果推理《因果推理》是一個公認自命不凡的書名。因果推理是一項複雜的科學任務,它依賴於多個來源的 三角互證( triangulating evidence)以及各種方法論的應用。任何一本書都不可能全面地描述跨學科因果推理的所有方法。任何因果推理書的作者都必須選擇他們想要強調的因果推理方法論的某些方面。
  • 刑法因果關係判斷需要更為具體的標準
    因果關係理論如何具體運用到實務因果關係理論並非一個單獨的理論,而是與刑法中其他問題糾結在一起。在「特殊犯罪類型的因果關係」這個問題上,與會專家學者圍繞不作為犯、結果加重犯、共犯、幫助犯、間接正犯等特殊犯罪類型中的因果關係問題進行了討論。東南大學教授李川針對不作為犯的因果關係問題,認為不作為因果關係問題只需要判斷歸責,而歸因並不重要。
  • 珀爾:數據非常愚蠢,領會因果關係才是理解世界的關鍵
    在珀爾眼裡,人類的認知能力之所以能超越「觀察」,達到「幹預」和「想像」的級別,是因為我們天生擁有一顆善於發現並理解「因果關係」的大腦,這也是我們目前仍領先AI的地方。不過嚴格來說,如同對「時間」或「意識」的理解一樣,在哲學、科學界對於什麼是「因果關係」至今仍未有一致的定論。
  • 反事實推理、特徵分離,「因果表示學習」的最新研究都在講什麼?
    因果推理(Causal inference)是根據影響發生的條件得出因果關係結論的過程,是研究如何更加科學地識別變量間的因果關係(Causality)。在因果關係中,原因對結果負有部分責任,而結果又部分取決於原因。客觀事物普遍存在著內在的因果聯繫,人們只有弄清事物發展變化的前因後果,才能全面地、本質地認識事物。
  • 論刑法中的因果關係
    在刑法中,將某結果歸咎於某人時,往往需要查明其行為與結果之間是否存在刑法上的因果關係。因此,刑法中的因果關係在定罪中具有重要意義。然而,很多學者習慣於直接將一些哲學概念和範疇引入刑法學研究,忽略刑法中因關係的特性,使問題略顯複雜。針對這一現象,對大陸法系及我國有關因果關係理論進行研究,取其精華,去其糟粕,對我國刑法因果關係理論做些新的探索,期對該問題的解決提供一些建議。
  • 楊建軍:刑法因果關係的司法證明|比較法研究202006
    其二,之所以有如此多樣乃至差異巨大的刑法因果關係的話語表達,可能是因為,不同的訴訟參與者會使用不同的語詞或語句,以證明或證偽因果關係。訴訟各方有什麼是因果關係的理解分歧,也有多因一果情形下原因力的對抗性論辯;有實行行為對損害結果作用大小的爭論,也有是否應認定因果關係中斷的對峙;除了定性分析,還常涉及到因果關係的定量認定問題。
  • 楊建軍:刑法因果關係的司法證明 | 比較法研究202006
    其二,之所以有如此多樣乃至差異巨大的刑法因果關係的話語表達,可能是因為,不同的訴訟參與者會使用不同的語詞或語句,以證明或證偽因果關係。訴訟各方有什麼是因果關係的理解分歧,也有多因一果情形下原因力的對抗性論辯;有實行行為對損害結果作用大小的爭論,也有是否應認定因果關係中斷的對峙;除了定性分析,還常涉及到因果關係的定量認定問題。
  • 相關性 ≠ 因果性,用圖的方式打開因果關係
    選自GitHub作者:David Salazar編輯:陳萍、魔王機器學習方法是預測的有力工具,但是很多領域的工作或研究重視對因果關係的討論。相關性並不意味著因果關係,那麼如何識別因果關係呢?