Parametric g-formula方法在因果分析中的應用

2021-02-20 中華流行病學微平臺

如果需要在不同處理措施之間做出正確選擇,則必須先要準確估計出不同處理條件下的可能結果。要做到這一點的最好方法是隨機對照實驗(RCT)。如果因為各種原因使RCT不可行,此時只能採用前瞻性隊列研究等觀察性研究方法。這類觀察性研究方法在用於因果關係研究時可能存在偏倚,而parametric g-formula方法可有效控制這些偏倚,特別是時依性混雜偏倚。如在HIV的治療策略研究中,若探究HIV陽性患者何時需要啟動抗病毒治療(CD4細胞<350個/μl或<500個/μl,還是HIV症狀出現時?),採用parametric g-formula可避免RCT分組過多帶來的樣本量過大而無法實現及時間過長等問題[4];在職業衛生研究中,若探究石棉對工人肺癌死亡的風險,在很多情況下,停止就業後肺癌的死亡還會增加,且其他病因的死亡作為競爭風險事件也會影響分析結果,採用parametric g- formula可避免健康工人效應及競爭風險所導致的效應估計偏倚[5];若探究各種假定生活方式幹預措施對護士冠心病風險的影響,幹預措施可能隨時間變化,且某些個體可發生多種幹預,採用parametric g-formula可對這類長期隊列資料進行分析,使得健康效益最大化[6]。

Parametric g-formula的基本原理是依據觀測數據特徵分布,模擬不同暴露場景下(幹預或非幹預,不同劑量藥物處理等)產生的潛在結果,從而估計不同策略/幹預/處理/暴露下的風險,進行因果推斷[7]。簡單來說,是構建一個序列模型,並以此為基礎在感興趣的處理策略下對人群(反事實)進行蒙特卡羅模擬。

由宏指令完成parametric g-formula的計算主要有3個步驟。首先,以過去的處理(previous treatment)和協變量(covariate)為條件,用參數回歸模型來估計結果(outcome)、處理(treatment)和時依性協變量的聯合分布情況。然後,用以上估計的參數進行蒙特卡羅模擬,模擬感興趣的處理措施或者無幹預措施下的分布。最後根據模擬結果計算風險值。

相關焦點

  • 哈佛大學Hernan教授《因果推斷:What If》新書,311頁講解因果效應(附下載)
    然後,本書描述了各種數據分析方法,這些方法可用於在收集一組人口中每個個體的數據時,在一組特定的假設下估算感興趣的因果關係。本書的一個關鍵信息是,因果推斷不能簡化為用於數據分析技巧的集合。本書分為三個難度越來越大的部分:第一部分講述沒有模型的因果推斷(即,因果關係的非參數辨識),第二部分是關於模型的因果推論(即,通過參數化模型對因果關係的估計),第三部分從複雜的縱貫數據中得出因果關係的推斷(即,估算時變處理的因果關係)。
  • 因果推斷領域新書(附PDF):Causal Inference: What If
    因果推斷是當今機器學習領域炙手可熱的研究方向,而圖靈獎得主貝葉斯網絡之父 Judea Pearl 的著作《為什麼》更是讓該領域的知識得以普及。而在2020年末,由哈佛大學公共衛生學院的 Miguel Hernan 與 Jamie Robins 教授合作完成的因果推斷領域的新書 Causal Inference: What If,更是詳細全面地闡述了因果推斷領域的基本概念與背後的理論基礎。
  • 相關性 ≠ 因果性,用圖的方式打開因果關係
    選自GitHub作者:David Salazar編輯:陳萍、魔王機器學習方法是預測的有力工具,但是很多領域的工作或研究重視對因果關係的討論。相關性並不意味著因果關係,那麼如何識別因果關係呢?
  • Python實現固定效應回歸模型實現因果關係推斷
    眾所周知,「相關並不意味著因果關係」。 我要告訴你,相關可以表示因果關係,但需要一定條件。 這些條件已在計量經濟學文獻中被廣泛討論。 在本文中,我將以一種易於理解的方式對其進行總結。 我將解釋如果不滿足這些條件為什麼標準的普通最小二乘(OLS)無法確定因果關係。 然後,我將介紹可以提供有效解決方案的固定效應(FE)模型。
  • 搞懂因果推斷中內生性問題解決方法必讀的書籍和文獻已搜集好!
    7.合成控制法與HCW方法, 誰能夠走得更遠?8.廣義合成控制法gsynth, Stata運行程序release,9.廣義合成控制法gsynth, 基於交互固定效應的因果推斷,10.再談合成控制法SCM, 幫你尋找因果推斷控制組,11.合成控制法什麼鬼?
  • 政治科學視角下的大數據方法與因果推論
    與此同時,大數據方法基於可視化方式呈現相關或因果關係,這在促進知識傳播方面很具優勢。  伴隨著大數據方法的應用,社會科學界逐步形成計算社會科學這一新興學科,以充分利用社會現象的數位化記錄,藉助數據分析、模擬計算和社會實驗以發現社會規律(17)。計算社會科學匯集了社會科學應用大數據方法探求因果性知識的新範式,其促進因果推論的方法進展包括:其一,算法智能化趨勢。
  • 因果發現:如何讓算法成為複雜系統中的「福爾摩斯」?
    例如某人聲稱窮人吸菸多,而窮人患肺癌的比例更高,而這意味著「吸菸多的人患肺癌多」不能支持「吸菸引起肺癌」,這就是一個已知的因果鏈條。然而真實世界中,類似的因果鏈條,往往並不是先驗知識。尋找因果關係,傳統的方法是通過隨機對照實驗。但是這種實驗方式在實際問題中可能涉及到一些倫理問題,並且通常需要花費大量的人力和物力。
  • Stata:格蘭傑因果檢驗
    計量百科·資源·乾貨:來源:http://dss.princeton.edu/training/,部分資源整理自:百度文庫、CDA數據分析師、社會科學中的數據可視化在實證分析中,我們經常需要確定因果關係是x導致y,還是y導致x。
  • 刑法中相當因果關係說的判斷方法
    根據一定的危害結果在具體犯罪中的地位,刑法因果關係影響到該犯罪的成立、既遂或加重處罰等。因此,刑法因果關係的地位至關重要。  綜上分析,刑法因果關係的判斷應堅持相當因果關係說。當然,該說並非完美無缺,可以故步自封。如今日本刑法因果關係理論出現新動向,提出了「危險的現實化」理論。它考察實行行為的危險是否現實化為危害結果,或者說,危害結果是否實行行為的危險的現實化。該觀點被認為是吸收了客觀歸責理論的合理成分。但是,沒有動搖相當因果關係說在日本的通說地位。可以將危險的現實化理論作為相當性判斷的有益補充。
  • 意向性治療分析、接受治療分析和依從者分析
    即在分析中除去那部分依從性(adherence)不足的患者。 [第二部分:優劣勢比較]一個理想的臨床研究應當是每個患者都遵循隨機分配後的方案並且隨訪數據完整。但是在實際的實施過程中,患者可能退出試驗,換到另一個試驗組或者缺了幾次的隨訪數據。
  • 跨媒體因果推斷
    本論壇將從跨媒體智能的抽象歸納、演繹推理及因果推斷等方面,討論跨媒體大數據表徵與推理、分析因果計算的前沿理論和方法、探索跨媒體因果推斷的未來發展趨勢,並暢想未來的創新應用方向。本報告首先介紹網絡多媒體大數據表徵與推理的科學問題和研究思路,然後介紹網絡多媒體大數據表徵與推理的研究方法,最後探討網絡多媒體大數據認知所面臨的挑戰與思考。
  • 大白話系列:分析方法之相關分析方法
    今天我們來講講分析方法的相關係數定義相關分析方法的定義就是利用指標衡量兩種數據間的相關程度。高度相關:0.6~12)數值正負反映兩種數據的相關方向:-:反方向變化,負相關,一種數據增大,另一種數據隨之減小+:同方向變化,正相關,一種數據增大,另一種數據隨之增大0:不是線性相關應用場景
  • 費海汀:政治科學中的歷史方法:以比較歷史分析為例
    在這一過程中,二者相互借鑑、取長補短,從傳統的比較史學中塑造出了比較歷史分析這一系統的社會科學研究方法。本文希望通過對比較歷史分析方法定義與特點,起源與發展,適用條件、研究設計、操作流程及質量控制等方面的探討,系統地介紹這一研究方法在學術研究實踐中的分類應用及優劣勢。
  • 淺談社會網絡分析方法在稅收分析中的應用
    淺談社會網絡分析方法在稅收分析中的應用 來源:中國稅務網-山東省青島市地稅局 作者:隋大鵬 編輯:劉娜 2014-10-15 08:42:49簡單地說,社會網絡分析就是對網絡中行動者間的關係進行量化研究的方法。    自Barnes(1954)首次利用社會網絡的概念來分析挪威某漁村的社會結構以來,時至今日已成為研究人際互動行為及社會結構最明朗、最具說服力的分析方法之一。在國外,社會網絡分析已被廣泛應用到眾多領域。
  • 9種常用數據分析方法
    數據分析是從數據中提取有價值信息的過程,過程中需要對數據進行各種處理和歸類,只有掌握了正確的數據分類方法和數據處理模式,才能起到事半功倍的效果,以下是數據分析員必備的9種數據分析思維模式:聚類聚類是根據數據的內在性質將數據分成一些聚合類,每一聚合類中的元素儘可能具有相同的特性,不同聚合類之間的特性差別儘可能大的一種分類方式,其與分類分析不同,所劃分的類是未知的,因此,聚類分析也稱為無指導或無監督的學習。
  • 論刑法中的因果關係
    該雙層分析理論通過對事實原因的認定,先基於經驗法則判斷的一般自然意義上的因果聯繫甄別出具有刑法意義的事實,然後通過對法律原因的篩選,實現最終將結果歸屬於行為的目的。從事實到法律的分析方法受到了許多學者的贊同。但是,筆者認為源於英美法系的雙層因果關係理論由於其產生的背景不同,並不適用於我國。
  • 從刑法因果關係中分析本案的定性
    [分歧]  本案中對王某的行為如何定性,有兩種不同的觀點。  第一種觀點認為,王某以傷害的故意,實施了傷害他人身體的行為,並造成他人的死亡,應認定為故意傷害致死罪。  第二種觀點認為,王某對李某繫心髒病患者不知情,王某的毆打行為與李某的死亡之間不存在刑法上的因果關係,故本案系意外事件。
  • Stata講座:因果推斷中的雙重差分法開講
    主講嘉賓是中央財經大學社會發展學院王存同教授,講座題目為《因果推斷中的雙重差分法》。來自全國多所高校及科研機構的10596多名師生及研究者觀看了本場直播。本次講座王老師為大家帶來了因果推斷模型中的雙重差分法(DID)的介紹。因果推斷模型與方法是現代社會科學研究者利用計量模型發表高水平實證論文的核心利器,其中雙    重差分法(DID)佔有舉足輕重的地位。
  • 反事實推理、特徵分離,「因果表示學習」的最新研究都在講什麼?
    因此,因果表示學習對人類和機器智能都是一項挑戰,但它符合現代機器學習的總體目標,即學習數據的有意義表示,其中有意義表示穩健、可轉移、可解釋或公平。在這篇文章中,我們選了幾篇關於因果表示學習的最新文獻,其中涉及了基於 SCM 和基於 RCM 的工作。我們主要分析了不同方法的基本架構,目的是對因果學習應用於機器學習的方向和可能一探究竟。
  • 數列極限專題:Stolz定理及在數列未定式極限中的應用典型題分析
    例3:設數列 由下式確定:  0,{a_{n + 1}} = {a_n} + \frac{1}{{{a_n}}}(n = 1,2, \cdots ) " data-formula-type="block-equation" >  證明以下結論成立:  【參考證明】:問題轉換:一般帶根號的問題不是很好計算,能夠轉換的儘可能去掉根號進行討論