傾向性得分匹配(PSM)

2020-10-18 一統漿糊

傾向值(Propensity Score,傾向性得分)分析近些年來火的一塌糊塗,PubMed自由詞搜索Propensity Score,相關文章近些年大有井噴之勢(圖標數據截止2020.05.21)。

但嚴格來說,傾向性得分算不得一種「分析」方法,而是一種用於數據處理的方式,常用於觀察性研究混雜因素的控制。比如你想研究施加某種幹預對結局指標是否有改善,數據來自回顧性的既有資料的收集,由於是觀察性研究,大概率存在混雜因素在組間不均衡的問題(如基線不平),這個時候你就可以考慮傾向性得分分析了。

PS就是以幹預因素(組別)為因變量,以所有觀測到的非研究性因素為自變量進行logistic或probit回歸,在給定的協變量條件下,個體接受幹預因素處理的概率。根據PS,我們就可以對試驗組和對照組進行篩選,使得不同組的非研究性因素實現均衡,從而達到控制的目的。傾向性得分本身並不能控制混雜,而是通過PS匹配、加權、分層或進入回歸模型直接調整混雜等方式,不同程度地提高對比組間的均衡性,從而削弱或平衡協變量對效應估計的影響,達到「類隨機化」的效果,又稱為事後隨機化。簡單理解,就是從大量的樣本數據中將具有共同特徵的幹預組和對照組樣本挑選出來,然後對這些符合要求的樣本進行分析。

傾向性得分可以同時調整大量的混雜因素,省時間省錢,但是需要的樣本量較大,只能均衡已觀測的指標變量,而且可能會以丟失樣本為代價。大部分軟體給出的是兩水平的幹預因素的傾向性得分,SPSS直接給出了1:1的傾向性得分匹配結果。

數據來自STATA16的自帶數據,是一項關於孕期婦女吸菸對新生兒體重的影響的觀察性研究,由Cattaneo (2010)報導。調查數據涉及眾多變量包括新生兒出生體重(bweight)外,還有孕母的婚姻狀況(mmarried)、孕期是否飲酒(alcohol)、年齡(mage)、教育水平(medu)、是否吸菸(mbsmoke)、母親是否白人(mrace)、是否首胎(fbaby)、首次產前檢查是否在頭三個月內(prenatal1)以及父親的年齡(fage)、是否白人(frace)等眾多變量。

在原數據中可分析的變量還有很多,我們僅以這幾個來演示傾向性得分的分析操作。
【0】分析並評估

經檢驗發現吸菸和非吸菸組的數據均呈非正態(數據非正態分布,宜用中位值[25%分位數,75%分位數]表示),如果直接採用兩獨立樣本非參數檢驗,結果如下:

但同時我們也發現,很多的混雜因素在吸菸和非吸菸組中也具有統計學意義,這樣以來我們就不能明確出生體重在吸菸和非吸菸組的不同是由於吸菸這個因素造成的還是由於其他的混雜因素造成的。

註:①我不知道老外的這個教育水平是怎麼個意思,本例按連續變量處理;②經檢驗年齡和教育水平均呈非正態分布;③正態性和方差齊性檢驗、均值、標準差、中位值、百分位數都可以通過explore過程獲得(Analyze>> Descriptive Statistics >> Explore…);非參數檢驗:Analyze >> Nonparametric Tests>> Independent Samples…;分類資料統計及卡方分析:Analyze >> Descriptive Statistics >> Crosstables…

傾向性得分匹配可以隆重登場啦!
【1】傾向性得分匹配

Data→Propensity Score Matching…

Group Indicator(組指示變量):選入需要考察的幹預因素,本例為mbsmoke

Predictors(預測變量):選入需要匹配的變量,本例有mmarried,alcohol,mage,medu,mrace,fbaby,prenatal1,fage,frace
Name for Propensity Variable(傾向性變量名稱):新建一個變量,值為傾向性得分,不能與已有的變量名稱相同。本例命名為PS
Match Tolerance(匹配容差):即卡鉗值(caliper),本例首先設為0.03。兩個個體的PS差值在事先設定的某範圍(卡鉗值,本例為0.03)內才能進行匹配,最合適的卡鉗值是取兩組傾向指數標準差的20%,或者取兩組間PS絕對差值(卡鉗值)為0.02或0.03等。很明顯卡鉗值越大,能夠匹配成功的個體越多,匹配集就越大,但是組間的均衡性可能會越差;卡鉗值越小,雖然可提高對比組間的均衡性,但匹配成功率可能降低,匹配集的樣本量減少;
Case ID(個案標識):確定觀測對象的ID,本例選擇id
Match ID Variable Name(匹配標識變量名稱):用於儲存匹配後結果,不能與已有的變量名稱相同。本例命名為matchid
Output Dataset Name(輸出數據集的名稱):建立一個匹配後的數據集,不能與當前的數據表名稱稱相同,本例psm
Options(選項)
  • Variable for Number of Eligible Cases(複合條件的變量個數):新建變量,表示在對照組中有多少個觀測對象滿足匹配條件。本例命名為EC

  • Give priority to exact matches(優先精確匹配):優先考慮精確匹配;

  • Maximize execution performance(最優化執行操作):綜合考慮精確匹配和基於設定的卡鉗值範圍內模糊匹配;

  • Randomize case order when drawing matches(提取匹配個案時隨機化個案順序):如有多個觀測對象滿足匹配條件,採取隨機原則進行選擇。因為是隨機,所以重複操作時結果可能會不一致,為保證匹配過程的可重複性,可在Random Number Seed設定一個隨機數種子。

【2】結果及解讀:

(1)二分類logistic回歸模型:首先給出的是以吸菸(1=吸菸者;0=不吸菸者)為因變量、以需要校正的變量為自變量構建二分類logistic回歸結果,採用的是enter方法,二分類logistic回歸可參加《》。後續每個研究對象的PS值就是根據該回歸模型得出的。

(2)傾向性匹配結果:結果會生成一個新的數據表,表格名稱為psm。同時給出匹配統計量和匹配容差的統計描述。
  • 匹配統計量:精確匹配0對,模糊匹配846對,共計匹配成功846對,同時有18個個案未能找到有效匹配人群。

  • 匹配容差:精確匹配(PS完全一致)匹配了376371次,基本上無匹配成功個案;在精確匹配後的PS的模糊匹配(PS±0.03,本例卡鉗值為0.03),匹配376371次,大約0.225%匹配成功。

【3】從匹配後的數據框中篩選匹配成功的數據

Data>>Select Cases…

選擇matchid不為0的個案

【4】匹配後數據分析

經檢驗發現母親教育水平(Z=-3.163,P=0.002)、是否飲酒(chi2=12.097,P=0.001)在組間仍有統計學意義,我們需要重新進行傾向性匹配,Match Tolerance(匹配容差)設為0.02時共成功匹配843對,是否飲酒在組間仍有統計學意義(chi2=3.957,P=0.047),Match Tolerance最終設為0.01時共成功匹配834對,經分析各混雜因素在組間實現均衡,結果如下表。結果表明扣除其他因素的影響,孕期吸菸對新生兒的體重的確有影響(Z=-10.408,P<0.001)。

在SPSS的Propensity Score Matching可以直接根據傾向性得分進行匹配,但並未給出匹配後數據的均衡性診斷,而且也只能對幹預組和對照組進行1:1的匹配,算是一種遺憾吧。當然我們在獲得傾向性得分後,除了匹配,還可以通過加權、分層或回歸校正等方法來控制混雜因素的影響,未來可期,這些就來日再記吧!

2020.05.21

相關焦點

  • Propensity Score Matching 傾向得分匹配
    匹配(Matching)是一種解決由自選擇(self-selection)導致內生性問題的方法。關於自選擇問題的成因,我們在理論篇一個隱藏的魔鬼——內生性中已經給出了詳細的解釋,這裡再簡單回顧一下。自選擇問題的原因是研究中樣本的選擇不是隨機的,而是包含了個體自主選擇的結果。
  • 內生性問題和傾向得分匹配, 獻給準自然試驗的厚禮
    部分模型計算時間超過五分鐘)方法一:近鄰匹配(nearest neighbor matching)含義:最鄰近匹配法是最常用的一種匹配方法,它把控制組中找到的與處理組個體傾向得分差異最小的個體,作為自己的比較對象 。優點:按處理個體找控制個體,所有處理個體都會配對成功,處理組的信息得以充分使用。
  • 【Anesthesia & Analgesia中文版】肺切除術後肺保護性通氣和肺部併發症的關係:一項傾向性匹配分析
    主要結局指標為肺炎發生率和/或急性呼吸窘迫症候群(acute respiratory distress syndrome,ARDS)。採用傾向性匹配將一般特徵類似的患者分為PLV組和非PLV組。採用確切邏輯回歸分析評估結局指標和PLV狀態之間的關係,並在解剖式肺切除術和非解剖式肺切除術人群中分別匹配。
  • Stata:終極匹配 ultimatch
    前期相關推文Stata:數據合併與匹配-merge-reclinkStata:psestimate-傾向得分匹配(PSM)中協變量的篩選Stata:廣義精確匹配-Coarsened-Exact-Matching-(CEM)伍德裡奇先生的問題:PSM-分析中的配對——小蝌蚪找媽媽Stata:psestimate-傾向得分匹配(PSM)中匹配變量的篩選Stata-從匹配到回歸:精確匹配、模糊匹配和
  • 百度NLP | 神經網絡語義匹配技術
    此後又有 PLSA(Probabilistic Latent Semantic Analysis)、LDA(Latent Dirichlet Allocation)等更高級的概率模型被設計出來,逐漸形成非常火熱的主題模型技術方向。這些技術對文本的語義表示形式簡潔、運算方便,較好的彌補了傳統詞彙匹配方法的不足。不過從效果上來看,這些技術都無法替代字面匹配技術,只能作為字面匹配的有效補充。
  • 文本匹配模型TextMatching
    寫在前面本次分享一篇NLP文本匹配的經典文章,主要思路是借鑑圖像識別的思路來解決NLP文本匹配問題,畢竟計算機視覺技術的發展在當時異常迅猛。個人心得:文本匹配問題可轉化為二分類問題,輸出概率則為相似度將圖像識別的思路應用於文本匹配任務中,利用卷積抽取文本特徵論文地址:https://arxiv.org/pdf/1602.06359.pdf1.
  • 明明有數據,為什麼我的VLOOKUP總是匹配不出來?
    經常用vlookup函數匹配數據的小夥伴們經常會遇到表格中明明有數據,卻總是匹配不到的情況,下面盤點下那些年匹配時遇到的坑~單元格中存在空白下圖中A、B兩列分別存放著員工姓名和員工得分數據,現在要求提取員工H及員工D的得分情況,大家都知道,這裡用vlookup相當簡單
  • 瑞金新知速遞 第258期|沈柏用教授發現機器人輔助全胰切除術對比開腹全胰切除術的傾向性評分匹配研究
    通過1:1傾向性評分匹配減少偏倚並對比RTP和OTP病例。結果:度過RPD和RDP的學習曲線後,通過標準化的手術流程完成RTP手術,RTP組的中位手術時間明顯少於OTP組[300 (IQR, 250–360) vs. 360 min (IQR, 300–525),   P=0.031],此外,RTP組en-bloc切除率和保脾率高於OTP組。
  • 海豚大多是右撇子 傾向性甚至比人類還嚴重
    :tech_163)大約90%的人類是右撇子,但我們並不是唯一表現出這種偏向性的動物。該研究結論源於美國非營利組織海豚交流項目的一項研究,研究的作者之一黛西·卡普蘭(Daisy Kaplan)博士聲稱:「我沒想到會會在海豚身上發現如此明顯的例子。」研究人員對巴哈馬群島常見的寬吻海豚進行了研究。
  • 天津工生所開發出蛋白質結晶多步驟實驗過程成功傾向性分析
    X-射線晶體學(X-ray crystallography)是解析蛋白質三維結構的主要方法,成功獲得可供衍射的晶體是該結構解析方法順利進行的關鍵。因此,從蛋白質一級序列信息出發,準確預測目標蛋白質成功通過多個實驗步驟的傾向性,將有助於篩選容易成功結晶的目標蛋白,從而幫助降低實驗費用和試錯成本,加速蛋白質晶體結構解析的過程。
  • 每日一讀:基於雙重注意力模型的微博情感傾向性分析
    2.基於雙重注意力模型的微博情感傾向性分析2.1 論文信息太原理工大學信息與計算機學院,羅春春,郝曉燕南京大學學報(自然科學),2020年歸檔:WPS網盤\我的雲文檔\論文匯報\畢業論文\論文部分\短文本情感分析算法部分\參考文獻2.2 論文重點研究目的
  • 2020,人工智慧技術進一步飛躍的一年(上)
    2020,人工智慧技術進一步飛躍的一年(上)IHS Markit在近日發布AI普及度調查中預測,到2025年AI應用將從智能網絡營銷加強企業廣告和用戶的匹配度儘管外界普遍預測2020年經濟發展增長將會繼續放緩,數字媒體營銷、廣告設計行業企業都會面臨諸多問題挑戰。但是,隨著各種前沿智能營銷技術的應用,智能化產品的效果受到廣告商的青睞。比如,常見的信息流廣告發展具有一個良好的曝光效果,AI視頻網絡廣告有良好的內容匹配度和品牌關聯度。
  • 阻抗匹配電路的作用,阻抗匹配的理想模型
    ,IC廠商針對其應用一般會向終端產商提供PCB板材質、PCB疊層、PCB板厚等一些相關參考設計建議(這些都是跟PCB阻抗控制設計息息相關的),終端廠商在拿到這些資料後,會結合實際情況據此進行本地化的設計調整,然後將相關設計資料及要求提供給PCB的生產廠家進行PCB生產。
  • 今天就簡單解讀一下廣泛匹配、詞組匹配和精準匹配的區別,以求幫助...
    今天就簡單解讀一下廣泛匹配、詞組匹配和精準匹配的區別,以求幫助各個賣家能夠更好的利用亞馬遜廣告投放來達到自己的目標。 舉例關鍵詞為:boys shoes 廣泛匹配Broad Match:鍵入的關鍵詞沒有特定的順序要求,中間可以插入其它單詞,同時支持常見的拼寫錯誤,也支持近義詞的匹配。
  • 最新碰撞測試結果出爐,得分最低竟然是它!
    一:威馬EX5 400 Extra創新版(星級:五星)威馬是一個新興的品牌,威馬EX5是威馬旗下的首款量產車型,緊湊型 SUV 的定位,補貼後 11.23-16.48 萬元的售價區間,也說明了威馬走的是親民路線,本次威馬EX5 400 Extra創新版碰撞得分如下:乘員保護得分63.254,得分率90.36%,行人保護得分10.117,得分率67.45