輔助生殖臨床數據特點:每個研究對象可能有多個周期。
研究設計:隊列
(1) 每個人(ID)有多個周期(cycle),重複測量了多個周期
(2) 每個人周期數可以不同
(3) 同一個人的基線指標相同:例如不孕類型
(4) 允許缺失(記錄為NA或空白)
ID=1的人做了2個周期,首次取卵時年齡為28,第二個周期有活產。
「縱向數據」好處是更靈活:更符合臨床實際情況:患者周期數不同、各指標在變化。就像記流水帳一樣,客觀記錄每個周期的情況即可。
常規方法:只納入第一次周期的數據進行分析,簡單,損失數據信息,可能導致選擇偏性。或者納入多個周期,進行最佳和保守估計,看兩種極端情況下結果是否一致。考慮重複測量的方法:將所有周期都納入,好處是減少只納入第一次周期可能帶來的選擇偏性。May reduce bias over first-cycle only approaches。多個周期(重複測量)推薦使用的統計方法:
廣義相加混合模型(Generalized additive mixed model, GAMM)
廣義估計方程(Generalized estimating equation , GEE)
通常GAMM和GEE的分析結果是一致的,然而數據分布會影響不同統計方法的結果,建議結合研究假設和數據特徵進行選擇。
下載練習數據CYC.xls.連結:https://pan.baidu.com/s/1KzWzoWt3nsoAgsp4zqygSg提取碼:tfxm
1. 廣義估計方程(Generalized estimating equation , GEE)論文實例:2016年發表在 Hum Reprod的隊列研究,採用1472例患者的1702個 IVF/ICSI 鮮胚移植周期數據,分析基線指標對hCG日孕酮升高(>1.5 ng/ml)的預測價值。下表採用GEE分析基線指標和Y(二分類)的關係。如何實現呢?配套視頻
易侕軟體的基本統計-回歸分析-廣義估計方程(GEE)模塊:
結果解讀,本例中OR值是sep(coef),紅框中是95%CI和p值。OR值的結果解讀與不用GEE得出的OR結果解讀相同。
同理在閾值效應模塊給出「研究對象編號」也是基於GEE,操作略。
統計方法描述可以參考這篇論文[1]:The generalized estimating equation (GEE) framework was used to construct univariable and multivariable regression models for the prediction of PE occurrence. This was done to control for the non-independence of data since some patients contributed more than one cycles in the dataset analysed.廣義估計方程(generalized estimating equation, GEE)模型可以考慮到同一患者多個周期內部相關性的影響。同一患者多個周期的資料並非相互獨立(non-independence),例如基線年齡等指標都是相同的。
2. 廣義相加混合模型(Generalized additive mixed model, GAMM)例如X是某激素水平(連續變量),是隨時間變化的,即每個周期的X不同。如果做重複測量數據的曲線擬合,需要用GAMM模型。
配套視頻
易侕軟體的基本統計-回歸分析-廣義相加混合模型模塊:
得出曲線擬合:
其他操作略:調整混雜、分層分析、交互作用檢驗等。
結局指標(Y)可以是二分類或連續變量。例如,臨床妊娠(是否)、新生兒出生體重
暴露因素(X)可以是連續或分類變量。
· 可以不隨時間變化:例如,如果每位患者所有周期的黃體支持方案相同,研究黃體支持方案對活產的影響。
· 可以隨時間變化:例如每次周期時的年齡或某激素水平。
其他的影響因素(Z)可以是連續或分類,可以隨或不隨時間變化。
如果有多個層級的重複測量:例如每位患者做了多個周期,每個周期取多個卵。均可以採用重複測量數據分析。具體研究設計時,需要結合研究假設進行選擇。
GAMM和GEE在運用時,用默認設置,還有更多選項,具體請見易侕軟體幫助文件。
參考文獻
[1] Venetis, C.A., et al., Basal serum progesterone and history of elevated progesterone on the day of hCG administration are significant predictors of late follicular progesterone elevation in GnRH antagonist IVF cycles. Hum Reprod, 2016.
[2] Yland J, Messerlian C, Mínguez-Alarcón L, et al. Methodological approaches to analyzing IVF data with multiple cycles[J]. Human Reproduction, 2019.
[3] Malizia, B.A., M.R. Hacker and A.S. Penzias, Cumulative live-birth rates after in vitro fertilization. N Engl J Med, 2009.