Meta分析已經成為現在臨床決策中非常關鍵的一部分,而網狀Meta分析作為Meta分析的拓展,也在近些年被大力發展並應用於臨床決策。為了區分,我們通常稱傳統Meta分析為pairwise Meta分析,其應用在僅有兩種幹預比較的情況下。而當幹預超過兩種時,pairwise Meta分析則不再適用,此時需要引入新的比較方法,即間接比較(indirect comparisons)。
當我們有兩對幹預比較(A vs B、A vs C)的數據時,間接比較B vs C很自然的就產生了,表示為AB直接比較的結果(dAB)減去AC直接比較的結果(dAC),即
的確,我們可以通過AB、AC的數據來獲得BC比較的數據,但這卻不是最主要的目的。事實上,更多的情況是需要得到這三種幹預中哪一個是最優的。而為了進行這些比較,我們需要一個假設,即不同試驗中的效應量(如RR、RD等)在適合的尺度下必須相對穩定,儘管它們中每一組的response rate本身會變化。這是整個Meta分析中最基本的假設,也就是所謂「同質性假設」。
到此為止,我們進行的比較都非常簡單,然而,當出現環路結構(loop)時,情況則變得複雜了一些。如圖1中的閉合環路結構,假設我們有兩個dBC的來源:(1)來自B vs C的直接比較數據,即關於BC的RCT,(2)來自AB、AC的間接比較數據。此時我們需要將dBC的兩個來源數據合併,形成一個合併值。同時,我們也可以測試這兩個來源數據即直接比較和間接比較的一致性。
圖1
網狀Meta分析的首要任務則是簡單的將所有數據合併,通過某種「一致」的方式。那麼什麼是「一致」呢?回到圖1中,假設現在分別進行3個不同的pairwise Meta分析,分別得到3個不同的結果:
然而,這三個結果並不能得到一個一致的決策來決定誰是最優的幹預。一個簡單的例子假設A、B、C三個人的體重比較為:A比B重2kg,B比C重3kg,那麼我們應該得知A比C重5kg。然而此時我們又得知A比C僅重2kg,那麼我們無法得出哪個人最重,因為出現了不一致。
同理,在剛剛3個分開的pairwise Meta分析中,我們需要的不是那3個直接比較的且不一致的結果,而是需要3個一致的估計,同時它們滿足:
事實上,網狀Meta分析即是一種「得到一致估計的方法」,因而得到一致的決策。在某種意義上,pairwise Meta分析和間接比較都是網狀Meta分析的特殊例子。
如前所述,間接比較是兩個直接比較的差,即dBC=dAC-dAB。而間接比較的方差估計則是兩個直接比較方差的和,因為不同試驗中涉及不同研究人群且相互獨立,即:
因此,間接比較的方差永遠大於其中任意一個直接比較的方差,且隨著其成分數量增加,方差會變得很大。
此時,將上述計算繼續拓展,當同時存在直接比較和間接比較時,我們可以將二者合併為一個估計值。例如,假設在三角環路結構中(同三角形),存在3個試驗,分別為幹預A vs B、B vs C、A vs C。我們可以分別計算3個pairwise Meta分析合併值和相應方差,即:
此時對於dBC來說有兩個估計來源,即直接比較和間接比較,使得我們需要對其進行合併,例如使用倒方差加權(inverse-variance weighting, IV):
同理,我們也可以計算出其餘兩對比較的合併值。此時相比於最開始不一致的3個直接比較而言,我們得到了3個一致的合併值。儘管整個過程需要重複3次,但是我們仍然可以通過簡單的電腦程式去運算。
然而,當幹預數量增加時,需要計算的直接比較pairwise Meta分析估計值數量便飛速向上增長,例如幹預數量為3、4、5、10、30,則相應pairwise估計值數量為3、6、15、45、445,即S(S-1)/2,因此,整個過程變得非常繁瑣。所以,我們需要的是一個能同時計算全部數據並產生一致估計值的方法,以及檢驗每個幹預的直接比較和間接比較之間是否具有一致性。這便是網狀Meta分析的核心內容。
前述提到網狀Meta分析是pairwise Meta分析的拓展,因此,當說到網狀Meta分析時,首先應該說的是pairwise Meta分析的假設,即同質性假設。意思是同一幹預比較中不同RCT的效應量應該是近似一致的,僅有的差別是由於隨機誤差導致的。簡單來說就是不同RCT之間「不存在效應修飾的作用」。
那麼在網狀Meta分析中,同質性假設變為:在試驗A vs B中,dAB的值應該等於,在試驗A vs C或B vs C等試驗中假如存在幹預A vs B時dAB的值。當然,如果是隨機效應模型,同質性假設變為:在試驗A vs B中存在不同的di,AB的值(即trial-specific effect),每一個值都是抽樣自指定的隨機效應分布,這個分布的均值是dAB,方差是σAB2。且如果其他試驗(AC、BC等)包含AB,那麼它的估計值dj,AB也抽樣自同一隨機效應分布。
上述同質性假設也可以從另一個角度來理解,假設現在全部RCT均是多臂試驗(multi-arm trials)且幹預有ABC等,然而,由於某些原因,其中僅一部分幹預報告了,其餘幹預均被隨機丟失(missing at random,rubin 2002)。因此,幹預AB是同質的。
如前所述,這個同質性假設是全部類型的Meta分析均存在的,並不僅僅局限於網狀分析中,因此,試圖以此為藉口僅攻擊網狀Meta分析是站不住腳的,除非連pairwise Meta分析一起質疑。這是另一個話題,在此不多說了。
同質性假設的存在時刻提醒我們,在納入文獻時要「小心」,制定的納排標準要儘可能使研究同質。當然,也使得我們開發出一系列方法來減輕異質性帶來的問題,如covariate adjustment和bias modelling。
對於納入研究的數據也會存在各種各樣的潛在問題,例如研究人群與臨床僅部分相關(即外部真實性),試驗本身可能出現隨機分配失敗、盲法失效、失訪數據等等(即內部真實性)。
通常情況下,我們可以對它們的質量進行評估,如Cochrane Risk of Bias tool評價RCT質量。
但是評估質量的局限性在於,其無法對現存數據的缺陷進行改變,只能通過降級的形式來表現。而我們這裡需要的是通過系列方法減輕這些缺陷,從而基於現有不完美的證據得出最優解。
首先,我們需要熟悉網狀Meta分析的所有假設,在此基礎上盡最大可能使收集的數據滿足這些假設,同時這些數據需要直接回答臨床決策問題。第二,當分析時出現一些不可避免的效應修飾時,我們通過多變量meta回歸的方法校正協變量。第三,當出現一些潛在的偏倚時,使用bias adjustment的方法進行處理。
當我們做網狀Meta分析時,理論上可以把全部幹預涉及的所有RCT都納入進來,但是這樣做會產生一系列問題。在評價一種新藥時,有兩種不同的方法比較,其一是將新藥和一種或多種標準幹預相比,如果新藥更好或更cost-effective,那麼就做一個推薦。其二是將新藥和所有標準幹預以及所有相互競爭的其他新藥相比,然後選其中最好的藥。
這兩種方法是截然不同的,例如我們的「選擇最好」方法,將全部標準藥與全部新藥共同比較,如果這樣,最終的決策體系也需要基於這種比較空間,也就是基於相同的試驗集和相同的網狀Meta分析。然而,這種情況下,「證據空間」和「決策空間」並不能很好的相容或保持一致。事實上,我們「選擇最好」的過程並不應該基於全部幹預,相反應該基於與臨床決策相關的幹預進行。
但是,當我們僅納入臨床決策相關的幹預時,並不一定總能成網,也就是幹預和幹預之間可能是兩個分離的小網狀結構,或分離的幾個網狀結構,這種情況也很不理想。因此,我們這裡給出一個選擇準則:
(1)首先找出全部臨床決策相關的幹預。
(2)找出決策相關幹預的全部試驗。
(3)將多臂試驗中不相關的幹預去掉。如果此時依然成網狀結構,則結束。
(4)如果上述無法成為網狀結構:a)尋找在兩個分離的網狀結構中共有的幹預比較。b)納入這些比較。c)重新執行步驟(2)、(3)。
這個步驟可以保證識別出相關臨床決策面的最小試驗集,當然,也並不能保證幹預之間一定成網狀結構。同時,選擇的過程依然保留了主觀的意願,因此目標人群的選擇仍然需要領域內相關知識的結合。
在這裡首先需要強調,我們的網狀Meta分析全部基於隨機對照試驗(RCT),儘管我們後面還會介紹一些bias modelling的方法使得可以校正一些潛在的偏倚。此外就是通常我們會使用multiplicative scale的效應量(如RR、OR),也就是意味著我們不能納入單臂試驗。除上述外,網狀結構的建立其實就是如何定義幹預和結局的問題。在pairwise meta中,我們通常使用PICOs的框架來制定,然而在網狀Meta中我們需要適當的對I、C、O進行修改。
在pairwise meta中,有時會把一些「不太一樣」的幹預進行強行合併,以達到納入足夠的研究進行定量分析的目的。在網狀Meta中,天然的可以分析多種不同幹預,或者相似的幹預也可以全部分開進行分析。如在一般網狀Meta中,所有不同的幹預、不同的劑量、不同的組合,均視為不同的「幹預單元」,並且地位相等。
這樣做的問題在於,當不同幹預之間劃分越細,無法連成網狀結構的風險越大。通常情況下,我們可以使用一些特殊的方法來處理,例如dose-response model、treatment combination models、class effects models。這些方法有時可以極大的減少被估參數的數量,從而增加統計功效。
5.2 多重結局另一種增加網狀結構連接的方法是納入多個彼此相關的結局進行分析。通常一些試驗會同時報告一個結局在多個隨訪時間點的值,然而,當我們限制在僅估計其中一個特定的結局時,結果可能會非常稀疏,或者無法連網。但當我們可以同時使用多個結局的信息時,連接更緊密效率更高的模型將可以被使用,然而這樣的模型也並非很容易建立,在這裡就不多論述了。
5.3 網狀結構的大小理論上,越大的網狀模型,結果越穩健。然而,當納入大量不同的試驗時,人群異質性也會相應增加。當異質性增加時,模型中研究間方差也會增加,最終降低估計的精確性。除此之外,異質性也可能導致直接比較和間接比較之間的不一致性。所以這也是需要權衡的一點。
附1:網狀Meta分析的小歷史「Network meta-analysis」這個詞最早在Lumley(2002)的文章中提出,當然還有一些其他的叫法,如mixed treatment comparisons、multiple-treatments meta-analysis。網狀Meta分析的雛形可以追朔到1992年Eddy的Confidence Profile Method,其中同時使用了間接比較和類似於網狀比較的「chain of evidence」。另一個網狀Meta的分支源於Cooper and Hedges(1994)的書Handbook of Research Synthesis,其中一個章節,Gleser and Olkin描述了合併多個試驗中多種幹預的一個方法。
除此之外,Heiner Bucher和Gordon Guyatt等(1997)一起討論了meta分析中的直接比較和間接比較。
而在1年前,Julian Higgins和Anne Whitehead(1996)提出了兩種不同的策略,其一是在隨機效應模型中使用外部數據來估計異質性參數,另一個是針對指定幹預比較對直接比較和間接比較結果進行合併,同時基於假設它們可以估計相同的參數。事實上這個想法最終形成了網狀Meta分析的核心模型(Lu and Ades, 2004, 2006; Ades et al, 2006),因此是非常具有意義的。
附2:一些題外話
現在做網狀Meta分析的人越來越多,通常大家就是簡單的將數據扔進程序中,跑一下然後出來看結果。然而,對它背後的原理卻不是很清楚,以至於可能會出現各種各樣潛在的問題。作為醫學生,雖然並不需要完全了解模型背後的全部機制,但也不能完全不了解。很多情況下,模型的機制和假設是與臨床意義息息相關的,比如我們應該如何解釋有異質性時的結果,或存在不一致性時的結果,以及應該如何處理以減輕它們的影響。
如果順利的話,這個網狀Meta分析的介紹可以寫成一個系列文章,系統的講述一下網狀Meta分析中的全部內容。事實上,這個系列文章並不準備寫如何「做」一個網狀Meta分析,做網狀Meta分析的軟體或程序有很多且操作簡單,並不需要我多說,因此,本系列文章準備著重寫一下網狀Meta分析背後的原理和一些方法,以及為什麼它可以支撐臨床決策。
References
1.Ades, A. E. & Sutton, A. J. 2006. Multiparameter evidence synthesis in epidemiology and medical decision making: current approaches. Journal of the Royal Statistical Society: Series A (Statistics in Society), 169, 5–35.
2.Bucher, H. C., Guyatt, G. H., Griffith, L. E. & Walter, S. D. 1997. The results of direct and indirect treatment comparisons in meta‐analysis of randomized controlled trials. Journal of Clinical Epidemiology, 50, 683–691.
3.Cooper, H. & Hedges, L. 1994. The Handbook of Research Synthesis, New York, Russell Sage Foundation.
4.Dias, S., Ades, A. E., Welton, N. J., Jansen, J. P., & Sutton, A. J. (2018). Network meta-analysis for decision-making. John Wiley & Sons.
5.Eddy, D. M., Hasselblad, V. & Shachter, R. 1992. Meta‐Analysis by the Confidence Profile Method, London, Academic Press.
6.Higgins, J. P. T. & Whitehead, A. 1996. Borrowing strength from external trials in a meta‐analysis. Statistics in Medicine, 15, 2733–2749.
7.Little, R. J., & Rubin, D. B. (2019). Statistical analysis with missing data (Vol. 793). John Wiley & Sons.
8.Lumley, T. (2002). Network meta‐analysis for indirect treatment comparisons. Statistics in medicine, 21(16), 2313-2324.
推薦醫咖會專欄課程《缺失值的處理和常見研究類型的統計分析》!
講解缺失數據的核心處理方法及SPSS操作,以及病例對照研究和RCT的統計分析思路。
使用電腦,打開醫咖會,觀看專欄視頻:
https://www.mediecogroup.com/zhuanlan/courses/7
關注醫咖會,及時獲取最新統計教程
點擊左下角「閱讀原文」,查看全部免費統計教程。或者使用電腦打開網址:http://www.mediecogroup.com/,分類查看全部統計教程。