原作者:凌莉 韓璐
Meta分析一詞最早由教育心理學家Glass GV於1976年命名。1991年, 由Fleiss和Gross給Meta分析作的定義恰如其分地概括了Meta分析的特點:「Meta分析是一類統計方法,用來比較和綜合針對同一科學問題所取得的研究結果,比較和綜合的結論是否有意義,取決於這些研究是否滿足特定的條件」。有關 Meta 分析的統計分析方法 、應用、一些存在的爭議和待解決的問題國內外均有報導。本文主要就Meta分析的優點以及正確應用的注意事項作一介紹。
1. Meta分析的優點
1.1 引入了定量的概念——效應尺度(effect magnitude)
傳統的文獻綜合研究是合併假設檢驗,其結果只能得出「有差別」或「無差別」的結論。Meta分析合併的統計量——效應尺度(常為相關係數,優勢比,對照組與實驗組的標準化差值),可給出處理效應大小的定量結果,且各研究的效應尺度可進行對比,提高了準確性,更具實際意義。
1.2 客觀
傳統的綜述由於作者的一些主觀看法及興趣不同而產生不同的結果。Meta分析有一定的「程序」,有章可循,能使結果的客觀性增強。高質量的Meta分析由於客觀性強,在解決研究結果不一致的問題上的說服力較強。
1.3 增大統計學功效
合併可增大樣本量,從而增大統計學功效,所以Meta分析對於合併那些統計學功效較小或效應較小的研究非常有用。
1.4 解決獨立研究不能解決的問題
當各研究結果不一致時,可運用亞組分析(subgroup analysis),將可能影響處理效應的因素分組,從而找出差異的原因,加深認識,並提示今後研究的方向。
2. 有關meta分析的主要爭議
基於Meta分析的眾多優點,它在醫學中的應用越來越廣泛,應用中也存在一些爭議,主要有:
1)把一些在研究人群、實驗設計和質量控制等方面有差別的研究合併是否合理?
2)把陽性結果和陰性結果合併,是否會掩蓋矛盾,阻礙進一步研究?
3)大規模的完全隨機對照(RCT)結果存在矛盾時是否可應用Meta分析?
4)各種偏倚對結果的影響等。
由於Meta分析常常帶有決策性分析的性質,因此Meta分析的質量很重要。進行Meta分析要遵循一定的程序,採用正確的方法,以儘可能揚長避短。
3 進行Meta分析須注意的問題
3.1 前言部分
1)明確研究目的。目的應簡單明確,除了研究本身的意義外,更應指明在解決爭論問題、提示今後研究方向和指導實踐方面的意義。
2)描述所研究的人群及Meta分析結果可適用的人群。人群可通過臨床診斷、人口統計上的分類(如年齡、職業)或根據不同的處理因素來定義,解釋結果時應注意這一點。
3.2 分析過程
1)系統、全面地查找相關文獻。系統、明確地識別與研究問題有關資料的過程是Meta分析的重要特徵,不但有助於減少偏倚,且使Meta分析的結果有較好的再現性。
① 定義研究中涉及的一些變量。如觀察指標、觀察對象和觀察終點。這些定義應儘可能具體,可操作性強。
②指明查找的文獻覆蓋的時間。
③制定完善的查找策略。儘可能查找進入及未進入資料庫的文獻;一般多個策略比單一策略有較好的查全率。
在查找文獻過程中的偏倚為抽樣偏倚(sampling bias),包括發表偏倚(publication bias),索引便宜(indexing bias)和查找偏倚(search bias)等。其中發表偏倚對Meta分析的結果產生較大影響,特別是以小樣本研究為主時,常使合併效應被高估,因此,應對發表偏倚進行識別和控制。
通常評價發表偏倚的方法是計算失效安全數(fail-safe number),也就是要有多少個陰性結果才能改變Meta分析的結果。在較大規模的分析中,還可應用「漏鬥圖」(funnel plot)來定性觀察進入Meta分析的一批研究是否存在發表偏倚。
2)制定納入和排除研究的標準,確定要分析的文獻。
制定標準的目的是儘可能減少選擇偏倚(selection bias),選擇偏倚也是影響Meta分析結果的重要原因。選擇偏倚包括入選標準偏倚(inclusion criteria bias)和選擇者偏倚(selector bias)。標準應儘可能詳細,才能保證有一定質量的研究入選,使結果具有一致性。
選擇的標準主要應從以下幾方面考慮:
①研究對象:對納入Meta分析研究對象的疾病類型、年齡、性別、病情嚴重程度等均應作出規定。
②研究設計類型:研究是否有對照,是否採用盲法,是回顧性研究還是前瞻性研究都會影響各研究的同質性,都會影響各研究的同質性,應選擇相同類型的資料進行Meta分析。
③暴露或幹預措施:在制定文獻選擇標準時,必須明確觀察性研究中暴露因素、臨床試驗中幹預措施的劑量和強度、病例的依從性等,還要考慮不同研究中暴露或處理的一致性。
④研究結局:納入的研究的結局變量必須有較好的一致性,一般應選擇可以量化的、具有可比性的療效指標或觀察性研究中的相對危險度、優勢比、危險度差值、均數之差等。
⑤研究開展的時間或文獻發表的年份和語種。不同時代的研究可能因為當時的技術水平而存在差異,因此應明確研究的年份和發表年份。
⑥樣本大小及隨訪年限。一些小樣本的研究可能不符合大樣本的近似條件,因此應規定樣本量大小。對一些隨訪研究,隨訪年限直接影響結局變量,應規定隨訪年限。也可以通過敏感性分析,分別探討不同樣本量和隨訪年限時Meta分析的結果是否一致。
對於選擇者偏倚,可由2個或2個以上選擇者根據一個標準選擇,比較結果,取得一致。
列出被排除的研究及排除原因,可以使其他的研究者對Meta分析選擇文獻的過程的偏倚大小得出自己的看法。
3)資料的提煉。在入選的研究中獲得精確數據,可能產生的偏倚為研究內偏倚(within study biases)。提煉內容應該全面準確,比如發表時間、抽樣大小、研究質量評價、持續時間、劑量大小、研究設計以及各個單獨研究的有關結局、特徵等資料。尤其應包括合併結果所要用到的數據資料,如各研究實驗組和對照組樣本量、均值、方差、合併方差、效應尺度等。提煉過程也包括計算一些新的指標,如效應尺度加權合併結果,並將這些資料列表說明。
4)統計學分析。把獨立研究的結果用統計學方法合併是meta分析的又一重要特徵。對於離散型變量資料、連續性變量資料、診斷實驗資料、連鎖分析資料,有不同的分析方法。Meta分析常用的方法有固定效應模型(fixed-effects model)和隨機效應模型(random-effects model)。固定效應模型應用最廣,包括適用於效應尺度是優勢比、相對危險度和率比的Mantel-Haenszel法(Mantel-Haenszel,1959),Peto法(Yusuf,1985,即改進的M-H法)及效應尺度是率比和率差的Wolf法(General variance-based methods, Wolf,1986)。目前對模型選擇比較一致的看法是:如果進行Meta分析的研究間同質性(homogeneity)較好,選用何種模型對合併效應估計的影響不大,如果研究間存在異質性(heterogeneity),則應選用隨機效應模型。1990年DuMouchel提出了分層貝葉斯模型(hierarchical Bayesian model)Meta分析方法來解決一般隨機效應模型不能解決的數據極端值較多的問題,近年來Meta分析的貝葉斯方法受到重視,有研究表明經典模型(特別是固定效應模型)可能導致總效應以及個體效應的不確定性的過低估計。由於傳統Meta分析只作一次綜合分析,雖能綜合反映研究結果,但不易辨明先前每個研究結果對綜合結果的影響,有學者提出了累積Meta分析方法(Cumulative Meta-analysisi)。
3.3 結論部分
1)得出估計效應大小及方向的指標及其可信限。
2)將各個獨立研究的結果及Meta分析的結果用圖表表示。典型的圖是將各個獨立研究和Meta分析的優勢比及其95%可信限作圖。
3)敏感性分析。敏感性分析中,觀察排除一些研究之後對結果的影響。如果影響較小,說明分析的結果代表性較好。一般地說,那些大規模、高質量或有最新的研究成果的文獻,對meta分析結果影響較大。
3.4 討論
1)討論獨立研究的異質性。異質性不僅和模型選擇有關,當異質性的程度大於隨機變異,對異質性來源的討論比對Meta分析結果的解釋更重要。
2)討論Meta分析結果所代表的人群及其可推廣的人群。研究人群間的差異會對Meta分析結果的解釋帶來困難。如以住院患者為基礎的研究結果如何能反映門診患者的狀況呢?為了保證Meta分析的作用,必須明確適用的人群。
3)討論結果的意義。同其它所有的研究一樣,Meta分析結果對於科學研究及衛生保健工作的意義也要討論。包括:將某些結果用於實踐的證據是否充分;在何種處理水平上其益處大於危險性;對估計效應的大小及其精確性的評價。
4 一些不恰當的情況
目前,各種刊物上發表的有關Meta分析的文章越來越多,從已查閱的文獻來看,不恰當應用Meta分析的情況或者說在應用Meta分析時不夠規範的情況有:
1)文獻資料檢索方法不是很全面:部分研究只發表了發表或通過計算機檢索能收集到的資料,而未收集一些需人工檢索的資料、學術會議資料和未發表的資料。
2)未描述研究的人群及可推廣到的人群。
3)未列出排除文獻的標準及排除的原因。
在應用Meta分析方法時,應嚴格按照一定的程序及規則,避免不恰當應用,這樣才能保證Meta分析發揮其應有的作用。