Meta分析系列之一 :Meta分析的類型
原作者:曾憲濤、冷衛東、郭毅、劉菊英
證據是循證醫學 (Evidence—basedMedcine,EBM)的核心 ,基於隨機對照試驗 (RCT)的系統評價/Meta分析是當前公認的最高級別證據。近些年來 ,隨著Meta分析的不斷推廣,國內 Meta分析 大量湧現 ,這為臨床實踐提供了很好的支持。但因製作者的水平各異 ,使得Meta分析的質量良莠不齊,也給臨床實踐中使用者的選擇帶來了疑惑;再者,Meta分析只有真正走向臨床並正確的使用,才能體現其價值 ,而當前 Meta分析的應用較少。鑑於此 ,我們擬從 Meta分析的類型、相關軟體、原始研究 質量評價、報告規範、Meta分析 的質量評價等方面進行 一個系列的講解,以期為使用者提供參考。
本文作為第一篇 ,我們將對Meta分析的起 源和發展進行簡要回顧後,對 當前存在的Meta分析類型進行一個簡介。希望通過本系列 ,使相關的讀者能夠撰寫出較高質量的Meta分析並能將其在臨床工作中進行運用。
1起源及發展
Meta分析的起源最早可以追溯到著名統計學家 Pearson,他於 1904年在研究 「血清接種預防腸熱病的療效」研究中用這一方法將接種腸熱病疫苗與生存率之間的相關係數進行了合併;1907年,Goldberger製作 了特定的標準對所發表的有關傷寒桿菌尿毒症的文獻進行選擇及資料的提取分析,然後進行統計學分析 ,被認為達到了當今Meta分析的基本要求;1920年,著名統計、遺傳學家Fisher提出了「合併P值」的思想,被認為是Meta分析的前身;1930年開始,Meta分析開始廣泛應用了社會科學領域。
直到1955年,Beecher發表了醫學領域第一篇真正意義上的Meta分析,用以評價安慰劑的療效,並給予了Meta分析初步的定義;之後Meta分析在社會學領域再次得到發展,這一術語由英國教育心理學家 Glass 於 1976年命名並將其定義為 :「The statistical analysis of large collection of analysis results from individual studies for the purpose of integrating the findings.」此後,關於Meta分析的定義一直存在爭議 ,不少方法學家亦都對其下過定義,但都傾向於「Meta分析是對以往的研究結果進行系統定量綜合的統計學方法」這一含義。
如今,Meta分析在醫學領域應用最為廣泛,應用 最多的是對幹預性的隨機對照試驗的評價,在 觀察性研究和交叉對照研究中也得到推薦 。自 Archie Cochrane奠定 「循證醫學」思想以來,Meta分析已成為臨床證據的重要來源之一。
2. 單組率的 Meta分析
單組率的Meta分析,是一種只提供了一組人群的總人數和事件發生人數,不像其它類的Meta分析有兩組人群,多為患病率、檢出率、知曉率、病死率、感染率等的調查,基於的原始研究為橫斷面研究 (cross-sectional study)。
目前 ,對各獨立樣本中效應量為率的同類研究資料進行Meta分析並沒有比較成熟的方法,較常用的有以下幾種 :①加權計算:即根據每個獨立研究的樣本量大小,給予不同的權重,對各獨立樣本的效應量率進行合併;②直接等權相加 :即把各獨立的結果事件直接等權相加,然後直接計算合併率,再用近似正態法計算其可信區間 (95%可信 區間 =P±1.96Sp);③調整後再等權相加:即對各個獨立研究資料的率進行調整後再行等權相加,計算出合併率的大小。
對單組率的 Meta分析而言,最難的就是控制異質性 ,進行亞組分析和 Meta回歸分析是其重要的處理方法。
3 單純P值的Meta分析
1932年 ,著名統計學家 Fisher提出了「合併P值」的思想 ,被認為是 Meta分析的前身 。但在後期的應用中許多學者發現單純合併P值存在以下不足。 不同研究未能根據研究特點進行加權;無法獲知事件的發生信息,故無法得出有任何臨床意義的信息 ;③無法分析兩個結論相反的研究 ;④無法進一步評價研究之間的差異 。
因此,單純行P值的 Meta分析是不 推薦的 。但當納入研究僅給出了P值 ,且按照 Cochrane系統 評價員 手冊 給出計算方法也不能計算出需要的數據 ,且臨床實踐需要合併,那麼 ,在這種情況下可 以考慮單純對P值進行合併 。
4 Meta回歸分析
在 Meta分析時,需分析各研究間的異質性,並對 異質性的來源進行探討 ,Meta回歸 (meta—regression)分析可評價研究間異質性的大小及來源。一般認為,Meta回歸分析是亞組分析的一種擴大,主要通過對多因素的效應量進行聯合分析實現,僅當Meta分析納入的研究數量在10個以上時才行此分析」。
在 Meta回歸裡,將效應估計量(如RR、OR、MD或logRR等)作為結果變量,將可影響效應量大小的研究特徵因素(「協變量」或「潛在效應量改變因子」)作為解釋變量,則回歸係數描述了結果變量怎樣隨著解釋變量的單位增加而改變;其統計學差異性通過對結果變量和解釋變量之間有無線性關係來確定,通過回歸係數的P值來判斷這種差異有無統計學意義。
5 累積Meta分析
累積 Meta分析 (cumulativemeta—analysis)最早應用 於1981年,是指將研究資料作為一個連續的統一體,按研究開展的時間順序及時將新出現的研究納入原有 Meta分析的一種方法。因此,Meta分析每次研究加入後均重複一次Meta分析,可以反映研究結果的動態變化趨勢及各研究對結果的影響,也有助於儘早發現有統計學意義的幹預措施。
6間接比較的Meta分析
在臨床實踐中,經常會碰到沒有直接比較的證據或者需要從眾多幹預措施中選擇對患者最佳的措施,此時,研究者往往會從RCT中尋找間接證據,這就形成了間接比較的Meta分析或多種幹預措施比較的Meta分析 (網狀Meta分析)。
6.1 兩因素間接比較 若想比較兩種幹預措施 A與 B的效果,但當前沒有兩者的直接比較的RCT,卻有兩者同幹預措施 c的比較,此時,可以將 C作為公共比較組 ,藉助間接比較的方法得出 A與 B的效果 。
間接比較包括未調整間接比較和調整後間接比較。未調整間接比較是直接從 RCT中提取 A與 B的數據 ,此方法雖然簡單但對隨機性的破壞很大,故可能生較大偏倚從而高估療效,現已不推薦使用。調整後間接比較以 C作為公共比較組 (C可以是安慰劑或陽性對照組 ),與未調整間接比較相比其最大的的優勢是能夠在一定程度上保留隨機特性 ,且經過了同質性和相似相檢驗 ,因而偏倚較小 ,為當前推薦的方法 (圖 1)。
6.2網狀 Meta分析 在臨床實踐中 ,若有一系列的藥物可以治療某種疾病 ,但 RCT均是藥物與安慰劑的對照 ,而藥物互相之間的 RCT都沒有進行或很少 ,那麼在這種情況下 ,就需要將間接比較和直接比較的證據進行合併,即行網狀 Meta分析 (network meta—analysis)(圖 2) 。
進行網狀 Meta分析首要的是構造一個等級模型,以處理抽樣變異、治療異質性及研究治療比較間的不一致性,並提供模型的最大似然比。目前,主要的方法有經典的頻率學法和貝葉斯法 。頻率學法目前主要應用的有倒方差法和廣義線性 (混合)模型 。倒方差法即將各研究的方差倒數作為權重,對各研究效應進行加權平均,總體效應的方差為權重之和的倒數,操作相對簡單;廣義線性模型則考慮了隨機效應,但應用的前提是需要獲得受試者個體數據。貝葉斯法是基於貝葉斯定理而發展而來的,與頻率學方法相比,其優勢在於可以利用後驗概率對所有分析的幹預措施進行排序,且克服了頻率學法在參數估計時通過不斷的迭代去估計最大似然函數、易出現不穩定而得到有偏倚的結果的缺陷,故估計值更為準確 ,且建模更靈活 ,為當前所推薦的方法 。
7 診斷性Meta分析
因地區、個體 、診斷方法及條件的差異,使得發表的關於同一診 斷方法的研究結果存在著不同甚至是矛盾的;且隨著新技術的不斷走向臨床 ,選擇也愈來愈多。診斷性 Meta分析是近年來 出現的,並為「診斷試驗 準確性 研究的報告規 範(STARD)」指導小組 和「Cochrane協作網」所推薦 。
診斷性Meta分析主要是為評價某種診斷措施對目標疾病的準確率,多為對目標疾病 的敏感性、特異性進行評價,報導似然比、診斷比值比等。若是為了評價某種診斷措施對目標疾病的診斷價值,則一般納入的應為病例對照研究,對照組多為健康人群;此外,若是為評價運用診斷措施後對患者的治療效果或預後效果的改善作用,則納入的原始研究 應為RCT,這兩種情況下行Meta分析的方法亦與防治性研究的Meta分析相同 。
8 個體數據Meta分析
個體數據 (individual patient data,IPD)Meta分析是近年來發展起來的一種特殊類型,其不是直接利用已經發表的研究結果總結數據進行 Meta分析 ,而是通過從原始研究作者那 裡獲取每個參與者的原始數據,並對這些數據進行 Meta分析 。
與常規Meta分析相比,個體數據 Meta分析具有以下優點 :能夠最大限度的納入未發表的試 驗或灰色數據,能夠進行時間一事件分析 ,能夠更新長期隨訪的數據 ,能夠進行更複雜的多變量統計分析;但耗費大量時間 、資源等是其最大的缺陷。 目前 ,建立在 IPD基礎上的Meta分析被稱為系 統評價的金標準」 。
9 前瞻性Meta分析
前瞻性 Meta分析 (prospective meta—analysis,PMA)是指在 RCT的結果尚未出來之前,先進行系統檢索、評價和制定納入及排除標準的一種 Meta分析 。因 PMA是在研究 開始之前或者進行中就制定好 了計劃,可以避免各研究問出現較大的差異,同時具有個體數據 Meta分析的優點。當前認為,PMA是針對需要行多中心 、大樣 本研究但現實又不能實現的情況下的最有效方式,但成本非常高、操作困難且需要耗費大量的時間。
11其他類型 Meta分析
近年來 ,隨著方法學的研究 進展及循證實踐的實際需求,出現了許多上述未涉及到的 Meta分析,主要有:不良反應的 Meta分析,成 本一效果/效 用/效 益的 Meta分 析 ,患者報告結局的 Meta分析 ,全基因組關聯 研究的 Meta分析 ,Meta分析的匯總分析,等 。
結語:毫無疑問,高質量的證據是循證醫學實踐取得成功的重要支撐 ,高質量 的 Meta分析則是其重要的保障。隨著 Meta分析知識的普及及方法學的不斷改進與廣泛應用,其質量將進一步提高,從而真正為醫療衛生和預防實踐提供更 科學的證據 。
------------------------------------------------------
系統評價與Meta分析的類型及製作步驟
原作者:翁鴻,王穎,李柄輝,曾憲濤
系統評價與Meta分析是基於原始研究開展的,因此其類型可根據原始研究的設計分為不同的類型。不同類型的系統評價與Meta分析的製作步驟相似,不同的地方在於因原始研究特點及研究目的帶來的資料提取、方法學質量評價工具、報告內容、結果解讀上的不同。本文在上期在介紹系統評價與Meta分析的內涵及價值的基礎上,介紹系統評價與Meta分析的類型及製作步驟。
1 Meta分析的方法學
系統評價與Meta分析的類型不同,很大程度上取決與Meta分析的方法學進展。 每一種Meta分析類型的出現,都離不開相應的方法學支持。現代意義上的系統評價與Meta分析最開始是基於臨床隨機對照試驗(randomised controlled trial, RCT)的直接比較(direct comparison),後來應用於觀察性研究以探討疾病的發病率、患病率、危險因素、預後、診斷準確性等,再接著又發展到基於RCT的累積Meta分析(cumulative meta-analysis, CMA)、間接比較(indirect comparison)、網狀Meta分析(network meta-analysis, NMA) 和 試驗序貫分析( trial sequential analysis, TSA)等,以及根據實踐的需求進一步深化的方法。 領域亦從人體在體實驗、到離體實驗及動物實驗等。 圖 1 簡要展示了 Meta 分析的方法學進展。
2 分型的規則
本文對系統評價與 Meta分析的類型的下述劃分並非是嚴格獨立的,在不同的劃分規則中是存在交叉的關係的。
2.1 基於研究設計類型
一般可分為隨機試驗、非隨機實驗性研究、診斷。準確性試驗(diagnostic accuracy test, DTA)、隊列研究、病例對照研究、橫斷面研究、質性/定性研究、病例報導/系列、生態學研究、動物實驗、遺傳關聯性研究、真實世界研究及其他特殊類型的設計(如N-of-1試驗、巢式病例-對照研究、病例-隊列研究等)的系統評價與Meta分析試驗。
2.2 基於數據類型
按照開展分析基於數據類型的不同,可分為二分類數據、有序數據、連續型數據、效應量(或其對數) 及其可信區間/標準誤/方差、P值、相關係數、Cohen’s d值、Hedges’s g值、率值(如生存率、死亡率、發病率、成活率、依從率)、均數值等的系統評價與Meta分析。
2.3 基於證據獲取方式
按照證據的獲取方式,可以分為傳統的直接比較(亦稱為頭對頭比較,head to head comparison)、間接比較(indiret comparison)、網狀比較(network comparison)、累積(cumulative)、TSA、個體患者數據(individual patient data)、劑量-反應數據(dose-response)及前瞻性數據(prospective)等的系統評價與Meta分析;以及以系統評價/Meta分析為基礎的系統評價再評價/匯總評價。
2.4 基於研究領域按照研究領域的不同,可以分為臨床醫學、護理學、檢驗醫學、基礎醫學(動物實驗、基因遺傳研究、細胞研究等)、衛生經濟學、流行病學、生態學、教育學、心理學、經濟學、司法犯罪、社會科學等的系統評價與Meta分析。
2.5 基於研究目的
在醫學領域,按照研究目的的不同,又可分為預防、診斷、篩查、治療、病因、預後、不良反應等系統評價與Meta分析。
3 主要類型簡介
經典的頭對頭比較的系統評價與Meta分析及診斷試驗準確性Meta分析已廣泛使用多年,並從網際網路及會議上可獲取大量的內容。故本處重點介紹幾種新興的、理解難度大的方法。
3.1 間接比較Meta分析
在實際研究開展中,申辦方一般不會選擇強陽性幹預作為自己產品的對照組,更多的時候選擇的是安慰劑或能有足夠信心認為劣於自己產品的幹預作為對照。 因此,會出現如下情況:兩種或多種強陽性藥物之間沒有直接比較的RCT存在,或有但數量極少或質量很低。 在臨床實踐中,往往需要知曉多種陽性藥物的效果,這就導致傳統的頭對頭比較Meta分析無法滿足需求了。 這就催生了間接比較Meta分析的方法,於1997年正式提出。
間接比較能夠產生的前提在於RCT很好的控制了偏倚,是一種理想世界的研究,故可以通過找到兩者之間的橋梁,即通過A幹預與C幹預、B幹預和C幹預的結果,間接得出 A與B的相對效果的一種方法。 顯然,直接得出的A與 B的結果會存在一定的偏倚,譬如C的劑量不同,因此方法學家們進行了校正,同時需要首先判定這A vs.C 與B vs.C之間是否具有良好的同質性(homogeneity),也就是傳統Meta分析中的異質性(heterogeneity)。 當前,推薦使用的為校正後的間接比較以最大限度的保存隨機化。 橋梁一般是安慰劑。
當有3種以上幹預的時候,就可以產生更多的間接比較,見圖2。 在圖2 中,可以產生B vs.E、B vs.C、B vs.D、B vs.F、B vs.G、E vs.C、F vs.C、G vs.C、D vs.C、D vs.E、G vs. E、D vs.F、D vs.G和 E vs.G這些間接比較的結果。這些比較帶來了一個額外的問題,即傳遞性(transitivity)。也就是說B通過到A與 E比較了之後,還有沒有必要繼續與F及G比較以及在這個傳遞過程中帶來的風險有哪些? 這些都是未來研究亟待解決的問題。
3.2 網狀Meta分析
通過間接比較解決了缺乏有效直接比較證據的問題。 那麼,如圖2所示,在面對一個具體問題時,臨床醫生或決策者通常需要在眾多的幹預措施中選擇對具體患者最安全有效的措施,如諸多幹預中哪種幹預對目標疾病的療效最好、哪種方案性價比最高? 這些問題通過間接比較不足以解答,就催生了網狀Meta 分析方法。 網狀Meta分析方法於2002年正式提出。
網狀Meta分析又稱混合治療比較Meta分析( mixed treatment comparison, MTC)、多種治療Meta分析(multiple treatments meta-analysis)等。該方法是將直接比較和間接比較同時合併起來進行Meta分析,構成了一個網的形狀,亦即將圖2中的B與C、D、F、G中的一個或多個連接起來(代表B與它們之間有直接比較)形成的結果。顯然,當無閉合環存在時,只能做間接比較Meta分析;當有任何一個閉合環存在時,即可形成網狀Meta分析。 一項網狀Meta分析,可以都是閉合環,但常見的是閉合環與開合環同時存在。
因為網狀Meta分析是融合了直接比較與間接比較,那麼就需要考慮間接比較結果是否與直接比較結果相類似。 這就產生了該類Meta分析中必須要進行的步驟,即比較證據的一致性(consistency)。從圖2可以看出,B與E連接後形成的是三邊環、B與F連接後形成的是四邊環、B與 G連接後形成的是五邊環,還有可能形成五邊以上的環,那麼到底該認可多少邊環的結果也是當前尚無公認答案的問題。不管怎樣,三邊環是網狀Meta分析的基礎,故不一致性檢驗方法中其中一種是檢測環不一致性。
正確理解同質性/異質性、相似性(similarity)和一致性,是把握間接比較及網狀Meta分析的基石。同質性是指每項RCT的研究特徵與受試者特徵應相同,基於同一種處理比較類型的不同研究間;相似性是基於不同的處理比較類型之間;一致性是基於直接比較與間接比較之間。在網狀Meta分析中,即使傳統的Meta分析中存在非常大的異質性,相似性假設與一致性假設也可能成立。
3.3 序貫Meta分析
由於系統誤差(偏倚)和隨機誤差(機遇)的影響,Meta 分析可能會得出假陽性結果或高估幹預措施的效應量。此外,Meta分析的更新中,檢驗次數亦隨著納入新的RCT而不斷增加,使得隨機誤差進一步增大。再者,新的研究持續開展,Meta分析不斷更新,何時才能夠得到結論性的(conclusive)結論以停止相關研究、避免造成大量人力、物力和財力的浪費?顯然,需要探索新的分析方法。
累積 Meta分析常被用來觀察效應量隨特定順序(如發表時間等)變化的趨勢,以判斷當前所獲得的證據是否足夠、新的RCT是否應繼續開展。但其過程未能校正重複檢驗(重複檢驗會增加Ⅰ型錯誤風險),亦不能計算拒絕無效假設的統計檢驗效能。
藉助於序貫試驗(sequential trial;亦稱序貫分析,sequential analysis)的思路與方法,1997年被引入到Meta分析中以計算Meta分析的界值,即最優信息量(optioanal information size, OIS)。 丹麥哥本哈根臨床試驗中心小組在此基礎上進行了延伸,提出了TSA方法和期望信息量(required information size, RIS)的概念,是當前最為常用的序貫Meta分析方法。
序貫Meta分析具有以下優點:(1)具有終止無效假設的標準;(2)可量化統計效能;(3)點估計和區間估計均可進行多重檢驗校正;(4)可增加效率,即無效/有效假設均有接受的標準,可達到倫理學和經濟學上的優化。
3.4 劑量-反應Meta分析
在流行病學研究中,經常評價某暴露因素水平的增加(或降低)與某疾病發病風險的關係是否符合線性劑量反應(效應)關係(dose-response relations),即隨著劑量的增加或減少對結局指標的影響。 基於這種類型原始研究開展的Meta分析即為劑量反應Meta分析(dose-response meta-analysis)。
劑量反應關係研究的數據主要有3種類型:病例對照型數據(case-control data)、發病率型數據(incidence-rate data)和累積發病率型數據(cumulative incidence data)。對於劑量反應型研究,效應指標根據研究設計的類型及主題,在危險比(risk ratio,RR)/比率(rate ratio,RR)、比值比(odds ratio, OR)或風險比(hazard ratio, HR)中選擇合適的指標。
對於劑量反應數據,傳統的的Meta分析是將其按照分層模型(category model)進行處理,即按照暴露水平,分為高比低兩組,或者高比中比低的多分層形式。 這種方法不僅各層數據的暴露劑量在不同研究中存在差異,並且由於分層後會導致每層數據的樣本量減少,大大降低了結果的準確性及統計把握度。 當前推薦使用基於方差加權最小二乘法(weighted least-squares, VWLS法)或廣義最小二乘法(generalized least squares for trend, GLST法) 進行估計的線性模型、基於限制性立方樣條(restricted cubic spline)回歸模型進行估算的非線性模型。
開展劑量反應關係Meta分析的研究思路大致如下:確定研究的目標後,一般先收集暴露與疾病的病例對照和隊列研究,在每個病例對照或隊列研究中挑選出最高劑量組相對於最低劑量組的RR或OR 值及其95%CI進行Meta分析合併,得到一個匯總的RR或 OR合併值;然後,再進一步進行劑量反應關係Meta分析探討這種關聯是否存在劑量反應趨勢。具體操作時還存在模型的選擇。
3.5 整合
質性研究的系統評價 ( qualitative systematic review)又稱為質性研究整合,是指對基於質性研究產出結果所進行的二次整合與評價。 Meta 整合(metasynthesis)即為此過程中,對同類的質性研究資料進行收集、理解、比較、分析和歸納,形成更為全面和深入地反映現象實質的、新的、綜合性的解釋或結論的方法。該方法於 2004 年提出,主要用於護理領域質性研究結果的整合。
Meta 整合分為匯集性整合 ( integrative oraggregative synthesis ) 和解釋性整合 ( interpretive synthesis)。 其步驟主要分為 6 大步: 制定計劃書,文獻資料的篩選及質量評價,資料提取,結果整合,整合結果的解釋與傳播,整合結果的質量評價。
3.6 動物實驗的系統評價
動物實驗與臨床研究一起被認為是現代醫學研究的兩條基本途徑,是連接基礎研究和臨床試驗的重要橋梁,其結果直接影響著許多領域研究課題成果的確立和水平的高低。 動物實驗與臨床研究的偏倚風險來源類似,只是在某些具體實施方面略有差異。 開展動物實驗的系統評價與Meta分析被認為是探索提升動物實驗對臨床研究指導價值的有效途徑,主要目的有:(1) 後效評估動物實驗,回顧性比較動物模型是否使用得當。(2) 降低將動物實驗所獲結果引入臨床的風險,可在即將開展的臨床試驗中計算效能時增加估計療效的精度,降低假陰性結果的風險,可用於決定動物實驗結果何時可被臨床接受,以終止不必要的臨床試驗,更好地促進動物實驗向臨床研究轉化。 其與臨床研究的 Meta分析不同之處在於方法學質量評價工具及動物自身的一些特點,如種系、模型等方面。
3.7 四大專業性系統評價
四大專業性系統評價是指 Cochrane 系統評價( Cochrane Systematic Review )、 JBI 系 統 評 價(Joanna Briggs Institute Reviews)、Campbell 系統評價( Campbell Systematic Reviews) 和 CEE 系統評價。 這些系統評價從標題開始就要強制性進行註冊,並在其對應的機構指導下、遵照手冊進行製作。
Cochrane 系統評價是由 Cochrane 協作網組織製作、由系統評價小組( Cochrane Review Group,CRG)負責實施,並定期發表於 Cochrane 圖書館。製作完成的系統評價優先發表於 CDSR(CochraneDatabases of Systematic Review)、亦可在得到相關的CRG 批准後發表於其他刊物。 更多相關信息請參閱 https: / / www.cochranelibrary.com/ 。
JBI 系統評價是 Joanna Briggs 循證衛生保健中心發起並管理製作的,製作完成的系統評價優先發表於 JBI 圖書館,亦可發表在同行評議期刊 InternationalJournal of EvidenceBased Health Care。 更多相關信息請參閱 http:/ / joannabriggs.org/ 。
Cochrane 協作網的姊妹組織 Campbell 協作網(C2)成立於 2002 年,協作網宗旨是和 Cochrane 協作網建立合作,為社會、心理、教育、司法犯罪及國際發展政策等非醫學領域提供科學嚴謹的系統評價和決策依據。 Campbell 系統評價即為在該組織管理指導下生產的系統評價,優先發表於 Campbell 圖書
館[。 更多相關信息請參閱 https: / / www.campbellcollaboration.org /
環境證據協作網( the collaboration for environmental evidence, CEE)是全球可持續環境和保護生物多樣性領域中的科學家和管理者工作的開放性社區組織,致力於合成與環境政策和實施最相關的證據。 CEE 系統評價即為在該組織管理指導下生產的系統評價,優先發表於 CEE 圖書館及其官方刊物Environmental Evidence 雜誌[9]。 更多相關信息請參閱 http: / / www.environmentalevidence.org / 。
4. 製作步驟
有較多文獻介紹了系統評價與 Meta 分析的製作步驟,其中以 Matthias Egger 等 2001 年出版的第 2 版Systematic reviews in health care: Metaanalysis incontext 中所提出的步驟和 Cochrane Handbook for Systematic Reviews of Interventions 中提出的製作步驟最為常用。
前者將系統評價的製作分為了 8 個步驟: (1) 提出要評價的問題;(2) 確定納入和排除標準(研究對象,幹預及對照措施,結局指標,研究設計和方法學質量);(3) 查找研究———制定檢索策略(應包括:The Cochrane Controlled Trials Register/ CCTR,CCTR 未涵蓋的電子資料庫及試驗註冊庫,檢索納入研究的參考文獻,檢索關鍵的期刊,聯繫本領域的專家);(4) 選擇研究(至少兩位評價員獨立選擇,制定解決分歧的策略,記錄排除的研究及其排除的原因);(5) 評估研究的質量(至少兩名評價員獨立評價,使用簡明的清單而非質量量表,每次都要評價分配隱藏、盲法和失訪,評價員評價時應隱藏研究的作者、單位及發表的期刊);(6) 提取數據(設計數據格式並進行預提取,考慮至少兩名評價員獨立提取,考慮對評價員隱藏研究的作者、單位及發表的期刊);(7) 分析和表達結果(列表描述每個研究的情況,審查森林圖,探討異質性的可能來源,考慮整體研究的 Meta 分析及各亞組的 Meta 分析的結果,進行敏感性分析並審查森林圖,提供排除研究的清單供對排除研究感興趣的讀者參考);(8) 解釋結果(考慮本研究的局限性,包括發表偏倚等相關的各種偏倚,考慮證據的強度、適用性、利/ 弊的需治療人數、經濟學意義及對未來研究的啟示)。
Cochrane Handbook for Systematic Reviews ofInterventions 中則將系統評價的製作分為了 10 個步驟: (1) 提出要評價的問題;(2) 制定研究的納入及排除標準;(3) 制定檢索策略並檢索研究;(4) 篩選研究和收集資料;(5) 評估納入研究的偏倚風險;(6) 分析數據並在適合的情況下進行 Meta 分析;(7) 解決報告偏倚;(8) 陳述結果和製作結果摘要
表格;(9) 解釋結果與得出結論;(10) 完善和更新。上面兩種步驟均為為基於 RCT 的系統評價設計的,但其他類型的系統評價與 Meta 分析亦可以遵照此步驟。
5 結 語
製作高質量的系統評價與 Meta 分析是其價值的保證,而製作的一個前提是掌握步驟及各種類型,並根據目標選擇最合適的類型。 譬如,基於 RCT 製作更新的直接比較的系統評價與 Meta 分析,可優先考慮選擇序貫 Meta 分析;若 RCT 涉及到了不同的用藥劑量,那麼則可考慮開展網狀 Meta 分析以比較不同劑量的效果。 若是針對劑量反應數據的觀察性研究探討危險因素時,可考慮轉化成傳統的二分類數據的系統評價與 Meta 分析,亦可以直接開展劑量反應Meta分析。 此外,四大專業性系統評價也是相關領域初學者應給予關注的,這些系統評價均在其官網上給出了詳細的製作手冊,並有專人負責指導,這對於入門者來說是非常寶貴的資源。