上期我們談到了系統綜述和Meta分析的常用軟體工具,今天我們就來重點解析一下Meta分析的方法步驟。
Meta分析是對具備特定條件的、同課題的諸多研究結果進行綜合的一類統計方法,通常用於支持研究經費申請,指導臨床實踐和健康政策。
由於用於計算Meta分析的軟體和腳本的廣泛可用性,Meta分析可能會在已發表研究領域中以指數增長的形式持續下去,比如在心理科學中的運用(圖1)。。
圖1. 心理科學中的Meta分析
本文的目的是提供一個簡短的Meta分析非技術性入門,以指導讀者完成從預註冊到結果發布的整個過程。
在心理學中發表最多Meta分析的25種期刊中,超過一半建議使用PRISMA指南,或相關Meta分析報告標準(MARS)(圖2)。因此,本文將演示如何按照PRISMA指南進行Meta分析。本文提供了一個補充的R腳本來演示論文中描述的每個分析步驟,該步驟很容易適應研究人員用於他們自己的數據分析。
同時還強調了Meta分析聲明和預註冊的重要性,以提高透明度並幫助避免意外重複。更好地理解這個工具不僅可以幫助科學家進行他們自己的Meta分析,還可以改善他們對已發表Meta分析的評估。
圖2. 發表最多Meta分析的心理學期刊
一、Meta分析聲明和預註冊
預先登記Meta分析聲明的主要好處是雙重的。首先,預註冊過程迫使研究人員為特定研究問題制定研究理論基礎;其次,預註冊通過提供先驗分析目的的證據有助於避免偏倚。
在Meta分析的情況下,可以在已知結果以適應廣受歡迎的結果或減少發表偏倚的證據後調整入選標準。PRISMA(PRISMA-P)指南提供了報告Meta分析聲明的框架。這些指南建議聲明應該包括以下詳細信息,如研究原理,研究資格標準,檢索策略,調節變量,偏倚風險和統計方法。
由於Meta分析是迭代過程,聲明可能會隨著時間的推移而發生變化。實際上,超過20%的Meta分析改變了原始聲明。通過在分析之前記錄聲明,這些變化是一目了然的。與原始聲明的任何偏差都可以在文章的方法部分中說明。
Meta分析可以在PROSPERO資料庫中註冊。雖然大多數期刊沒有明確規定Meta分析註冊是一項要求,但許多期刊要求提交PRISMA檢查表,其中包括聲明和研究註冊。此外,預註冊可能有助於避免意外的Meta分析重複,檢查其他研究人員是否正在進行類似的Meta分析,可以節省寶貴的資源。
二、文學搜索和數據收集
Meta分析最重要的步驟之一是數據收集。為了進行有效的資料庫搜索,需要確定適當的關鍵詞和搜索限制。有許多資料庫可供使用(例如PubMed, Embase, PsychInfo),然而,研究人員需要為他們的研究領域選擇最合適的資源。可以根據PRIMSA流程圖進行搜索並記錄相關信息,該流程圖詳細介紹了所有階段的信息流(圖3)。
因此,重要的是要注意在使用指定的搜索術語後反饋了多少研究,丟棄了多少研究,以及出於什麼原因。搜索術語和策略應該足夠具體,以便讀者重現搜索。還應提供研究的日期範圍以及進行搜索的日期。
圖3 PRIMSA流程圖
數據收集表提供了從符合條件的研究中收集數據的標準化方法。對於相關數據的Meta分析,效應量信息通常被收集為Pearson’s r統計量。部分相關性通常在研究的報告中,然而,與零階相關性相比,這些可能會擴大相關性。此外,部分變量可能因研究而異。許多Meta分析排除了與其分析的部分相關性。因此,應聯繫研究作者以提供缺失數據或零級相關性。
最後一個考慮因素是是否包括灰色文獻的研究,灰色文獻被定義為尚未正式發表的研究。這類文獻包括會議摘要,論文和預印本。雖然包含灰色文獻降低了發表偏倚的風險,但作品的方法學質量通常(但並非總是)低於正式發表的作品。無論如何,Meta分析應明確詳細說明研究方案和方法中的搜索策略。
三、分析
各種工具可用於運行Meta分析,例如綜合Meta分析和SPSS語法文件。對於本文,將使用R的「metafor」和「robumeta」軟體包(R Development Core Team, 2015)。為了進行說明,將分析來自16項研究(Molloy等, 2014)Meta分析的數據,該研究分析了調查責任心和藥物依從性之間的關聯。
數據集包括相關性,研究樣本量,以及可以評估為潛在調節變量的一系列連續(例如,平均年齡)和分類變量(例如,所使用的盡責性測量的類型)。這個Meta分析的數據以及分析示例都包含在metafor包中。與本文相關的腳本詳細介紹了本文所述分析的所有方面,讀者可以根據這些方面對相關數據進行自己的Meta分析。
第一個分析步驟是將數據從收集表格輸入到.csv文件中以便在R中進行分析。由於Pearson’s r不是正態分布的,因此這些值將轉換為Fisher's z標度。Meta分析中通常採用兩種模型:固定效應模型和隨機效應模型。固定效應模型假設所有研究都來自單一的常見群體,在類似條件下進行測試,不考慮研究的異質性,可能會高估綜合效應量。而隨機效應模型研究來自不同的群體,為了實現更少差異,加大了研究量。
在進行Meta分析計算後,應將Fisher's z轉換回Pearson's r,以報告平均相關性和95%CI。對示例數據進行分析後發現,綜合相關性和95%CI表明了責任心和藥物依從性之間存在顯著但適度的關係[r = 0.15; 95%CI(0.09,0.21),p <0.0001]。
四、異質性研究
觀察到的效應差異有兩個來源:研究內誤差和效應量的真實異質性。出於Meta分析的目的,我們對效應量的真正異質性感興趣。計算Q-統計量,即觀察到的差異與研究內方差的比率,可以揭示整體異質性中有多少可歸因於真實的研究間變化。相關的I2統計量是表示觀察到的差異比例的百分比(其中25%,50%和75%分別代表低、中和高差異),其可以歸因於研究之間的實際差異,而不是研究內的差異。
與Q統計量相比,I2的兩個主要優點是它對所包含的研究數量不敏感,並且還可以計算CI。Tau-squared也可用於評估隨機效應模型中研究異質性的總量。當Tau-squared為零時,這表明沒有異質性。在示例數據中,I2為61.73%(95%CI; 25.28, 88.25),表示中度到高度的差異,Q統計量為38.16(p = 0.001),Tau-squared為0.008(95%CI; 0.002, 0.038)。
儘管這些測試提供了異質性的證據,但它們並未提供哪些研究可能不成比例地影響異質性。Baujat圖可以很好的解析過度促成異質性和整體結果的研究。圖的橫軸表示研究異質性,而縱軸表示研究對整體結果的影響。落入圖右上象限的研究對這兩個因素貢獻最大。檢查從示例數據集生成的Bajaut圖顯示了三個研究對這兩個因素都有貢獻(圖4)。
圖4. 用於識別導致異質性的研究的Baujat圖
五、森林圖
森林圖可以顯示納入研究中的效應量和CI,以及計算的綜合效應量。圖5顯示了根據示例數據計算的森林圖。每項研究都由一個點評估來表示,該點評估由效應的CI限定。綜合效應量由圖底部的多邊形表示,多邊形的寬度表示95%CI。與高I2和顯著的Q統計量一致,森林圖顯示了異質性研究的樣本。與其他研究相比,較大方陣的研究對綜合效應量的貢獻更大。在隨機效應模型中,方陣的大小與CI和研究間差異相關。
圖5. 示例數據的森林圖
責任心和藥物依從性之間關係的示例數據總結。Meta分析中包含的每項研究均由點估計表示,該點估計以95%CI為界。綜合效應量在圖的底部顯示為多邊形,多邊形的寬度表示95%CI。
六、發表偏倚
發表偏倚是一種現象,即具有更強效應量的研究更有可能被發表並隨後被納入Meta分析。漏鬥圖是一種可視化工具,用於檢查Meta分析中潛在的發表偏倚。漏鬥線以綜合效應量為中心,由垂直線表示,這些點應等效地分布在漏鬥線的兩側(圖6A)。圖6B使用從示例數據集中移除三個研究的模擬來說明漏鬥的不均勻性,為發表偏倚提供了證據。
如果有發表偏倚的證據,可以使用修剪和填充方法。該方法假設漏鬥圖不對稱是由於發表偏倚,通過將「缺失」研究歸結為增加漏鬥圖對稱性來調整Meta分析(圖6C)。這種更新的估算研究的Meta分析不應用於形成結論,因為這些不是真正的研究,只是為了平衡不對稱的漏鬥圖。圖5A,C的比較說明了這一點,因為該方法被設計為僅通過創建現有研究的鏡像來近似缺失的研究。
圖6. 漏鬥圖以說明發布偏倚
漏鬥圖(A)包括Molloy等人的所有16項研究(2014)。 該圖示出了對稱性(即,點落在綜合效應量的兩側)。漏鬥圖(B)模擬了移除Molloy等人數據集中的三種小效應和大標準誤差的研究。情節不再是對稱的,證明了發表偏倚的證據。漏鬥圖(C)修剪和填充程序會導致缺失的研究(空心圓圈),以創建更加對稱的漏鬥圖。
七、調節變量分析
調節變量有助於觀察到一些差異。因此,可以進行調節變量分析以確定異質性的來源以及這對研究之間觀察到的效應量的變化有多大貢獻。調節變量可以是連續變量或分類變量。例如,可以使用Meta回歸模型進行調節變量分析,以檢查平均年齡對Molloy等人(2014)數據集的影響。計算該分析表明,年齡沒有調節效應[Q(1)= 1.43,p = 0.23]。
另外,可以檢查方法學質量的調節效應。對實例數據的分析表明,方法學質量也沒有緩和相關性[Q(1)= 0.64,p = 0.42]。然而,調節變量分析表明變量分類是否研究控制變量(是/否)是一個重要的調節者[Q(1)= 20.12,p <0.0001]。雖然可能存在其他未明確的研究異質性來源,但數據表明控制研究中的變量有助於整體觀察到的異質性。
八、從單個研究中獲得多種效應量的計算
如果從同一研究中收集了多組數據,則由於統計依賴性問題,應考慮這些研究中效應量的內部統計依賴性。最直接的方法是僅使用預先指定的標準收集每個研究的效應量。或者,可以聚合效應量(參見'MAc'R包中的'Agg'功能)。然而,如果沒有報告研究內相關性,研究人員必須估計預期的相關性水平。
Robust方差評估(RVE)可以在不了解研究內相關性的情況下解釋非獨立效應。為了說明使用RVE處理多種效應量,我們創建了一個新的模擬數據集,其中前三個研究來自樣本數據集,就像它們是從一項研究報告的三種效應量一樣。使用RVE分析顯示統計學上顯著的點估計[0.15; 95%CI(0.08,0.22),p = 0.001]。
九、數據解釋和報告
Meta分析的最後一步是數據解釋和寫作。PRISMA指南提供了一份列表,其中包括報告Meta分析時應包括的所有項目。遵循此列表將有助於確保報告Meta分析的質量,並有助於改進對稿件的評估。同時還可以提供用於分析的R腳本作為補充材料以幫助再現性。
本文的目的是提供一個非技術性的入門書,用於按照黃金標準指南進行相關數據的Meta分析。Meta分析是一種有效的數據合成方法,即使只需要兩到三項研究,也可以有效地提高統計精度。
本文利用可自由訪問的軟體演示了Meta分析的每個分析步驟,其中補充腳本提供了執行本文所述分析的必要代碼。還討論了數據可視化的方法,識別可能過度影響樣本異質性的研究,以及組合來自個體研究的多種效應量。還描述了關於發表偏倚和調節變量分析的Meta分析數據解釋。
參考資料(圖片均來自文獻):
From pre-registration to publication: a non-technical primer for conducting a meta-analysis to synthesize correlational data;
Conscientiousness and medication adherence: a meta-analysis.
END