亞組分析 失敗臨床研究的一線生機?

2021-01-12 健康一線視頻網

未達到主要終點時,通常會在特定患者亞組中探索可能的獲益;即使是在陽性試驗的情況下,也可用以確定治療特別有效或無效的患者子集。然而,不幸的是,它們經常被過度解讀或誤用,希望使一項失敗的研究死灰復燃。區分這些被過度解讀、誤用或計劃外的亞組分析與預先規定和精心設計的亞組分析至關重要。今天,跟大家翻譯分享一篇2010年發表在J Thorac Oncol的經典文獻《What a Clinician Ought to Know: Subgroup Analyses》,為臨床醫生提供如何適當解釋亞組分析的簡明指南。

一、什麼是亞組分析?

在隨機臨床試驗中,亞組分析指的是在根據基線特徵(如年齡、性別、組織學和種族)定義的患者亞組中評估特定終點(如總生存期)的治療效果(如風險比HR)。不建議根據隨機化後測量結果確定亞組,因為可能會影響患者分配至亞組的隨機化原則。

亞組分析有助於探索更可能從試驗性治療中獲益的患者亞組,從而從臨床試驗中獲得最大化信息。隨後,可根據這些結果生成新的假設和試驗。最終,這可能導致臨床實踐的變化。

此外,亞組分析還可用於評價總體治療效果在患者亞組之間是否一致,這通常被稱為「穩健性檢查」(robustness checking)。基於上述原因,監管機構支持進行適當的亞組分析。

二、亞組分析存在哪些問題?

亞組分析有兩個關鍵的統計學局限性。首先,它們經常統計效能不足(under-powered)。這是由於臨床試驗的樣本量計算通常僅考慮在所有隨機化患者(而非患者子集)中達到足夠的統計效能。因此,某一亞組(如性別)的一個子集(男性)與另一個子集(女性)中觀察到的治療效應是否存在顯著差異的交互效應檢驗通常效力不足。因此,亞組分析容易產生「假陰性」結果。

亞組分析的第二個主要局限性在於特別容易出現多重性(multiplicity)。多重性是指獲得「假陽性」結果的概率增加,即錯誤地得出治療組之間存在顯著差異的結論。換句話說,通過對主要終點進行多次亞組分析,這些比較中的一個或多個偶然產生顯著結果的可能性更大。例如,如果對主要終點進行10次比較,其中至少有一次得出假陽性結果的概率為40%。因此,當進行多個亞組分析時,單次比較中小於0.05的p值並不能提供充分的證據支持治療組之間存在顯著差異。

三、亞組分析可能導致哪些有害的後果?

亞組分析有時可用於「拯救」一項失敗的研究,即雖然未達到試驗的主要目的,但發現試驗組在特定患者亞組中顯著優於對照藥物。然而,正因於此,申辦方可能會對許多亞組進行計劃外的分析,以嘗試找到治療組顯著優於對照藥物的一個(或幾個)患者亞組,這通常被描述為「數據疏通(data dredging)」或「捕魚旅行(fishing trip)」。對亞組分析的誤讀可能導致啟動基於未經證實的假設的臨床研究,並最終造成對受試者健康的直接損害。這些有害後果的成本極高,但通過了解亞組分析的基本原理可以很容易地進行預防。

四、如何正確實施和解釋亞組分析?

為了適當進行和解釋亞組分析,首先需要確定是否預先規定了亞組分析。預先規定的亞組分析旨在進行假設檢驗;與之相反,計劃外(也稱為探索性、回顧性或事後)的亞組分析則生成新的假設並進行「穩健性檢查」。需要指出的是,兩者都可以提供有價值的信息,但原理和目的存在很大的差異。而且,只能根據預先規定的亞組分析才能得出結論性推論,或導致臨床實踐中的任何後續變化。

為了克服效能不足(把握度降低)和多重性的兩大統計學局限性,以下5個步驟概述了適當進行、解釋和報告預先規定的亞組分析的最佳方法:

1、在方案和/或統計分析計劃(SAP)中預先設定亞組分析

大多數情況下,應在方案中詳細記錄預先指定的亞組分析。但也可在數據揭盲前或開放性研究的首例患者訪視前在SAP中詳述。下表概述了預先規定亞組分析時應記錄的信息。

預先規定的亞組分析被認為更可信,因為它們是在任何數據檢查之前就計劃的。但是,預先規定或計劃外的亞組分析都傾向於多重性,即由於檢測上述多個亞組導致假陽性結果的概率增加。因此,僅預先規定亞組分析並不能使其自動有效:仍必須按照以下步驟適當進行、解釋和報告。

2、使用交互效應檢驗(Interaction Test)

交互效應檢驗是進行亞組分析最合適的統計方法,這一概念可用以下假設示例來說明:

圖1:什麼是交互效應檢驗?

假設臨床試驗中有兩個治療(Tx)組:Tx A組和Tx B。根據基線特徵定義的患者亞組也有兩個水平:男性和女性。連接圓圈和正方形的回歸線分別代表Tx A和Tx B治療延長總生存期的療效。因此,回歸線越高,死亡風險越高。

通過亞組每個水平的箭頭意指治療效應。如果回歸線平行,則治療效應和性別之間無交互效應(圖A),即男性的治療效果與女性相同。如果回歸線不平行或交叉(圖B和圖C),則治療效應和性別之間存在統計學顯著的交互效應,即男性的治療效果與女性存在顯著差異。

3、估計亞組每個水平的治療效應

交互效應檢驗通常作為回歸模型的一部分進行,而回歸模型的類型取決於分析的終點。Cox比例風險模型是分析臨床試驗中至事件時間終點的標準方法。因此,在該假設示例的情況下,使用Cox模型進行」治療-性別」交互效應檢驗,提供了亞組每個水平的HR(Tx A vs Tx B)、95%置信區間和相關p值。

圖2:通常使用森林圖顯示亞組分析結果。上圖是與圖1C中描述的交互效應示例相對應的結果。菱形代表HR的點估計值(Tx A vs Tx B),水平線代表95%置信區間。

應謹慎解釋亞組每個水平HR的相關p值。一個常見的錯誤是聲稱存在治療效應差異,因為與HR相關的p值在男性中具有統計學顯著性,但在女性中不具有顯著性。這是不正確的,因為僅有交互效應檢驗的p值才能確定在不同性別中觀察到的HR是否存在顯著差異。這是因為交互效應檢驗考慮了:(i)亞組不同水平患者的預後,例如,無論分配的治療如何,女性的總生存期可能優於男性;(ii)除組內變異性外,男性和女性之間的組間變異性。

4、使用確證性證據驗證亞組結果

為了證實單個臨床試驗的亞組結果,需要在獨立研究或薈萃分析中進一步驗證。需要強調的是,在得到確證性證據之前,亞組分析僅生成假設,在所有隨機化患者中觀察到的治療效果仍被視為亞組每個水平患者的最合適估計值。

5、負責任地報告結果

需要負責任地報告亞組結果,以便其他人能夠對其進行適當解釋。應在摘要和結論中強調所有隨機化患者的主要終點分析結果。此外,還應說明預先規定的亞組分析的名稱,並應明確說明預先規定和計劃外進行的亞組分析的數量。還應在當前確證性證據和科學文獻的背景下討論亞組分析結果的有效性。

上文所述概念適用於任何類型的終點,例如分類(應答者或非應答者)、連續(收縮壓)或至事件時間數據(總生存期)。下表總結了幫助臨床醫生正確解釋亞組分析的關鍵要點。

參考資料:

Barraclough H, Govindan R. Biostatistics primer: what a clinician ought to know: subgroup analyses. J Thorac Oncol. 2010 May;5(5):741-6.

相關焦點

  • | CHANCE 研究亞組分析
    眾所周知,由天壇醫院王擁軍教授團隊領銜完成的 CHANCE 研究(氯吡格雷治療急性非致殘性腦血管事件高危患者的研究)於 2013 年發表在新英格蘭醫學雜誌中。這項研究確立了雙抗治療對於小卒中的短期內的預防卒中復發的效果。
  • 諾華泛胱天蛋白酶抑制劑NASH二期臨床失敗
    新聞事件今天諾華在NASH領域的合作夥伴Conatus宣布其泛胱天蛋白酶抑制劑emricasan在一個NASH二期臨床失敗。這個叫做ENCORE-PH的二期臨床招募263位NASH肝硬化患者,其中多數(76%)是相對較輕的代償性肝硬化患者、其餘24%為早期代償不全肝硬化。
  • 亞臨床甲亢,何時啟動治療?
    一項前瞻性研究發現,在中位隨訪41個月期間,年齡大於60歲、初始TSH水平為0.1~0.4mIU/L的亞臨床甲狀腺功能亢進女性中僅3%進展為顯性甲亢。相比之下,TSH 對於Graves病引起的亞臨床甲亢,疾病進展相對難以預測,在36個月內可能緩解、進展或無變化。而多結節性甲狀腺腫患者傾向於持續性亞臨床甲亢,自發緩解率低。
  • 速讀社丨諾華fevipiprant兩項III期臨床研究失敗
    公告透露,信立泰已完成S086片Ⅰ期臨床相關研究,原發性高血壓適應症準備進入Ⅱ期臨床階段。(藥明康德) 諾華DP2受體拮抗劑fevipiprant兩項III期臨床研究失敗 諾華近日公布了哮喘新藥fevipiprant關鍵性全球III期LUSTER-1和LUSTER-2研究的最新結果。這些研究探索了DP2受體拮抗劑fevipiprant的療效和安全性。
  • 總結|臨床研究常見統計方法與統計問題
    臨床研究的設計和分析常基於一定的假設,如果假設不滿足可能會帶來一定影響,敏感性分析通過改變研究假設、統計分析方法和模型等方法來檢驗研究結論是否一致,常見場景有缺失值、離群值、研究方案違背、研究結局的不同定義、基線不均衡等。主要分析結果和敏感性分析的一致性能鞏固研究結論,使研究發現更可信。臨床試驗中,需在方案中提前定義,結論不一致時需討論併合理解釋。
  • ASFV亞單位疫苗研究
    本文主要介紹ASFV的各種亞單位疫苗研究策略,主要包括ASFV亞單位疫苗、DNA疫苗和病毒載體疫苗。同時還介紹了已知的ASFV抗原和ASFV免疫病理學增強相關抗原。ASFV是一種能引起家豬和野豬死亡的毀滅性和有巨大經濟意義的疾病。目前還沒有針對ASFV的疫苗。之前很多探索過程在很大的程度上是失敗的。主要的原因是該病毒的複雜性以及我們對ASFV毒力因子和保護相關因素的理解有限。
  • 最新研究揭示癌症胚系基因組模式與癌症風險及臨床預後的關聯
    ,為研究胚系基因組對癌症發展的影響、潛在分子機制和臨床結果提供了一種新的分析方法。亞組2也富含GBM樣本,但與亞組1不同,亞組2更傾向於CGGP_A而不是CGGP_E。同時,研究團隊在三個亞組之間也觀察到顯著的患者生存差異,表明CGGP與治療和臨床結果密切相關。
  • 代謝組學在醫學領域機制研究的實驗設計方案
    )+298個HCC樣本(購買組織晶片)研究手段:利用5種組學技術(基因組、轉錄組、蛋白組、代謝組、單細胞測序)研究細胞與細胞、亞克隆與亞克隆、病變體與病變體、病人與病人之間的腫瘤異質性使用技術:基因組、轉錄組、蛋白組、LC-MS非靶向代謝組、單細胞測序
  • 「FOURIER研究」最新亞組分析,依洛尤單抗治療再添新證據,這一部分人群不得不重視
    後陸續發布的FOURIER研究的亞組分析為依洛尤單抗的臨床應用提供更多有價值的信息,讓臨床醫生能夠識別出更有可能從依洛尤單抗治療中受益的患者,讓治療更加有的放矢,遊刃有餘。2020年美國心臟病學協會科學年會(AHA)上再次公布了關於FOURIER研究的亞組分析,為依洛尤單抗的臨床治療再添新證據。下面讓我們一起欣賞一下精彩的研究內容吧!
  • 領星發表學術論文,臨床基因組測序技術助力腫瘤患者個體化治療
    在這項研究中,領星對一千多例中國腫瘤患者的樣本進行了臨床全外顯子組測序 (CWES),然後對其中成功檢測的953例中國腫瘤患者的突變特徵進行了鑑定,並與 The Cancer Genome Atlas (
  • 早期肺癌肺段切除:從技術到臨床研究
    1.2   國內指南2018 版《中華醫學會肺癌臨床診療指南》推薦用於早期肺癌的手術方式:解剖性肺葉切除仍是標準術式(1 類推薦)。亞肺葉切除目前仍處於臨床研究階段,在取得可靠結果之前意向性亞肺葉切除的適用情況與 NCCN 指南相同(2B 類推薦)。
  • 臨床多重耐藥菌基因組編輯研究取得進展
    直接在臨床分離的多重耐藥菌中進行功能基因組學研究是解析耐藥機制以及開發抗耐藥策略最直接有效的方法。然而,由於缺乏能在臨床耐藥菌中直接進行高效基因編輯的工具,目前耐藥機制仍主要是採用組學分析加在模式菌中的異源驗證進行研究。
  • 【精準醫學】廣州組學與臨床大會11月舉辦,推進組學臨床應用
    ,從整體角度出發進行研究分析的技術手段——組學技術已成為新時代精準醫學的重要方式。當前,精準醫學的發展已經全面進入多組學時代。多種高通量的組學研究方法和技術,早已被組合應用到不同的課題研究和臨床應用中,為科研與臨床提供更精準的檢測、診療手段。精準醫學發展日新月異,組學研究技術百花齊放,但在一定程度上也逐步擴大了組學研究與臨床應用之間的距離,造成組學研究與臨床應用脫節。臨床醫生往往受困於「相關疾病我應該選擇何種組學技術進行檢測和研究?」
  • 美國一項愛滋病疫苗臨床試驗宣告失敗
    新華社華盛頓2月3日電(記者周舟)美國國家衛生研究院3日說,一項在南非進行3年多的愛滋病疫苗臨床試驗宣告失敗。美國國家衛生研究院下屬國家過敏症和傳染病研究所在一份聲明中說,一個獨立數據和安全監控委員會在中期評估中發現,這種愛滋病試驗疫苗不能預防愛滋病。目前,該研究所已停止接種這種疫苗。這種名為HVTN 702的愛滋病疫苗組合由一種刺激免疫系統的疫苗與一種增強免疫反應的疫苗組成。
  • 【ASCO 2017】華海清教授:lenvatinib打破肝癌一線治療研究的「陰」霾
    Tivantinib是一種口服的高選擇性、非ATP競爭性c-MET抑制劑,臨床前研究數據證明其能抑制c-MET合成與HGF誘導的c-MET激活。一項多中心、隨機、安慰劑對照、雙盲的Ⅱ期臨床研究,共納入107例經一線系統治療失敗的晚期HCC患者,結果顯示,在37例c-MET高表達的患者中,接受tivantinib治療者比安慰劑組患者的中位PFS(2.2個月對1.4個月,P=0.02)期和OS(7.2個月對3.8個月,P=0.01)期明顯延長。
  • 出版簡訊|IST-3亞組研究:急性缺血性卒中動脈高密度徵、症狀性梗死...
    這項第三國際卒中試驗(Third International Stroke Trial, IST-3)亞組研究旨在探討HAS與症狀性梗死區水腫之間的關係,以及靜脈阿替普酶對此種關係的影響。作者團隊納入隨機前已進行CT非增強掃描的卒中患者,隱去患者臨床信息,所有評估者盲法評估患者基線(隨機前)及隨訪(隨機後24~48小時)時CT平掃中的HAS,HAS定義為相較於對側動脈出現密度增高的徵象。症狀性梗死區水腫定義為卒中發病7日內出現臨床上顯著的神經功能惡化,並伴有中線偏移、基底池壓閉或鉤回疝等影像學證據。
  • 4萬人薈萃分析:預防房顫,應關注亞臨床動脈粥樣硬化!|研究速遞
    房顫使卒中風險增加5倍,已成為日益嚴重的公眾健康問題,如果沒有得到適當的治療,房顫可導致致命併發症。 冠狀動脈疾病是房顫的公認危險因素,但尚不清楚亞臨床動脈粥樣硬化是否也會增加房顫風險發病率。本研究是首個評估亞臨床動脈粥樣硬化與房顫相關性的研究,亞臨床動脈粥樣硬化定義為頸動脈內膜中層厚度(cIMT)或冠狀動脈鈣化評分(CACS)增加。
  • 想要開展臨床研究?第一步,先認識臨床研究!
    大多數人一提到臨床研究就想到隨機對照試驗(RCT),潛意識裡把研究與RCT等同起來。結果問題就來了:試驗分幾組?如何隨機?如何做到盲法?病人不配合怎麼辦?…… 而這些問題往往限制臨床醫生開展臨床研究。 最後得出一個定論:這個臨床研究無法做。
  • 多組學文獻精讀36|對持續CTLA-4和PD-1阻斷的腫瘤活檢的綜合分子分析揭示了其反應預測和耐藥的標誌物
    與作者研究隊列結果一致,在6q25.1(ESR1)和10q(NCOA4,BMPR1A,PTEN,FAS和SUFU)中觀察到了抑癌基因。值得注意的是,在臨床獲益亞組和長期生存亞組中,在任何抑癌基因中均未觀察到復發拷貝數丟失(圖10)
  • 藥物臨床試驗多重性問題等相關指導原則實施
    日前,國家藥品監督管理局藥品審評中心(以下簡稱藥審中心)發布《藥物臨床試驗多重性問題指導原則(試行)》《藥物臨床試驗協變量校正指導原則》《藥物臨床試驗亞組分析指導原則(試行)》和《藥物臨床試驗富集策略與設計指導原則(試行)》多個和藥物臨床試驗有關的指導原則,為藥物臨床試驗中相關問題的解決提供指導意見