寫在前面的話
3月7日,呼吸界在採訪中日醫院曹彬教授的對話中,曾經對正在進行的瑞德西韋治療重症新冠肺炎的臨床試驗進度有過以下對話:
王一民:雖然我們目前不太了解最終的結果,那能不能有一些能夠「透露」給我們的信息?
曹彬:我們現在瑞德西韋2的研究已經超過了230例,已經達到了中期分析所需要的樣本量,但是「達到樣本量」和「能進行中期分析」是完全兩個不同概念意義,為什麼呢?因為入組不代表就可以進行評價了,還需要28天的隨訪,當然也不代表就一定是28天,因為我們的終點是「只要達到臨床結局」,我們就可以進行評價。所以,作為研究者,我們也很期待——這230多個病人都達到臨床結局的時候,能不能出現一個節點?這個節點就能夠讓獨立安全委員會做出一個客觀的、科學的評價,如果真能達到這樣一個結局時,我們就不需要入組453例病人了,有可能入組400例或者300例就可以了。
為了保證這項臨床試驗科學性和完整性,該項隨機雙盲安慰劑對照臨床試驗設置了一個獨立的數據和安全監查委員會(簡稱DSMB),也就是上面曹彬教授提到的獨立安全委員會,該委員會的設立不僅要保障受試者的安全,也要保證試驗數據的完整性和研究結論的科學性,整個試驗期間該委員會可以在非盲態下動態監測累積的與有效性和安全性相關的試驗數據,並做出相應的建議,每次DSMB會議,除了公開會議內容可以讓研究者獲悉外,閉門會議內容一直處於保密之中,只有在臨床試驗揭盲後,完成統計分析並在專業雜誌上發表臨床試驗結果後才得以解禁。近期,由本次獨立數據和安全監查委員會的兩位統計學家(美國羅格斯大學公共衛生學院施維中教授和北京大學臨床研究所姚晨教授)聯合撰寫的有關「大流行危機期間瑞德西韋治療COVID-19患者的中國臨床試驗數據監測」論文在藥物信息學會(DIA)旗下的「Therapeutic Innovation & Regulatory Science」雜誌上全文發表,文章以文獻記錄的方式回顧了關於數據與安全監查委員會(Data and Safety Monitoring Board,DSMB)對關鍵數據的監查過程,這些過程包括如何在緊急情況下基於對數據及分析的洞察力從統計角度及時對主要數據進行頻繁監查並向申辦方和研究者提出建議。
現在論文作者完成了中文翻譯稿,在徵得主要研究者同意後在呼吸界發布,讓廣大讀者正確無誤地了解曾經被稱為「人民的希望」瑞得西韋治療重症新冠肺炎臨床試驗數據和安全監查委員會工作內幕,從另一個側面反映了DSMB視角下的瑞德西韋中國研究從開始到落幕的故事。
[1] Shih W, Yao C, Xie T. Data Monitoring forthe Chinese Clinical Trials of Remdesivir in Treating Patients with COVID‑19 During the Pandemic Crisis. Therapeutic Innovation &Regulatory Science, 2020.
大流行危機期間瑞德西韋治療COVID-19患者的中國臨床試驗數據監查
施維中1§,姚晨2,謝泰亮3
1 羅格斯大學公共衛生學院,新澤西州,皮斯卡塔韋,美國
2 北京大學臨床研究所,北京,中國
3 CIMS Global and Brightech International,薩默塞特郡,新澤西州,美國
摘要
在緊急COVID-19流行期間,中國研究人員在武漢醫院進行了瑞德西韋+標準護理(standard of care,SOC)與安慰劑+ SOC的兩項III期,隨機雙盲臨床試驗[ClincalTrials.gov NCT04257656和NCT04252664]。這些試驗已在全球範圍內備受期待。我們希望試驗的研究者們將從醫學的角度儘快報告臨床和實驗室檢查結果。本文以-文獻記錄的方式回顧了關於數據與安全監查委員會(Data and Safety Monitoring Board,DSMB)對關鍵數據的監查過程,這些過程包括如何在緊急情況下基於對數據及分析的洞察力從統計角度及時對主要數據進行頻繁監查並向申辦方和研究者提出建議。通過對237位患者的序貫式監測,我們對研究設計的優缺點進行了評論,並對瑞德西韋對重度COVID-19病例的治療效果提供了看法。我們的經驗證明使用動態數據監測(Dynamic Data Monitoring,DDM)方法可以有效並可靠地支持DSMB在緊急情況下對關鍵數據實時了解的需求。DDM在被訓練有素的統計學家正確使用,能夠靈活探索試驗數據的能力,同時可以保護試驗的科學完整性。
英文版(可上下滑動瀏覽)
Data Monitoring for the Chinese Clinical Trials of Remdesivir in Treating Patients with COVID‑19 During the Pandemic Crisis
Weichung J. Shih1§, Chen Yao2, Tai Xie3
1 Rutgers University School of Public Health, Piscataway, NJ, USA
2 Peking University Clinical Research Institute, Beijing, China
3 Brightech International and CIMS Global LLC, Somerset, NJ, USA
§Correspondence to Weichung J. Shih, shihwj@sph.rutgers.edu
Abstract
Two phase-III, double-blind, randomized clinical trials of remdesivir plus SOC (standard of care) versus placebo plus SOC have been conducted in Wuhan hospitals by Chinese investigators during the urgent COVID-19 epidemic [ClincalTrials.gov NCT04257656 and NCT04252664]. These trials have been highly anticipated worldwide. We expect investigators of the trials will soon report the clinical and laboratory findings from the medical perspective. This manuscript provides documentary style information on the process of monitoring key data and making recommendations to the sponsor and investigators based on analytical insights when dealing with the emergent situation from the statistical viewpoint. Having monitored data sequentially from 237 patients, we comment on the strength and weakness of the study design and suggest the treatment effect of remdesivir on severe COVID-19 cases. Our experience with using the Dynamic Data Monitoring (DDM) tool has demonstrated its efficiency and reliability in supporting DSMB’s instantaneous review of essential data during the emergent situation. DDM, when used properly by disciplined statisticians, has shown its capability of exploring the trial data flexibly and, in the meantime, protecting the trial’s scientific integrity.
Keywords Monitoring clinical trials, ICH, DSMB, eDMC, DDM, Remdesivir, COVID-19 pandemic
一、引言
在2020年2月3日至6日,武漢市爆發新型冠狀病毒(novel coronavirus,nCOV-2019)僅幾周後,中國研究人員緊急啟動了兩項臨床試驗,以評估瑞德西韋治療由病毒引起呼吸道疾病的成人住院患者方面的療效和安全性。新型冠狀病毒最近被稱為COVID-19(世衛組織於2020年2月11日正式命名)。第一項試驗是針對重症患者[1],第二項試驗是針對具有輕度-中度症狀的患者[2]。兩項試驗均是由中國醫學科學院藥物研究所贊助的隨機、雙盲、安慰劑對照、多中心研究。為了確保患者的利益以及試驗申辦方和研究者的客觀性,他們在整個研究過程中對患者的治療分配均被隱藏,由五個成員組成的數據與安全監查委員會(Data and Safety Monitoring Board,DSMB):2名醫學專家, 1名流行病學家和2名統計專家均獨立於試驗的贊助者和研究者(有關DSMB成員的姓名,請參見致謝)。在申辦方籤約的臨床合同研究組織(Contract Research Organization ,CRO)的支持下, DSMB的啟動會議於2020年2月12日召開,會議審查了研究方案並批准了DSMB章程,在其中確定了隨後的會議時間表,數據格式和監查指南。對於本文的其餘部分,「背景」部分首先闡述了在緊急情況下設立DSMB的可行性問題和挑戰,這些問題在正式啟動會議之前已進行了討論。其次,還描述了研究者方的顧問和DSMB之間在選擇監測終點指標方面進行的討論和交換。「方法」部分介紹了統計方法,I型錯誤概率保留策略,以及在這種緊急流行病情況下用於頻繁數據監測的eDMC工具。在「結果」部分中,我們使用日記樣式按日期記錄每次數據監查 委員會(Data Monitoring Committee,DMC)會議,著重描述我們如何根據掌握的數據和觀察到的趨勢與申辦方和研究者團隊討論,溝通和給出建議。最後,在「結論與討論」部分中,憑藉我們在連續監查237例患者的關鍵數據方面的經驗,我們對試驗設計的一些弱點和優勢進行了評論,並對瑞德西韋對重症COVID-19病例的治療效果提供了看法。在中國的瑞德西韋試驗中該DSMB所獲得的數據監查經驗,應該可以為當前正在全球進行COVID-19試驗的其他研究提供有意義的信息。
二、背景
1、DSMB的可行性和必要性的問題與挑戰
申辦方和研究者小組討論了是否有必要為這兩項全球預期的試驗組成DSMB。一部分人認為, 鑑於武漢市的這一流行病,患者的招募會非常快,以至於沒有時間或沒有必要進行臨時數據監測和審查。但是考慮到10天的治療期和長達28天的隨訪期,以及瑞德西韋是一種研究藥物,根據ICH藥物臨床試驗質量管理規範(Good Clinical Practice,GCP)指南[3]和中國新藥研發的法規[4],設立DSMB被認為是可行的和必要的。考慮到緊急情況,申辦方強調,DSMB應該儘快獲得有關該試驗的累積療效和安全性信息,以便DSMB可以做出快速、科學的決定。DSMB的真正挑戰是要高效地進行數據傳輸,並以非常及時和科學的方式監查關鍵有效性和安全性數據。於是,DSMB選擇使用eDMC系統與動態數據監測(Dynamic Data Monitoring,DDM)軟體的統計工具對累積進行頻繁監測;請參見後續部分中有關DDM的更多說明和使用。
2、啟動會議:2020年2月11日
在第一次DSMB啟動會議上,僅舉行了公開會議,內容涉及關鍵人員的介紹,研究方案的提要,以及包括數據監查計劃在內的DMC章程的討論和批准。除了DMC成員,CRO數據經理和獨立統計師外,其他參與者還包括申辦方(醫學科學院官員),主要研究人員(臨床醫生)及其學術顧問,以及吉利德科學(藥品供應商)的代表。研究狀態報告概述了武漢的3所醫院/中心(計劃的10個中)已將136名重症患者(計劃的453例中)隨機分配(瑞德西韋:安慰劑為2:1)[1]。一些中心準備在兩天內接受輕度-中度病例的治療方案[2]。因此, DSMB要求召開下一次會議,以期在7-10天內對重症病例的首次試驗的基線、有效性和安全性數據進行審查。根據患者的入組情況,隨後的數據監測原則上可以是每周一次或更短。
關鍵的討論是在接下來的數據審查會議上,要監查哪些數據以及如何提出相應建議。DSMB要求提供基線特徵,包括人口統計學,SPO2(脈搏血氧飽和度)水平以及從發作到隨機化(接受藥物治療)的時間,這些是區分嚴重與輕度/中度COVID-19病例的兩個主要特徵,研究藥物暴露和患者處置數據應該被審查。安全性數據包括臨床不良事件(adverse events,AE),尤其要注意嚴重或高等級(嚴重性≥3)的AE。這些數據在公開會議中不顯示治療組識別號,而在僅存在DSMB成員和獨立統計師的非公開會議中顯示治療組識別號。
在有效性數據方面,DSMB對要監查的終點指標和監查頻率上存在不同看法。方案設計參考了世界衛生組織研發藍圖[5],並指定了主要有效性終點,即在第28天檢查的臨床改善時間(time to clinical improvement censored at Day 28,TTCI),定義為從研究治療隨機分組到6類序數等級下降到2類的時間(以天為單位)臨床狀態(1=出院;6=死亡)。請參見續集和即時方法部分中序數標度的完整說明。該方案還規定,一旦觀察到所需的TTCI事件總數的一半,就應進行一次有效性和無效性的中期分析。但是,DSMB對TTCI的定義表示擔憂。首先,對於嚴重的情況,其死亡風險可能很高,對於死者,TTCI將是無法定義的。28天的刪失(censoring)規則對死者沒有臨床意義,可是把28天仍然生存但未達到2分改善的患者與死者的TTCI刪失(censor)在28天是不太合理的。其次,患者可能會先下降然後在28天內逐漸增加。如果患者隨後惡化,則選擇首次達到兩點下降的選擇可能沒有意義。第三,基線評分為2(住院治療,不需要補充氧氣)的患者可能無法改善兩種類別,但方案並未將他們排除在外。(注意:在得知我們的關注之後,方案隨後將TTCI修改為「兩點下降或出院」)。因此,DSMB建議使用方案中指定的次要有效性終點來監查研究,這是6級序數尺度本身,在試驗7, 14, 21天和第28天時由基線類別分層。
申辦方還表示他們對中期分析計劃不太滿意。方案計劃在TTCI事件達到一半時進行中期分析,並只做一次。申辦方認為該計劃並不能真正應對流行病的緊迫性。因此,DSMB提議使用動態監測方法對6類量表進行數據監測。該提案獲得了普遍認可。在下面的「方法」部分中提供了有關此建議過程的更多詳細信息。
三、方法
1、後續DSMB審查的動態監查過程
儘管方案指定的主要終點TTCI和基於TTCI的正式的一次性中期分析計劃保持不變,但DSMB在2020年2月22日舉行的第二次會議之前設計了以下監查程序。
要監查的終點是按基線量表分層的6類序數量表。研究方案中指定的序數等級為:6=死亡;5=住院,需要ECMO和/或IMV;4=住院,需要NIV和/或HFNC治療;3=住院,需要補充氧氣(但不需要NIV / HFNC);2=住院,不需要補充氧氣;1=出院或達到出院標準(出院標準定義為臨床恢復,即發燒,呼吸頻率,血氧飽和度恢復正常和咳嗽緩解)。在每個DMC會議的公開會議上,僅顯示6類量表的總體基線分布。
閉門會議的計劃是使用分層的Wilcoxon-Mann-Whitney(WMW)秩和檢驗來比較治療組的序數範圍分布。隨著試驗的進行,以及患者的積累和治療時間的延長,應監測試驗的趨勢。該計劃將分布數據的條形圖和WMW秩和檢驗顯示在臨床試驗監測「雷達」屏幕上。「雷達」屏幕由條件概率的邊界構成,以顯示秩和檢驗是否處於「有利」(favorable)、「有希望」(promising) 或「不利」(unfavorable) 區域。eDMC系統中的動態數據監測(DDM)軟體可簡化WMW測試和條件概率的計算[6]。在「結果」部分中提供了具有相關條件概率的區域的更多詳細信息。隨著樣本量不斷增加(as patient being accumulated),WMW秩和的軌跡展現了試驗結果的趨勢。我們期望更多的數據在早期的時間節點,而較少的數據在後期的時間節點;這種數據監測方法僅是探索性的。當秩和檢驗顯示出一致的強信號(即,落在有利區域內)時,才會觸發對方案設計的主要端點TTCI的正式分析。隨著時間的推移,我們希望更多的患者提供有後期的隨訪數據。大多數情況下,我們計劃通過檢查「雷達」圖僅進行探索性分析。然而,在需要控制膨脹的假陽性率時,特別是在試驗的後期階段,當有足夠數量的患者被登記/隨訪時,我們將在第7, 14, 21天和第28天檢查多個秩和檢驗,DSMB選擇使用Hochberg步進法[7]。用於保護該次要終點的整體α處於0.025(單側,或雙側0.05)。
由於我們不知道何時以及多少次將觸發TTCI分析,因此設計了成組序貫靈活的α消耗函數方法[8]以同樣地將主要終點的總體α維持在0.025(單側,或雙側0.05)水平。此外,由於患者快速入組並且試驗時間相對較短的特點,並考慮到研究的緊迫性,因此我們選擇了Pocock型α消耗功能作為主要終點。請注意,Pocock型α消耗函數是凹而不是凸的,這樣更多的α會消耗在早期(信息)時間點,而較少的α會消耗在後期(信息)時間點,以此來適應該流行病的緊急情況。參見有關文獻[9]關於選擇α消耗函數的討論。
四、結果
1、第二次DSMB會議(第一次數據審查):2020年2月22日
共有231例患者知情同意,其中有215例被隨機分組(瑞德西韋組中為144例,安慰劑組為71例)。54名(25.1%)完成了為期10天的治療,但還沒有達到14天的隨訪時間。96天(44.7%)在10天的治療期內;53(24.7%)尚未開始治療。12名(5.6%)因包括AE(n=8)和其他(n=4)的原因而中止了治療。
在閉門會議中,DSMB檢查了開盲數據,兩組之間的基線特徵和AE比例相似。根據DSMB的醫學專家判斷,未觀察到意外的不良事件。使用條形圖檢查分層的臨床6類量表結果,並在動態「雷達」屏幕上顯示分層的WMW秩和檢驗。例如,圖1顯示了第10天結果的條形圖。(DSMB還要求在第3、5和7天添加其他條形圖,但此處未顯示。)大多數(n=118,或83%)患者的基線序數類別=3。4位患者的基線序數=2,有20位患者的基線類別=4,沒有一個是類別=5。
【圖1】DSMB第一次數據回顧:第10天按基線得分分配6類量表得分。綠色是安慰劑,紅色是瑞德西韋。每組患者數:安慰劑51,瑞德西韋91。每組中位評分:安慰劑3,瑞德西韋3。
【圖2】DSMB首次數據審查:第3天,通過分層Wilcoxon-Mann-Whitney秩和檢驗進行的動態數據監查Z評分以及入組患者的數量;將「有希望的區域」的上邊界設置為條件概率(CP)=90%,將下邊界設置為CP=5%。中間劃線表示的CP=50%。
【圖3】DSMB首次數據審查:第5天,通過分層Wilcoxon-Mann-Whitney排名和檢驗對患者入組人數進行動態數據監查Z評分;將「有希望的區域」的上邊界設置為條件概率(CP)=90%,將下邊界設置為CP=5%。中間劃線表示的CP=50%。
【圖4】DSMB首次數據審查:第7天,通過分層Wilcoxon-Mann-Whitney秩和檢驗對動態的數據監查Z評分以及入組患者的數量;將「有希望的區域」的上邊界設置為條件概率(CP)=90%,將下邊界設置為CP=5%。中間劃線表示的CP=50%。
【圖5】DSMB首次數據審查:第10天,通過分層Wilcoxon-Mann-Whitney秩和檢驗進行動態數據監查Z評分,納入患者數;將「有希望的區域」的上邊界設置為條件概率(CP)=90%,將下邊界設置為CP=5%。中間劃線表示的CP=50%。
圖2,3,4,和5顯示了分層WMW秩和檢驗(Z值)的運動的動態圖作為分別在隨機化後第3天,第5天,第7天和第10天累積的患者人數。將「有希望的區域」的上限設置為條件概率(conditional probability,CP)=90%,將下限設置為CP=5%。中間的虛線表示CP=50%。如圖所示,與安慰劑相比(在第3、5、7天)瑞德西韋在臨床量表上沒有快速作用,但在第10天呈上升趨勢。這個呈現為DSMB提供了一個充滿希望的信息,DSMB建議一個星期後繼續進行下次會議。請注意,與第7天不同,第3、5和10天的數據不是計劃中的分析節點,而是由高效eDMC系統應即時要求提供給DSMB。補充數據為DSMB審查提供了有用的「趨勢」信息。另外,這時,武漢的COVID-19流行病正在減緩,2月份該地區也開始進行其他許多研究,對患者資源形成競爭。面對入院人數下降的情況,DSMB建議研究者考慮加強招募患者的努力,並建議試驗申辦方重新評估研究完成日期的計劃時間表(原始預測日期為2020年4月27日)。
DSMB還敦促研究人員驗證患者的入排標準,特別是把關重症COVID-19的基線SPO2和/或PAO2 / FIO2水平。
另外:2020年2月21日,美國國家過敏和傳染病研究所(NIAID)開展了一項多中心、適應性、隨機盲法對照試驗,其中涉及瑞德西韋用於治療住院成人的COVID-19[10],因為疾病正在全球迅速傳播。瑞德西韋治療方案與中國試驗中的相同。DSMB注意到NIAID試驗使用了類似的8類序數量表作為試驗的主要終點。但是,住院隨訪時間為15天,比中國的28天要短。樣本量為n=440,類似於中國重症病例試驗的樣本量n=453。
2、第三次DSMB會議(第二次數據審查):2020年2月29日
在會議之前,研究人員告知,參加輕度至中度病例試驗的患者也受到COVID-19流行率下降的不利影響,這對疾病控制來說是幸運的,但對試驗本身來說是個遺憾的消息。DSMB審查的重點仍然放在重症病例的第一項試驗上。
共有228名患者被隨機分組(瑞德西韋組為152名,安慰劑組為76名)。自7天前進行DSMB審查以來,僅招募了13位新患者。但是,更多的患者完成了10天的治療,並在治療後14天進行了隨訪。保留出院和死亡狀態後,六類臨床量表顯示第10天有201例患者的數據,第14天有177例患者的數據,第21天有97例患者的數據。但是,大多數(191/228或83.8%)的基線類別=3。
在不良事件方面,總死亡人數=24(死亡率10.53%),平均分布在兩個治療組之間。未發現相關的不良事件,但DSMB注意到瑞德西韋組中止治療的患者多於安慰劑組(13 / 149,8.7%,3 / 75,4.0%)。但是,接受瑞德西韋治療的患者中有20/149(13.4%)出現嚴重AE,低於安慰劑組(15/75或20.0%)。
就有效性而言,出院總數為55(24.12%),在瑞德西韋組(40/152,或26.32%)高於安慰劑組(15/76,或19.74%)。6類臨床量表分析增加了DSMB對試驗的成功希望,如第14天的分層分布所示(條形圖,圖6;早期的其他條形圖也由DSMB進行了檢查,但此處省略了)以及在7, 10, 14天和21天的分層WMW秩和檢驗的動態「雷達」圖(分別對應圖7,8,9,10; 早期的其他圖表也通過DSMB審查,但在此省略)。根據第14天進入有利區域的Z值(見圖9),DSMB要求在下一次審核會議上顯示TTCI終點指標的K-M(Kaplan-Meier)圖(無P值)。總體而言,目前的監測似乎對瑞德西韋朝著有利的方向發展,但是DSMB仍對尚未收穫的數據持謹慎態度,尤其是因為第21天的數據不足,並且缺乏與第14天保持一致的趨勢,建議繼續進行試驗,DSMB敦促申辦方重新評估研究完成日期的時間表以及主要終點TTCI上最初計劃的中期分析策略。
【圖6】DSMB第二次數據審查:在第14天時按基線得分劃分的6類量表的分布。綠色是安慰劑,紅色是瑞德西韋。每組的患者數:安慰劑59,瑞德西韋118。中位數:安慰劑3,瑞德西韋3。
【圖7】DSMB第二次數據審查:第7天,通過分層Wilcoxon-Mann-Whitney秩和檢驗進行的動態數據監查Z評分以及入組患者的數量;將「有希望的區域」的上邊界設置為條件概率(CP)=90%,將下邊界設置為CP=5%。中間劃線表示的CP=50%。
【圖8】DSMB第二次數據審查:第10天,通過分層Wilcoxon–Mann–Whitney秩和檢驗對患者入組人數進行動態數據監查Z評分;將「有希望的區域」的上邊界設置為條件概率(CP)=90%,將下邊界設置為CP=5%。中間劃線表示的CP=50%。
【圖9】DSMB第二次數據審查:第14天,通過分層Wilcoxon-Mann-Whitney秩和檢驗進行動態數據監查Z評分,納入患者數;將「有希望的區域」的上邊界設置為條件概率(CP)=90%,將下邊界設置為CP=5%。中間劃線表示的CP=50%。
【圖10】DSMB第二次數據審查:第21天,通過分層Wilcoxon-Mann-Whitney排名和檢驗對患者入組人數進行動態數據監查Z評分;將「有希望的區域」的上邊界設置為條件概率(CP)=90%,將下邊界設置為CP=5%。中間劃線表示的CP=50%。
另外:該方案計劃n=453名重病患者在2020年4月28日之前完成28天的研究。截至2020年2月28日,n=228隨機分組,DSMB通知申辦方在3月份,研究人員小組必須平均每天招募隨機分組7或8位患者,以便在3月底完成目標入組。
3、第四次DSMB會議(第三次數據審查):2020年3月8日
共有235名患者被隨機分組(瑞德西韋組為157名,安慰劑組為78名)。8天前的上一次DSMB審查僅招募了7名新患者。兩組之間的基線特徵具有可比性。在235例患者中,隨機分配前有217例(92.3%)帶有鼻導管或面罩,有27例(11.5%)帶有高流量氧氣,有15例(6.4%)進行了無創通氣,有2例(0.9%)進行了有創通氣作為呼吸支持。鼻導管或面罩的中位天數為3天,高流量氧氣支持為2天。四名患者撤回了知情同意書。
兩個治療組之間的基線SPO2水平也相似。在室溫下,不需要補充氧,SPO2範圍為75至94%(235名患者中n=75;中位數=92%)。有氧補充時,SPO2的範圍為37~100%( 235名患者中n=158;中位數=93%)。一位患者(安慰劑組)在基線時出現高碳酸血症呼吸衰竭,其SPO2為88%。
在安全性數據集(n=230)中,瑞德西韋組的26/153(17%)患者患有SAE,而安慰劑組為17/77(22.1%)。研究人員認為幾乎沒有SAE與藥物相關(每組2個)。然而,如先前的DSMB評論中所述,與安慰劑組相比,瑞德西韋組比安慰劑組有更多的患者因AE停藥(17/153或11.1%對3/77或3.9%)。死亡率為27/230(11.74%),較上次審查略有增加,但兩組之間相當。
就有效性而言,儘管自上次評估以來僅招募了7名新患者,但有更多患者完成了10天的治療並達到治療後的第14天和第21天的隨訪。根據出院和死亡狀況,六類臨床量表在第10天累計了220例患者的數據,在第14天累計了218例患者,在第21天累積了197例患者,在第28天累積了143例患者的數據。仍然,主要是192/230,或83.5%基線組為3。因此,DSMB堅信對「臨床改善」(TTCI終點)的分析需要通過對「臨床無變化或惡化的分析」進行補充。DSMB使用分層WMW秩和檢驗對6類量表的分布進行的分析實際上是針對此的兩面兼顧。
出院總人數為92(40.0%),瑞德西韋組(58/153,或37.91%)比安慰劑組(34/77,或44.16%)為低。與先前的數據審查相反,DSMB對此感到擔心。檢查了6類臨床量表數據後,DSMB對此不如以前樂觀,它們在以下意義上也令人失望,如第21天的分層分布所示(條形圖,圖11;早期的其他條形圖也被DSMB檢驗,但這裡省略了),以及在第10, 14, 21天和第28天的分層WMW秩和檢驗的動態「雷達」圖(圖)。(分別對應圖12,13,14,15;DSMB也檢查了較早日期的其他圖表,但此處省略了)。第14天的秩和檢驗Z值似乎向下移動,雖然保持在「雷達」屏幕上的有利區域內。此外,第21天和第28天測試並沒有加強第14天的結果,而是未進入對瑞德西韋的有利區域。eDMC系統應上一次會議的DSMB的要求,首次顯示了TTCI的Kaplan-Meier圖(無P值);TTCI的中位數約為23天,而瑞德西韋和安慰劑組分別為24天。1天的差異遠低於試驗方案中預期的6天的差異。
【圖11】DSMB第三次數據審查:在第21天時通過基線得分劃分的6類量表的分布。綠色是安慰劑,紅色是瑞德西韋。每組的患者數:安慰劑68,瑞德西韋129。每組的中位數:安慰劑3,瑞德西韋2。
【圖12】DSMB第三次數據審查:在第10天,通過分層Wilcoxon–Mann–Whitney秩和檢驗的動態數據監查Z分數以及所招募的患者人數,為條件概率(CP)設置了「有希望的區域」的上界=90%,並且下邊界設置為CP=5%。中間劃線表示的CP=50%。
【圖13】DSMB第三次數據審查:第14天,通過分層Wilcoxon–Mann–Whitney秩和檢驗對動態數據進行監查的Z評分以及入組患者的數量,「有希望的區域」的上限設置為條件概率(CP)=90%,並且下邊界設置為CP=5%。中間劃線表示的CP=50%。
【圖14】DSMB第三次數據審查:在第21天,通過分層Wilcoxon–Mann–Whitney秩和檢驗的動態數據監查Z分數以及所招募的患者人數,為條件概率(CP)設置了「有希望的區域」的上界=90%,並且下邊界設置為CP=5%。中間劃線表示的CP=50%。
【圖15】DSMB第三次數據審查:第28天,通過分層Wilcoxon–Mann–Whitney秩和檢驗對動態數據進行監查的Z分數以及入組患者的數量。「有希望的區域」的上限設置為條件概率(CP)=90%,並且下邊界設置為CP=5%。中間劃線表示的CP=50%。
從申辦方那裡獲悉,由於武漢市COVID-19病例持續下降,研究人員將無法招募新患者以達到方案規劃的人數,DSMB建議申辦方考慮將研究擴展到中國其他城市或其他國家的研究。否則,申辦方需要修改方案:(a)由於招募人數下降的原因而改變計劃的樣本量;(b)取消TTCI的預定中期分析;(c)繼續試驗,直到所有隨機分組的患者完成其28天的隨訪;(d)在3月底準備針對重症病例的DSMB最終審查會議。
其他:在2020年3月3日,吉利德公司推出瑞德西韋的兩項臨床試驗[11,12]。對於中度病例[11],主要終點是5到10天出院時間。對於重症病例[12],主要終點是至第14天發燒和血氧飽和度正常的參與者比例。2020年3月11日,世界衛生組織宣布迅速傳播的COVID-19暴發大流行。
4、第五次DSMB會議(第四次和最終數據審查):2020年3月29日
DSMB從申辦方那裡得到了信息,他們接受了DSMB有關對重症病例試驗方案修訂的以上建議。因此,這將是DSMB對重症病例數據的最後審查。輕度-中度患者的第二項試驗尚不足以分析療效數據。CRO僅提供基線和安全性數據。我們仍將重點放在以重症案例上:
隨機分配了237例患者(瑞德西韋組158例,安慰劑組79例)。三周前的上一次DSMB審查僅招募了2名新患者。在237個研究中,有195個(82.3%)完成了研究,其中1個仍在進行中,有35個(14.8%)死亡,還有6個(2.5%)因死亡以外的原因退出研究。一名正在進行的患者將在2020年4月1日之前完成第28天的隨訪。
瑞德西韋組的意向性(ITT)治療全因死亡率為24/158(15.2%),安慰劑組為11/79(13.9%),包括2名在接受瑞德西韋之前隨機分組後死亡的患者和3名患者在第28天後死亡(安慰劑1例,瑞德西韋組2例)。這些比率低於同一研究者小組在洛匹那韋-利託那韋與SOC的試驗中報告的相應比率(19.2%對25.0%)[13]。
在基線的6類序數量表上,類別1(出院或達到出院標準)至6(死亡),瑞德西韋組的分布(%)為(0、0、81.6、17.7、0、0.6)和安慰劑的分布為(0、3.8、83.5、11.4、1.3、0)。可以看出,多數(> 80%)是住院的第3類患者,需要補充氧氣(但沒有NIV / HFNC)。
與安慰劑組的57/77(74.0%)相比,瑞德西韋組的實時出院率繼續較低(107/157,68.2%)。(記錄了三個丟失的數據。)
儘管自上次審核以來僅招募了兩名新患者,但有更多患者完成了10天的治療,並在治療後的第14、21和28天進行了隨訪。積累出院和死亡狀況,該六類臨床量表在第10天累計了228例患者的數據(第10天缺少一名患者),在第14天有229例患者,在第21天有227例患者,在第28天有225例患者(這6類數據不包括接受治療之前發生的2例死亡和第28天之後發生的3例死亡。)
【圖16】DSMB第四次數據審查:在第28天時按基線得分劃分的6類量表。綠色是安慰劑,紅色是瑞德西韋。每組的患者數:安慰劑76,瑞德西韋149。每組的中位數:安慰劑1,瑞德西韋1。
【圖17】DSMB第四次數據審查:第10天,通過分層Wilcoxon–Mann–Whitney秩和檢驗的動態數據監查Z評分以及所招募的患者人數,為條件概率(CP)設置了「有希望的區域」的上界=90%,並且下邊界設置為CP=5%。中間劃線表示的CP=50%。
【圖18】DSMB第四次數據審查:第14天,通過分層Wilcoxon–Mann–Whitney秩和檢驗對動態數據進行監查的Z評分以及入組患者的數量,「有希望的區域」的上限設置為條件概率(CP)=90%,並且下邊界設置為CP=5%。中間劃線表示的CP=50%。
【圖19】DSMB第四次數據審查:第21天,通過分層Wilcoxon–Mann–Whitney秩和檢驗的動態數據監查Z分數以及入組患者的數量,確定了「有希望的區域」的上界作為條件概率(CP)=90%,並且下邊界設置為CP=5%。中間劃線表示的CP=50%。
【圖20】DSMB第四次數據審查:第28天,通過分層Wilcoxon–Mann–Whitney秩和檢驗對動態數據進行監查的Z分數以及入組患者的數量。「有希望的區域」的上限設置為條件概率(CP)=90%,並且下邊界設置為CP=5%。中間劃線表示的CP=50%。
圖16顯示了第28天的6類量表的分層分布。(DSMB也檢查了較早日期的其他分布條形圖,但此處省略了)。圖17,18,19,和20上顯示了在第10、14、21和28天分層的WMW測試的「雷達」屏幕。(其他早些天的也被DSMB檢查,但是這裡沒有顯示。) 與之前的數據回顧相比,觀察到了相似的趨勢,但更多的受試者證實了這一趨勢。第10、14、21和28天的分層WMW測試的Z值均在「有希望的」區域內,條件把握度僅從上面接觸50%,然後在21和28天降低到50%(折線)以下。條件把握度是根據當前觀察到的治療效果來預測如果試驗繼續進行到原計劃的435樣本量,最終Z值是否會超過1.96(即未調整多重性的統計學意義)的概率。然而, 根據21和28天的結果,條件把握度降低到50%(折線)以下。
DSMB還審查了TTCI端點的Kaplan-Meier圖(無P值)。瑞德西韋組的中位TTCI為22天,而安慰劑組為24天。令人失望的2天差異比協議中預計的6天差異小得多。
在通常情況下,我們會建議繼續進行試驗, 甚至增加樣本量。但是,不幸的是,申辦方無法切實可行地繼續在大流行開始的中國以外地區招募患者。因此,DSMB同意以目前的237名隨機分組的患者完成研究。DSMB建議讓最後一名進行中的患者在揭盲之前完成第28天的隨訪。DSMB還敦促研究人員小組在與國際社會分享試驗結果後,儘快做出最終分析。
五、結論與討論
總之,國際跨學科專家合作以及網際網路會議和高效數據監測工具的使用保證了研究參與者的利益,滿足了申辦方的迫切需求,並在特殊情況下保護了試驗的完整性。TTCI的正式中期分析未觸發,因為事件數量不多,並且由於及時控制了中國的COVID-19流行,該研究提前終止。但是,根據237位患者的數據,我們認為仍然可以從研究設計以及瑞德西韋對COVID-19重症病例的治療效果中提取有價值的信息。最終的醫學報告將很快出現在柳葉刀期刊[14]上(腳註1)。
對於2020年3月29日的最終數據,相對於安慰劑組, 瑞德西韋組的死亡率稍高些,而出院率稍低些。此外,在3, 5和7天「雷達」屏幕上觀察到的六類尺度上的WMW秩和檢驗的Z值是負的。而相比安慰劑組,瑞德西韋組的中位TTCI卻縮短了2天。對於這種不一致的一個解釋可能是隨機的因素,因為儘管沒有進行正式的計算,沒有一個以上的數值比較可以通過通常的統計顯著性水平。另一個原因可能是TTCI刪失(censor)死亡病例在第28天,以至於中途死亡病例比生存但未達到2分改善的病例獲得公平意義的TTCI。第三種解釋可能是TTCI只著眼於改善方面而忽略了惡化方面,而83.5%的患者處於6類量表的中間,可以朝任何方向發展。使用TTCI作為主要終點是本研究設計的弱點。
28天的隨訪時間是重症病例的試驗設計的重點。對於為期10天的治療方案,數據清楚地表明,瑞德西韋在重症病例的治療7天之內沒有立即起效。在第14天就顯示出對臨床改善的最佳效果。但是,這種效果似乎在第21天和第28天都沒有持續。僅10天的療程可能不足於重症病例。如果試驗設計為僅隨訪14天,則無法發現這種後來效果不能持續的現象。NIAID和Gilead Sciences分別進行的試驗[10,12]為期14天(腳註2)。
最後,我們使用DDM的經驗證明了其在支持DSMB在緊急情況下即時檢查次要有效性終點和關鍵安全性數據方面的效率和可靠性。DDM在訓練有素的統計學家正確使用中,顯示出能夠靈活探索試驗數據的能力,同時可以保護試驗的科學完整性。
六、腳註
1. 該醫療報告於2020年4月29日在線發布。
2. 後來這兩項試驗修改了研究時間。
七、致謝
作者要感謝DSMB的成員:瞿介明(上海瑞金醫院院長),Weichung Joe Shih(羅格斯大學公共衛生學院),Robert Fowler(多倫多大學),Rory Collins(牛津大學)和姚晨(北京大學); 獨立統計學家:閻小妍(北京大學)和Bin Shan(泰格醫藥CRO);和eDMC程式設計師:Peng Zhang,Emy Wang(CIMS Global)。
符合倫理標準
八、利益衝突
本文中所表達的觀點和經驗只反映了作者的觀點,而不一定是整個DSMB。作者宣稱沒有利益衝突。
參考文獻(可上下滑動瀏覽)
[1] A Phase 3 Randomized, Double-blind, Placebo-controlled, Multicenter Study to Evaluate the Efficacy and Safety of Remdesivir in Hospitalized Adult Patients With Severe 2019-nCoVRespiratory Disease. PI: Cao Bin. (ClinicalTrials.gov Identifier: NCT04257656).
[2] A Phase 3 Randomized, Double-blind, Placebo-controlled Multicenter Study to Evaluate the Efficacy and Safety of Remdesivir in Hospitalized Adult Patients With Mild and Moderate 2019-nCoV Respiratory Disease. PIs: Cao Bin and Wang Yeming (ClinicalTrials.gov Identifier: NCT04252664).
[3] International Conference on Harmonization of Technical requirements for Registration of Pharmaceuticals for Human Use. Guideline for Good Clinical Practice E6 (R1).
[4] China National Medical Products Administration (previous CFDA), State Administration for Market Regulation. Order for medical products registration and management. (In Chinese). NO. 2020–1585550949312.
[5] World Health Organization WHO R&D Blueprint novel Coronavirus: Outline of trial designs for experimental therapeutics, 2020.
[6] Xie T, Zhang P, Shih WJ, Tu Y, Lan KKG. Monitor on-going clinical trials with a dynamic procedure. CIMS Global LLC: Technical report; 2019.
[7] Hochberg Y. A sharper Bonferroni procedure for multiple tests of significance. Biometrika. 1988;75:800–2.
[8] Lan KKG. and DeMets DL. Changing frequency of interim analysis in sequential monitoring. Biometrics (1989), Vol 45, 1017–1020.
[9] Hwang IK, Shih WJ, DeCani JS. Group Sequential Designs Using a Family of Type I Error Spending Rate Functions. Stat Med.1990;9:1439–45.
[10] A Multicenter, Adaptive, Randomized Blinded Controlled Trial of the Safety and Efficacy of Investigational Therapeutics for the Treatment of COVID-19 in Hospitalized Adults. National Institute of Allergy and Infectious Diseases (NIAID). ClinicalTrials.gov Identifier: NCT04280705.
[11] A Phase 3 Randomized Study to Evaluate the Safety and Antiviral Activity of Remdesivir (GS-5734) in Participants With Moderate COVID-19 Compared to Standard of Care Treatment. Gilead Sciences. ClinicalTrials.gov Identifier: NCT04292730.
[12] A Phase 3 Randomized Study to Evaluate the Safety and Antiviral Activity of Remdesivir (GS-5734) in Participants With Severe COVID-19. Gilead Sciences. ClinicalTrials.gov Identifier: NCT04292899.
[13] Cao B, Wang Y, et al (2020) A trial of lopinavir–Ritonavir in adults hospitalized with severe Covid-19. March 18, 2020, and updated on March 19, 2020, at NEJM.org. doi:10.1056/ NEJMoa2001282.
[14] Wang Y, Cao B, Wang C et al (2020) Remdesivir in adults with severe COVID-19: results of a randomized, double-blind, placebocontrolled, multicenter trial. Lancet In press (April 2020).
專家介紹
姚晨
現任北京大學第一醫院醫學統計室主任,兼任北京大學臨床研究所副所長。主要學術任職:中國醫師協會循證醫學專業委員會主任委員,中國衛生統計學會統計理論與方法專業委員會副主任委員,吳階平基金會腫瘤醫學部副主任委員,國家食品藥品監督管理局(CFDA)高級研修學院客座教授,CFDA藥品/器械審評專家顧問委員會委員。「臨床研究(方法)學」博士生導師。致力於臨床研究的數據管理與統計分析方法應用的研究,開展臨床研究設計教育培訓工作。與臨床醫生合作,參與了眾多的的新藥、醫療器械和研究者發起的臨床研究項目。
本文完
排版:Jerry