國家藥監局藥審中心關於發布《抗腫瘤藥臨床試驗影像評估程序標準技術指導原則》的通告(2021年第1號)
發布日期:2021.01.15
為規範和指導當前抗腫瘤新藥臨床試驗過程中影像學相關的設計和實施,提高影像學相關終點的評價質量,為行業提供技術參考,在國家藥品監督管理局的部署下,藥審中心組織制定了《抗腫瘤藥臨床試驗影像評估程序標準技術指導原則》(見附件)。根據《國家藥監局綜合司關於印發藥品技術指導原則發布程序的通知》(藥監綜藥管〔2020〕9號)要求,經國家藥品監督管理局審查同意,現予發布,自發布之日起施行。
特此通告。
國家藥品監督管理局藥品審評中心
2021年1月14日
附件 1 :《抗腫瘤藥臨床試驗影像評估程序標準技術指導原則》.pdf
下載連結:http://www.cde.org.cn/attachmentout.do?mothed=list&id=ac581fb2a72c5eeb
抗腫瘤藥臨床試驗影像評估程序標準技術指導原則
2021年1月
目 錄
一、前言
二、背景
三、臨床試驗影像的設計考慮
(一)設立獨立評估委員會的考慮
(二)影像源數據的規範化
(三)影像評估數據的規範化
(四)其它設計考慮
四、實施
(一)申辦方職責
(二)研究者職責
(三)影像 CRO 職責
五、影像數據的質量保障
(一) 數據鎖定及修改的考慮
(二)審評數據清單
六、總結
七、參考文獻
附件 1 影像章程的規範化和科學性建議
附件 2 上市申請影像相關資料清單
一、前言
抗腫瘤藥是當前全球新藥研發的熱點之一,隨著腫瘤治療手段的逐漸豐富,患者的生存期不斷延長,客觀緩解率(objective response rate, ORR)、無進展生存期(progression freesurvival, PFS)和無疾病生存期(disease free survival, DFS)等基於醫學影像評估結果的替代終點,越來越多地被作為支持新藥上市的關鍵研究的主要終點。目前臨床影像學中影像處理、信息傳輸等已經具備了一定程度的標準化,並在臨床實踐中被廣泛應用。臨床或影像科醫師對醫學影像進行分析和診斷時,通常以主觀判斷及病灶測量為主,不需要系統性的量化評估也能滿足臨床對影像診斷的需求。但在臨床試驗中,影像檢查及評估過程的差異可導致相關測量誤差增加、臨床試驗終點評估變異增大,最終影響臨床試驗結果,因而臨床試驗影像評估程序的標準化在以影像評估為主的臨床試驗中變得十分重要。
由于越來越多的關鍵研究採用了醫學影像相關的研究終點作為主要研究終點,而在影像評估的總體設計、實施過程和數據管理等方面,尚無相關技術要求或行業標準可循。因此,在該領域急需制定臨床試驗影像評估程序標準的技術指導原則,以規範行業操作,明確技術標準。
二、背景
當新藥研發的關鍵研究採用影像相關終點作為主要研究終點時,為保障評估的客觀性和獨立性,通常會在臨床研究中設置第三方獨立影像評估,依據獨立影像評估章程(後簡稱為影像章程)開展工作。影像章程具體描述試驗的影像評估過程和標準,特別當試驗的影像評估過程與標準包含了現有的醫學影像實踐的額外要求,或試驗的影像採集、標準運用或療效結果評估較為複雜時,更需要注意具體的操作細節,使影像評估結果科學可信,因此申辦方和或委託方需要起草獨立的影像章程。影像章程應描述影像檢查可能涉及的偏倚和變異及其控制方法,以及如何在臨床試驗中良好地採集影像數據並進行影像評估,確保評估結果的客觀性和科學性。良好的臨床試驗影像評估設計、嚴格依從影像章程實施評估是獲得可靠的影像評估結果的關鍵要素。
合格的臨床試驗影像評估程序應滿足以下要求:能客觀地反映研究藥物/治療手段的療效;在未來的臨床試驗和治療中,評估結果穩定;評估數據可溯源。
本指導原則適用於在國內開發的抗腫瘤藥物臨床試驗,指導原則將以臨床試驗影像的設計、實施和數據管理方面的考慮為邏輯,闡述臨床試驗影像評估程序標準化的研發和審評考慮,並附影像章程的規範化和科學性考慮(附件 1),以及上市申請時影像相關資料建議清單(附件 2),為醫藥研發企業、影像合同研究機構(contract research organization, CRO)、研究者及各臨床試驗參與者提供臨床試驗影像評估程序標準化和資料準備建議。
在臨床試驗影像評估等實施過程中,還應遵循人用藥品註冊技術要求國際協調會議 (international conference forharmonization, ICH)所發布的 E61和 E92指導原則,和現行《藥物臨床試驗質量管理規範》。
本技術指導原則旨在闡述當前藥品技術審評機構對抗腫瘤藥臨床試驗影像評估程序標準的評價考慮,不能涵蓋在新藥研發中遇到的所有情況。目的是提升臨床試驗影像的標準化和規範化,提高創新藥物/治療方法的療效評價質量、確保療效可信,為藥物研發從業者在臨床試驗影像相關內容的設計、實施及申報提供參考。
三、臨床試驗影像的設計考慮
當影像學終點作為關鍵臨床試驗的主要研究終點時,在臨床試驗影像的設計層面,申辦方首先應評估該終點的臨床意義,與藥品技術審評機構討論,確定在關鍵研究中使用該終點的可行性。一旦可行,將在設計層面討論臨床試驗影像的相關問題,包括主要研究終點是否選擇獨立評審委員會(independent review committee, IRC)評價、影像學檢查方式和其它相關方案設計等內容。
1 E6(R2): Guidance for Good Clinical Practice. E6(R2):藥物臨床試驗管理規範
2 E9: Statistical Principles for Clinical Trials. E9:臨床試驗的統計學原則
(一)設立獨立評估委員會的考慮
與抗腫瘤臨床試驗中作為金標準的總生存期(overallsurvival, OS)相比,研究者在療效評估時不僅有影像數據,還可獲得影像外的臨床數據。該因素有助於研究者對影像學資料的判讀,但在開放性設計的臨床試驗中,研究者可能對試驗組受試者產生傾向獲益的預期,由此可能導致研究的影像評估結果出現潛在的偏倚或傾向性。
獨立中心化的影像評估過程通常是充分盲化的,評估者不知曉所評病例的治療信息(非單臂試驗)和研究者的評估結果,即盲態獨立中心評估(blinded independent central review,BICR),BICR 可提高影像評估的獨立性和可信度,並與研究者的評估結果互為對比。因此可能提高研究結果的客觀性。若能夠充分證實影像評估數據在常規臨床診療環境中有很好的一致性和可重複性,此情況下獨立影像評估也不是必要的;在雙盲隨機對照的大型 III 期設計的臨床試驗中,從數據可重複性/穩定性的角度出發,隨機抽取部分影像進行 BICR也可做為一致率是否符合要求的檢測,以提高數據的可靠性。
當擬支持註冊的關鍵研究存在以下情況時,建議使用獨立影像評估:
單臂設計的試驗(當前須採用 BICR 評估);
無法設盲、可能存在評估偏倚的對照試驗;
有效性假設/預期結果趨於臨界值的隨機對照試驗;
影像源數據質量易出現偏差,需要設置 IRC 對影像源數據質量進行控制的試驗;
使用特殊評估標準的試驗,如需要特殊影像量化方法:少數罕見病如神經母細胞瘤間位腆代苄胍掃描(meta?iodobenzylguanidine, MIGB)或 PET,或影像數據須藉助特殊軟體進行處理和評估,在實施時難以控制各中心的一致性。
一項關鍵研究是否需要 IRC,採用前瞻性或回顧性 IRC,是否將 IRC 終點設置為主要研究終點,以及 IRC 的章程設計,例如採用同步評價,階段性評價或者回顧性評價,須在關鍵研究方案設計時溝通明確。
(二) 影像源數據的規範化
1. 影像檢查方式
影像檢查方法的選擇,例如選擇 X 線/CT/MRI/PET-CT等,是設計層面重點考慮的問題。由於檢查方法與解剖部位和/或適應症及試驗藥物的作用機制密切相關,建議在設計試驗時充分考慮影像檢查方式對目標適應症和主要研究終點的適用性。如 MRI 或增強 CT 是肝細胞癌評效的可選方式,而目前肺癌評效通常採用增強 CT,而不常採用 MRI。
2. 影像檢查的標準化
雖然常規臨床醫學的影像診斷已經具備了一定的標準化,鑑於臨床試驗對影像評估的要求高於一般臨床診療,常規影像數據的質量也許不能滿足註冊臨床試驗的要求。多中心臨床試驗中,如果各研究中心影像數據質量的一致性較差,也可能直接影響評估結果的可靠性。建議申辦方考慮如下影像檢查的標準化因素,保障不同研究中心的影像質量滿足試驗所需最低要求:
各研究中心間或其它(第三方)影像檢查機構,影像檢查手段在技術和性能上的差異,影像檢查成本,以及多中心的可行性(部分中心是否適宜納入研究);
(2) 對影像檢查醫師和/或責任醫師的資質核實,能滿足試驗所需的任何特殊技術條件;
(3) 需在影像上做測量的,推薦使用體模和/或適當的校準標準對影像檢查設備根據特定臨床試驗的需求進行定期校準驗證和維護,以保證各臨床研究中心圖像的質量以及一致性;
(4) 任何臨床試驗設計相關的圖像採集特徵,包括受試者的擺位、影像檢查的解剖覆蓋範圍、造影劑的使用、圖像的採集時相、受試者是否需要麻醉以及影像採集設備的設置等;
(5) 圖像質量控制標準,包括必要時為複查影像檢查獲取可評估圖像所規定的標準。
3. 操作人員資質及培訓
在圖像採集過程中,臨床研究中心的影像技師和/或責任醫師有非常重要的職責,包括識別成像錯誤或不可接受的圖像,必要時重新進行影像檢查等。多中心試驗影像採集過程的實施差異可能影響評估結果。因此,申辦方應在設計層面評估影像採集實施過程的潛在差異,決定是否對影像採集人員進行資質要求或進行相關培訓。具有特殊要求的影像檢查手段,應在試驗開展前對影像採集人員開展必要的培訓。
影像章程應說明影像技師和/或責任醫師在圖像採集過程中的職責,包括應具備的資質,以及在必要時對圖像質量做出初步評估的職責。在某些情況下,即便患者增加少量的輻射劑量,重新做影像檢查對試驗也是合理的,應儘量避免因為不合格的圖像質量而導致無法評估療效的情況。在某些情況下,如超聲成像中,應對醫師操控成像探頭的要點進行詳細說明。根據影像檢查手段和技術的要求,章程可以描述或引用試驗方案中所描述的培訓部分,以提高圖像採集質量和一致性。
4. 影像掃描設備管理的規範化
影像源數據的質量是評估者實現準確評估的基礎,尤其是需要進行量化評估的影像終點更依賴於影像掃描設備的精準度,故如前所述可通過影像體模等工具或可行的校準手段對參與掃描的設備進行定期檢驗,以保證各臨床研究中心圖像質量的精準度及一致性。非量化或量化權重較低的影像終點應提供符合國家標準的檢測報告。
採用常規影像操作標準的臨床試驗,應在方案中詳細說明如何執行這些標準。對影像過程中可能引入或增加的圖像質量偏離應考慮是否採納超出常規的操作標準,如圖像質量控制標準;另外,圖像的存儲對於試驗的實施、監察和臨床試驗數據核查也非常重要。
章程應包括對圖像採集、存儲和傳輸的定期質量監察計劃,以及適用時利用體模和/或適當的校準標準對影像檢查設備進行的定期檢測,對可預期的相關質量偏離制定相應糾正計劃。這類監察的重要性和特點因影像技術的特點而異,但至少應該包括某種形式的定期的由研究中心或第三方機構對影像檢查設備做出的質檢報告。
另外影像檢查設備可能出現的升級或故障,以及影像相關的藥物如造影劑在不同研究中心可能存在的差異;這類監查的重要性和特點因影像技術的特點而異,應用 PET 的standard uptake value (SUV) 絕對值變化對藥物療效的定量評估時,需要使用體模對 PET 進行定期測試。但在實體瘤療效評價標準 1.1 (RECIST 1.1 標準)中,當 PET 僅作為疾病定性評估的輔助工具時,提供常規年檢或規定檢測周期範圍內的檢查報告即可。
在影像檢查過程比較複雜或是某種創新檢查的試驗中,我們建議研究中心按照特定標準進行圖像的預採集,並提交給影像質控人員進行圖像質量的確認,以評估參與研究的中心的圖像採集能力。
5. 影像源數據規範化的其它考慮
影像源數據規範化的其它考慮,還包括採用國際通用的醫學數字成像和通信標準,即醫學數字成像和通信(digitalimaging and communications in medicine, DICOM)格式圖像。
DICOM 影像數據在進行傳輸、展示及存儲等操作時也需要遵守 ICH 和藥物臨床試驗管理規範(good clinical practice,GCP)原則,對受試者的隱私進行充分保護,如在規定外但在懷疑疾病進展時採集的影像也應該上傳,涉及患者隱私非評價必要的信息不能上傳等。章程或附件中應詳細說明對DICOM 數據的處理標準和過程。
建議將受試者基線的手術史(包括近期的胸腹腔穿刺術)、放療史(詳細到具體病灶)和病理活檢結果等基線信息反饋給 IRC,為 IRC 選擇基線靶病灶提供必要的背景信息。如果上傳的不良事件(adverse event, AE) 影像會破壞 IRC 的獨立性或導致 IRC 評估偏倚,應避免上傳。建議章程明確與研究藥物或同類藥機制可能相關的特殊 AE(如與免疫檢查點抑制劑相關的非感染性肺炎)的影像是否上傳,以及上傳的條件和限制,在 IRC 的獨立性和影像結果評價的準確性之間做合理的平衡。總體上,應避免上傳非必要的 AE 影像,以保障 IRC 的客觀獨立。
(三)影像評估數據的規範化
影像評估數據的規範化是在設計層面對結果質量和可信度的重要保障。在設計層面評估數據的規範化考慮範圍包括:是否選擇了正確的評估標準,評估周期設置是否合理,評估流程設計的科學性,對評估者的資質和培訓要求,以及其它設計層面的規範化考慮。
1. 評估標準
影像評估標準作為影像臨床試驗個體評估轉歸結論的核心依據,應在影像章程中明確。影像評估標準可由個人或專家組(如 GCP 專家、醫學、影像專家和影像物理師等);制定者應具備與臨床試驗指徵相符的臨床資質和相關專業學科領域的經驗。
影像評估標準的確定可參考自身早期經驗,或是以往類似臨床試驗中曾使用過的以影像學為主要終點的案例,尤其應注意已觀察到的影像學方法中的問題。
影像終點療效評估標準應根據不同適應症和藥物作用機制的特點來確定,建議使用量化或半量化評估標準,並且所採用的標準應首選經充分驗證的、國際通用且被廣泛認可的評估標準 (Sargent et al., 2009),如 RECIST 1.1 標準(Eisenhauer et al., 2009)、Lugano 標準(Cheson et al., 2014),肝癌選用的 mRECIST 標準(Lencioni & Llovet, 2010),胃腸間質瘤選用的 Choi 標準(Choi et al., 2007),腦膠質母細胞瘤選用的 RANO 標準(Wen et al., 2010),前列腺癌選用的 PCWG3 標 準(Scher et al., 2016)等。在部分適應症或藥物的臨床試驗中可能選擇其它評估標準作為探索性終點,例如免疫檢查點抑制劑選用的 iRECIST 標準(Seymour et al., 2017)等。須在影像章程中明確試驗所採用的評估標準,避免出現標準適用錯誤的情況。評估標準可根據臨床試驗適應症和預期影像學變化特徵而確定,當臨床試驗終點指標的評估標準較複雜時或臨床信息部分具有較高評效權重時,在 IRC 組織內可引入相關專業學科的獨立臨床醫師評估者,以獨立評審委員會的形式完成綜合療效評估。對常用標準中容易產生歧義或導致偏倚的方面或是試驗擬採用特殊的標準時,應當在方案和影像評估程序標準的設計中明確說明,避免出現對評估標準理解不統一。隨著治療方法的改進,也許未來還會有其他類型疾病的特定評估標準出現,屆時可根據具體情況特殊制定。
如果申辦方需要對常規實踐已接受的評估標準進行修訂,或是有定製化的評估標準時,須提供充分的修訂科學依據,並與臨床影像專家及藥品技術審評機構溝通修訂的合理性可行性。
2. 評估頻率
影像學檢查的頻率取決於:
對目標適應症潛在變化趨勢的了解,例如晚期惡性腫瘤常依據治療周期的整倍數選擇每 6/8 周進行療效評價,輔助和新輔助腫瘤可以每 8/12 周或更長周期進行評價等;
影像檢查計劃的可行性,患者的依從性,影像檢查劑量對受試者的安全性;
總體試驗設計的特徵,如系統性治療與局部治療。
在非單臂研究設計中,所有試驗組中影像隨訪周期及評估的頻率還應考慮一致性的問題,非對稱影像評估時間點在療效評估中可能產生偏倚。對於使用時間-事件分析方法的主要終點,應當進行充足頻次的影像學評價,以確保精確捕捉事件時間。當研究設計了不同於常規的評估頻率時,應與藥品技術審評機構溝通,提供證據支持其合理性。
3. 評估流程的設計考慮
為保障 IRC 評估結果的獨立性、穩定性和科學性,須有嚴謹的操作章程。IRC 的獨立性是藥品技術審評機構的關注重點。設計者可以根據目標適應症特點、試驗設計和實際實施因素考慮章程的設計。要避免因評估流程存在的科學性問題而導致評價結果發生系統性偏倚:如由一名技術員選擇靶病灶,評估者根據技術員已選擇的靶病灶再進行評估,由於技術員的選擇偏倚,將不能保障評估者評估結果的獨立性;如多名評估者同時在一塊大屏幕上評價目標病例,將難以避免討論並影響單個評估者的獨立判斷;如採用回顧性 IRC 分析時,IRC 獲知了研究者的評估結果,甚至包括具體病例的評價結果,這將嚴重影響 IRC 評價的獨立性。諸如此類問題應在影像章程的設計時避免。
有 多 種 隨 機 化 圖 像 展 示 方 法 , 如 順 時 排 序 (time?sequential image presentation),同步圖像展示(simultaneousimage presentation),同步-隨機時態圖像展示(simultaneous,randomized temporal image presentation),單時間點同步展示(simultaneous time point presentation),混合隨機化圖像展示(hybrid, randomized image presentation)等。對這些方法的選取應由項目申辦方在滿足科學性的基礎上依具臨床試驗的需求選取。
在保障 IRC 的獨立性後,應關注評估流程的設計細節,以提高 IRC 評價的穩定性和準確性。應有準確、量化的評價標準,符合資質的評估者,訓練和質控等設計以保障 IRC 的評價結果穩定準確。如果影像評價所採用的標準存在爭議或在實踐中有較大自由度,則應儘可能明確其標準或細則,並加以培訓,以提高評價結果的穩定性。
IRC 評估數據的穩定性是保證評估結果可信以及反映IRC 評價質量的重要指標。IRC 穩定性的概念是相對廣泛的,包括同一個臨床試驗在評估實施初期和結束時,或根據章程規定的時間(例如按每 1/3 病例或事件數)評估結果的穩定性;IRC 評估者之間評估結果的穩定性;同一個評估者前後自身評估結果的穩定性;以及總體 IRC 的評估結果與研究者的評估結果之間差異的穩定性,包括試驗組和對照組之間差異的方向和幅度。而不過度強調 IRC 與研究者在最終評估結果的一致性。
由於 IRC 僅可獲得章程規定的有限的臨床信息,不宜將IRC 的評估結果作為決定患者治療決策的唯一依據。如果採用前瞻性實時 IRC 評估,方案設計需要明確是否根據 IRC 的評估結果揭盲,以將 IRC的評價結果及時地反饋給研究中心。採用回顧性的影像收集時,因所有影像數據已採集完畢,IRC無法對影像源數據進行質控,可能會降低其評估質量,建議在設計層面權衡上述因素,明確影像傳輸時間及所採用的IRC 評估為實時評估、階段性評估還是回顧性評估。
本指導原則的附件 1 提供了對影像章程設計的規範化/科學性考慮。
4. 評估者的資質及培訓
在制定章程時,申辦方/研究者應確定評估者的數量及評估者所需的背景資質。章程制定者應明確以下幾點:
IRC 評估者的利益衝突迴避情況;
評估者能夠完成影像評估的必要的專業背景和/或技術知識範圍;
影像評估和/或評估過程設盲的重要性;
評估者疲勞對臨床試驗的潛在影響以及使用替代評估者作為解決措施。因評估者疲勞引起的圖像評估質量下降在臨床醫學中已有報導(Krupinski et al., 2012);
評估者對評估任務所用時間的承諾,及評估者參與評估的可能性。
對裁定評估者資質的考量,確定其能裁定評估者間的結果差異並決定最終評估結論。根據研究特點和對 IRC 的要求,裁定評估者可以是固定的或是在評估者間輪轉的。
章程對評估者的培訓過程應做描述,特別要強調培訓文件編制過程、任何特定的培訓材料的使用,例如培訓手冊或培訓圖像、圖像展示的培訓以及任何圖像評估標準應用的測試過程。章程應對培訓影像資料的來源做出描述,例如從影像資料庫或公開資料庫中獲得。另外,章程應預先規定,在培訓後和整個試驗過程中,是否會以某種標準對評估者進行資質認證。評估者培訓手冊是一份關鍵性文書,其包含更多評估者培訓程序的細節,所以應與章程一同提交給藥品技術審評機構審查。
申辦方/研究者在制定評估者培訓過程中應考慮以下條目的重要性:
對影像評估主要目標的概述:除非影像評估過程中還涉及臨床信息的使用,一般來說,對影像評估者的培訓只應強調和圖像相關的影像評估過程的各個方面。該過程還應減少影像評估時可能會引入的偏倚,避免評估者從某些圖像特徵中可了解到治療分組情況,進而破壞臨床試驗設計中的盲化設置;
對圖像後處理、病變測量和其他圖像評估的主要要求進行概述,評估者可以從以下培訓中受益:計算機輔助判讀、輔助測量和其他分析工具的使用、圖像的測量和記錄的過程,尤其是當此過程涉及獨特的軟體數據鎖定和密碼保護功能時。某些情況下,輔助評估過程的順利實施需要評估者具備以下先決條件:紮實的評估標準知識,並能使用特殊的評估工具,例如 RECIST 1.1 的評估工具(Eisenhauer et al.,2009)。章程應詳細的描述圖像後處理、病變測量和其他圖像評估的主要要求,並當圖像質量不利於必要的病變測量或其他軟體工具的使用條件時,需對這些情況進行說明;
確認某些特定評估的定義和/或標準,包括對影像病例報告表的使用:多數臨床試驗可能受益於對評估標準的預先定義,例如識別導致圖像不可評的條件,而且這些標準可能不同於常用的臨床標準。培訓和對培訓的認證含模擬影像評估可能對記錄評估者的讀片熟練程度很重要;
對維持評估者評估能力措施的描述:一些影像評估的過程包括了在臨床試驗圖像中混合了一些測試圖像,定期對評估者的能力和一致性進行間斷性測試。若評估者不能維持評估的能力效果,他/她可能會接受再次培訓或被替換為另一個經過培訓測試的有資質的評估者。章程應對評估者的測試和重新培訓或更換過程加以描述。
為保障評估質量,IRC 的每一名評估者均須具備項目所需的相關評估資質,並進行項目相關培訓或具有實施經驗。建議 IRC 能夠採用至少一名具備臨床專業背景、對影像評估標準有過充分培訓、對目標適應症診療具備豐富執業經驗的質控員進行質控,以提高評估者執行影像評估標準的嚴謹性和評估結果的準確性。建議各中心的主要研究者也遵循評估章程中的規範,針對目標試驗影像評估的特殊流程,在入組前培訓本中心的影像評估人員(通常為臨床研究醫師),將對提升研究評估質量有一定幫助。
在同一多中心試驗中,研究者評估可能存在多種情況,例如部分中心採用研究醫師評估,部分採用放射科醫師評估。申辦方應在設計層面考慮研究者評估的複雜情況,對評估者資質提出具體要求,並在項目實施前實施必要的培訓。
(四)其它設計考慮
在影像源數據的規範化方面,應在受試者數據隱私保護等方面具備相應考慮。在臨床試驗影像評估程序標準的設計層面,如下的考慮內容有助於提高影像評估的實施效率並利於核查:比如在與方案設計匹配的影像學內容,簡單的可增設影像檢查實施記錄表及療效評價記錄表,或在研究者手冊中明確影像相關內容;複雜的可進行獨立的病歷報告表(CaseReport Form, CRF)設計和或滿足 CRF 需求的電子數據採集(electronic data collection, EDC) 系統。申辦方自行評估,根據數據收集需要,確定是否在 EDC 中設置相應的影像學模塊。
影像相關檢查結果的溯源是當前 GCP 核查的重要內容,申辦方應考慮影像相關內容的設計清晰簡要,提高臨床試驗數據核查中溯源的便利性。
四、實施
臨床試驗中影像數據的採集、存儲、記錄、評估和修訂均須參照現行 ICH E6 和《藥物臨床試驗質量管理規範》的原則實施。本章節將提醒不同的實施主體關注如下關鍵要素。
(一)申辦方職責
所有的 IRC 有關的文件,由申辦方遞交。申辦方對遞交的所有臨床試驗數據負責,包括臨床試驗影像數據產生及評價過程,具有保障臨床試驗影像章程良好實施,記錄完整,結果可溯源的義務,並承擔相應責任。以下內容提醒申辦方在實施過程中關注:
申辦方的監查員應按照臨床試驗方案和/或章程對臨床試驗影像的實施過程進行監查,包括是否按方案及章程要求開展了相應的影像學檢查,以及是否超窗,記錄是否完整,修改是否合規;並將所發現問題及時反饋給申辦方及研究者。
申辦方對所遞交的臨床試驗數據全權負責,申辦方應關注以下方面:
影像數據與臨床數據一樣需要注重受試者隱私,符合 ICH 標準,相關數據記錄務須完整,履行結果可溯源的義務,並承擔相應責任;
影像檢查是否在既定窗期內進行了檢查,影像數據的採集是否符合既定的設計標準,各時間點影像檢查方式是否一致,掃描覆蓋解剖區域是否完整,圖像質量及增強掃描的時相是否符合設計要求,圖像數據在評估時是否保持無損等;
評估流程及遮盲措施是否符合設計規範,數據是否準確、真實、可溯源,數據鎖定是否合理,鎖定後是否存在變更記錄,使用第三方獨立評估時是否能夠保證其評估的獨立性。
若使用 EDC 系統,影像評估數據應在對獨立評估者的病例報告確認後完成鎖定,任何變更都應符合 GCP 要求進行留痕。
(二)研究者職責
研究中心或第三方的影像科室應有專人負責臨床試驗影像相關事務。研究者應參照 ICH E6 和國內現行 GCP 原則,實施臨床試驗影像標準相關內容。具體包括:按照影像章程或影像掃描協議採集並儲存圖像;提供真實、完整和可溯源的評價記錄,並對修訂內容留痕;及時反饋申辦方和/或第三方合同研究機構檢查員的溝通/問詢內容;配合臨床試驗數據核查等。
(三)影像 CRO 職責
IRC 務必保障其評估流程的獨立性。IRC 實施方面的主要職能是數據的收集、質量保障及盲化獨立評估,輸出準確的評估數據,對影像源數據和評估數據進行可靠的存儲,並有義務配合申辦方和藥品技術審評機構對相關記錄進行核查。影像終點獨立評估合同研究機構(CRO)應在實施過程中需注意以下方面:
影像 CRO 利益衝突迴避,例如影像 CRO 或其關聯公司持有或被持有申辦方及申辦方關聯公司的股份等情況;
(2) 運營的質量管理體系應符合 ICH E6 和現行 GCP 的相關要求,並能夠支持臨床試驗影像終點獨立評估的規範實施及保障數據質量;
(3) 涉及臨床試驗計算機管理系統和 EDC 的,應以臨床試驗為單位,根據試驗特定流程和需求,對軟體工具/系統進行用戶權限、流程和評估標準的充分測試、驗證、風險分析及應對措施,以確保臨床試驗平穩運行。保存相關記錄以備稽查所用。用於 DICOM 圖像的展示、測量和或後處理軟體建議具備國內和/或國際同等權威機構的認證證書方可用於影像終點的量化評估;
(4) 有職責要求或協助申辦方選擇符合評估資質的獨立評估者,並對其評估質量負責,包括對其進行試驗特定標準的培訓、測試及認證,以滿足影像終點獨立評估的專業性要求,必要時重複培訓-測試-認證過程,以保證評估數據的質量和一致性。獨立評估者的資質及培訓可參照《評估者的資質及培訓》章節;
(5) 嚴格執行影像評估章程和/或影像採集協議對影像終點相關標準的設計。獨立評估者在實施影像終點評估的過程中,不應被任何組織或個人進行幹預和/或誘導,影響其終點結論的判斷,否則涉嫌嚴重違規;
(6) 在臨床試驗運營期間及試驗結束後的 5 年內對原始影像數據、評估數據及輸入至輸出的全過程文件記錄有保存、管理和維護的責任;
(7) 獨立影像評估實際包含兩大職能:數據收集和獨立評估,根據臨床試驗對數據的需求,IRC 在實施不同類型的評估時應注意時效性的問題,從執行獨立評估的方式與時效性的關係上可分為:
a. 回顧性批量數據收集及獨立終點評估,可用在臨床試驗啟動前未對影像終點標準進行獨立評估規範化設計的臨床試驗,對數據收集及評估的時效性根據申辦方提交審批材料的進度而定,較易實施,這裡不做詳細說明;
b. 實時入組標準獨立評估,用於需要對患者入組標準判斷嚴謹性較高的臨床試驗,需要患者在入組前完成的影像檢查,應根據試驗方案在既定時間內完成數據的質量檢查及評估,對時效性要求較高,需要臨床研究中心的配合度較高;
c. 實時數據收集及質控後批量獨立終點評估,用於多數對影像數據質量有要求但對獨立評估結論的時效性不高的臨床試驗,此方式實施的可行性較高,但應注意數據收集和質量檢查過程的時效性,因為需要考慮到可能出現的需要進行重新影像檢查的情況以避免檢查超窗,也需要研究中心的配合。
實時數據收集及質控後實時獨立終點評估,用於獨立評估作為部分治療決策依據或確認進展的臨床試驗,對數據收集和質量檢查過程以及獨立評估結論都有時效性要求的方式,實施時比較依賴於研究中心的配合度。
在實踐中,醫學影像診斷通常在圖像採集後幾個小時至數天內完成,但臨床試驗中的獨立中心化影像評估可能需要更長的時間。
以下情況需要 IRC 及時地評估:
受試者入組評估,例如方案規定納入由 IRC 評估基線具有靶病灶的患者,對基線是否存在靶病灶的確認,需在受試者的入組前及時完成;為減少 IRC 評估時間對試驗入組效率的影響,應在方案內對 IRC 的評估時間做出具體規定,並在試驗流程設計中將其考慮在內,避免 IRC 評估延遲造成的研究方案偏離;
臨床試驗中期分析評估;
用於圖像質量控制的評估;
IRC 評估結果為受試者治療決策考慮之一時。
五、影像數據的質量保障
涉及臨床試驗影像終點標準的數據包括影像源數據(推薦使用 DICOM 標準格式的影像數據)和影像終點評估結論數據兩部分。影像源數據又包括在各研究中心的受試者的原始影像數據,經過後處理的影像數據,研究者和/或獨立評估者進行影像評估時在圖像上所做的標記圖像;影像終點評估結論數據則為評估者填寫的病歷報告表。
數據管理的核心考慮包括影像數據在傳輸、接收、變更過程中的留痕,以及評估結論數據的鎖定及修改的原則,IRC評價質控不合格的考慮,基於變更而觸發核查的可能情形以及支持技術審評及核查的影像數據建議。
(一) 數據鎖定及修改的考慮
在臨床試驗某一時間點(如達到目標事件數或末例受試者的訪視時間達到方案分析要求)進行影像終點評估時,應對評估者產生的影像評估數據,包括病例報告表中所填信息和相應的評估者在圖像上所做的任何標註,都應在完成評估後做鎖定處理。常規情況下,數據鎖定後不允許做進一步修改,除非有充足理由時,例如新增了影響本次或該受試者總體療效評價結果的關鍵影像數據,IRC 被發現有明顯方案或評估標準違背,或章程允許其他的理由。數據的變更應完整記錄並保障可溯源及被核查。對圖像數據和評估結論數據所做的任何變更都應包含但不限於以下要素:變更內容,變更的理由,變更者和變更的時間。對數據的鎖定和任何可能的變更都應在章程中做詳細說明。
應在章程設計時明確 IRC評價過程中可能存在的質控不合格的情況及處理措施,而不是在出現問題後再修改章程的原則性條款。在項目實施過程中,IRC 應對所推薦的評估者的專業表現負責,實時或階段性評價評估者的專業水準及評估結論是否符合評估標準,並採取相應措施保障評估質量。
出現以下情況將導致數據無效甚至整個臨床試驗失信:
無依據修訂結果;
幹涉 IRC 評估獨立性的行為,如誘導或迫使獨立評估者對其評估結果和/或結論進行修改以符合申辦方預期或與研究者評估一致的行為;
隱瞞修改結果的行為;
無可溯源數據。
不同的IRC評估者對某類影像結果可能存在一定的傾向性,例如對疾病進展新病灶判定較為敏感,很多情況下評估結論的不同與正確與否無關,只代表不同評估者或同一評估者的不同時期對影像表象的解讀有所不同。關鍵臨床試驗IRC 和研究者在總體評估結果以及部分選定病例的評估結果通常會存在一定差異,此差異可來自於不同的評估者在基線選擇了不同的靶病灶,或對同一病灶的測量差異等,或對新病灶的判定差異,甚至是 IRC 和/或研究者的評價錯誤(如採用了錯誤的評價標準,或明顯的錯判、漏判等)。儘管如此,章程應明確規定被允許的總體差異的範圍,如雙評一致率,仲裁同意率,評估者自身的組內差異率等,建議通過優化 IRC的評估流程、加強質控等措施儘可能避免評價錯誤的發生。在 IRC 的總體質控合格、結果可溯源的情況下,不能因上述原因否認原 IRC 評估結論,尤其在 IRC 評估的結果未達預期的情況下。
鑑於當前IRC評估結果對於支持加速附條件上市產品的重要性,建議章程明確重評的具體條件,目前僅在試驗數據鎖庫前,達到章程的重評條件,且申辦方與 IRC 雙方確認總體評估結果已失信時,申辦方應及時地與藥品技術審評機構溝通,考慮能否重評。
提醒注意的是,考慮重評引入的不確定風險,包括重評對盲態的破壞和對 IRC 的幹擾,重評存在將試驗藥物的療效評價過高的系統性風險,重評結果可能被視為敏感性分析,尤其為擬支持註冊的關鍵單臂試驗。
(二)審評數據清單
除非申辦方/研究者特別說明影像評估章程是包含在臨床方案中,否則我們默認影像章程是一個獨立的、重要的評估結果文件,可由單一文件或一系列文件共同組成,建議作為附件,附在研究方案之後,與關鍵研究方案一併提交討論。在遞交新藥上市申請時,將影像章程實施的具體結果與其他資料一併提交。提交章程和操作記錄供監管機構審查有助於對試驗數據完整性/綜合性的確認,影像章程的有效執行對研究核查和數據質量評估都很重要。
監管機構對章程的格式沒有特定的要求。在制定章程時,申辦方/研究者應該根據試驗的影像學檢查目的、影像檢查方法在各研究中心的具體實施細節來制定標準。並且,申辦方/研究者也應明確影像學檢查的關鍵要求,包括影像設備和圖像質量,以及圖像採集、顯示、評估、存儲和數據傳輸的過程。當前註冊遞交建議清單詳見附件 2。
六、總結
本技術指導原則旨在闡述藥品技術審評機構當前對臨床試驗影像評估程序標準的評價考慮,期望通過對臨床試驗影像的採集和評價的規範化,以提高新藥/治療手段影像相關終點的評價質量、確保療效可信。本技術指導原則尚不能涵蓋臨床試驗影像採集和評價等過程的全部內容,鼓勵研發從業者與藥品技術審評機構及時溝通,持續完善本指導原則。
七、參考文獻
[1] Cheson, B. D., Fisher, R. I., Barrington, S. F., Cavalli, F., Schwartz, L. H., Zucca, E., . . . UnitedKingdom National Cancer Research, I. (2014). Recommendations for initialevaluation, staging, and response assessment of Hodgkin and non-Hodgkinlymphoma: the Lugano classification. J Clin Oncol, 32(27), 3059-3068.doi:10.1200/JCO.2013.54.8800
[2] Choi, H., Charnsangavej, C., Faria, S. C., Macapinlac, H. A., Burgess, M. A., Patel, S. R., . . .Benjamin, R. S. (2007). Correlation of computed tomography and positron emissiontomography in patients with metastatic gastrointestinal stromal tumor treated at asingle institution with imatinib mesylate: proposal of new computed tomographyresponse criteria. J Clin Oncol, 25(13), 1753-1759. doi:10.1200/JCO.2006.07.3049
[3] Eisenhauer, E. A., Therasse, P., Bogaerts, J., Schwartz, L. H., Sargent, D., Ford, R., . . .Verweij, J. (2009). New response evaluation criteria in solid tumours: revised RECISTguideline (version 1.1). Eur J Cancer, 45(2), 228-247. doi:10.1016/j.ejca.2008.10.026
[4] Krupinski, E. A., Berbaum, K. S., Caldwell, R. T., Schartz, K. M., Madsen, M. T., & Kramer, D.J. (2012). Do long radiology workdays affect nodule detection in dynamic CTinterpretation? J Am Coll Radiol, 9(3), 191-198. doi:10.1016/j.jacr.2011.11.013
[6] Sargent, D. J., Rubinstein, L., Schwartz, L., Dancey, J. E., Gatsonis, C., Dodd, L. E., &Shankar, L. K. (2009). Validation of novel imaging methodologies for use as cancerclinical trial end-points. Eur J Cancer, 45(2), 290-299. doi:10.1016/j.ejca.2008.10.030
[7] Scher, H. I., Morris, M. J., Stadler, W. M., Higano, C., Basch, E., Fizazi, K., . . . ProstateCancer Clinical Trials Working, G. (2016). Trial Design and Objectives for CastrationResistant Prostate Cancer: Updated Recommendations From the Prostate CancerClinical Trials Working Group 3. J Clin Oncol, 34(12), 1402-1418.doi:10.1200/JCO.2015.64.2702
[8] Seymour, L., Bogaerts, J., Perrone, A., Ford, R., Schwartz, L. H., Mandrekar, S., . . . group,R. w. (2017). iRECIST: guidelines for response criteria for use in trials testingimmunotherapeutics. Lancet Oncol, 18(3), e143-e152. doi:10.1016/S1470-2045(17)30074-8
[9] Wen, P. Y., Macdonald, D. R., Reardon, D. A., Cloughesy, T. F., Sorensen, A. G., Galanis,E., . . . Chang, S. M. (2010). Updated response assessment criteria for high-gradegliomas: response assessment in neuro-oncology working group. J Clin Oncol,28(11), 1963-1972. doi:10.1200/JCO.2009.26.3541
附件 1 影像章程的規範化和科學性建議
獨立(影像)評估章程內容架構
專業術語和縮寫表
1. 執行摘要/前言
2. 研究概述
如:方案編號/方案名稱;適應症;研究目的;研究設計;入排標準;試驗終點/影像終點,等
3. 職責
說明在項目中的職責
4. 圖像採集、提交和處理
4.1.中心資質認證
如:設備信息、醫師等人員的基本資質
4.2.圖像採集標準
4.3.圖像提交說明
4.4.圖像數據處理原則
如:技術處理、質量檢查、對方案/IAP 偏離圖像的特別說明、不符合評估條件的受試者,等
4.5.質量監查和質量偏離糾正計劃
5. 臨床數據收集、提交和處理(如涉及)
數據清單、數據提交、數據處理-質量檢查,等
6. (腫瘤)終點療效評估標準/影像評估標準
7. 盲態獨立中心評估流程
7.1.評估流程圖
7.2.訪視點評估說明
如:評估者的職責、設盲、提供的圖像和/或臨床數據、測量和評估、數據鎖定,等
7.3.仲裁評估
如:評估者的職責、設盲、提供的圖像和/或臨床數據、測量和評估、數據鎖定,等
7.4.臨床評估(如涉及)
如:評估者的職責、設盲、提供的圖像和/或臨床數據、測量和評估、數據鎖定,等
8. 獨立評估者的質量控制
如:獨立評審員的資質和篩選;預防偏倚措施;利益衝突聲明;獨立評審員的培訓;獨立評審員更換的流程;評估穩定性分析,包括並不限於評估者組間和組內一致性分析。
9. 數據傳輸和保存
10.評估質量保證措施
11.參考文獻
附件 2上市申請影像相關資料清單
上市申請提交文件列表建議
註:5 和 6 為核查依據,在 NDA 申請時可根據審評需要遞交。