【編者按】臨床研究往往少不了統計學,其在腫瘤臨床研究中的地位更是舉足輕重。而在現實中,生物統計學家卻是一個熟悉而又陌生的名字。熟悉是因為統計的「必要性」,陌生往往是因為統計的「高深莫測」。
本文作者Daniel Sargent教授和Qian Shi教授作為梅奧腫瘤研究中心的「掌門人」,將跟大家「揭露」生物統計學家在腫瘤臨床試驗中所扮演的角色。
日前,Chinese Clinical Oncology雜誌邀請到來自梅奧統計部門的Daniel Sargent教授和Qian Shi教授組建「Statistics in Oncology Clinical Trials」統計學專欄,希望通過組織腫瘤臨床試驗領域頗有貢獻的著名統計學家來撰寫相關文獻,提高人們對生物統計學家重要作用的認識,增強腫瘤學家和統計學家間的交流,刺激更多臨床試驗設計方面的創新研究,並且最終在不遠的將來發現抗癌治療中有革命性的發展。
引言
在過去的十年中,儘管西方國家腫瘤患者的死亡率都在以每年至少1%的速度下降,但是癌症仍然給全世界的人們和醫療工作者帶來了巨大挑戰。隨著對分子通路改變、疾病預後和治療效果的認識不斷增加,癌症治療進入了靶向治療和個體化治療的新紀元。然而在臨床腫瘤研究中,與生物標記物的快速發現相比,靶向治療藥物的發展卻屢屢受挫。
臨床腫瘤學研究需要多學科專家的合作,這已經成為共識。在這些專家中,有一個人們比較陌生的群體:致力於癌症治療與多學科協作的生物統計學家。本文將針對腫瘤研究領域中生物統計學家的重要作用做一個大概的介紹。
匯聚臨床推理和統計推理
現代醫療中,臨床一詞通常跟病人的護理息息相關。臨床試驗包括一系列的實驗研究,旨在尋找有效的治療方法,比較各種治療方案的利弊,和/或制定最理想的聯合治療,或是優化各種治療方法的先後順序。與實驗室研究的最大區別在於,臨床試驗研究的對象是人。
病人在遺傳學、行為學和環境方面的異質性為疾病的發展和研究性治療的效果賦予了巨大的複雜性。儘管針對單個病人的醫學觀察可以促進醫療的進步,但所得的結果往往難以代表更大範圍的患者群體。
這賦予了臨床試驗的第二個特徵:好的臨床試驗設計和實施會使得所試治療方法具有更大的人群適用性。要實現這一點,一方面需要很好地控制和描述人與人之間已知或未知的個體差異,另一方面需要通過嚴格的實驗設計和操作使設備誤差和偏倚最小化。
在「外行人」看來,統計學主要是由機率和數學運算組成,這並不準確。Piantadosi認為「統計推理強調以數據為基礎」;統計學既涉及理論性科學,又涉及基於證據推理的實際性應用。這裡的「證據」不僅包括確定的數據,也包括實際情況下提供的不確定信息,更重要的是在科學推理過程中知識的更新。
統計學理論和方法使我們能夠對隨機因素的影響進行定量分析,區分系統影響和隨機影響,控制偏倚,並且將來自試驗樣本的推論適用於更廣泛的人群,使研究更加高效。
腫瘤學家關注的是生物學指標,然而統計學家更加重視數學模式。實際上,將來源於試驗數據的推論對於臨床和統計學領域具有重要意義。結合臨床試驗的新老數據,更新抗擊癌症的知識體系,調整和制定更加科學合理的治療方案是腫瘤學家和統計學家的共同任務。統計學家會將腫瘤學家概念性的想法轉化為科學、合理且實用的臨床試驗。
生物統計學家眼中的臨床試驗設計
上世紀40年代以來,臨床試驗成為臨床研究的核心。但是直到70年代,統計學家才因受試對象的隨機性和層次性而得到重視。後來,隨著政府監管部門、基金委員會和全社會對臨床研究設計和實施規範性的要求日益增加,使得試驗人員必須採用更加嚴格的、科學的方法設計指導實施臨床試驗。
結果,統計學家的參與達到了前所未有的高度和深入度,從臨床試驗的提出到完成,甚至到後續的進一步研究中,都需要有統計學家的參與。對於統計學家的作用,誤解之一是將其等同於數據分析。儘管數據分析非常關鍵,但是好的試驗設計和指導更加重要。科學嚴謹的設計是最終結果分析的保障。好的設計可以使分析簡化和高效,控制結果的精確性,使試驗方案根據研究需要進行合理調整,避免倫理問題,並且保障患者的安全。
儘管計算樣本量也要求豐富的統計經驗,但是臨床試驗並不單純是計算樣本量那麼簡單,尤其是在醫學研究的試驗設計領域。臨床試驗的設計需要腫瘤學家和統計學家之間反覆的交流和合作。這種溝通通常以對新提出的假設進行深入的剖析開始。統計學家收集的關鍵信息包括:目標疾病人群,預期治療效果,最合理的終點,以往的證據和允許的錯誤概率。
例如,一個腫瘤學家可能提出一個假設:新藥X可以改善KRAS基因突變的晚期大腸癌患者的預後。這裡的研究對象是初診為KRAS基因第12或13外顯子突變的IV期大腸癌患者。預期治療效果為藥物X可延長患者的生存時間或提高規定時間點 (如診斷後3年) 的無病生存率。
以統計概念來說,一個常用的研究終點就是中位無進展生存(PFS)時間。統計學家將上述假設改述為:跟對照組相比,X藥物延長KRAS突變的轉移性大腸癌(mCRC)患者的無進展生存時間。這裡的對照組為接受標準化常規方案治療的患者。通過整合分析腫瘤學家提供的信息和文獻數據,統計學家可以得出一個中位PFS時間(例如在本例中,已有相關臨床研究報導為10個月)作為治療的比較標準。統計學家再與腫瘤學家討論,確定療效評估值。比如,中位PFS時間從10個月延長到14.3個月(相當於危險比為0.75)可以作為這樣一個評估值。這樣,統計學家可以用統計學語言將此假設概述為:如果將用X藥物治療與接受標準化治療的KRAS突變型mCRC患者的PFS相比較,危險比小於或等於0.75,那麼就可以認為X藥物是有效的。
有的人可能會不假思索地想,統計學家可以輕而易舉地找到研究的樣本量。實際上,腫瘤學家和統計學家之間在試驗設計方面的交流和溝通至關重要,並且這種交流也應該延伸到其他領域專家之間。與病理學家和放射學家討論交流有助確定一些需要嚴密推敲的實驗細節包括受試群體和研究終點。
與政府管理部門和基金提供機構的討論有助於增加研究的可行性、可靠性和科學性。而即將參與實驗的醫生和患者權益代表者的意見可使具體操作過程涉及到的倫理問題考慮得更全面。以上這些方面因素,將會使研究的設計更加規範,充分體現科學的科學性、實用性和有效性。
仍然以mCRC為例,我們還有另外一個方面沒有討論,就是X藥物現在所處的研發階段。該藥物的研發是否處於人體安全劑量尚未知曉早期階段?藥物的安全性和初期的藥效相關數據是否有提供,以便於研究的藥物被批准使用和進一步被投入到患者的常規治療中?這就涉及到臨床試驗的分期。
臨床試驗根據藥物研發過程的主要目的,可分為I、II和III期。I期試驗通常以藥物的毒性評估為基礎,旨在確定藥物的最佳劑量水平和治療方案。這種試驗樣本量通常較小(20-40個患者),以相關不良事件的出現情況為終點。I期試驗的受試對象入選標準通常比II和III期要低一些。
通常以不同用藥劑量的自身做為對照。II期試驗以I期試驗的療效評價為依據,並對所選藥物劑量和用藥策略的安全性做進一步的評估。與I期試驗不同,II期試驗的受試對象更具有針對性(比如特定腫瘤類型的特定階段)。對照組的終點評價為治療效果的評估提供了基礎(例如對照組終點測量的差異),前者可以基於文獻報導或者研究所包含的同步隨機對照隊列。
這時樣本量增加到50-100人以上。II期試驗的結果決定了是否有必要進行大規模的III期臨床試驗。III期試驗最為關鍵,其結果將決定新的治療藥物或方法是否可以真正應用於臨床還是最終被摒棄廢除。這些研究使用隨機分布的方法來防止兩組治療方案分配可能產生的偏倚,包括由預後相關因素和已知/未知(可測量/不可測量)的混雜因素引起的治療選擇的偏倚。
在臨床研究的各個階段,統計學家在過去的幾十年裡做了各種各樣的設計。這些創新源於臨床治療的需要。由於人們認識了生物劑量-反應效應,持續重新評價方法(CRM)成為一個很好的例子,它從簡單的運算搜索到熟練的I期劑量搜索研究。多重問題和有效合併內外部數據刺激了適應性設計的發展。
研究靶向藥物療效的新要求催生出了生物標識驅動的設計。終點代替物的應用在減少試驗費用的同時保證了有效的研究結論,進而促進了臨床試驗的發展。
相較於不涉及患者的基礎研究,臨床研究的設計和開展比實際上要複雜得多。倫理問題在研究的設計、監管和結果分析中至關重要。清晰明確的數據收集和質量控制過程是實現研究結論的合理性和可靠性的保障。我們希望加強統計學家和腫瘤學家之間的交流與合作,促進臨床試驗的創新和發展。
譯者| 朱廷準,Chinese Journal of Cancer Research(CJCR)沙龍委員,瀋陽軍區總醫院神經外科工作,主治醫師,博士,博士後。近幾年來一直從事腦部惡性腫瘤的基礎研究工作,第一作者發表SCI論文4篇,主持中國博士後科學基金一項,獲專利一項。