北京時間7月21日晚,《自然·通訊》(Nature Communication)發表了復旦大學泰州健康科學研究院和人類表型組研究院科研團隊的成果《血液無創檢測可以比常規診斷提前四年發現癌症》(「Non-invasive early detection of cancer four years before conventional diagnosis using a blood test」)。該團隊由青年研究員陳興棟等領銜,對復旦大學牽頭建設的泰州隊列的部分血液樣本進行了長期、系統的癌症早期檢測研究。研究發現,對於結直腸癌、食管癌、肝癌、肺癌和胃癌等5種常見惡性腫瘤,在達到現有臨床確診金標準之前,甚至在病人出現自覺症狀前,早期的癌症信號——微量腫瘤甲基化就存在於血液循環之中,並可以被無創檢測。利用由復旦校友企業鵾遠基因原創研發的ctDNA甲基化多癌篩查技術PanSeer方法,陳興棟團隊在泰州隊列的血樣中實現了比臨床診斷提前4年發現血液中的微量腫瘤甲基化信號。
這一最新研究成果具有重要的科研與健康意義,證實了通過提高檢測技術的靈敏度能夠更早的發現腫瘤標誌物,從而實現有效的對癌症早期篩查。
當前,惡性腫瘤的發病率和死亡率呈逐年上升的趨勢,已成為全球人類主要的疾病負擔之一。與早期腫瘤相比,晚期腫瘤由於不能通過手術切除,缺乏有效的治療方案,平均5年生存率僅為26%,而早期腫瘤患者的5年生存率可達91%。因此,實現腫瘤的「早發現」,可幫助患者贏得治療時間,有效提高治癒率。但是,要對早期腫瘤檢測和篩查進行驗證和研究,不僅僅需要高效、靈敏的技術,更關鍵的是需要對腫瘤患者在確診前即進行血液和生物樣本採樣。這就決定了,基於已有的腫瘤醫院確診病例樣本庫無法嚴格證明一個新早期篩查技術能夠超越當前的臨床標準。此時,就需要有大型、長期開展科研活動的人群隊列來支撐科學家們的探索活動。
泰州隊列由復旦大學牽頭,於2007年開始建設。截止目前,已有近20萬社區人群參加該項研究。研究團隊通過系統的隊列隨訪,長期跟蹤隊列人群各種重大慢性病的發生情況,並且在無症狀人群中於多個時間節點跟蹤採集了150餘萬份各類生物樣本長期保存。此次發表的研究成果,納入了191個在採樣時間點1-4年後確診腫瘤的病人血液樣本,和223個在當地醫院確診後採集的腫瘤病人血樣,並遵循嚴格的1:1匹配原則,選取414個隨訪超過10年且未被診斷為腫瘤的病人樣本作為對照人群。
開展研究的過程中,校企科研團隊融合生命科學和大數據科學多學科手段,基於ctDNA甲基化特質設計了一套機器學習方法。為嚴格控制大數據分析中常見的過擬合隱患,研究團隊採用計算樣本中每個靶基因組區域的平均甲基化水平和集合logistic回歸(LR)分類器的組合,並充分考慮大量的幹擾因素,以完成區分健康患者與癌症患者的分類模型搭建。該分類器在訓練集中的特異性為94.7%,對確診後採集的病人樣本以及未確診之前採集的樣本分別達到88% 和91% 的敏感性。在一個獨立的測試樣本集中,研究團隊在207個健康對照樣本重現96%的特異性的前提下,在113個確診後採集的病人樣本上達到了88%的敏感性(表1,圖1B-D)。接下來,在98名未確診之前1-4年採集的樣本中PanSeer技術達到了95%的檢測敏感性(表1,圖2B)。
研究發現,這一中國原創技術對結直腸癌、食管癌、肝癌、肺癌和胃癌等5個不同癌種的檢測敏感性在確診前不同時間採集的血樣相似(圖1E-F)。這說明癌症信號在病症發展早期、甚至在無症狀未確診的若干年前就會存在於血液中。利用泰州前瞻性隊列的樣本,復旦研究團隊在嚴格意義上證明DNA甲基化測序能夠比傳統診斷方法更早地發現癌症。
PanSeer®®甲基化腫瘤早篩性能
PanSeer®分析結果【所有呈現的結果僅使用測試集樣本,點代表logistic回歸(LR)得分】
A、PanSeer®分析中接收算子特徵曲線(ROC)和曲線下面積(AUC)值。紅星表示從訓練集導出的截止值。
B、確診前患者樣本的LR評分。
C、按癌症分期的確診患者樣本LR評分。
D、按組織來源確診患者樣本LR評分。
E、按癌症分期的確診前患者樣本LR評分。
F、按組織來源(癌種)的確診前患者樣本LR評分。
該研究的通訊作者、中科院院士、復旦大學泰州健康科學研究院和人類表型組研究院院長金力教授指出,在精準醫學和大數據時代的今天, 大型人群隊列研究成為生物醫學研究的主要支撐平臺之一。泰州隊列已建成世界領先的單一地區人群隊列,擁有包括20萬人、近200萬份生物樣本和PB級資料庫的高質量隊列資源。此次利用PanSeer®®技術和泰州隊列資源合作進行的研究至少證明癌症早期篩查可以通過無創血液檢測完成,便於對無症狀癌症易感人群的「早發現」繼而「早幹預」,具有十分重要的應用價值。這也例證了泰州隊列在開展生命科學與精準醫學研究上的長遠價值。
該研究的第一作者、復旦大學泰州健康科學研究院和人類表型組研究院青年研究員陳興棟表示,開發針對高風險人群或社區人群的癌症早期篩選檢測,成本是確保檢測可用性和受眾依從性的關鍵因素。目前國外的一些類似多癌早期篩查研究的檢測方法成本很高。而此次研究採用的我國原創技術PanSeer是為癌症早篩特定開發,僅檢測目標明確、數量有限的基因組區域的甲基化異常,僅需從單管血液中取樣少量DNA即可,具備了作為潛在一線癌症早篩手段的有效性和經濟性。
該研究共同通訊作者、鵾遠基因公司聯合創始人兼首席技術官劉蕊博士認為,該研究在技術上的最大的技術突破是利用半靶向PCR技術構建血漿游離DNA靶向測序文庫的方法,大幅度提高甲基化靶點的富集效率,解決了早期癌症患者血漿中ctDNA稀少、常規方法DNA丟失率高、檢測靈敏度受限等問題。劉蕊博士介紹到,機器學習技術廣泛應用於大數據處理中,是利用成百上千個基因組區域進行綜合評分,所以要特別注意過擬合的情況。PanSeer分析通過層層質控篩選,最終綜合評估477個基因組區域的10,613個CpG位點,高深度測序,單分子標記去除雜音,從而獲得較高的分析準確性。未來,如對PanSeer多癌篩查技術進一步優化,增加癌種,結合多組學靶標,進行擴大樣本的前瞻性多中心研究,有望讓該技術更加成熟、更早投入實際應用。