點內科技:基於3D深度學習自動預測肺腺癌EGFR突變狀態,預測精準度...

2021-01-13 鎂客網

點內科技與多單位聯合研究成果《基於3D深度學習自動預測肺腺癌EGFR突變狀態》登上Cancer Medicine封面。

2019年7月,國際期刊CancerMedicine以封面文章的形式,刊登了點內科技、復旦大學附屬華東醫院、上海交通大學等多單位的最新聯合研究成果,《基於3D深度學習自動預測肺腺癌EGFR突變狀態》,研究顯示預測精準度超過傳統影像組學。

基於3D深度學習自動預測肺腺癌EGFR突變狀態預測精準度超過傳統影像組學

肺癌是腫瘤相關死亡的首因[1],肺癌患者中80%為非小細胞肺癌(NSCLC),腺癌為其最常見的病理類型[2]。近數十年來基於基因組學而發展的針對驅動基因的靶向治療,如靶向特定表皮生長因子受體(EGFR)突變的酪氨酸激酶抑制劑(TKI)吉非替尼、靶向ALK基因的TKI 克唑替尼等,已成為肺癌精準醫學不可或缺的重要組分[3]。然而,對於無EGFR突變或非ALK陽性的肺癌患者,靶向治療卻並無臨床獲益,有時還可能導致PFS縮短以及不必要的醫療支出[4],因此,選擇靶向藥物前需要提前明確驅動基因狀態。此外,EGFR TKI治療期間可能出現EGFR T790突變而導致耐藥,出現病情進展,因此,也需要動態監測相關基因的突變狀態以調整治療藥物[5]。

對活檢或外科手術切除後的樣本進行突變檢測是明確EGFR突變類型的標準手段,但取樣的侵入性、為監測治療所必須的反覆取樣等問題,以及DNA質量不佳、腫瘤異質性、患者床位周轉時間、檢測費用等諸多難題限制了分子檢測的推廣,也一定程度上影響了肺癌精準醫療在臨床實踐中的推廣規模[6-9]。

腫瘤的表型源於特定的基因型,因此,通過甄別特定表型來預測基因型是一種潛在可行的手段。已有研究顯示,特定的影像組學特徵與EGFR突變類型相關[10,11]。然而,傳統影像組學面臨諸多挑戰,如在檢測、分隔、提取特徵等過程中大量依賴手工操作,費時費力;不同讀片者之間的可複製性較低。

近年來以深度卷積神經網絡為代表的深度學習在醫學圖像計算方面顯示出令人難以置信的優越表現,並在很大程度上降低了人工操作的必要性。此前,點內科技聯合復旦大學附屬華東醫院和上海交通大學SJTU-UCLA機器感知與推理聯合研究中心等利用3D深度學習技術,成功證明了3D深度學習在預測肺腺癌侵襲性方面的有效性和效能,準確率高達88%[12]。受其鼓舞,點內科技再次與華東醫院李銘、Hua Yanqing團隊、以及上海交通大學SJTU-UCLA機器感知與推理聯合研究中心、上海第十人民醫院、同濟大學同濟醫院等合作,探索了3D深度學習在基於CT影像預測EGFR突變方面的潛能。研究結果近期發表於 Cancer Medicine (IF=3.2,TowardautomaticpredictionofEGFR mutationstatusinpulmonaryadenocarcinomawith3Ddeeplearning),華東醫院李銘、滑炎卿教授為論文的共同通訊作者,華東醫院趙偉和上海交大楊健程為共同第一作者。

研究流程

研究的影像數據來自華東醫院CT資料庫(HdH資料庫579例,包括訓練集348例、開發集116例和測試集115例)。為測試所建模型的通用性,從獨立的腫瘤公共影像庫TCIA選取37例肺結節也作為測試集。全部病例均由人工進行定位、分割和標記EGFR突變/野生型狀態。通過訓練集採用3D DenseNets深度學習方法訓練,採用強大的數據擴增技術mixup以提升規範化/正則化(regularization),通過有監督的端到端學習模型完成擬合。與此同時,對全部影像數據進行傳統的影像組學分析,與3D深度學習對照,計算成對關聯繫數分析二者的關聯性。

結果顯示,3D深度學習在預測EGFR突變狀態方面明顯優於傳統的影像組學方法(P=0.021),3D深度學習對HdH資料庫測試集和公共測試集測試的AUC分別為75.8%和75.0%(表1)。更重要的是,不同於傳統影像組學要求人工對感興趣的病灶部位進行分割,非常耗時耗力,3D深度學習的興趣部位與肺結節病變部位有良好的一致性。

研究者對提取的401個傳統影像組學特徵(上圖A)與從3D DenseNets提取的114個深度學習影像組學特徵(上圖C)進行分析發現,3D深度學習方法提取的特徵較通過人工提取的特徵更具代表性,因此聚類分析的結果更佳。研究首次用矩陣的方法進一步比較了深度學習特徵與傳統影像組學特徵(上圖B),分析發現,深度學習特徵與傳統影像學之間存在著強關聯,從分類性能的ROC曲線方面,深度學習特徵的敏感性和特異性更高,這說明深度學習通過增強的影像組學方式,從魯棒性(robustness)、緊密度(compactness)和表達能力(expressiveness)方面可以發揮強大的預測效能。

深度學習系統在各資料庫的預測表現匯總

研究者發展的這一深度學習體系實現了非侵入性、自動預測肺腺癌EGFR突變型,從而通過明確EGFR靶向治療的獲益人群,輔助肺腺癌的臨床治療決策。研發過程中整合了近期關於深度監督學習的一些進展,比如深度連接、mixup技術等,從而顯著降低了過度擬合等風險。由於這一方法因無需對肺結節進行精細的分隔,因此非常節省勞動力,同時,因為採用的學習算法的增強特性,可望獲得更加穩定的表現。

研究者稱,未來還需進一步對成果進行驗證,比如本研究EGFR突變是通過ARMS-PCR檢測的,未來還需對有二代測序的EGFR突變數據的樣本進行驗證;目前的模型僅納入了CT影像信息,未來還需整合更多的臨床信息如病理、血檢驗結果、蛋白組學等。

2019年7月刊 CancerMedicine封面

關於點內科技

點內科技成立於2016年4月,是一家創新型高科技企業,總部位於中國上海。公司核心管理團隊均來自世界500強制藥及醫療設備企業;核心技術團隊實力雄厚,多位核心研究人員為國家中組部千人計劃成員和美國科學家榮譽協會( Sigma ⅪSociety)會員。

此外,公司匯聚了一批人工智慧行業、深度學習領域及醫療行業的資深專家學者,通過國內肺部專科醫院和大三甲醫院近50000例肺部CT數據的訓練,將人工智慧與大數據技術緊密結合,利用部署在地面端的人工智慧輔助診斷系統和雲端的智能引擎系統,為醫生提供針對肺部結節的早期輔助診斷和治療建議的產品。

2017年,參加「2017天池醫療AI大賽——肺部結節智能診斷大賽」,點內科技從來自全球的2887支隊伍中脫穎而出,獲得大賽第一名。

2018年8月,點內科技順利獲得國家CFDA醫療器械註冊證(二類)。同年,點內科技作為肺結節輔助診斷處理軟體(AI類)送檢企業,參與中檢院主導的肺部結節標準資料庫建立以及AI產品相關標準制定,或將成為國內首批獲準CFDA三類註冊證的AI企業。

【參考文獻】

1.Bray F, Ferlay J, Soerjomataram I, Siegel RL, Torre LA, JemalA. Global cancer statistics 2018: GLOBOCAN estimates of incidenceand mortality worldwide for 36 cancers in 185 countries. CACancer J Clin. 2018;68(6):394-424.

2.Ettinger DS, Wood DE, Aisner DL, et al. Cell lung cancer, Version5.2017, NCCN Clinical Practice Guidelines in Oncology. J NatlCompr Canc Netw. 2017;15(4):504-535.

3.NCCN臨床實踐指南:非小細胞肺癌(2019.V4)

4.Mok TS, Wu Y-L, Thongprasert S, et al. Gefitinib or carboplatin-paclitaxel in pulmonary adenocarcinoma. N Engl J Med.2009;361(10):947-957.

5.中國臨床腫瘤學會腫瘤生物標誌物專家委員會《中國非小細胞肺癌患者EGFR T790M基因突變檢測專家共識》制定專家組 中國非小細胞肺癌患者EGFR T790M基因突變檢測專家共識 中華醫學雜誌2018,98(32:2544-51)

6.Bedard PL, Hansen AR, Ratain MJ, Siu LL. Tumour heterogeneity in the clinic. Nature. 2013;501(7467):355-364.

7.Lindeman NI, Cagle PT, Beasley MB, et al. Molecular testing guideline for selection of lung cancer patients for EGFR and ALK tyrosine kinase inhibitors: guideline from the College of American Pathologists, International Association for the Study of Lung Cancer, and Association for Molecular Pathology. J Mol Diagn. 2013;15(4):415-453.

8.Kim TO, Oh IJ, Kho BG, et al. Feasibility of re-biopsy and EGFRmutation analysis in patients with non-small cell lung cancer.Thorac Cancer. 2018;9(7):856-864.

9.Kobayashi K, Naoki K, Manabe T, et al. Comparison of detection methods of EGFR T790M mutations using plasma, serum, and tumor tissue in EGFR-TKI-resistant non-small cell lung cancer.OncoTargets Ther. 2018;11:3335-3343.

10.Yip S, Kim J, Coroller TP, et al. Associations between somatic mutations and metabolic imaging phenotypes in non‐small cell lungcancer. J Nucl Med. 2017;58(4):569-576.

11.Rios Velazquez E, Parmar C, Liu Y, et al. Somatic mutations drive distinct imaging phenotypes in lung cancer. Can Res. 2017;77(14):3922-3930.

12.Zhao W, Yang J, Sun Y, et al.3D Deep Learning from CT Scans Predicts Tumor Invasiveness ofSubcentimeter Pulmonary Adenocarcinomas. Cancer Res. 2018 Dec 15;78(24):6881-6889.

最後,記得關注微信公眾號:鎂客網(im2maker),更多乾貨在等你!

相關焦點

  • 肺腺癌EGFR突變新位點
    結論 這項研究明確了基於測序方法識別罕見突變的價值。 目標 編碼表皮生長因子受體(EGFR)的基因突變是預測非小細胞肺癌(NSCLC)患者對EGFR靶向治療反應的生物標誌物,統稱為酪氨酸激酶抑制劑(TKIs)。 因此,EGFR基因分型為治療決策提供了重要信息。
  • 人工智慧可預測患者壽命!精準度與醫生相當
    據連線雜誌報導,阿德萊德大學的研究者開展了一項史無前例的研究,使用人工智慧預測人類壽命,其精準度與醫生相當。人工智慧通過分析患者胸部影像預測未來五年內哪些病人會死亡,精確度為69%,與人類醫生判斷的精準度相當。
  • 深度學習預測比特幣價格;基於神經網絡的自動化前端開發 | Github...
    用深度學習預測虛擬貨幣價格 —— ethereum_futureGithub 地址:https://github.com/llSourcell/ethereum_future這是 Youtube 網紅小哥 Siraj Raval 「Ethereum Future Price Prediction」視頻的代碼,視頻 B 站連結:https://www.bilibili.com
  • 谷歌開發出的深度學習算法模型,可用於預測DNA鏈等亞細胞結構的變化
    繼Alpha Go之後,谷歌研究團隊又一「黑科技」秒殺人類。其實揭開它的神秘面紗,其核心就是圖像處理算法。圖像處理是如何應用到生物學領域的?在生物學研究領域,細胞生物學的研究核心點就是:結構決定功能。其中,蛋白質學中就有理論明確提出,細胞的狀態由細胞內結構的位置以及細胞周期的改變來確定。
  • 謝國彤:疾病預測的機器學習、深度學習和經典回歸方法
    疾病預測會根據某個人群定義,例如全人群、房顫人群、心梗住院人群等,針對某個預測目標,例如腦卒中、心衰、死亡等,設定特定的時間窗口,包括做出預測的時間點,和將要預測的時間窗,預測目標的發生概率。造成數據中正例相對較少,很不均衡,對機器學習算法的要求更高。疾病預測的主要方法疾病預測的主要方法可以簡單的分為經典回歸方法、機器學習方法和深度學習方法三大類。下面分別用三篇論文舉例介紹一下。
  • 基於深度神經網絡的脫硫系統預測模型及應用
    關鍵詞:燃煤電廠;脫硫系統;計算機模擬;深度學習;神經網絡;預測;模型應用;智慧環保;當前,國家正加快推進以 5G、人工智慧、工業網際網路、物聯網為代表的新型基礎設施建設(新基建),電力行業的智能化建設也蓬勃發展。國內大型火力發電廠很早就實現了廠級 DCS 數據監控,歷史運行數據豐富,為實現數據驅動的神經網絡建模提供了有利條件。
  • |利用深度學習實現流式肽合成的預測與優化
    近年來,流式化學技術的發展催生了自動合成儀化學平臺的設計與使用,作者的實驗室就設計了一個自動化的快速流式肽合成儀(AFPS),可以實現高效自動的SPPS。但是,合成過程中出現聚集等副反應的問題仍未得到解決。為了提高產率,作者設想通過算法對自動合成進行實時的優化。為了實現這一設想,作者需要這種算法可以在合成條件與產率之間建立準確的聯繫,這一目標可以通過深度學習來實現。
  • 關於深度學習未來發展方向的六項預測
    關於深度學習未來發展方向的六項預測 隨著深度學習在大規模市場化應用領域的快速推進,其將與數據可視化、商務智能與預測分析一道成為眾多行業的立足基石。本文將與大家一同探討關於深度學習未來發展方向的六項預測。
  • 基於序列信息來預測潛在的抗癌多肽的深度學習方法
    打開APP 基於序列信息來預測潛在的抗癌多肽的深度學習方法 中國科學院網站 發表於 2019-09-20 15:13:00 癌症是人類健康最致命的殺手,在全球範圍內每年造成數百萬人的死亡。
  • CellPress|單細胞技術和基於深度學習的藥物反應預測
    目前,深度學習模型已經能夠從大量複雜的序列數據中提取出特徵,用於預測藥物的反應。論文的作者總結了近來單細胞技術和基於深度學習方法的藥物敏感性預測模型。作者認為,通過利用大規模的序列數據,深度學習模型可以幫助我們更好的利用單細胞數據去完成藥物反應預測任務。下圖是單細胞數據結合深度學習模型的一個概述圖。
  • 領星發表論文,初探突變特徵在中國肺癌患者的分布及對預後的預測
    此項研究納入了401例肺腺癌(LUAD)患者和92例肺鱗癌(LUSC)患者,通過全外顯子基因組測序分析突變特徵在肺癌患者中的整體分布情況,以及具有相應突變特徵的患者人群是否表現出不同的預後狀態。點擊查看大圖此外,在LUAD中高頻突變基因的突變位點也在兩組患者中做了對比
  • 新的深度學習方法從胺基酸序列預測蛋白質結構
    近年來,計算方法在基於其胺基酸序列的知識預測蛋白質如何摺疊方面取得了重大進展。如果完全實現,這些方法有可能改變生物醫學研究的幾乎所有方面。然而,目前的方法在可以確定的蛋白質的規模和範圍方面受到限制。現在,哈佛醫學院的一位科學家使用了一種稱為深度學習的人工智慧來預測基於其胺基酸序列的任何蛋白質的三維結構。
  • 推薦:早期肺腺癌的瘤內異質性
    在肺腺癌(ADC)的情況下,這是非常重要的,因為過度診斷率很高,在預測腫瘤的惰性和侵襲性行為方面缺乏準確性(2)。為了更好地預測疾病行為,了解腫瘤的細胞和分子基礎是至關重要的。因此,研究腫瘤內的異質性及其克隆成分已成為了解腫瘤進展和行為的一個有吸引力的策略(3-7)。近年來,新興的單細胞分析平臺使得對腫瘤微環境(TME)的深入分析成為可能,並且可能是用於分析和研究腫瘤異質性的很有前景的方法(8)。
  • ...知識計算解決方案,讓鋼企一年省2000萬,合金成分預測精準度超 95%
    中國科學院院士張鈸在今年的世界人工智慧大會上提到,深度學習面臨著許多瓶頸,我們即將要進入「第三代人工智慧」時代。第二代人工智慧主要以神經網絡和深度學習為基礎,但它是一種通用工具,不需要領域知識,使用的技術門檻較低,並且在理解環境、AI 安全和推理決策方面會出現不安全、不可靠、不可解釋的情況。
  • Nature | 幹細胞圖片資料庫共享,深度學習預測細胞外觀
    這些圖像源自經基因編輯工具CRISPR改變的細胞系,通過深度學習分析而生成。不久的將來,該網站將允許研究人員預測可能預示癌症和其他疾病的細胞布局的變化。「如果你知道所有球員的統計數據,但從來沒有看過比賽,那麼你無法預測足球比賽的結果。」該項目大約一年前開始,Horwitz和他的團隊先將成年皮膚細胞重新編程成胚胎樣、未分化狀態,然後使用CRISPR-Cas9在基因中插入標籤,使細胞內的結構發光。
  • 摺疊革命,深度學習通過胺基酸序列預測蛋白質結構
    近些年,蛋白質通過自身的胺基酸序列可以實現被預測,在計算方法上有了巨大進步。如果都能使用這些計算方法,那生物醫學研究都可以被轉換成計算公式。然而,現在一些應用則受到了蛋白質規模和範圍的局限而無法決策。近期,來自哈佛醫學院的科學家應用了深度學習的方法,基於胺基酸序列來有效預測蛋白質的3D結構。
  • 時間序列深度學習:狀態 LSTM 模型預測太陽黑子(上)
    由於數據科學機器學習和深度學習的發展,時間序列預測在預測準確性方面取得了顯著進展。隨著這些 ML/DL 工具的發展,企業和金融機構現在可以通過應用這些新技術來解決舊問題,從而更好地進行預測。在本文中,我們展示了使用稱為 LSTM(長短期記憶)的特殊類型深度學習模型,該模型對涉及自相關性的序列預測問題很有用。我們分析了一個名為「太陽黑子」的著名歷史數據集(太陽黑子是指太陽表面形成黑點的太陽現象)。我們將展示如何使用 LSTM 模型預測未來 10 年的太陽黑子數量。
  • 「深度學習」通過學習勢能函數實現蛋白質的結構預測
    然而在很多情況下,蛋白質的三維結構信息是難以獲得的,因此有必要藉助基於理論計算的方法對其結構進行預測。深度神經網絡(DNN)近期在蛋白質結構預測方面展現出了優異的表現,該領域常用的方法包括(1)胺基酸殘基間距預測(參考:AlphaFold開啟了新方向嗎)以及(2)相鄰殘基間的扭轉角預測(參考:最新蛋白結構預測模型-循環幾何網絡RGN),這些方法在往期的推送中都有所涉及。
  • 當模型預測控制遇見機器人學習
    喻超深藍學院作者簡介:作者喻超,加拿大滑鐵盧大學在讀博士,主要研究方向:基於機器學習的模型預測控制技術,及其在車輛動力學、自動駕駛規劃和控制領域的應用,碩士畢業於上海交通大學,擁有8年電動汽車控制系統開發工作經驗,曾擔任上汽通用汽車電氣化控制架構開發經理,美國通用汽車高級控制系統工程師
  • 使用深度學習分類並預測NSCLC組織病理學圖像
    在這項研究中,我們在從癌症基因組圖譜獲得的全幻燈片圖像上訓練了一個深度卷積神經網絡(初始v3),以準確和自動地將它們分類為LUAD,LUSC或正常肺組織。此外,我們訓練網絡預測LUAD中十個最常見的突變基因。