——聲明:僅供醫療專業人士參考
編者按:如今,大數據、人工智慧的應用高速發展,各行各業都已顯現其重要性,醫療行業更是備受其益。以二代測序 ( Next Generation Sequencing,NGS) 為代表的高通量生物技術已經並正在極大地促進醫學科學的研究與發展。精準醫學也在緊跟國際和時代發展的步伐。91360智慧病理網邀請到吉林省磐石市醫院病理科徐捷主任為大家講解被大數據和人工智慧加持的分子病理學檢測技術,將會為中國醫學界帶來怎樣的福音?
專家介紹
徐捷
畢業於吉林大學本科臨床醫學專業
現任吉林省磐石市醫院病理科主任 主治醫師
海峽兩岸精準醫學協會 臨床細胞精準診斷委員會 委員
吉林市病理科醫療質量控制中心 委員
北京大學宮頸細胞學閱片技能培訓班優秀學員
第十二期全國宮頸細胞學規範化系統培訓班學員
2018年IAC巡講培訓班學員
聚焦前沿——「當分子病理檢測技術」偶遇「大數據與人工智慧」
2015年,伴隨著《超能陸戰隊》的上映,一個融合了人工智慧(artificial intelligence,AI)、醫療救護、戰鬥能力的機器人「大白」,走進了人們的視野,使人們進一步了解到人工智慧。事實上,醫療機器人,這個原本只存在於科幻小說、科幻電影中的神奇物種,正在慢慢滲透我們的生活,並逐漸成為新的創業和投資熱點。在過去的十年裡,人工智慧和機器學習對醫療部門產生了巨大的影響。技術的進步也已經為大數據的分析和整合鋪平了道路。在人工智慧的賦能下,醫療的技術性得到了前所未有的提高。2016年科大訊飛入局AI醫療領域,2017年阿里健康聯合萬裡雲發布AI系統Doctor you,騰訊發布AI醫學影像輔助產品覓影,IBM公司與紀念斯隆凱特琳癌症中心合作開發的Watson 產品金。歐巴馬宣布的「癌症登月計劃「中的一個項目就是讓人工智慧進行機器學習(算法)和深度學習以識別癌症。本文將從分子檢測的重要性入手,簡述大數據和人工智慧在分子檢測中的應用,並對目前遇到的問題及挑戰進行總結。
分子檢測的重要性日益劇增
基因測序是精準醫療產業的重要組成部分,分子診斷也是精準醫療的重要子行業之一。早在2003 年,WHO首次將腫瘤的分子分型納入病理診斷標準[1]。大家逐漸認識到,分子檢測與分子診斷具有同等的重要性。2005 年,美國食品藥品管理局( FDA) 強調了腫瘤分子診斷與靶向抗癌藥物的重要地位,並於 2011 年將分子靶向藥物與敏感人群篩選的檢測試劑審批流程更改為藥物與診斷試劑盒同時批准,並命名此診斷方法為「伴隨診斷(companion diagnosis)」,分子檢測的重要性進一步得以體現。對於肺癌、乳腺癌以及結直腸癌等腫瘤患者而言,基因檢測已成為病理診斷中不可或缺的重要組成部分。腫瘤的異質性等原因,促使著腫瘤治療朝著精準化、個體化的方向發展。與此同時,我國的分子病理實驗室建設也取得了階段性成果。2003年,北京協和醫院就建立起分子病理實驗室,陸續開展多種腫瘤基因檢測。此後,國內很多醫院都建立起獨立完善的規範化分子檢測實驗室,並通過了相關的資質認證[2,3]。
大數據和人工智慧在分子檢測技術方面的應用
在臨床應用中,NGS在闡明預測或預後的生物標誌物方面具有強大的優勢。在過去的十年中,NGS在提高測序的通量、質量、成本和時間方面有了巨大的發展。NGS還集成了短讀和長讀平臺。短讀有利於精準醫學鑑定具有臨床效益的變異株和人群篩查。相比之下,全長度的亞型測序是通過長讀來實現的。先進的算法及其分析高度複雜數據的能力將闡明精準腫瘤靶向治療的新選擇[4]。第二屆現代臨床分子診斷研討會特設了人工智慧分論壇。論壇重點介紹了Watson for Genomics,針對腫瘤患者樣本的二代高通量測序(NGS)生物信息學文件信息,Watson for Genomics可以憑藉人工智慧技術從醫學典籍中提取內容相關的信息,基於IBM Watson的知識平臺(包括:高質量的期刊文獻、指南、基因變異資料庫和臨床試驗信息),基因變異的信息分析可以快速高效的完成,並根據循證等級作出推薦排序的靶向治療建議。在專家的專題報告中著重介紹了在臨床使用NGS檢測技術結合IBM Watson for Genomics的案例,該案例使用了來自拓普基因的泛癌種檢測Panel(覆蓋了573個與腫瘤相關的基因),並應用Watson for Genomics進行了數據的全面解讀,為該患者的臨床治療決策提供了詳細的參考信息。
大數據主要是指用傳統的數據處理方法分析結果不夠理想的大規模複雜數據集合。生命科學研究已進入「組學」時代,高通量、大規模的組學研究已逐步成為當前生物醫藥領域的重要研究方向之一,隨著數據信息的逐漸積累,產生的信息數量和規模越來越大,「大數據」的概念在生物醫藥領域逐漸普及[5]。2008年和2011年,Nature 和 Science分別推出了大數據專刊,不僅探討了科學研究領域中大數據的應用,還強調了大數據在科學研究領域的重要性。伴隨著二代測序(next-generation sequencing,NGS)技術的發展,基因組學的測序數據是生物醫藥領域最常見的大數據典型代表之一。目前,Illumina Hiseq 4000系統能夠在3天內測序12個基因組、100個轉錄組或180個外顯子組,每次運行能夠產生1.5 TB數據量和50億條序列信息。由此可見,高通量組學產生大數據的規模之大,生物醫藥領域組學大數據的存儲、挖掘、分析和應用具有豐富的價值[3]。楊健和蔡浩洋[6]總結了生物信息學常用的腫瘤大規模資料庫。如:腫瘤基因組圖譜(The Cancer Genome Atlas,TCGA)、Oncomine、 Cosmic、ClinVar、人類基因突變資料庫(Human Gene Mutation Database,HGMD)、在線人類孟德爾遺傳資料庫(OMIM)、國際癌症基因組聯盟(The International Cancer Genome Consortium,ICGC)以及美國臨床腫瘤學會( American Society of Clinical Oncology)等,為腫瘤數據的研究和比對提供很好的技術支持。
精準醫學就是組學大數據與醫學的結合。2015年以來,隨著精準醫療概念的逐漸深入,以腫瘤分子檢測為主要任務的分子病理學(molecular pathology)也逐漸顯示了其在腫瘤診斷、治療及預後監測各方面的優勢地位。NGS更是進一步推進了分子檢測和分子診斷的廣泛普及。靶向治療通常又被稱作分子靶向治療,是指利用腫瘤組織或細胞具有的特異性或相對特異性的結構分子作為靶點,使用能與這些靶分子特異性結合的抗體或配體達到直接治療或導向治療目的的抗腫瘤治療方法。靶向治療具有高效、低毒、不良反應輕微等優勢,能夠最大程度地殺死癌細胞。靶向治療的特異性決定在進行靶向治療之前,需要對相應靶點進行諸如突變、缺失等基因檢測,以預估治療的有效性。2001年FDA批准了首個分子靶向藥物甲磺酸伊馬替尼,開創了腫瘤分子靶向治療的時代。2017年11月,紀念斯隆·凱特琳癌症中心(Memorial Sloan Kettering Cancer Center)病理科研發的首個腫瘤多癌種多基因檢測平臺[3]。王紅強等[7]報導了一種癌變用藥基因檢測模式。不同於突變用藥檢測,癌變用藥檢測直接面向病人的癌變分子病理,藉助高通量測序數據 (全基因組或全外顯子組) ,採用人工智慧與大數據理論與技術深度解析腫瘤病人個體化分子病理,實現不同藥物的療效、毒副作用與不良反應的系統性、量化的評估。例如,通過癌變用藥檢測,能夠回答突變基因是否為癌變相關基因,是否為癌變驅動基因等更深層次的問題。
問題和挑戰
大數據應用發展迅速,但同時也面臨一些問題與挑戰。數據解讀是應用NGS進行常規臨床測序以診斷和治療癌症的一個主要障礙。大數據的管理和解讀需要大型伺服器和專業的生物信息學人員。對於診斷,生成的數據包括關於變異的分類信息,如良性、可能良性、未知意義的變異、可能致病和致病變異。將所有變異分類並認識到其臨床意義是非常必要的。數據共享大數據越來越多,如何做到國家層面的數據共享,這不僅僅是學術界的問題,也是牽扯到國家管理層的問題。數據共享,有利於我們在大數據時代高效的完成工作。比如,中山大學和美國的一所大學合作,結合人工智慧,觀察眼底從而發現黃斑變性。這也促成了人工智慧對不同大數據的學習。同樣地,人工智慧也可以幫助我們分析基因組。隨著大數據的激增,解決在未經許可的情況下使用患者數據相關的倫理問題是非常必要的。此外,還需要制定相應的倫理政策和指南來保護患者的安全和隱私。克服這些挑戰,人工智慧和大數據將使醫療衛生和精準醫療領域顯著受益[2-4,7]。
未來和展望
NGS與高級生物信息學的結合在醫療領域已應用多年。隨著精準醫學和新生的生物標記物的興起,人工智慧和大數據在臨床的應用也在不斷發展,以期改善癌症診斷和治療。隨著科學技術的進步,NGS檢測有望提高高通量數據處理速度和敏感性,降低成本檢測,使其廣泛用於研究和臨床應用。人工智慧已經對醫學產生了重大影響,並將繼續推動醫療衛生和精準醫學的發展。谷歌、微軟、百度、騰訊、阿里巴巴等巨頭也爭相進入人工智慧醫療領域,AI醫療肯定會迎來極速發展階段。當然,人工智慧和大數據在醫療領域的應用還有很長的路要走,期待其能夠給我們帶來更美好的未來!
參考文獻
1. Tavassoli FA,Devilee P. World Health Organization classification of tumors: Pathology and genetics of tumors of the breast and female genital organs[M]. Lyon (France): IARC press, 2003.
2. 曾瑄,梁智勇.分子病理在腫瘤個體化醫療發展中的地位和作用[J].中華病理學雜誌,2016,(1):3-5.
3. 張繁霜, 應建明, 魯海珍,等. 腫瘤分子病理診斷中大數據的應用研究[J]. 中華病理學雜誌, 2018, 047(007):562-564.
4. Dlamini Z , Francies F Z , Hull R , et al. Artificial intelligence (AI) and big data in cancer and precision oncology[J]. Computational and Structural Biotechnology Journal[J], 2020, 18: 2300-2311.
5. Drmanac, Radoje. Human Genome Sequencing Using Unchained Base Reads on Self-Assembling DNA Nanoarrays.[J]. Science, 2010. 327(5961):78-81.
6. 楊健,蔡浩洋.腫瘤生物信息學資料庫[J].生物技術通報,2015, 31(11): 89-101.
7. 王紅強, 顧康生. 腫瘤精準醫療中的個性化藥效評估(預測)方法[J]. 模式識別與人工智慧, 2017, 30(002):117-126
CN-71447
今天因為你的分享,讓我元氣滿滿!
你的每個贊和在看,我都喜歡!