計算醫學:跑在超算上的醫學|醫學|計算技術研究所|譚光明|基因

2020-12-06 騰訊網

譚光明(左)與張春明正在分析數據。

2019年對於吳雙(化名)而言是最難熬的一年。年初,本以為是一場普通感冒引起的咳嗽,卻未曾想到在3個月後被診斷為中央型肺腺癌第四期,縱隔淋巴轉移,伴遠端腎上腺轉移。

「拿到診斷報告的那一刻,我沒有掉一滴眼淚。」說這句話的時候,吳雙轉頭看向窗外,故意將視線避開了記者的目光,但眼角卻滲出晶瑩的淚水。

吳雙,41歲,是一位都市職業女性。患病後,她和家人跑遍了北京多家知名的三甲醫院,嘗試過靶向藥物、化療、中藥等辦法,但病情都沒有得到緩解。「我還特地花了一萬多塊錢做了腫瘤基因檢測,很遺憾,報告顯示是沒有可用藥的基因突變。」

沒有相應的「可用藥」,又不能通過手術和放療進行積極幹預,這在臨床上只能「盲」用藥,即嘗試使用臨床上常用的一些藥物進行治療,再定期評估治療效果。但通常盲用藥物治療的效果只能「聽天由命」,而在醫院,像吳雙這樣的患者大有人在。

「即便能檢測到相應的基因突變,靶向藥物對不同患者的療效也並不相同。」中國工程院院士、中國醫學科學院腫瘤醫院主任醫師孫燕表示,腫瘤的發生是多基因聯合「發力」的結果,雖然通過基因檢測等手段可以得到海量的數據,但現有的認識仍集中在個別基因與治療腫瘤的關係,比如攜帶了致病性突變的BRCA1/2基因與乳腺癌、卵巢癌的關係,突變的EGFR基因與肺癌的關係等。「是否還會有其他基因的參與、每個基因發揮的作用如何,我們不得而知。」

其實,孫燕的這種困惑,也正是目前腫瘤領域最讓人「頭疼」的難題。對此,中國科學院計算技術研究所高性能計算機研究中心主任譚光明在接受《中國科學報》採訪時表示,當前,生物醫學大數據的規模和產生速度遠遠超出了普通規模計算機的處理能力,急需超算助力科學家從多維、立體、融合的數據中摸索出規律,從而更精確地輔助疾病的診斷和治療。

「查字典」式的有限應用

自人類基因組計劃啟動以來,以下一代測序技術(NGS)和質譜技術(MS)為代表的各類組學技術得到了飛速發展,再加上傳統的顯微鏡技術、生化方法、免疫組織化學方法、生理體徵檢測和臨床影像拍攝技術等數據源的聚集,使海量生物醫學數據呈現指數級增長態勢。

不可否認,即便尚未引入信息科學的大型工具,這些大數據也賦予了醫生和臨床科研人員更多、更細緻的維度去了解疾病發生發展過程,大大拓展了醫學研究的深度和廣度。

「比如,目前對一些明確的、單基因突變引起的疾病,基因組測序已經能實現精準診斷,幫助臨床更好地區分不同疾病、施以更恰當治療。」北京大學第三醫院病理科分子病理實驗室武睿博士表示,21—三體症候群、新生兒遺傳耳聾基因篩查等都是測序技術在臨床的良好應用。

但是,對於複雜的、多基因改變引起的疾病,我們尚不能有效地解讀患者的生命數據信息。以癌症患者為例,絕大多數突變都具有「個體特異性」,除了個別基因(例如EGFR等),同一個基因在不同患者中能找到相同突變的可能性微乎其微。不過,若從數據呈現的網絡調控模型來看,特定信號通路上的關鍵節點基因儘管發生了不同突變,但驅動的下遊細胞內事件可能是相同的。

現在生物醫學專家習慣性地將基因組數據與已有的知識體系進行「查對」(俗稱「查字典」)。「雖然這種方式在一定程度上解決了相應問題,但人體的複雜程度絕對是超乎想像的,真的有一本『字典』可查嗎?」哲源科技(中國科學院計算技術研究所孵化的一家構建生命數據解析平臺的人工智慧企業)營運長趙宇表示。

「這就需要我們有將生物學、醫學相關學科的知識轉化為數學模型的能力。」中國科學院計算技術研究所副研究員、中國科學院計算技術研究所西部高等技術研究院常務副院長張春明表示,應充分利用現有的生物醫學數據,引入系統科學理論和視角,通過設計新的算法挖掘數據之間的關係,為解決現有的問題尋找新的路徑。最終,以生物醫學大數據推動生物醫學研究由原來的假設驅動向數據驅動的方式轉變。

算法與算力助力大數據應用

但長期以來,醫生們受循證醫學訓練,更為強調「可靠」的知識。他們善於採集大樣本的臨床數據,並將基礎理論的研究與臨床經驗相結合,最後把臨床數據總結成臨床診療指南與路徑。

在精準醫療時代,清華大學人工智慧研究院教授楊斌認為,應該在循證醫學的基礎上,更強調患者個體的個性化診療,通過對患者的數據分析並結合臨床經驗,給出最佳治療方式。

「傳統循證醫學以群體證據作為核心依據,往往無法解釋個體差異。而精準醫學從基因、環境等個體因素考慮疾病在個體的發生發展過程和治療應答,與僅考慮患者共性的傳統循證醫學相比,能更好地詮釋個體差異,更好地提供個體化的藥物治療方案,更安全、更有效、更合理地配置醫療資源。」中國工程院院士、中國醫學科學院北京協和醫學院院校長王辰說。

此外,中國工程院院士樊代明也指出,傳統的生物醫學數據分析思維和方法難以適應大數據分析的需求。生物醫學大數據實現了以患者為維度的多源數據的整合,需要分析的數據如此之多,因此不再只依賴分析少量隨機抽樣的數據,也不再熱衷於探求數據之間難以捉摸的「因果關係」,而是更多關注數據的「相關關係」。與傳統隨機對照研究常用差異性統計分析方法不同,生物醫學大數據更多採用數據模型以及控制混雜的統計分析方法。

那麼,即便有了高質量的生物醫學大數據,有了相應的算法,就一定能摸索出疾病的發生發展規律麼?

譚光明給出的答案是否定的。他表示,光有數據和算法還遠遠不夠,必須要有強有力的算力支持。他舉例道,過去單一零散的數據,只需要在普通伺服器上用簡單程序處理和統計就可以;現在是多維海量的大數據,為了解決複雜生物醫學問題,要用多維海量的PB級(1PB=106GB)大數據對生命進行建模,那就要設計複雜的算法,而算法的複雜度和計算量遠遠超過了普通伺服器所能處理的規模,急需高性能的算力資源支撐。

計算醫學扛起數據分析的「大旗」

「基於此,面向人類健康大數據,我們不能簡單地將其理解為需要大規模存儲和處理的數據。大數據的概念有別於統計抽樣,它不是根據小規模抽樣調查來推測被觀察對象的全貌,而是試圖用對該對象的所有測量數據來刻畫對象。因此,大數據泛指能全面刻畫客觀對象所有數據的集合。」中國科學院計算技術研究所—哲源圖靈達爾文實驗室主任牛鋼表示。隨著數據量呈指數增長,數據更新速度不斷加快,精準醫學若想早日落地,急需計算機驅動的臨床決策支持系統。

這在譚光明看來,勢必會產生一門新型交叉學科——計算醫學。「它致力於發展定量方法,通過應用數學、工程學和計算科學來智能化理解人類疾病的機理,並基於工業化的數據、算法、算力及生物醫學技術體系為醫學服務提供新洞見。」

對此,譚光明從四個維度闡釋了計算醫學的內涵。首先,計算醫學以複雜性系統科學的整體論作為思維方式,去理解生物分子、細胞、組織器官、種群等多個生物層級結構之間相互作用中「湧現」出的新屬性,從系統的角度去捕捉疾病發生的機理;其次,計算醫學採用密集數據驅動的科學範式,挖掘隱藏於高維、高通量、多維融合的生物醫學大數據中的新洞見;再次,計算醫學將生物醫學領域的知識模型轉換為數學模型,以生物醫學大數據作為輸入參數,以人工智慧算法對模型進行迭代、訓練,輸出逼近於真實的生命系統結構與功能特徵,從而理解疾病發生的本質;最後,計算醫學以高性能計算為新一代計算基礎設施,為新科學發現提供數據存儲、計算精度和計算速度上的支撐。

「循證和計算都是實現精準的技術手段,計算醫學在更高維度上實現了循證。」張春明表示,未來,以基因測序為代表的數據生產一定會迎來免費的時代,數據挖掘成為最終的價值出口,立足生物醫學的科研和產業需求,我們構建了「生命信息引擎」,該引擎歸根到底就是面向生命醫學數據的計算機系統,屏蔽了海量數據的管理、理解和計算等方面的技術細節,讓生物醫學專家能夠便捷地利用信息技術解決行業問題。

文章開頭提到的吳雙,最後藉助「生命信息引擎」給出的數據分析結果,採用了一種可能的治療方案。目前,經過這一方案治療,她的體內已經沒有影像可見的腫瘤,血液腫瘤指標也回落至正常水平。

最後,張春明呼籲,生物學家、醫學專家和計算科學家攜起手共同豐富計算醫學的內涵,以期將疾病的預防、診斷和治療推向精準。

權威觀點

傳統的生物醫學數據分析思維和方法難以適應大數據分析的需求。生物醫學大數據更多採用數據模型及控制混雜的統計分析方法。

——中國工程院院士樊代明

我們發現的很多新的基因,是關鍵基因還是「沉默基因」?目前缺乏更廣泛和深入的研究。

——中國工程院院士孫燕

由於生物醫學數據種類繁多、數據分散、內部結構高維複雜,大數據分析比其他領域更困難。生物醫學領域如果仍只停留在採用字符串比對、搜索等傳統計算機技術,就難以挖掘生物醫學大數據的潛在高價值。

——中國工程院院士李國傑

作為醫生,需要轉變思想。未來每一個醫生都應該熟練應用智能工具處理海量信息,以尋求更加準確的診治方案。

——中國工程院院士胡盛壽

隨著數據規模的增加,傳統的數據模型和數據組織方式已經無法滿足海量數據的結構、數量快速增長以及數據結構不斷變化的管理需求。

——中國科學院院士賀林

伴隨大數據的累積而來的問題是如何將這些數據資源轉化為有價值的信息,並指導臨床實踐。

——中國科學院院士陸林

生命的整體性和疾病的複雜性,使信息化和大數據成為生命科學研究的必然。

——中國工程院院士王紅陽

大數據分析正在成為生物醫學領域的下一個前沿,將數據存儲、共享、分析和質量控制等技術融為一體,能不斷為大數據應用產業發展創造全新機遇。

——中國工程院院士劉昌孝

(張思瑋)

相關焦點

  • 中科院計算技術研究所副研究員 譚光明
    嘉賓介紹:譚光明,中國科學院計算技術研究所副研究員、博士生導師。  主要研究方向為並行算法、編程與體系結構,負責計算機體系結構國家重點實驗室和曙光團隊的並行算法小組的研究工作。
  • 中國醫學科學院醫學實驗動物研究所
    康藍生物---Corelab Biotech 疾病動物模型研發轉化平臺      醫學實驗動物研究所成立於1980年,是中國醫學科學院的專業研究所之一。研究所是從事實驗動物學和比較醫學科研與教學的專業研究所,是國內唯一的集實驗動物和疾病動物模型資源創製、保種和生產供應、比較醫學技術研究、及實驗動物技術培訓於一體的研究單位,是國家級的傳染病和新藥創製研究的實驗動物技術平臺的承擔單位,是衛生部人類疾病比較醫學重點實驗室和國家中醫藥局三級實驗室。研究所通過了國家實驗室認可及國際AAALAC認證。1.
  • 醫學光子技術分類及醫學成像技術詳解
    醫學光子技術分為兩大類:光子診斷醫學技術與光子治療醫學技術,前者是以光子作為信息載體,後者則以光子作為能量載體。 目前,無論是光診斷還是光治療技術,多以雷射為光源。
  • 翼方健數與中科院上海營養與健康研究所生物醫學大數據中心籤署...
    11月16日,翼方健數(BaseBit.ai)與中科院上海營養與健康研究所生物醫學大數據中心(以下簡稱「中心」)籤署合作協議,雙方將在醫療健康領域展開深度合作。其中,隱私安全計算技術為健康醫療、生物信息、新藥研發等方向提供了數據協作、價值挖掘的重要基礎平臺技術支撐。中心成立於2017年5月,歸屬於中科院計算生物學重點實驗室,是醫療大數據應用技術國家工程實驗室(上海)、國家基因組科學數據中心等機構的參建單位。
  • 跑步進場 高效施工醫學和計算智能前沿技術研究中心
    (通訊員 楊海)近期,由中建四局六公司承建的合肥綜合性國家科學中心協同創新交叉研究平臺—醫學前沿科學和計算智能前沿技術研究中心項目正在進行大面積土方開挖施工。該項目位於中國科學技術大學西區內,總佔地面積 5324.14 ㎡,總建築面積55812.00 ㎡。
  • 口腔醫學和口腔醫學技術的區別
    口腔醫學屬於醫學方面的學科,學生通過對口腔醫學的基本理論和基本知識的學習,可以到口腔科進行實習,以及口腔疾病的診治,畢業後可進行職業醫師考試。>課程和主要實踐環節:口腔解剖生理學、口腔內科、口腔外科、口腔正畸學、口腔修復材料、口腔技工工藝、口腔醫學、口腔美學、口腔工藝技術實訓、口腔科見習、畢業實習等,以及各校主要特色課程和實踐環節。
  • 醫學研究,樣本量計算結果到底給誰看的?
    當你沒有樣本量計算過程,胡亂湊個整數10、30、50,那你對整個項目的預期結果根本無法預計。你根本無法斷定你預期將有多大的可能性獲得陽性結果。當你為了減少樣本量,用高估的參數去計算樣本量時,那意味著你自己就很清楚,你將有較高的概率結果是陰性結果。只有客觀估計樣本量,你的統計分析結果才會在你的預期中。
  • 新一代基因測序技術助力突破現代醫學瓶頸(圖)
    普朗克分子遺傳學研究所獲博士學位。近年來,陳煒研究團隊發表論文超過60篇,已處於世界基因組學研究領域的前沿位置。圖為陳煒博士演示單分子基因測序儀的使用。「自2003年完成第一個人類基因組測序以來,基因測序技術及相關的醫學系統生物學研究突飛猛進。新一代高通量基因測序技術的廣泛應用不僅提高了基因測序的速度,還大幅降低了成本。
  • 基因測序助益精準醫學高峰論壇
    基因測序是精準醫學的重要組成部分,也是基因檢測的核心領域,被認為是未來經濟的12大顛覆技術之一。2017年10月21日,由中國康復技術轉化及發展促進會主辦、中國康復技術轉化及發展促進會精準醫學與腫瘤康復專業委員會承辦,以「準+時代」為主題的基因測序助益精準醫學高峰論壇在成都隆重召開。本次會議邀請到來自全國各地四百餘位臨床專家、科研人員、行業同仁共同參加。
  • 金橡醫學攜手華為雲、加速腫瘤基因檢測創新
    這還需要通過腫瘤基因檢測對藥物的靶點進行檢測,以確定患者是否對該靶向藥物敏感或是耐藥。  在腫瘤基因檢測領域,金橡醫學就是一家專注於腫瘤精準診療監控的醫療服務公司。  金橡醫學擁有覆蓋全鏈條的產業隊伍,具有深厚的技術儲備和積累,具備強大的醫學轉化、品牌宣傳和市場營銷能力。
  • Illumina與中國醫學科學院藥用植物研究所合作建立中草藥參考基因庫
    首個1000種藥用植物參考基因庫,為中國藥典建立標準  中醫中藥歷史悠久,現代中醫藥將現代醫學與傳統中醫藥療法相結合,在疾病治療、藥物與保健品研發領域潛力巨大。
  • 「大數據+」助推生命科學、醫學、農業創新發展!ICG-15國家基因庫...
    10月27日,由深圳國家基因庫承辦的「大數據分析與生物樣本庫」(Ⅲ-1)和「未來農業、未來食品與全球發展」(Ⅲ-5)兩場分論壇舉行,13位國內外知名資深專家受邀出席,以專題報告分享最新科研成果、權威應用經驗及獨到的行業洞見,串聯基因組技術、大數據技術和未來農業,發掘生命科學、臨床醫學、未來農業研究的創新機遇。
  • 蘇州生物醫學工程技術研究所獲批——「體外診斷工程實驗室」
    近日,中國科學院印發了《中國科學院關於設立天然活性多肽等10個中國科學院工程實驗室的通知》(科發函字〔2020〕323號),中國科學院蘇州生物醫學工程技術研究所作為依託單位獲批「中國科學院先進體外診斷技術工程實驗室」。
  • 智能醫療:量子計算/人工智慧等將成為未來醫學的重點
    會議期間,廣東省人民醫院黨委書記耿慶山分享了「基於大數據的未來醫學」,在其看來,量子計算、人工智慧、醫療機器人、3D列印等十大技術領域都將成為未來醫學的重要發展方向。  據了解,未來量子計算在醫療領域的應用主要是服務於大數據下的精準醫療發展。
  • 大數據+」助推生命科學、醫學、農業創新發展!ICG-15國家基因庫分...
    10月27日,由深圳國家基因庫承辦的「大數據分析與生物樣本庫」(Ⅲ-1)和「未來農業、未來食品與全球發展」(Ⅲ-5)兩場分論壇舉行,13位國內外知名資深專家受邀出席,以專題報告分享最新科研成果、權威應用經驗及獨到的行業洞見,串聯基因組技術、大數據技術和未來農業,發掘生命科學、臨床醫學、未來農業研究的創新機遇。
  • 英國醫學學會認知與腦科學研究所蘇裡博士訪問心理所
    4月20日至5月9日,英國醫學學會認知與腦科學研究所(MRC Cognition and Brain Science Unit)蘇裡博士訪問中國科學院心理健康重點實驗室神經心理學與應用認知神經科學實驗室(NACN Lab)。蘇裡博士此行主要目的是促進和加強與陳楚僑研究員課題組的合作研究。蘇裡博士的研究項目之一就是使用實時的技術來探討精神疾病的精神病理學。
  • 我校學子在醫學圖像計算頂級會議MICCAI挑戰賽中斬獲多個獎項
    10月13日,醫學圖像計算與計算機輔助介入領域的國際頂級會議MICCAI2019在深圳舉行,我校機械與電氣工程學院梅昊陳、雷文輝、王璐和郭棟等四名研究生受邀參加該會議,並在該學院王國泰老師的指導下,利用人工智慧算法在該會議上的多個醫學圖像自動分割挑戰賽中獲獎。
  • 腫瘤基因檢測公司扎堆上市:中國腫瘤NGS檢測第一股燃石醫學領跑
    以美國腫瘤基因檢測公司Guardant Health為例,市值78億美元,國內腫瘤基因檢測企業亦有可能達到此規模。如何在保證技術領先的同時,找到持續的盈利點,取得商業上的成功?這是擺在國內企業面前的重要挑戰。
  • 數位化醫學影像技術的進展分析
    我們使用CR技術,利用新型的IP板代替原材料,X線照射到IP板,在上面留下影子。可以將IP板放到雷射掃描儀中來掃描其中存儲的影像信息,然後利用先進的計算機功能進行一定的數據處理。因此,CR技術將傳統醫學過渡到數位化醫學之中所起的作用非常關鍵。
  • 精準醫學,對人類意味著什麼?
    科學家要和臨床專家聯合起來,進一步尋找基因、尋找標誌物。」李青說。  「精準醫學計劃是人類基因組計劃的『續集』」  「目前臨床疾病診斷治療的現狀就像一座冰山,人們看到的只是海面上的部分,治療的也是海面上的部分,而對海面下巨大的冰床了解還非常有限,這是現階段臨床治療的局限性。」