中國首個醫學術語搜尋引擎成功落地 連接臨床表型、疾病、基因三類...

2020-12-05 健康界

隨著基因測序技術發展,人們開始頻繁探尋疾病的深層的分子基礎,並將基因型和疾病表型數據聯合分析,作為認識和診治疾病的重要手段。然而基因數據的科學解讀,仍是當前面臨的巨大挑戰。最主要的原因之一,就是缺乏基因數據、臨床表型和疾病三者間的溝通橋梁。大量斷層和不完整的數據,讓信息之間無法「平等對話」,也讓海量的基因數據的價值大打折扣。

為此,2008年國際生物醫藥組織OBO聯盟成員——德國柏林夏洛特(Charité)醫學院聯合Monarch Initiative啟動HPO項目。其中Monarch Initiative提供一個在線資料庫,可便捷瀏覽、查詢生物醫療領域的專業術語,聚集疾病、表型、模型生物、基因等大量結構化的語義數據。

HPO(Human Phenotype Ontology)譯為人類表型術語集。其中Phenotype指表型,是生物體外在表現出來的形態與功能特徵,是基因和環境共同作用的結果,而Ontology是描述專業領域的標準化詞彙表及詞彙間的語義關係。

所以HPO就是描述人類疾病表型特徵的標準詞彙表,每個術語描述了一種異常表型。HPO利用從醫學文獻,Orphanet,DECIPHER,和OMIM資料庫獲得的信息進行開發,目前包含約11,000多項名詞(仍在擴充)和115,000餘項關於遺傳性疾病的注釋。HPO資料庫還提供了一套針對4000多種疾病的注釋(annotations)。HPO開發組還在持續地進行詞條的維護和完善工作。

迄今為止,HPO已被國際20餘家頂級科研機構廣泛應用於人類遺傳學的臨床診斷,人類表型異常與細胞和生物化學網絡之間關係的生物信息學研究,人類和模型生物體表型之間的映射,以及為臨床資料庫提供標準化的詞彙表。HPO項目鼓勵醫學和遺傳學界投入對「本體」本身和臨床注釋的開發和研究。

官網顯示,HPO常用臨床術語主要是描述表型異常(Phenotypic abnormality),包含結締組織異常、聲音異常、神經系統異常等23大類。HPO上線至今,已歷經多次更新迭代,最新版是2017年6月30日推出。

反觀國內,大部分醫療、科研工作者所使用的表型描述詞語並沒有統一標準,醫院信息系統中記錄的臨床表型數據大多是非結構化的自然語句,這對人類疾病,尤其是遺傳性疾病的臨床研究和交流帶來極大不便,對後期數據的分析和挖掘也造成很大困擾,所以中國也亟需建立一套標準的臨床表型用語體系。慶幸地是,在近百名中外專家的辛勤努力下,HPO已成功引進中國並生根發芽。

2015年底,由國內臨床、遺傳諮詢、分子生物學領域知名人士自願組織、共同發起成立中文人類表型標準用語聯盟(CHPO,The Chinese Human Phenotype Ontology Consortium),對國外已有的HPO詞條進行翻譯優化。

組成聯盟的成員都是業內赫赫有名的權威專家,比如,華大基因團隊、美國醫學遺傳學學院會員張巍教授和南加州大學生物信息學專家王凱(現任職於哥倫比亞大學)教授分別翻譯部分HPO詞條,王凱教授搭建了CHPO wiki技術網站,中日醫院顧衛紅教授負責相關方協調溝通與組織,北京協和醫學院黃尚志教授也給予大力支持。最終,在華大基因楊煥明院士與HPO創始人Peter Robinson教授的推動下,萬眾所歸的CHPO終於正式成立了。

CHPO成立宗旨是在中國建立一個開放平臺,聯合相關領域專業人士,逐步建立中文臨床表型術語標準,並讓其指導、服務於中文使用者的臨床和科研工作。目前已實現的兩個目標是,提供人類表型的中文標準術語;提供一個高效的中文人類表型搜尋引擎。

CHPO wiki

CHPO 搜尋引擎

這是中國第一個,也是迄今為止唯一一個醫學術語搜尋引擎,目前已與OMIM遺傳病知識庫建立連接。

其實成立CHPO不僅滿足醫療當下所需,還緣起於一段真實歷史。顧衛紅介紹,2015年發生一件轟動醫療圈的林林案例事件。患兒林林不幸得了疑難罕見症,林林的家長是清華校友,於是請求清華生命科學與醫學校友會援助,藍燦輝先生為此發表一篇《孩子罕見病,五年未確診,清華校友求病因線索》的文章,一時引發社會各界廣泛關注。後來知名學者、研究機構和社會企業自發組織林林病例的研討會,會上業內人士普遍認為臨床表型數據缺乏統一標準,限制了基因數據的分析效率,提議啟動臨床術語標準化工作,於是有專家建議引入HPO,由此誕生了CHPO聯盟。

「HPO是一種連接方式,也是一種共同語言,能將臨床、遺傳、生物信息、醫學數據等進行專業有效的匹配。在這個過程中,醫生藉助HPO轉化採集到的患者表型信息,是後續的深入分析的基礎。」 

顧衛紅還解釋了HPO術語集與其他醫學標準術語的區別,第一是來源於已有的醫學文獻和資料庫,涵蓋常見、常用的詞條,源自對疾病的表型描述;第二是相對簡化便於推廣應用,已被眾多基因資料庫及分析工具所採用;第三是專注遺傳病與罕見病。

耗費一年半,CHPO志願者成員犧牲業餘時間完成翻譯編輯優化。資料顯示,2016年10月,CHPO對HPO詞條進行了翻譯編輯,共計11896個詞條;今年1月,入中科晶雲公司捐贈的5600種OMIM中文名錄與檢索方式;今年6月剛剛結束各分類詞彙定義的最終編輯。除了CHPO核心成員,在整個項目引進過程中,先後有近百位國內外專家參與編輯與審核工作。

近期,CHPO也取得不少進展,已經能提供詞庫免費下載,迄今有80餘個機構/項目申請下載,包括基因檢測機構、醫療機構、研究所、大學、數據分析機構、科研項目組等,而且與國家罕見病註冊登記系統建立了密切合作,共同推動中國臨床術語標準化進程。

雖然基因測序技術的飛速發展,讓疾病的基因層面診斷變為可能,然而作為臨床醫生,顧衛紅感觸最大的是,新興的技術一經推出,來不及消化與優化,就直接面向臨床進行推廣。基因檢測公司的各類基因檢測技術和項目,目前缺乏統一標準,難以做到全流程質控。

為此,她建議疑難病診斷除了臨床表型數據會診,還應建立基因表型數據會診,通過搭建基因表型共享數據平臺,實現臨床表型信息和基因數據在一個平臺上完成會診。「不僅有臨床會診,未來還需要基因會診,這樣才能建立基因檢測行業真正意義上的的質控體系,突破制約行業發展的瓶頸。」

她分享了一個想法,也是目前正在實踐的工作,即讓醫生端和基因檢測機構互通連接,讓局部的連接逐漸拓展、完善並且模式複製,最終形成以患者數據為中心的網絡平臺。

實際上,僅有臨床數據、基因數據、表型性狀還不完整,患者的健康狀態數據也必不可少,數據全面、信息完整才能讓醫生對患者未來生活方式進行科學幹預。她表示,目前健康狀態數據和臨床數據一樣,稀缺且薄弱,龐大的基因數據無法匹配碎片化的臨床表型和健康性狀數據。因此,彌補臨床表型數據,建立標準化方式,構建健康狀態數據也是業界共同努力的方向。

展望未來在AI領域的應用,顧衛紅認為,漢化版HPO不僅能應用在連接臨床、基因檢測、遺傳分析、科研等領域,也有助於機器學習,提高計算機輔助分析能力,推動AI技術與醫療的深入結合與落地應用。

相關焦點

  • 中國臺灣省ABCA4相關視網膜不良的基因表型、臨床特徵介紹
    ABCA4基因是遺傳性視網膜變性最常見的致病基因之一。在本研究中,我們報告中國臺灣地區人群中不同表型的abca4相關視網膜營養不良,其臨床進展,及其與遺傳特徵的關係。本次研究是中國臺灣地區首個具有廣譜基因型和表型特徵的abca4相關性視網膜變性研究。我們注意到,在東亞以前沒有報導過c.1804C>T的極高流行率。視網膜受累的廣泛性可視為abca4相關的視網膜營養不良的頻譜。根據變異編碼的影響,不同類型的遺傳變異可能導致不同的表型。
  • 首個中國兒童腎臟病基因突變圖譜被揭示,「沉默殺手」將可實現精準...
    復旦大學附屬兒科醫院率多中心團隊,繪製出首個中國兒童腎臟病基因突變圖譜。7月22日,國際學術期刊《臨床遺傳學》(Clinical Genetics)雜誌在線發表題為「基於多中心註冊登記系統的1001例兒童腎病疾病致病基因譜系研究」的文章,引起國際領域高度關注。
  • 未來,我需要這樣一款基因搜尋引擎
    基因數據解讀成為目前最為嚴峻的考驗,如何才能讀懂基因組這部「天書」。今天,我們就回到未來,設計一款未來的的基因搜尋引擎。1、首先,它需要支持中文,雖然我英文很好,但是畢竟生物醫學相關專業術語太多。2、不接受競價排名,比如將一些與搜索內容不相關基因排到前面。
  • 中國首個基因編輯新藥臨床試驗申請獲受理
    基因編輯是最有前景的生物醫藥技術之一,而中國擁有大量適合這類療法的患者。記者 | 文思敏基因編輯是當今最受矚目的醫學和生物技術之一。這個產品簡單而言是一種基於CRISPR/Cas9基因編輯技術的造血幹細胞注射液,針對治療重症β地中海貧血症(下簡稱「地貧」)。這也是中國首個申報IND(新藥臨床試驗申請)的基因編輯藥物。
  • 第一屆華南小動物表型分析研討會,探索基因與疾病的關係
    小動物表型分析有哪些研究新動態?小動物疾病模型如何構建及其應用?無菌鼠在腸道微生物領域有哪些應用?第一屆華南小動物表型分析研討會給你答案。從2006年登陸中國廣州,到2020年完成2.85億B輪融資,十幾年來,賽業生物憑藉優質的產品和服務在全球市場綻放出強大的生命力。2020年,賽業生物搭乘粵港澳大灣區生物醫療產業發展快車道,選址廣州福珀斯生物醫藥創新園,建立賽業百沐小動物手術模型表型分析平臺,通過檢測小鼠的表型變化來理解基因功能,探索基因與疾病的關係。
  • 燃石醫學獲批中國首個腫瘤NGS檢測試劑盒
    (以下簡稱 「燃石醫學」)的創新產品 「人EGFR/ALK/BRAF/KRAS基因突變聯合檢測試劑盒(可逆末端終止測序法)」(以下簡稱 「試劑盒」)的三類醫療器械產品的註冊。  該試劑盒是中國首個基於高通量測序技術(NGS)以及伴隨診斷標準審批的多基因腫瘤突變聯合檢測試劑盒,將用於幫助非小細胞肺癌患者精準選擇靶向藥物治療的方式。2016年9月,國家藥品監督管理局批准該試劑盒作為中國首個腫瘤NGS檢測產品進入 「創新醫療器械特別審批程序」。
  • 基因檢測臨床應用中的難題:基因型與表型信息關聯
    與大多數研究不同,臨床表型信息的收集,必須考慮臨床醫療環境的約束、有限的資源、醫生的時間限制,以及通常做診斷時的緊迫感。已有臨床基因組研究指出,表型對罕見疾病遺傳以及基因診斷的重要性,並且強調確保表型信息準確可靠對基因診斷的重要性。什麼是表型數據?
  • 中國首部胸外科疾病術語集重磅發布 ——《胸外科疾病標準化診療...
    點擊查看         4月26日,在「共享・互聯・築造健康醫療大數據共同體——醫療大數據開發及應用大會」上,中國醫師協會胸外科醫師分會聯合人民衛生出版社共同推出《胸外科疾病標準化診療術語》,這是關於我國胸外科疾病方面的首部術語集。
  • 中國首個RET(基因突變)靶向新藥落地博鰲樂城
    中國首個RET(基因突變)靶向新藥落地暨「基因驅動精準治療腫瘤中心」啟動。)的全球創新產品普拉替尼膠囊(Pralsetinib Capsules,簡稱「普拉替尼」)30日引入博鰲樂城國際醫療旅遊先行區(下稱「樂城先行區」),這是該藥物在美國之外僅有的落地市場,9月初獲得美國食品藥品監督管理局(FDA)批准,普拉替尼也成為樂城首個當月同步落地的全球新藥。
  • 繪製生命與疾病的導航圖 人類表型組學策動生命科學原始創新
    10月24日,由復旦大學、中國生物物理學會表型組學分會、上海國際人類表型組研究院聯合主辦的第二屆中國人類表型組大會及第三屆國際人類表型組研討會開幕。表型是生命體的生物特徵。表型組,是指生物體從微觀(即分子)組成到宏觀、從胚胎發育到衰老死亡全過程中所有表型的集合。基因(內因)與環境(外因、含環境暴露和生活方式)共同決定了表型。
  • 中國首個治療地貧基因編輯新藥臨床試驗申請獲受理
    10月27日,博雅輯因宣布,國家藥品監督管理局藥品審評中心已經受理其針對輸血依賴型β地中海貧血的基因編輯療法產品ET-01,即CRISPR/Cas9基因修飾BCL11A紅系增強子的自體CD34+造血幹祖細胞注射液的臨床試驗申請,這也是國內首個獲得受理的基因編輯療法臨床試驗申請。
  • 用巨大疾病知識網絡構建精準醫學模式,電子病歷為其核心
    該報告為對電子病歷未來5個應用方向並提出了10條建議,其中明確提出電子病歷對精準醫學計劃的支持。1、分子生物學數據的整合電子病歷是精準醫學臨床數據的主要來源,精準醫學的研究需要建立基因型與表型之間的關聯模型,而描述患者的表型主要來源於電子病歷。許多研究報導了電子病歷整合分子生物學的數據。
  • ChinaMAP發布最大規模中國人群全基因組測序和表型研究
    2020年4月30日,由國家代謝病臨床醫學研究中心(上海),上海交通大學醫學院附屬瑞金醫院啟動的ChinaMAP(中國代謝解析計劃)聯盟攜全國29家研究機構和醫院,在中科院上海生命科學研究院主辦的《Cell Research》雜誌首次報導了最大規模中國人群全基因組測序和表型研究。
  • JDR:表觀遺傳學 連接環境和疾病的表型與基因型
    這些「表觀遺傳學」可以通過改變染色質的結構來影響基因的表達。自然發生的甲基化通常在CpG序列的胞嘧啶鹼基上,他參與了基因正確表達的控制。DNA甲基化通常與組蛋白脫乙醯化、染色質濃縮和基因沉默相關,染色質濃縮,和基因沉默。不同的甲基化可引起不同的組織模式和疾病差異。這種甲基化可變位點並非均勻分布在整個基因組,而是集中在某些基因,這些基因進行基因轉錄、生長、代謝、分化和癌變的調控。
  • 溫州醫生研發出世界首個遺傳性骨骼疾病基因資料庫
    溫州網訊 侏儒症、脆骨病、先天性多指並指畸形,這些常見的骨骼疾病,與基因的突變有著密切的關係。記者9月7日從溫州醫科大學定理臨床學院(溫州市中心醫院)獲悉,唐少華教授課題組新開發建立了國際上首個遺傳性骨骼疾病基因資料庫,研究成果已於本月在國際期刊上發表。
  • 基因簡報丨轉化醫學首個國家重大基礎設施啟用,重症新冠患者或與...
    轉化醫學首個國家重大基礎設施在上海瑞金醫院啟用  12月19日,歷經兩個五年規劃的轉化醫學首個國家重大基礎設施在上海交通大學醫學院附屬瑞金醫院落成,這也是目前我國在生物醫療領域的第一家國家級大設施。未來,瑞金轉化大樓將設自動化臨床生物樣本庫+百萬人資料庫。  ?
  • 全國首個無創篩查胎兒基因組病技術團體標準發布,可篩查這些疾病
    歷時3個月,全球首個關於NIPS技術篩查胎兒基因組病的技術標準——《基於孕婦外周血漿游離DNA高通量測序無創產前篩查胎兒基因組病技術規範》團體標準(下文簡稱「新團體標準」)11月29日在廣州正式發布。據悉,這也是國內首個無創產前篩查胎兒基因組病技術團體標準發布。
  • ...ChinaMAP發布最大規模中國人群高深度全基因組測序和表型研究成果
    因此,國家代謝性疾病臨床醫學研究中心(上海)基於上海交通大學醫學院附屬瑞金醫院牽頭開展的多項覆蓋全國的隊列研究,依託轉化醫學國家重大科技基礎設施(上海)和醫學基因組學國家重點實驗室,實施了中國代謝解析計劃ChinaMAP (China Metabolic Analytics Project)。
  • 陳啟宇辭任復星醫藥董事長;藥監局受理首個基因編輯臨床試驗;基石...
    普實醫療是一家醫療器械產品研發生產商,主要從事開發醫療設備技術以及生產及銷售醫療設備,專攻心臟相關疾病,其產品以PushMed商標營銷及銷售。質肽生物是一家醫學研究與試驗發展服務提供商,主要經營範圍是技術開發、技術服務;醫學研究與試驗發展;經濟信息諮詢等。
  • 關於「中國標準臨床診斷術語平臺」,你關心的都在這裡!
    中國醫院管理案例評選,醫院卓越管理實踐大秀場。點擊查看 全文852字,歡迎關注!繼上周我們推送了《醫學溝通總卡殼?》之後,得到了眾多讀者的關注。