針對大規模全基因組測序數據尋找與常見疾病有關的罕見遺傳變異的檢驗方法 |
2020年8月24日, 《自然-遺傳學》(Nature Genetics) 在線發表了哈佛大學林希虹教授團隊的最新研究成果。
研究團隊提出了一個針對大規模全基因組測序數據的罕見變異檢驗方法STAAR(variant-Set Test for Association using Annotation infoRmation)。
該方法有效地引入並整合了多組學功能注釋數據,有助於快速,有效,高通量地分析全基因組測序數據來發現疾病與罕見變異之間的關聯性,並可以廣泛地應用於分析多種類型的表型數據,加快精準預防,精準醫療和尋找新的藥物標靶的研究。
文章分析了3萬人的全基因組測序數據,發現了可能和膽固醇和脂醯甘油的有關聯的新的罕見遺傳變異位點。
哈佛大學教授、美國國家醫學院林希虹院士為該論文的通訊作者,博士研究生厲希豪與博士後李子林為該論文共同第一作者。
其他參與成員研究員周胡峰、博士後Sheila Gaynor,西南財經大學教授劉耀午,美國德州大學休斯敦健康科學中心助理教授陳漢,美國德州大學MD Anderson癌症研究中心助理教授Ryan Sun,也參與了該論文的部分工作,還有美國國家心肺血液研究所(National Heart Lung and Blood Institute(NHLBI))的精準化醫學研究計劃(Trans-Omics Precision Medicine (TOPMed) Program)的許多成員。
在過去十幾年中,全基因組關聯研究(genome-wide association studies,GWAS)廣泛用於解析複雜疾病與數量性狀的遺傳結構。GWAS 採用陣列技術在全基因組中對數百萬個位點進行基因分型,旨在找出與表型和疾病有關的基因或遺傳位點。
迄今為止,GWAS 已成功識別出數千種與疾病相關的常見變異.但是這些常見變異只能解釋疾病遺傳率中很小的比例,許多缺乏重要的已知生物功能。這對將這些發現用於臨床和新藥研發造成困難。
人類基因組中絕大部分的變異為罕見變異,而GWAS的一個局限性是只能對常見變異進行基因分型。
近年來,隨著全基因組測序成本大幅下降, 越來越多的大規模全基因組和全外顯子組測序研究(whole genome sequencing/whole exome sequencing(WGS/WES))正在快速進展,以發現人類疾病和表型的遺傳構架,導致疾病的遺傳變異位點,和新的藥物標靶。
例如美國國家心肺血液研究所(NHLBI)的15萬人的精準化醫學研究計劃(TOPMed),美國國家人類基因組研究所(National Human Genome Research Institute)的35萬的基因組測序計劃(Genome Sequencing Program (GSP)),以及許多生物樣本庫(biobanks), 例如50萬人的英國生物樣本庫(UK Biobank)。
這些研究使得罕見變異與表型和常見疾病間的關聯分析變得可能,且有助於加快精準預防,精準醫療的研究,和新的藥物標靶的發現。
多組學(multi-omics)中的功能注釋(functional annotation)提供了基因變異的生物學信息,有助於更有效地發現與疾病相關的罕見變異。
林希虹教授團隊創造性地在罕見變異檢驗中引入了多組學中的功能注釋信息,開發了基於多組學功能注釋數據的罕見變異檢驗方法STAAR,顯著地提高了罕見變異與表型和常見疾病關聯性檢驗的統計分析功效。
研究人員將STAAR方法應用於TOPMed全基因組測序數據中,分析了3萬人的四種脂類,包括膽固醇和脂醯甘油,新發現並驗證了與低密度脂蛋白膽固醇(low-density lipoprotein cholesterol)相關的罕見遺傳位點,包括位於第7號染色體上基因NPC1L1中的罕見破壞性錯義突變(disruptive missense)和位於第19號染色體上基因APOC1P1下遊附近基因區域中的罕見變異。
STAAR方法為大規模全基因組和全外顯子組測序數據的罕見變異分析提供了快速,有效,準確, 高通量的分析工具,適用於大規模全基因組測序數據與疾病和表型關聯性和大型生物樣本庫的數據分析,加快精準健康的研究和新的藥物標靶的發現。(來源:科學網)
相關論文信息:https://doi.org/10.1038/s41588-020-0676-4