74萬跨族群全基因組關聯研究揭示血細胞性狀在不同人群中的遺傳基礎

2020-12-05 澎湃新聞

原創 樓海一 CellPress細胞科學 收錄於話題#Cell Press青促會述評22個

生命科學Life science

作為世界領先的全科學領域學術出版社,細胞出版社特與「中國科學院青年創新促進會」合作開設「青促會述評」專欄,以期增進學術互動,促進國際交流。

第二十二期專欄文章,由中國科學院上海營養與健康研究所、馬普計算生物學夥伴研究所副研究員、中國科學院青年創新促進會會員 樓海一,就Cell 中的論文發表述評。

長按圖片掃描二維碼閱讀論文

血細胞性狀包括了紅細胞(RBC)、白細胞(WBC)和血小板(PLT)計數,以及血紅蛋白含量(HGB)、血細胞比容(HCT)、中性白細胞(NEU)等定量指標,是臨床上反映造血祖細胞生成,血紅蛋白合成和從骨髓中釋放,以及在循環中清除衰老血細胞等生理過程的重要統計量。紅細胞、白細胞和血小板的這些血液性狀具有非常強的遺傳性[1]。由於血細胞在病原體入侵、防禦和炎症反應中扮演著重要的角色,血液性狀相關的遺傳位點更可能由於人群歷史和局部環境的自然選擇而產生人群間的分化,從而導致不同的人群有著不一樣的血細胞性狀指標分布特徵以及遺傳性血液病患病率,比如非洲人群相比歐洲人群具有更高的貧血和小紅細胞增多症的發病率[2]。因此,對不同人群的血液指標性狀的遺傳基礎研究是很有必要的。儘管一項基於15萬歐洲人的大樣本全基因組關聯研究(GWAS)找到了1000多個血細胞性狀的遺傳關聯位點[3],但是針對歐洲人以外人群的血細胞遺傳研究依舊匱乏。

研究的實驗設計及分析流程

9月3日, Cell 最新上線了多家研究機構合作的題為Trans-ethnic and Ancestry-Specific Blood-Cell Genetics in 746,667 Individuals from 5 Global Populations 的研究論文。該研究分析了來自五大人群(非洲、歐洲、南亞、東亞和美洲)74.6萬樣本(其中包含了18萬個歐洲以外人群的樣本)的4500萬常染色體變異的基因型與15個血細胞表型的關聯性。通過跨族群的(trans-ethnic)整合分析,總共發現了5552個與血細胞表型關聯的位點(圖1),其中71個新的關聯位點是在歐洲特異性的整合分析中沒有發現的,並且128個關聯位點顯示出了族群間的等位基因效應的異質性。此外,針對每個人群內部的關聯分析額外發現了28個關聯位點,其中21個來自非洲人群。對於歐洲人特異性的整合分析結果單獨撰文發表在同期 Cell 上[4]。進一步地,作者通過關聯位點的精細定位(fine-mapping)發現,跨族群相比於單個人群的精細定位分析能進一步縮小因果變異(causal variant)的範圍,其主要原因是群體間遺傳變異連鎖不平衡(linkage disequilibrium)存在的差異輔助精確定位因果變異,而非樣本量的增大。

▲圖1 跨族群以及祖先特異性的血液性狀指標與基因型關聯分析

接著,作者對因果變異進行了功能注釋分析(圖2),發現了可信度更高的因果變異在錯義突變以及染色質開放區域有富集。此外,作者對因果變異在18個造血細胞群的染色質開放區域進行了富集分析,發現了顯著富集的細胞類型在不同人群中總體一致,但也存在少數人群差異的細胞類型,例如ELL2基因內含子突變(rs115906455)。該變異與平均細胞容積相關,並且位於紅細胞祖細胞開放染色質區域。它在非洲人群中具有一定的等位基因頻率(4.7%),但在非洲以外的人群中該變異頻率很低或者基本為零。

▲圖2 血細胞性狀相關的潛在因果位點的功能注釋

為了解5,552個血細胞相關的變異會對人類表型產生怎樣的影響,作者在不同人群的生物樣本庫中查詢了關聯的遺傳變異所涉及的疾病表型。在收錄歐洲人樣本的英國生物銀行(UKBB)、收錄日本人樣本的生物銀行(BBJ)和收錄非洲裔美國人樣本的範德比爾特大學生物銀行(BioVU),分別發現了366,133和19對基因型與疾病表型的關聯。作者分析了疾病表型與基因型在不同生物銀行間無法被重複的原因,部分是由人群遺傳的異質性產生的,其中不乏一些一因多效性(pleiotropy)的遺傳位點。如在BBJ中與心絞痛、心肌梗塞以及腸癌相關的ACAD10基因上的突變(rs11066008)在UKBB中由於該變異頻率在歐洲人群中的頻率為0而無法被重複。跨族群分析所得的關聯位點強度效應(effect size)可以作為權重來計算多基因性狀分數(ploygenic trait scores),從而用作對血細胞性狀指標的預測。作者利用所計算的多基因性狀分數對BioMe生物庫中的血細胞性狀指標進行了預測,發現歐洲人血細胞指標有著更好的預測效果。此外,作者還以一個在南亞人群低頻、但在其它人群罕見的IL7基因的錯義突變(rs201412253)為例,通過實驗驗證了該低頻變異在表型上會改變B細胞和T細胞淋巴組織生成的細胞因子IL-7蛋白的分泌量。

▲圖3 歐亞人群關聯位點的效應比較

另一個重要的問題是,血液性狀的遺傳基礎在不同人群中具有怎樣的一致性和異質性?作者以歐洲人群和亞洲人群為例(圖3),發現了血液性狀的遺傳解釋度在兩個不同的人群中具有很高的相關性,並且總體遺傳位點的效應強度也在兩個人群中有著顯著的相關性。另一方面,也存在一些在兩個人群中的頻率差異或是效應差異較大的性狀關聯位點。那麼這些差異大的位點是否是由於自然選擇導致的呢?通過富集分析,作者發現這些血液性狀關聯位點富集在了千人基因組項目中自然選擇掃除位點(tag selective sweep)[5],說明這些遺傳位點可能受到自然選擇。例如在IL6基因上遊與血小板數目顯著相關的遺傳變異(rs2188580,圖4)有著很大的人群分化:亞洲人C等位基因頻率44%,而歐洲人僅為4%。

▲圖4 IL6基因座與血小板計數的關聯以及在亞洲人群的選擇掃除信號

總結全文,作者通過五大人群近75萬大樣本隊列的血細胞性狀與基因型的關聯分析,發現血細胞性狀指標的遺傳基礎,尤其是發現的不少遺傳位點是無法在歐洲人群中找到的;通過進一步的精細定位、功能注釋、與疾病表型的關聯預測,闡釋了這些基因型與表型的關聯在人群間的一致性與異質性;通過關聯位點在族群間比較與自然選擇分析,揭示了自然選擇壓力是導致人群間血細胞性狀指標差異的因素。文章最大的亮點是運用了跨族群的基因組關聯方法,發現了許多歐洲以外人群的遺傳關聯效應,並比較和探索了基因型與表型關聯在人群間一致性與異質性及其產生的原因。

本文參考文獻(上下划動查看)

1. Evans, D.M., Frazer, I.H., and Martin, N.G. (1999). Genetic and environmental causes of variation in basal levels of blood cells. Twin Res. 2, 250–257.

2. Raffield, L.M., Ulirsch, J.C., Naik, R.P., Lessard, S., Handsaker, R.E., Jain, D., Kang, H.M., Pankratz, N., Auer, P.L., Bao, E.L., et al.; NHLBI Trans-Omics for Precision Medicine (TOPMed) Consortium, Hematology & Hemostasis, Diabetes, and Structural Variation TOPMed Working Groups (2018). Common a-globin variants modify hematologic and other clinical phenotypes in sickle cell trait and disease. PLoS Genet. 14, e1007293.

3. Astle, W.J., Elding, H., Jiang, T., Allen, D., Ruklisa, D., Mann, A.L., Mead, D., Bouman, H., Riveros-Mckay, F., Kostadima, M.A., et al. (2016). The Allelic Landscape of Human Blood Cell Trait Variation and Links to Common Complex Disease. Cell 167, 1415–1429.e19.

4. Vuckovic, D., Bao, E.L., Akbari, P., Lareau, C.A., Mousas, A., Jiang, T., Chen, M.-H., Raffield, L.M., Tardaguila, M., Huffman, J.E., et al. (2020). The Polygenic and Monogenic Basis of Blood Traits and Diseases. Cell 182

5. Johnson, K.E., and Voight, B.F. (2018). Patterns of shared signatures of recent positive selection across human populations. Nat. Ecol. Evol. 2, 713–720.

論文摘要

大多數全基因組關聯位點是在歐洲祖先的人群中發現的。通過15個血液性狀的746,667個跨族群樣本(其中包括了184,535個歐洲以外人群樣本)的整合分析,本研究發現了5,552個基因型表型的關聯(p < 5×10-9),其中包括了71個歐洲人群以外新發現的關聯位點。除此之外,本研究還在祖先特異的、歐洲人以外的整合分析中發現了28個未曾報導的關聯位點,其中包括了南亞人群中IL7基因上的一個錯義突變,該突變在體內與淋巴細胞數量有關並且在體外與IL-7分泌水平相關。相比於只用歐洲人群的分析結果,跨族群關聯分析所得結果通過精確定位鎖定的95%置信區間內的被注釋為有功能的因果變異數目要少30%。本研究探索了這些關聯變異的臨床表型並通過這些變異對多人群血液表型指標進行了預測,還比較了人群間血液性狀的遺傳基礎以及自然選擇的效應。綜上,這些研究結果強調了開展更多世界代表人群的血液性狀遺傳學分析的價值。

Most loci identified by GWASs have been found in populations of European ancestry (EUR). In trans-ethnic meta-analyses for 15 hematological traits in 746,667 participants, including 184,535 non-EUR individuals, we identified 5,552 trait-variant associations at p < 5×10-9, including 71 novel loci not found in EUR populations. We also identified 28 additional novel variants in ancestry-specific, non-EUR meta-analyses, including an IL7 missense variant in South Asians associated with lymphocyte count in vivo and IL-7 secretion levels in vitro. Fine-mapping prioritized variants annotated as functional and generated 95% credible sets that were 30% smaller when using the trans-ethnic as opposed to the EUR-only results. We explored the clinical significance and predictive value of trans-ethnic variants in multiple populations and compared genetic architecture and the effect of natural selection on these blood phenotypes between populations. Altogether, our results for hematological traits highlight the value of a more global representation of populations in genetic studies.

述評人簡介

樓海一

中國科學院青促會會員

中國科學院上海營養與健康研究所、馬普計算生物學夥伴研究所副研究員

樓海一,博士,中國科學院上海營養與健康研究所、馬普計算生物學夥伴研究所副研究員,2019年入選中國科學院青年創新促進會會員,主要從事基因組的遺傳變異(單核苷酸變異以及結構變異)在人類群體遺傳和進化方面的研究。在American Journal of Human Genetics, National Science Review, Journal of Medical Genetics等雜誌發表研究論文20餘篇,被引用1000餘次。獲得上海市揚帆計劃、上海市市級科技重大專項、中國自然科學基金青年項目和中國自然科學基金面上項目資助。

Dr. Haiyi Lou is an associate professor in CAS-MPG Partner Institute for Computational Biology, Shanghai Institute of Nutrition and Health, Chinese Academy of Sciences (CAS). He was selected as a member (2019) of Youth Innovation Promotion Association of CAS. His research mainly focuses on genetic variations (single nucleotide variation and structural variation) in human population genetics and evolution. He has published more than 20 research articles in SCI journals, including American Journal of Human Genetics, National Science Review, and Journal of Medical Genetics, which were cited over 1,000 times. He received foundation support from Youth Innovation Promotion Association CAS, Science and Technology Commission of Shanghai Municipality, and National Natural Science Foundation of China.

原文刊載於CellPress細胞出版社旗下期刊 Cell 上

中國科學院青年創新促進會(Youth Innovation Promotion Association,Chinese Academy of Sciences)於2011年6月成立,是中科院對青年科技人才進行綜合培養的創新舉措,旨在通過有效組織和支持,團結、凝聚全院的青年科技工作者,拓寬學術視野,促進相互交流和學科交叉,提升科研活動組織能力,培養造就新一代學術技術帶頭人。

Youth Innovation Promotion Association (YIPA) was founded in 2011 by the Chinese Academy of Science (CAS). It aims to provide support for excellent young scientists by promoting their academic vision and interdisciplinary research. YIPA has currently more than 4000 members from 109 institutions and across multiple disciplines, including Life Sciences, Earth Science, Chemistry& Material, Mathematics & Physics, and Engineering. They are organized in 6 discipline branches and 13 local branches.

向下滑動閱覽青促會的英文介紹

閱讀原文

相關焦點

  • Cell兩連發 | 全基因組關聯研究揭示人類血液學特徵
    近年來,全基因組關聯研究(Genome-wide association studies,GWAS)已鑑定出數千種與複雜表型相關的遺傳變異。作為迄今為止最大規模的血細胞性狀變異研究,這項研究提供了對血細胞參數調節,以及遺傳變異如何影響在稀有血液病中觀察到的變異性的新見解。同時,評估了「全方位基因模型」與血細胞表型的相關性,肯定了多基因變異對於複雜性狀和疾病風險的重大貢獻。此外,該研究為個體遺傳背景及該背景可能如何影響血液疾病的表現提供了一個新穎的框架。
  • 科學家質疑全基因組關聯研究意義—新聞—科學網
    科學家質疑全基因組關聯研究意義 圖片來源:Sandor Csudai/Getty Images 本報訊 對於某種疾病而言,當比較足夠多的患病與不患病人群基因組後,與疾病相關的遺傳變異便有可能脫穎而出。這也是全基因組關聯研究(GWAS)背後運行的哲學——十多年來,研究人員利用它來尋找包括精神分裂症和類風溼性關節炎在內的疾病的遺傳關係。
  • 74萬跨族群全基因組關聯研究揭示血細胞性狀在不同人群中的遺傳基礎 | Cell Press青促會述評
  • 研究揭示不同人體組織中基因表達的細胞類型特異性遺傳調控
    研究揭示不同人體組織中基因表達的細胞類型特異性遺傳調控 作者:小柯機器人 發布時間:2020/9/14 13:42:31 美國哥倫比亞大學Tuuli Lappalainen、Sarah Kim-Hellmuth等研究人員合作揭示不同人體組織中基因表達的細胞類型特異性遺傳調控
  • Science特刊從轉錄組角度專注於人體遺傳變異
    第8版GTEx的數據包括了更多的組織和個體,從而可以更準確地繪製推測的因果變異(causal variant),並確定基因表達中的細胞類型特異性差異。研究規模的擴大還提供了在基因組近端和遠端,將遺傳變異與基因表達聯繫起來的能力,因此順式效應(cis effect)和反式效應(trans effect)以及在基因表達中的人群和性別差異都可以被檢測出來。
  • 全基因組關聯研究發現重症COVID-19遺傳易感基因
    目前已報導較高的死亡率與高齡、男性、高血壓、糖尿病和其他肥胖相關的心血管疾病特徵相關的臨床關聯,但人們對嚴重Covid-19的發病機制及其相關因素仍了解甚少。近日,來自挪威奧斯陸大學的研究團隊在《The New England JournalOf Medicine》上發表了其對重症Covid-19與呼吸衰竭的全基因組相關性的最新研究結果。
  • 新研究首次揭秘中國人群基因遺傳特徵—新聞...
  • ChinaMAP發布最大規模中國人群全基因組測序和表型研究
    2020年4月30日,由國家代謝病臨床醫學研究中心(上海),上海交通大學醫學院附屬瑞金醫院啟動的ChinaMAP(中國代謝解析計劃)聯盟攜全國29家研究機構和醫院,在中科院上海生命科學研究院主辦的《Cell Research》雜誌首次報導了最大規模中國人群全基因組測序和表型研究。
  • 芝麻大規模全基因組關聯分析完成
    由中國農科院油料所張秀榮研究員領銜的芝麻與特色油料遺傳育種創新團隊,與中科院國家基因研究中心等單位合作,在國際上率先完成了芝麻高密度單倍型圖譜構建、主要農藝性狀大規模全基因組關聯分析
  • 解碼生命:從多視角看生命|遺傳|人類基因組計劃|解碼生命|基因組|...
    20 年過去了,在完成人類染色體DNA 測序的基礎上,功能基因組、表觀基因組、蛋白質組等研究進展迅速,與疾病相關的基因及其致病機制不斷被發現,眾多基因靶向藥物以及臨床基因檢測和治療方案研發成功,基因編輯、定量計算、冷凍電鏡等生物學技術日臻完善,新方法、新知識、新技術、新思想層出不窮,人類正以前所未有的速度從各個維度,特別是從分子水平揭示生命的奧秘。
  • 作科所從全基因組水平揭示了lncRNA調控水稻重要農藝性狀變異的...
    RNA(lncRNA)的注釋,研究了水稻lncRNA的進化歷史,並從全基因組水平揭示了lncRNA調控水稻重要農藝性狀變異的分子機制。相關研究結果於12月18日發表在《科學進展(Science Advances)》上。儘管高達90%的真核生物基因組能夠發生轉錄,但僅2%的轉錄本能夠編碼蛋白。闡明非編碼區變異是揭示作物遺傳變異的基礎,對農藝性狀多樣性形成的作用機理具有重要意義。
  • ...ChinaMAP發布最大規模中國人群高深度全基因組測序和表型研究成果
    ,8個民族,超過1萬人的高深度(40)全基因組測序數據和表型的系統性分析。王衛慶教授解釋,該項研究中,研究團隊對隊列中代表中國不同地區和民族的10588人DNA樣本,使用華大基因-華大智造的國產自主高通量測序平臺進行了40深度全基因組測序,完成了高質量的中國人群遺傳變異數據構建、中國人群體結構分析、基因組特徵比較以及變異頻譜和致病性變異解析。
  • 新基因!帕金森新基因座、因果關係及遺傳風險的全基因組關聯研究
    在過去的十年中。全基因組關聯研究(genome-wide association study,GWAS)幫助研究者們發現了42個與PD相關的獨立危險位點。在這些具有常見風險突變中,還包括與家族性帕金森病風險相關的罕見變異,如SNCA、LRRK2、GBA等【4-5】。
  • 全基因組關聯的meta分析研究確定了多種長壽基因
    | 作者:範大志 (佛山市婦幼保健院)近日,德國馬克思·普朗克老化生物研究所(Max Planck Institute for Biology of Ageing)的Deelen J研究者們,通過全基因關聯meta分析的方法確定了多個人類長壽基因位點及相關基因
  • 大腦細胞類型的遺傳鑑定揭示帕金森氏病產生原因
    大腦細胞類型的遺傳鑑定揭示帕金森氏病產生原因 作者:小柯機器人 發布時間:2020/4/29 10:27:05 瑞典卡羅林斯卡學院Patrick F.
  • 研究揭示轉錄因子NKX2-5與心臟病的關聯
    研究揭示轉錄因子NKX2-5與心臟病的關聯 作者:小柯機器人 發布時間:2019/10/2 13:09:30 美國加州大學舊金山分校Kelly A. Frazer和Michael G.
  • 基因表達、男女有別:Science、Cell等發布15篇人類遺傳最新成果
    研究人員指出,這些跨組織不同類型數據之間共享的高度相似模式表明,從細胞類型組成到轉錄組變異和遺傳調控效應具有共享的生物學基礎。這些結果表明,組織間共享的細胞類型可能是組織共享遺傳調控作用的關鍵因素。在Science雜誌發表的其他四篇論文中,研究人員還分別探討了性別對人體組織基因表達的影響、跨組織基因表達的細胞類型特異性遺傳調控、人類組織中端粒長度的決定因素,以及在人類組織中轉錄組特徵中發現的功能性稀有遺傳變異。
  • 科學家揭示人類表觀遺傳多樣性模式
    研究人員對來自世界五個不同種群 DNA 甲基化、基因型和基因表達的數據進了分析。研究發現,在人群範圍內的表觀遺傳變化比 DNA 序列的變化快得多。相關研究於今日發表在 Nature Ecology and Evolution 期刊,這可能揭示了人類如何通過表觀遺傳學反應來應對環境壓力。
  • Cell繪製出全球不同種族70餘萬人的血細胞遺傳圖譜
    加拿大蒙特婁大學Guillaume Lettre、美國威斯康星大學密爾沃基分校Paul Auer等110多名研究人員合作,繪製出來自全球不同種族70餘萬人的血細胞遺傳圖譜。2020年9月3日出版的《細胞》雜誌發表了這項成果。由GWAS鑑定的大多數基因座已在歐洲血統人群中發現。
  • 顱內動脈瘤的全基因組關聯研究終於來了,這些基因風險位點值得注意!
    全基因組分析使家族性IA研究出現新突破隨著全基因組外顯子測序技術的出現,對家族性IA研究有一些新的發現。IA的遺傳模式尚不清楚,常染色體顯性遺傳可能是最常見的遺傳方式,在家族性和散發性IA病例中發現與染色體1p34.3-36.13、7q11、19q13.3和Xp22有關,而全基因組研究以CDKN2BAS和SOX17基因的證據最強。隨著全基因組關聯研究(GWAS)的發展,科學家已經可以實現對遺傳的多基因模型分析。