74萬跨族群全基因組關聯研究揭示血細胞性狀在不同人群中的遺傳基礎

2020-12-21 澎湃新聞

原創 樓海一 CellPress細胞科學 收錄於話題#Cell Press青促會述評22個

生命科學Life science

作為世界領先的全科學領域學術出版社,細胞出版社特與「中國科學院青年創新促進會」合作開設「青促會述評」專欄,以期增進學術互動,促進國際交流。

第二十二期專欄文章,由中國科學院上海營養與健康研究所、馬普計算生物學夥伴研究所副研究員、中國科學院青年創新促進會會員 樓海一,就Cell 中的論文發表述評。

長按圖片掃描二維碼閱讀論文

血細胞性狀包括了紅細胞(RBC)、白細胞(WBC)和血小板(PLT)計數,以及血紅蛋白含量(HGB)、血細胞比容(HCT)、中性白細胞(NEU)等定量指標,是臨床上反映造血祖細胞生成,血紅蛋白合成和從骨髓中釋放,以及在循環中清除衰老血細胞等生理過程的重要統計量。紅細胞、白細胞和血小板的這些血液性狀具有非常強的遺傳性[1]。由於血細胞在病原體入侵、防禦和炎症反應中扮演著重要的角色,血液性狀相關的遺傳位點更可能由於人群歷史和局部環境的自然選擇而產生人群間的分化,從而導致不同的人群有著不一樣的血細胞性狀指標分布特徵以及遺傳性血液病患病率,比如非洲人群相比歐洲人群具有更高的貧血和小紅細胞增多症的發病率[2]。因此,對不同人群的血液指標性狀的遺傳基礎研究是很有必要的。儘管一項基於15萬歐洲人的大樣本全基因組關聯研究(GWAS)找到了1000多個血細胞性狀的遺傳關聯位點[3],但是針對歐洲人以外人群的血細胞遺傳研究依舊匱乏。

研究的實驗設計及分析流程

9月3日, Cell 最新上線了多家研究機構合作的題為Trans-ethnic and Ancestry-Specific Blood-Cell Genetics in 746,667 Individuals from 5 Global Populations 的研究論文。該研究分析了來自五大人群(非洲、歐洲、南亞、東亞和美洲)74.6萬樣本(其中包含了18萬個歐洲以外人群的樣本)的4500萬常染色體變異的基因型與15個血細胞表型的關聯性。通過跨族群的(trans-ethnic)整合分析,總共發現了5552個與血細胞表型關聯的位點(圖1),其中71個新的關聯位點是在歐洲特異性的整合分析中沒有發現的,並且128個關聯位點顯示出了族群間的等位基因效應的異質性。此外,針對每個人群內部的關聯分析額外發現了28個關聯位點,其中21個來自非洲人群。對於歐洲人特異性的整合分析結果單獨撰文發表在同期 Cell 上[4]。進一步地,作者通過關聯位點的精細定位(fine-mapping)發現,跨族群相比於單個人群的精細定位分析能進一步縮小因果變異(causal variant)的範圍,其主要原因是群體間遺傳變異連鎖不平衡(linkage disequilibrium)存在的差異輔助精確定位因果變異,而非樣本量的增大。

▲圖1 跨族群以及祖先特異性的血液性狀指標與基因型關聯分析

接著,作者對因果變異進行了功能注釋分析(圖2),發現了可信度更高的因果變異在錯義突變以及染色質開放區域有富集。此外,作者對因果變異在18個造血細胞群的染色質開放區域進行了富集分析,發現了顯著富集的細胞類型在不同人群中總體一致,但也存在少數人群差異的細胞類型,例如ELL2基因內含子突變(rs115906455)。該變異與平均細胞容積相關,並且位於紅細胞祖細胞開放染色質區域。它在非洲人群中具有一定的等位基因頻率(4.7%),但在非洲以外的人群中該變異頻率很低或者基本為零。

▲圖2 血細胞性狀相關的潛在因果位點的功能注釋

為了解5,552個血細胞相關的變異會對人類表型產生怎樣的影響,作者在不同人群的生物樣本庫中查詢了關聯的遺傳變異所涉及的疾病表型。在收錄歐洲人樣本的英國生物銀行(UKBB)、收錄日本人樣本的生物銀行(BBJ)和收錄非洲裔美國人樣本的範德比爾特大學生物銀行(BioVU),分別發現了366,133和19對基因型與疾病表型的關聯。作者分析了疾病表型與基因型在不同生物銀行間無法被重複的原因,部分是由人群遺傳的異質性產生的,其中不乏一些一因多效性(pleiotropy)的遺傳位點。如在BBJ中與心絞痛、心肌梗塞以及腸癌相關的ACAD10基因上的突變(rs11066008)在UKBB中由於該變異頻率在歐洲人群中的頻率為0而無法被重複。跨族群分析所得的關聯位點強度效應(effect size)可以作為權重來計算多基因性狀分數(ploygenic trait scores),從而用作對血細胞性狀指標的預測。作者利用所計算的多基因性狀分數對BioMe生物庫中的血細胞性狀指標進行了預測,發現歐洲人血細胞指標有著更好的預測效果。此外,作者還以一個在南亞人群低頻、但在其它人群罕見的IL7基因的錯義突變(rs201412253)為例,通過實驗驗證了該低頻變異在表型上會改變B細胞和T細胞淋巴組織生成的細胞因子IL-7蛋白的分泌量。

▲圖3 歐亞人群關聯位點的效應比較

另一個重要的問題是,血液性狀的遺傳基礎在不同人群中具有怎樣的一致性和異質性?作者以歐洲人群和亞洲人群為例(圖3),發現了血液性狀的遺傳解釋度在兩個不同的人群中具有很高的相關性,並且總體遺傳位點的效應強度也在兩個人群中有著顯著的相關性。另一方面,也存在一些在兩個人群中的頻率差異或是效應差異較大的性狀關聯位點。那麼這些差異大的位點是否是由於自然選擇導致的呢?通過富集分析,作者發現這些血液性狀關聯位點富集在了千人基因組項目中自然選擇掃除位點(tag selective sweep)[5],說明這些遺傳位點可能受到自然選擇。例如在IL6基因上遊與血小板數目顯著相關的遺傳變異(rs2188580,圖4)有著很大的人群分化:亞洲人C等位基因頻率44%,而歐洲人僅為4%。

▲圖4 IL6基因座與血小板計數的關聯以及在亞洲人群的選擇掃除信號

總結全文,作者通過五大人群近75萬大樣本隊列的血細胞性狀與基因型的關聯分析,發現血細胞性狀指標的遺傳基礎,尤其是發現的不少遺傳位點是無法在歐洲人群中找到的;通過進一步的精細定位、功能注釋、與疾病表型的關聯預測,闡釋了這些基因型與表型的關聯在人群間的一致性與異質性;通過關聯位點在族群間比較與自然選擇分析,揭示了自然選擇壓力是導致人群間血細胞性狀指標差異的因素。文章最大的亮點是運用了跨族群的基因組關聯方法,發現了許多歐洲以外人群的遺傳關聯效應,並比較和探索了基因型與表型關聯在人群間一致性與異質性及其產生的原因。

本文參考文獻(上下划動查看)

1. Evans, D.M., Frazer, I.H., and Martin, N.G. (1999). Genetic and environmental causes of variation in basal levels of blood cells. Twin Res. 2, 250–257.

2. Raffield, L.M., Ulirsch, J.C., Naik, R.P., Lessard, S., Handsaker, R.E., Jain, D., Kang, H.M., Pankratz, N., Auer, P.L., Bao, E.L., et al.; NHLBI Trans-Omics for Precision Medicine (TOPMed) Consortium, Hematology & Hemostasis, Diabetes, and Structural Variation TOPMed Working Groups (2018). Common a-globin variants modify hematologic and other clinical phenotypes in sickle cell trait and disease. PLoS Genet. 14, e1007293.

3. Astle, W.J., Elding, H., Jiang, T., Allen, D., Ruklisa, D., Mann, A.L., Mead, D., Bouman, H., Riveros-Mckay, F., Kostadima, M.A., et al. (2016). The Allelic Landscape of Human Blood Cell Trait Variation and Links to Common Complex Disease. Cell 167, 1415–1429.e19.

4. Vuckovic, D., Bao, E.L., Akbari, P., Lareau, C.A., Mousas, A., Jiang, T., Chen, M.-H., Raffield, L.M., Tardaguila, M., Huffman, J.E., et al. (2020). The Polygenic and Monogenic Basis of Blood Traits and Diseases. Cell 182

5. Johnson, K.E., and Voight, B.F. (2018). Patterns of shared signatures of recent positive selection across human populations. Nat. Ecol. Evol. 2, 713–720.

論文摘要

大多數全基因組關聯位點是在歐洲祖先的人群中發現的。通過15個血液性狀的746,667個跨族群樣本(其中包括了184,535個歐洲以外人群樣本)的整合分析,本研究發現了5,552個基因型表型的關聯(p < 5×10-9),其中包括了71個歐洲人群以外新發現的關聯位點。除此之外,本研究還在祖先特異的、歐洲人以外的整合分析中發現了28個未曾報導的關聯位點,其中包括了南亞人群中IL7基因上的一個錯義突變,該突變在體內與淋巴細胞數量有關並且在體外與IL-7分泌水平相關。相比於只用歐洲人群的分析結果,跨族群關聯分析所得結果通過精確定位鎖定的95%置信區間內的被注釋為有功能的因果變異數目要少30%。本研究探索了這些關聯變異的臨床表型並通過這些變異對多人群血液表型指標進行了預測,還比較了人群間血液性狀的遺傳基礎以及自然選擇的效應。綜上,這些研究結果強調了開展更多世界代表人群的血液性狀遺傳學分析的價值。

Most loci identified by GWASs have been found in populations of European ancestry (EUR). In trans-ethnic meta-analyses for 15 hematological traits in 746,667 participants, including 184,535 non-EUR individuals, we identified 5,552 trait-variant associations at p < 5×10-9, including 71 novel loci not found in EUR populations. We also identified 28 additional novel variants in ancestry-specific, non-EUR meta-analyses, including an IL7 missense variant in South Asians associated with lymphocyte count in vivo and IL-7 secretion levels in vitro. Fine-mapping prioritized variants annotated as functional and generated 95% credible sets that were 30% smaller when using the trans-ethnic as opposed to the EUR-only results. We explored the clinical significance and predictive value of trans-ethnic variants in multiple populations and compared genetic architecture and the effect of natural selection on these blood phenotypes between populations. Altogether, our results for hematological traits highlight the value of a more global representation of populations in genetic studies.

述評人簡介

樓海一

中國科學院青促會會員

中國科學院上海營養與健康研究所、馬普計算生物學夥伴研究所副研究員

樓海一,博士,中國科學院上海營養與健康研究所、馬普計算生物學夥伴研究所副研究員,2019年入選中國科學院青年創新促進會會員,主要從事基因組的遺傳變異(單核苷酸變異以及結構變異)在人類群體遺傳和進化方面的研究。在American Journal of Human Genetics, National Science Review, Journal of Medical Genetics等雜誌發表研究論文20餘篇,被引用1000餘次。獲得上海市揚帆計劃、上海市市級科技重大專項、中國自然科學基金青年項目和中國自然科學基金面上項目資助。

Dr. Haiyi Lou is an associate professor in CAS-MPG Partner Institute for Computational Biology, Shanghai Institute of Nutrition and Health, Chinese Academy of Sciences (CAS). He was selected as a member (2019) of Youth Innovation Promotion Association of CAS. His research mainly focuses on genetic variations (single nucleotide variation and structural variation) in human population genetics and evolution. He has published more than 20 research articles in SCI journals, including American Journal of Human Genetics, National Science Review, and Journal of Medical Genetics, which were cited over 1,000 times. He received foundation support from Youth Innovation Promotion Association CAS, Science and Technology Commission of Shanghai Municipality, and National Natural Science Foundation of China.

原文刊載於CellPress細胞出版社旗下期刊 Cell 上

中國科學院青年創新促進會(Youth Innovation Promotion Association,Chinese Academy of Sciences)於2011年6月成立,是中科院對青年科技人才進行綜合培養的創新舉措,旨在通過有效組織和支持,團結、凝聚全院的青年科技工作者,拓寬學術視野,促進相互交流和學科交叉,提升科研活動組織能力,培養造就新一代學術技術帶頭人。

Youth Innovation Promotion Association (YIPA) was founded in 2011 by the Chinese Academy of Science (CAS). It aims to provide support for excellent young scientists by promoting their academic vision and interdisciplinary research. YIPA has currently more than 4000 members from 109 institutions and across multiple disciplines, including Life Sciences, Earth Science, Chemistry& Material, Mathematics & Physics, and Engineering. They are organized in 6 discipline branches and 13 local branches.

向下滑動閱覽青促會的英文介紹

閱讀原文

相關焦點

  • 研究揭示非認知技能的遺傳結構
    研究揭示非認知技能的遺傳結構 作者:小柯機器人 發布時間:2021/1/8 16:42:05 荷蘭阿姆斯特丹自由大學Michel G. Nivard課題組,使用全基因組關聯研究(GWAS)揭示了非認知技能的遺傳結構。
  • 顱內動脈瘤的全基因組關聯研究終於來了,這些基因風險位點值得注意...
    IA的遺傳模式尚不清楚,常染色體顯性遺傳可能是最常見的遺傳方式,在家族性和散發性IA病例中發現與染色體1p34.3-36.13、7q11、19q13.3和Xp22有關,而全基因組研究以CDKN2BAS和SOX17基因的證據最強。隨著全基因組關聯研究(GWAS)的發展,科學家已經可以實現對遺傳的多基因模型分析。
  • 基因表達、男女有別:Science、Cell等發布15篇人類遺傳最新成果
    研究人員指出,這些跨組織不同類型數據之間共享的高度相似模式表明,從細胞類型組成到轉錄組變異和遺傳調控效應具有共享的生物學基礎。這些結果表明,組織間共享的細胞類型可能是組織共享遺傳調控作用的關鍵因素。在Science雜誌發表的其他四篇論文中,研究人員還分別探討了性別對人體組織基因表達的影響、跨組織基因表達的細胞類型特異性遺傳調控、人類組織中端粒長度的決定因素,以及在人類組織中轉錄組特徵中發現的功能性稀有遺傳變異。
  • 西瓜甜瓜「甜蜜基因」雙雙被揭示
    北京時間11月2日,《自然—遺傳學》以兩篇長文形式在線發表了兩項由中國農業科學院聯合國內外優勢單位完成的瓜類作物基因組研究成果。兩項研究分別構建了西瓜和甜瓜的全基因組變異圖譜,揭示了兩種水果的馴化歷史及果實品質的遺傳分子機制。
  • 研究發現與啟動子相互作用的定量性狀基因座豐富了功能性遺傳變異
    研究發現與啟動子相互作用的定量性狀基因座豐富了功能性遺傳變異 作者:小柯機器人 發布時間:2020/12/22 22:11:15 美國拉霍亞免疫學研究所Pandurangan Vijayanand和Ferhat Ay小組合作的研究發現
  • 科學網— 揭示板藍靛藍生物合成遺傳基礎
    中科院昆明植物研究所 本報訊 近期,中科院昆明植物研究所(以下簡稱昆明植物所)民族植物學團隊研究員王雨華課題組和木本資源發掘與農林複合系統構建團隊研究員劉愛忠課題組合作,開展了板藍的精細基因組測序研究並揭示靛藍生物合成的分子機制。相關研究成果發表於《植物學報》。 板藍,又稱為南板藍根,具有較豐富的靛藍色素,因此一直是傳統的藍色染料植物。
  • Cell:構建出人類免疫細胞圖譜,可確定遺傳變異對基因表達的影響
    他們正在通過一個新的資料庫DICE(Database of Immune Cell Expression, Expression of quantitative trait loci and Epigenomics, 即免疫細胞表達、數量性狀座位表達和表觀基因組學資料庫)來分享他們的發現,這使得世界各地的科學家們輕鬆地探究這些數據,這是因為它們與基因、細胞類型或者疾病存在關聯。
  • 全基因組測序重現小麥「家世」—新聞—科學網
    10月26日晚,中國科學院遺傳與發育生物學研究所研究員魯非和焦雨鈴團隊合作,通過對共計414種有代表性的普通小麥和近緣麥類物種進行全基因組的重測序,並結合群體遺傳學分析「重現」了小麥的演化歷史。該研究同時挖掘了小麥的基因組多態性,為跨物種轉移適應性成功以進行作物改良奠定基礎並提供新視角。相關研究成果在線發表於《自然—遺傳學》雜誌。
  • 黃瓜番茄白菜等蔬菜基因組學研究利用國際領先——「十三五」農業...
    08 「十三五」農業十大科技成果 黃瓜番茄白菜等蔬菜基因組學研究利用國際領先 黃瓜番茄白菜等蔬菜基因組學研究利用國際領先,攻克了利用多組學研究作物複雜性狀的重大難題
  • science | 微生物群在人類遺傳適應中的作用|微生物群|雙歧桿菌|...
    這些差異是由跨多代發生的局部遺傳適應造成的,與宿主一生中免疫系統的適應或生理適應是有區別的。飲食中沒有牛奶,乳糖酶的生產就會停止。乳糖酶非持續性LNP(乳糖不耐受)是祖先的條件。註:由於乳糖酶活性的不同,人群中存在三種基因型,即純合乳糖酶持續性(LP)、純合乳糖酶非持續性(LNP)和雜合子(heterozygotes)。LNP是人群中最常見的表型。因乳糖酶的相對或絕對缺乏而導致的以腹瀉為主的相關消化道症狀的現象稱之為乳糖不耐受。LNP是原發性乳糖不耐受的生理基礎。
  • 「起底」影響人類衰老和長壽的基因座,血鐵水平竟也參與調控?
    不過,這種失衡在不同個體間存在很大差異,並取決於遺傳、環境和生活方式等許多不同因素。衰老表型,例如健康壽命(healthspan)、總壽命以及長壽的生存率,這是所有人都感興趣的,但是需要大量樣本進行遺傳學研究。
  • 前瞻基因產業全球周報第86期:全球首個血友病基因療法監管遇阻...
    本研究首次發現了導致早期胚胎停育的男性遺傳因素及機制,並探索其幹預策略,為臨床醫生診斷及治療此類患者提供了新的方向。基因組學研究揭示自閉症的產生風險蒙特婁大學的研究人員利用生物信息學工具開發出了一種統計模型,評估遺傳物質的得失如何影響自閉症的風險。
  • 前瞻基因產業全球周報第74期:病毒基因竟會和人類基因融合到一起...
    病毒基因竟會和人類基因融合到一起 產生新蛋白最近,頂尖學術期刊《細胞》在線發表了一篇關於病毒的最新論文,揭示了病毒的一個全新特性:一支跨國科研團隊發現,病毒會把自己的基因與人類基因拼接在一起,產生同時帶有病毒和人類遺傳信息的未知融合蛋白!
  • 昆明植物所利用基因組揭示板藍靛藍生物合成的遺傳基礎
    此外,靛藍indigo(一種吲哚生物鹼)具有多種藥物活性,是傳統中藥中的重要方劑,在當今我國傳統中藥的現代化利用中具有前景。解析indigo物質生物合成的遺傳基礎,對高效利用板藍具有重要指導意義。近期,昆明植物所民族植物學團隊研究員王雨華課題組和木本資源發掘與農林複合系統構建團隊研究員劉愛忠課題組合作,開展了板藍的精細基因組測序研究並揭示靛藍生物合成的分子機制。研究人員結合MinION單分子測序和Hi-C測序技術,首次獲得了板藍染色體水平的精細基因組(圖1c,板藍基因組網站)。
  • 蘭州大學研究團隊從全基因組水平揭示象草花青素積累和快速生長...
    蘭州大學研究團隊從全基因組水平揭示象草花青素積累和快速生長分子機制 2020-10-19 16:55 來源:澎湃新聞·澎湃號·政務
  • 金魚繁殖中體色與身體特徵的遺傳
    遺傳學是研究生物遺傳與變異規律的科學。遺傳表現為生物世代之間的連續性和相似性,就是人們常說的「種瓜得瓜,種豆得豆」。這種連續性和相似性是通過遺傳物質傳遞的由於遺傳物質在世代間連續傳遞,使生物具有遺傳特性,從而保持著物種的相對穩定性。變異是生物世代之間或同代不同個體之間的性狀差異性。變異有遺傳的變異和不遺傳的變異。遺傳的變異,在生物進化上具有重要的意義,它是自然選擇或人工選擇的材料。
  • 中國農業科學院北京畜牧獸醫研究所牛遺傳育種創新團隊發現肉牛淨...
    近日,中國農業科學院北京畜牧獸醫研究所牛遺傳育種創新團隊聚焦肉牛肉質性狀研究,發現myotrophin(MTPN)基因對淨肉重性狀具有重要調控作用。該研究為後全基因組關聯分析(post Genome-Wide Association Studies,post-GWAS)的體外生物學研究提供了新思路,為我國高效優質肉牛新品種培育提供了理論基礎。相關研究成果在線發表在《細胞增殖(Cell Proliferation)》上。
  • 哪些組蛋白修飾可遺傳?
    這個定義中包含了兩個基本的條件:a) 染色質歸根結底還是發生變化了,但並不是 DNA 序列的改變;b) 這種染色質的改變可以引起性狀的改變,而且最重要的是,這種改變的性狀可以穩定遺傳。改變了的性狀(或理解為「獲得性性狀」)的穩定遺傳依賴於基因表達調控機器的遺傳。
  • 關於孟德爾遺傳定律的本質理解和應用
    關鍵詞:孟德爾;基因分離定律;基因自由組合定律;本質;應用遺傳之父孟德爾用了長達八年的時間,從現象到本質,從個別到一般,層層深入地進行了生物遺傳現象的探索研究,極具天才的發明了生物遺傳的分離定律和自由組合定律(以下簡稱「兩大定律」),從而揭示了人類生命豐富多彩的奧秘,為生物的遺傳和變異、植物的雜交育種、現代生物技術的發展奠定了重要的理論依據
  • ChinaMAP發布最大規模中國人群...
    ,8個民族,超過1萬人的高深度(40)全基因組測序數據和表型的系統性分析。王衛慶教授解釋,該項研究中,研究團隊對隊列中代表中國不同地區和民族的10588人DNA樣本,使用華大基因-華大智造的國產自主高通量測序平臺進行了40深度全基因組測序,完成了高質量的中國人群遺傳變異數據構建、中國人群體結構分析、基因組特徵比較以及變異頻譜和致病性變異解析。