一項新的研究提供了迄今為止人類基因多樣性的最全面的分析,來自惠康桑格研究所(Wellcome Sanger Institute),劍橋大學及其合作者對929個人類基因組進行了測序。該研究發現了大量以前未曾描述的遺傳變異,並為我們的進化歷史提供了新見解,突顯了祖先在世界範圍內進行多樣化,遷移和混合的過程的複雜性。該研究發表在《science》雜誌上,是迄今為止世界範圍內種群遺傳多樣性的最詳細代表作。所有研究人員均可免費使用它來研究人類遺傳多樣性,包括研究世界不同地區對疾病的遺傳易感性。
關於人類歷史的共識觀點告訴我們,大約在500,000-700,000年前直到近幾十萬非洲「現代」人類出現之前的年份,當今人類的祖先與絕種的尼安德特人和Denisovan群體的祖先背道而馳。大約在50,000-70,000年前,一些人從非洲擴張出去,不久之後便與古老的歐亞群體混為一談。此後,在過去的10,000年中,隨著許多群體從狩獵採集者過渡到食品生產者,人口迅速增長,伴隨著廣泛的移民和混合。
圖1,全球人口遺傳變異的結構。
在不同地理區域中發現的四種不同類別的遺傳變異的近似數量的示意圖。用點表示包含在研究中的人群的起源。
這項研究首次將最新的高質量測序技術應用於如此龐大而多樣的人類,涵蓋了來自全球54個地理,語言和文化上不同種群的929個基因組。這些基因組的測序和分析是人類基因組多樣性計劃(HGDP)-CEPH小組的一部分,現在為我們的遺傳史提供了前所未有的細節。研究小組發現了數百萬個以前未知的DNA變異,這些變異僅在一個大陸或主要地理區域內發生。儘管其中大多數是罕見的,但它們包括某些非洲和大洋洲人群的共同變異,而先前的研究並未發現這些變異。
來自不同人類群體的基因組序列可以揭示我們物種遺傳變異的結構以及不同種群的歷史以及它們之間的關係。 它們還為醫學遺傳學研究的設計和解釋提供了框架。在這裡,我們展示了來自該小組的54個地理,語言和文化差異人群的929個高覆蓋度基因組序列(圖2)
圖2,54個不同人群的基因組測序和變異發現。
(A)HGDP-CEPH面板中54個種群的地理起源,括號中顯示了每個種群的測序個體數量。 (B)在HGDP數據集中發現的變體的最大等位基因頻率,但在1000 Genomes階段3數據集中沒有發現(紅色),反之亦然(深藍色)。垂直軸顯示在任何單個種群中具有最大等位基因頻率等於或高於水平軸上對應值的變體數。為了解決由HGDP數據集中較小的樣本數量導致的較高採樣噪聲,還顯示了在1000個基因組數據集的向下採樣以匹配HGDP大小的版本中獲得的結果(淺藍色)。為了保守地避免計算兩個數據集中實際存在但由於技術原因未在其中一個數據集中調用的變體,應排除數據集中全局頻率大於30%的任何變體。 (C)使用全基因組序列和常用的確定的基因分型陣列位點比較來自54個種群的所有可能的f4統計量的Z得分。點數根據統計中包括的非洲人口數進行著色。
諸如此類的變化可能會影響不同人群對疾病的敏感性。但是,到目前為止,醫學遺傳學研究主要是在歐洲血統的人群中進行的,這意味著這些變體可能具有的任何醫學含義尚不清楚。鑑定這些新穎的變體代表了將基因組學研究全面擴展到代表性不足人群的第一步。但是,沒有發現任何主要地理區域的100%基因組中都存在單個DNA變異,而其他所有區域都沒有這種變異。這一發現突顯了全球常見的大多數遺傳變異。
「這項研究提供的細節使我們可以更深入地了解人類歷史,特別是在非洲內部,對人類進化的時間尺度目前知之甚少。我們發現,當今種群的祖先主要是在過去的25萬年來,通過逐漸複雜的過程而多樣化,這些早期世系之間有大量的基因流。但是我們也看到證據表明,人類祖先的一小部分可以追溯到比這更早多樣化的群體。」 來自Francis Crick研究所和Wellcome Sanger研究所的Anders Bergström博士說道。 法國巴黎愛德華·多態主義中心(CEPH)生物資源中心負責人Hélène Blanché強調:「人類基因組多樣性項目資源在過去的二十年中促進了許多有關人類歷史的新發現。令人興奮的是,藉助最新的基因組測序技術,這些基因組將繼續幫助我們了解我們的物種以及我們的進化方式。」
這項研究還提供了證據,表明現代人的尼安德特人血統可以通過一個重大的「混合事件」來解釋,很可能涉及幾名尼安德特人與現代人接觸後不久,他們才與非洲人接觸。相反,在大洋洲和東亞地區的人們中發現了從Denisovans繼承的幾組不同的DNA片段,表明至少有兩個明顯的混合事件。在西非人中發現少量的尼安德特人DNA,最有可能反映出後來的遺傳基因從歐亞大陸回流到非洲的情況,進一步凸顯了人類遺傳史是如何表現出多重複雜性的。直到最近,人們還認為只有撒哈拉以南非洲以外的人擁有尼安德特人的DNA。
圖3,時間深度和人口分離模式。
(A)MSMC2跨人口調查結果針對成對的非洲人口,包括以漢人作為非非洲人的代表,以及古人口與以現代人類為代表的姆布蒂之間的人口。使用每個人口四個物理階段性的單倍型計算現代人類群體之間的曲線,使用每個人口兩個基因型和未定相的古代基因組來計算現代人群和古種群之間的曲線。在不同時間點具有瞬時間隔的模擬歷史記錄的結果以黃色和灰色曲線交替顯示在背景中。 (B)與(A)中的MSMC2交叉填充結果,但針對成對的非非洲人口。 (C)在簡單突然的成對拆分模型下,使用momi2對54個群體中所有可能的對FST(等位基因頻率差異的度量)進行估計的拆分時間。
惠康桑格研究所(Wellcome Sanger Institute)的 Chris Tyler-Smith博士談到。「儘管這種資源只是許多研究途徑的開端,但我們已經可以推測出對人類歷史的一些誘人見解。對於更好地了解非洲的人類進化以及促進醫學研究以實現人類祖先的全面多樣性而言,這尤其重要。」
期刊參考:Bergströmet等,Science . 2020. 通過929個不同的基因組洞察人類遺傳變異和種群歷史。
DOI:10.1126 / science.aay5012。
原文連結:https://science.sciencemag.org/content/367/6484/eaay5012.full