Nature發布首個人類X染色體完成圖,長讀長測序盡顯優勢

2020-08-25 測序中國

基因組學研究領域再次迎來了重大進展!

當地時間7月14日,由加州大學聖克魯茲分校(UCSC)和美國國家人類基因組研究所(NHGRI)研究人員領導的國際端粒到端粒聯盟(Telomere-to-Telomere Consortium,T2T)於《自然》(Nature)雜誌發表了重磅文章,利用Nanopore ultra-long、PacBio、10X Genomics等多種測序技術,成功組裝出首個端粒到端粒(Telomere-to-Telomere)的無缺口人類X染色體完成圖。這項研究成果表明如今生成精確且「Gap Free」的人類染色體序列已經成為可能,也為重建完整人類參考基因組序列踏出了關鍵的一步

以基因組完成圖為參考基因組是動植物基因組和醫學遺傳學研究者們孜孜以求的終極目標之一。而人類基因組完成圖則有望幫助我們加深對染色體功能和人類疾病的理解,對基因組變異的全面了解將改善目前使用短讀取映射到參考基因組的生物醫學中的驅動技術。在人類基因組測序組裝發展歷程中,科學家們陸陸續續發布一系列參考基因組版本。2001年人類基因組計劃公布了首個人類參考基因組,2009年,基因組參考聯盟(GRC)發布了人類參考基因組版本GRCh37。2013年人類參考基因組第20個版本——GRCh38發布,被認為是世界上測序最準確、最完整的脊椎動物基因組,不斷「修修補補」使用至今。事實上,儘管經過了近二十年的改進,但人類基因組尚未解決的區域還有很多。而這些部分很難被測序,同時可能包括與人類健康和疾病有關的基因和其他功能元件。因此,在人類基因組領域,端粒到端粒的完整組裝是實現人基因組完成圖的一個關鍵步驟。

「這項成就開啟了基因組學研究的新紀元。」 NHGRI主任Eric Green表示,「獲得真正完整的染色體序列和基因組序列的能力是一個技術壯舉,將有助於我們全面了解基因組功能,並為醫學保健中基因組信息的使用提供指導。」據悉,本周發表於《自然》的最新成果是T2T項目的一部分,該項目由美國國立衛生研究院(NIH)下屬NHGRI等機構資助,旨在產生人類基因組的完整參考序列。

人類基因組由大約60億個鹼基組成,因此DNA測序儀無法一次讀取所有鹼基。取而代之的是,研究人員通常將基因組分割成較小的片段,然後分析每個片段,最後將這些較短的DNA序列組裝到一起。論文共同通訊作者,來自NHGRI的Adam Phillippy將這個過程比作完成一個拼圖:「想像一個要重建某份拼圖的遊戲。如果你使用的是較小的碎片,則每塊碎片都包含了較少的『上下文』信息來弄清它的來源,特別是在拼圖中某些沒有獨特線索的部分,例如一整片藍天。對於人類基因組測序也是如此。直到如今,這些碎片還太小,無法將基因組拼圖中最困難的部分組裝在一起。」

為了邁出人基因組完成圖的第一步,T2T研究團隊從24條人類染色體(包括X和Y染色體)中,首先選擇完成X染色體序列,因為它與許多疾病的發生密切相關,包括血友病、慢性肉芽腫病和杜興氏肌營養不良症等。眾所周知,人類的兩套染色體一套來自父親,一套來自母親。生物學上人類女性繼承了兩條X染色體,一條來自其母親,一條來自其父親。但是,這兩個X染色體並不相同,其DNA序列中存在著許多差異。在這項研究中,研究人員並沒有對正常人類細胞的X染色體進行測序。相反,他們使用了一種特殊的細胞類型,具有兩套相同的X染色體。該細胞系來自於一個經過減數分裂後染色體複製的精子,每條染色體都有兩個完全相同的拷貝,因此沒有任何等位基因變異。與僅具有X染色體單拷貝的雄性細胞相比,這種細胞可提供更多的DNA進行測序。此外,它還可以避免分析典型雌性細胞的兩個X染色體時遇到的序列差異。

基因組組裝中重複的解決依賴於長度足以跨越重複區域的測序read。考慮到這一點,T2T研究團隊使用了高覆蓋度Nanopore測序、PacBio長讀長測序、10X Genomics的linked reads以及Hi-C數據的組合,組裝了從端粒到端粒無Gap的X染色體序列版本。在完成組裝後,研究人員估計其X染色體de novo組裝的準確度超過99.99%,重建了約3.1 Mb的著絲粒周圍微衛星區域,並解決了當前X染色體參考基因組中所有29個剩餘的區域。由於沒有「金標準」可供研究人員嚴格評估組裝這種高度重複的DNA序列的準確性,為了幫助確認所生成序列的有效性,研究團隊最後進行了多項驗證操作。驗證結果最終表明該X染色體的組裝具有極高的連續性、完整性和正確性,超過了所有之前公布的人類基因組。

目前,T2T團隊正在繼續對剩餘的人類染色體序列進行處理,並期望能在2020年生成完整的人類基因組序列。但潛在挑戰仍然存在。例如,1號和9號染色體的重複DNA片段就比X染色體上出現的重複片段大得多。

「我們還不知道在將來新組裝的序列中會發現什麼。這是令人興奮的未知數。我們正在全心全意地擁抱一個完整基因組序列的時代。」Adam Phillippy說。

參考資料:

1. Miga, K.H., Koren, S., Rhie, A. et al. Telomere-to-telomere assembly of a complete human X chromosome. Nature (2020). https://doi.org/10.1038/s41586-020-2547-7

2. NHGRI researchers generate complete human X chromosome sequence

https://www.genome.gov/news/news-release/NHGRI-researchers-generate-complete-human-x-chromosome-sequence

3. Telomere-to-Telomere Team Shares Complete X Chromosome Assembly

https://www.genomeweb.com/sequencing/telomere-telomere-team-shares-complete-x-chromosome-assembly#.Xw_Gy3ot1PY

相關焦點

  • 新方法可完成高精度長讀擴增子測序
    新方法可完成高精度長讀擴增子測序 作者:小柯機器人 發布時間:2021/1/12 16:40:51 丹麥奧爾堡大學Mads Albertsen研究團隊近日取得一項新成果。
  • 納米孔長讀長測序完成蜂鳥高度連續基因組組裝並提高異構體識別
    PromethION測序結合短讀長測序從頭組裝高度連續準確的紅喉蜂鳥基因組利用納米孔高通量測序儀PromethION,生成超過25 Gb的測序數據,N50大於40 Kb,結合短讀長測序,使用由Aleksey Zimin和約翰·霍普金斯大學的Salzberg實驗室開發的MaSuRCA工作流程進行基因組混合組裝, 「安娜的蜂鳥(Anna’s hummingbird)」作為參考基因組
  • 科學家首次完成對人類X染色體的完整測序
    據外媒報導,儘管科學家已經完成了整個人類基因組的測序但仍有一些空白。現在,遺傳學家在一項具有裡程碑意義的新研究中帶來了一個重要的基因序列,即對整個人類X染色體從頭到尾進行測序並覆蓋了300多萬個此前沒有被繪製出來的鹼基對。
  • 科學家首次完成對人類X染色體的完整測序
    據外媒報導,儘管科學家已經完成了整個人類基因組的測序但仍有一些空白。現在,遺傳學家在一項具有裡程碑意義的新研究中帶來了一個重要的基因序列,即對整個人類X染色體從頭到尾進行測序並覆蓋了300多萬個此前沒有被繪製出來的鹼基對。人類基因組計劃是有史以來最雄心勃勃的科學事業之一。
  • 納米孔PromethION測序+Shasta完成人類基因組端粒到著絲粒的高效...
    團隊在2019年利用初代Shasta分析流程對納米孔測序數據進行從頭組裝、矯正和Hi-C拼接Scaffold(圖1),使用一臺納米孔PromethION測序設備在9天內完成了11個人類基因組測序,研究成果發表在《Nature Biotechnology》, DOI:高通量數據:共生成2.4 Tb序列數據,10kb及以上讀長序列的覆蓋度中位數約為55X,100 kb及以上的超長讀長序列覆蓋深度中位數約為
  • 首次獲得人類X染色體的完整序列
    但你想過完成一幅上百萬片,甚至再高几個數量級的拼圖作品嗎? 這幅巨大的「拼圖」實際上就是國際上許多機構和科學家多年來一直在努力完成的作品,也就是人類基因組研究。 最近,這項浩大的工程又迎來了一個裡程碑式的成就。
  • 科學家完成人類X染色體的完整組裝
    科學家完成人類X染色體的完整組裝 作者:小柯機器人 發布時間:2020/7/16 17:42:09 美國國立衛生研究院Adam M. Phillippy等研究人員合作完成了人類X染色體的完整組裝。
  • 20年磨一劍:納米技術完全測序人類X染色體
    從2000年人類基因組草圖宣告完成後的二十年間,人類參考基因組不斷更新迭代。即便如此,其中依然存在數以百計的空缺,尚無一條染色體被真正完成 [1]。 如今,科學家首次完成了一條 「從頭到尾」 真正完整的人類染色體測序。7月14日,《自然》雜誌上刊載了美國加利福尼亞大學聖克魯茲分校的 Karen Miga 教授團隊的研究成果[2]。
  • 20年磨一劍:納米技術完全測序人類X染色體
    從2000年人類基因組草圖宣告完成後的二十年間,人類參考基因組不斷更新迭代。即便如此,其中依然存在數以百計的空缺,尚無一條染色體被真正完成 [1]。 如今,科學家首次完成了一條 「從頭到尾」 真正完整的人類染色體測序。7月14日,《自然》雜誌上刊載了美國加利福尼亞大學聖克魯茲分校的 Karen Miga 教授團隊的研究成果 [2]。
  • WLA年度發布 | 首次獲取完整的X染色體序列,人類越來越了解自己了
    這一成果意味著創造出精確到鹼基的完整人類染色體已經成為現實,基因組學研究或許將邁入新的時代,人類離揭秘遺傳信息又進了一步。2020年,由中、美、英、法、日、德等多國科學家參與的人類基因組計劃,公布了人類基因組工作草圖。人類基因組非常長,包含約60億個鹼基。
  • 解碼人類基因組:人類基因組計劃後17年,X染色體被解碼了
    近年來,DNA讀取技術不斷改善,這些空缺被逐步填滿,研究人員得以進一步繪製完整的人類基因組圖譜。但還是有百餘個區域未得完成,其中就包括X染色體上的幾個部分。而近期發表於Nature的一項研究顯示,科學家首次確定從端粒到端粒的X染色體的完整序列,此成就能幫助科學家進一步了解多種遺傳條件。
  • 解碼人類基因組:人類基因組計劃後17年,X染色體被解碼了
    近年來,DNA讀取技術不斷改善,這些空缺被逐步填滿,研究人員得以進一步繪製完整的人類基因組圖譜。但還是有百餘個區域未得完成,其中就包括X染色體上的幾個部分。而近期發表於Nature的一項研究顯示,科學家首次確定從端粒到端粒的X染色體的完整序列,此成就能幫助科學家進一步了解多種遺傳條件。
  • Nature:藉助第三代測序韓國發表最連續人類基因組
    為了更全面了解結構變異的範圍和更好地理解AK1二倍體基因組結構的相,研究者對從PacBio單分子實時測序reads組裝得到的,每個染色體單倍型的裝配體——「haplotig」進行從頭組裝。除了PacBio長讀長測序,該研究還使用了Illumina短讀長測序、10X Genomics連接讀取、細菌人工染色體(BAC)測序和BioNano Genomics光學圖譜。
  • 三代宏基因組測序探究人類腸道中染色體外的可移動基因元件
    目前宏基因組研究主要是通過二代測序來進行研究,隨著三代測序技術的發展,PacBio SMRT測序技術應用場景越來越廣泛。與二代測序方法相比,採用PacBio SMRT長讀長測序技術的三代宏基因組可以減少部分拼接錯誤,提高基因組組裝注釋的準確性和微生物群落鑑定的解析度。
  • Nature重大突破:生成完整的人類X染色體序列!
    圖片來源:Nature這些缺口通常包含重複的DNA片段,非常難以測序。然而,這些重複片段包括可能與人類健康和疾病相關的基因和其他功能元素。因為人類基因組非常長,由大約60億個鹼基組成,DNA測序機無法一次讀取所有鹼基。
  • 科學家第一次實現了人類X染色體的完整測序
    X染色體之所以出現這麼多的缺口,是因為以前的基因測序技術一次只能讀取DNA的一個小片段,然後再將這些片段拼湊起來。問題在於人類基因組中有許多重複的片段,當讀取到許多重複小片段的時候,很難精確還原真正的基因組,畢竟誰也說不清楚到底是基因組是如何重複的。
  • 科學家第一次實現了人類X染色體的完整測序
    問題在於人類基因組中有許多重複的片段,當讀取到許多重複小片段的時候,很難精確還原真正的基因組,畢竟誰也說不清楚到底是基因組是如何重複的。現在,科學家們使用了新的方法,首次完成了人類染色體從一端到另一端的完整序列(「端粒到端粒」),沒有缺口,並且準確性達到空前水平。
  • 人類基因組X染色體被無死角解碼
    耗資30億美元、於1990年啟動的人類基因組計劃,經過十年努力,在2000年繪製出首個人類基因組工作草圖。這是有史以來最準確、最完整的脊椎動物基因組序列。但是,承載人類遺傳密碼的「密卷」並未被百分之百地破譯,仍然存在大量未知的缺口。這些缺口為什麼遲遲不能補上?這次幫助科學家獲得X染色體完整序列的是什麼基因測序技術?剩餘的基因序列空白,能夠順利補上嗎?
  • 基因組學新紀元:科學家首次完成人類X染色體的完整組裝序列
    不過,現在科學家們已經首次從一端到另一端(「端粒到端粒」)地確定了一條人類染色體的完整序列,填補了所有空白,而且精確度達到了前所未有的水平。對基因組學研究者來說,7月14日在《自然》雜誌上發表的人類X染色體端粒到端粒完整序列是一個裡程碑。
  • 人類X染色體被無死角解碼,最大功臣是它
    耗資30億美元、於1990年啟動的人類基因組計劃,經過十年努力,在2000年繪製出首個人類基因組工作草圖。這是有史以來最準確、最完整的脊椎動物基因組序列。但是,承載人類遺傳密碼的「密卷」並未被百分之百地破譯,仍然存在大量未知的缺口。這些缺口為什麼遲遲不能補上?這次幫助科學家獲得X染色體完整序列的是什麼基因測序技術?剩餘的基因序列空白,能夠順利補上嗎?