基因組學研究領域再次迎來了重大進展!
當地時間7月14日,由加州大學聖克魯茲分校(UCSC)和美國國家人類基因組研究所(NHGRI)研究人員領導的國際端粒到端粒聯盟(Telomere-to-Telomere Consortium,T2T)於《自然》(Nature)雜誌發表了重磅文章,利用Nanopore ultra-long、PacBio、10X Genomics等多種測序技術,成功組裝出首個端粒到端粒(Telomere-to-Telomere)的無缺口人類X染色體完成圖。這項研究成果表明如今生成精確且「Gap Free」的人類染色體序列已經成為可能,也為重建完整人類參考基因組序列踏出了關鍵的一步。
以基因組完成圖為參考基因組是動植物基因組和醫學遺傳學研究者們孜孜以求的終極目標之一。而人類基因組完成圖則有望幫助我們加深對染色體功能和人類疾病的理解,對基因組變異的全面了解將改善目前使用短讀取映射到參考基因組的生物醫學中的驅動技術。在人類基因組測序組裝發展歷程中,科學家們陸陸續續發布一系列參考基因組版本。2001年人類基因組計劃公布了首個人類參考基因組,2009年,基因組參考聯盟(GRC)發布了人類參考基因組版本GRCh37。2013年人類參考基因組第20個版本——GRCh38發布,被認為是世界上測序最準確、最完整的脊椎動物基因組,不斷「修修補補」使用至今。事實上,儘管經過了近二十年的改進,但人類基因組尚未解決的區域還有很多。而這些部分很難被測序,同時可能包括與人類健康和疾病有關的基因和其他功能元件。因此,在人類基因組領域,端粒到端粒的完整組裝是實現人基因組完成圖的一個關鍵步驟。
「這項成就開啟了基因組學研究的新紀元。」 NHGRI主任Eric Green表示,「獲得真正完整的染色體序列和基因組序列的能力是一個技術壯舉,將有助於我們全面了解基因組功能,並為醫學保健中基因組信息的使用提供指導。」據悉,本周發表於《自然》的最新成果是T2T項目的一部分,該項目由美國國立衛生研究院(NIH)下屬NHGRI等機構資助,旨在產生人類基因組的完整參考序列。
人類基因組由大約60億個鹼基組成,因此DNA測序儀無法一次讀取所有鹼基。取而代之的是,研究人員通常將基因組分割成較小的片段,然後分析每個片段,最後將這些較短的DNA序列組裝到一起。論文共同通訊作者,來自NHGRI的Adam Phillippy將這個過程比作完成一個拼圖:「想像一個要重建某份拼圖的遊戲。如果你使用的是較小的碎片,則每塊碎片都包含了較少的『上下文』信息來弄清它的來源,特別是在拼圖中某些沒有獨特線索的部分,例如一整片藍天。對於人類基因組測序也是如此。直到如今,這些碎片還太小,無法將基因組拼圖中最困難的部分組裝在一起。」
為了邁出人基因組完成圖的第一步,T2T研究團隊從24條人類染色體(包括X和Y染色體)中,首先選擇完成X染色體序列,因為它與許多疾病的發生密切相關,包括血友病、慢性肉芽腫病和杜興氏肌營養不良症等。眾所周知,人類的兩套染色體一套來自父親,一套來自母親。生物學上人類女性繼承了兩條X染色體,一條來自其母親,一條來自其父親。但是,這兩個X染色體並不相同,其DNA序列中存在著許多差異。在這項研究中,研究人員並沒有對正常人類細胞的X染色體進行測序。相反,他們使用了一種特殊的細胞類型,具有兩套相同的X染色體。該細胞系來自於一個經過減數分裂後染色體複製的精子,每條染色體都有兩個完全相同的拷貝,因此沒有任何等位基因變異。與僅具有X染色體單拷貝的雄性細胞相比,這種細胞可提供更多的DNA進行測序。此外,它還可以避免分析典型雌性細胞的兩個X染色體時遇到的序列差異。
基因組組裝中重複的解決依賴於長度足以跨越重複區域的測序read。考慮到這一點,T2T研究團隊使用了高覆蓋度Nanopore測序、PacBio長讀長測序、10X Genomics的linked reads以及Hi-C數據的組合,組裝了從端粒到端粒無Gap的X染色體序列版本。在完成組裝後,研究人員估計其X染色體de novo組裝的準確度超過99.99%,重建了約3.1 Mb的著絲粒周圍微衛星區域,並解決了當前X染色體參考基因組中所有29個剩餘的區域。由於沒有「金標準」可供研究人員嚴格評估組裝這種高度重複的DNA序列的準確性,為了幫助確認所生成序列的有效性,研究團隊最後進行了多項驗證操作。驗證結果最終表明該X染色體的組裝具有極高的連續性、完整性和正確性,超過了所有之前公布的人類基因組。
目前,T2T團隊正在繼續對剩餘的人類染色體序列進行處理,並期望能在2020年生成完整的人類基因組序列。但潛在挑戰仍然存在。例如,1號和9號染色體的重複DNA片段就比X染色體上出現的重複片段大得多。
「我們還不知道在將來新組裝的序列中會發現什麼。這是令人興奮的未知數。我們正在全心全意地擁抱一個完整基因組序列的時代。」Adam Phillippy說。
參考資料:
1. Miga, K.H., Koren, S., Rhie, A. et al. Telomere-to-telomere assembly of a complete human X chromosome. Nature (2020). https://doi.org/10.1038/s41586-020-2547-7
2. NHGRI researchers generate complete human X chromosome sequence
https://www.genome.gov/news/news-release/NHGRI-researchers-generate-complete-human-x-chromosome-sequence
3. Telomere-to-Telomere Team Shares Complete X Chromosome Assembly
https://www.genomeweb.com/sequencing/telomere-telomere-team-shares-complete-x-chromosome-assembly#.Xw_Gy3ot1PY