基因組學新紀元:科學家首次完成人類X染色體的完整組裝序列

2021-01-09 中國科學技術館

目前的人類參考基因組是迄今為止最準確和最完整的脊椎動物基因組,但即使經過了20年的改進,DNA序列上仍然存在空白。不過,現在科學家們已經首次從一端到另一端(「端粒到端粒」)地確定了一條人類染色體的完整序列,填補了所有空白,而且精確度達到了前所未有的水平。

對基因組學研究者來說,7月14日在《自然》雜誌上發表的人類X染色體端粒到端粒完整序列是一個裡程碑。該研究的主要作者、加州大學聖克魯茲基因組學研究所的研究科學家凱倫·米加(Karen Miga)說,這個項目之所以能夠完成,是因為新的測序技術使「超長讀取(ultra-long reads)」成為可能,比如加州大學聖克魯茲分校首創的納米孔測序技術。

重複的DNA序列在整個基因組中很常見,而且總是會給測序帶來困難,因為大多數技術只能相對較短地「讀序列」,然後再像拼圖一樣把它們重新拼在一起,組裝成完整的基因組。而重複序列會產生許多看起來幾乎一模一樣的短序列,就像拼圖裡面的那種大片藍天,不知道這些片段要怎樣組合在一起的,也不知道有多少重複的片段。

Miga說:「這些多次重複的序列曾經被認為是難以處理的,但現在我們已經在測序技術上取得了飛躍。通過納米孔測序,我們獲得了能夠跨越整個重複區域的數十萬鹼基對的超長讀數,從而繞過了一些挑戰。」

填補人類基因組序列中的剩餘空白開闢了基因組的新區域,研究人員可以在這些新區域中尋找序列變異與疾病之間的關聯,並為有關人類生物學和進化的重要問題尋找其他線索。

Miga說:「我們開始發現,此前在參考序列中存在空白的一些區域實際上是人類變異最豐富的區域之一,因此我們一直缺失了許多可能對理解人類生物學和疾病很重要的信息。」

Miga和國家人類基因組研究所(NHGRI)的Adam Phillippy是這篇新論文的通訊作者,2018年,他們兩人在一篇論文中展示了用納米孔技術產生一個完整人類基因組序列的潛力,這項研究使用了牛津納米孔技術的MinION測序器,該測序器通過檢測單個DNA分子通過薄膜上的小孔(一個「納米孔」)時電流發生的變化來對DNA進行排序。隨後,他們就共同創立了Telomere-to-Telomere (T2T)聯盟,旨在追求一個完整的基因組。

這個新項目就是建立在上述的基礎上,新項目將納米孔測序技術與PacBio和Illumina公司的其他測序技術,以及BioNano基因組公司的光學圖譜結合在了一起。利用這些技術,該團隊製作出了一個完整的基因組組合,在連續性、完整性和準確性方面超過了之前所有的人類基因組組合,甚至在某些指標上超過了當前的人類參考基因組。

儘管如此,Miga表示,序列中仍然有多個中斷。為了完成X染色體,研究小組必須手動解決序列中的幾個缺口。研究小組用超長納米孔技術解決了兩個重複片段,他們完全跨越了重複片段,並且兩邊錨定在獨特的片段。剩餘的中斷在著絲點,這是一個眾所周知的困難區域,在每個染色體中都可以發現重複的DNA。

在X染色體上,著絲點包含一個高度重複的DNA區域,該區域跨越310萬個鹼基對(鹼基A、C、T和G在DNA雙螺旋中形成對,並在其序列中編碼遺傳信息)。該團隊在重複序列中識別出變異並以它們作為標記,用這些標記來排列長片段,把它們連接在一起,從而橫跨整個著絲粒。

Miga說:「對於我來說,我們可以組裝一個3個巨鹼基大小的串聯反覆這個想法是非常令人興奮的。現在,在覆蓋了數以百萬計的鹼基之後,我們可以對這些重複區域的進行研究了,人們以前認為這是非常棘手的。」

下一步是進行完善,利用多重測序技術的數據來確保序列中每個鹼基的準確性。

Miga解釋說:「為了完善序列,我們在三個不同的測序平臺上使用了一種迭代過程,以達到高度準確性。獨特的標記為超長序列讀取提供了一個錨定系統,一旦錨定讀取,就可以使用多個數據集來調用每個基。

納米孔測序除了提供超長序列讀取外,還可以檢測被甲基化修飾的鹼基。甲基化是一種「表觀」變化,不會改變序列,但對DNA結構和基因表達有重要影響。通過在X染色體上繪製甲基化模式,該團隊能夠確認之前的觀察,並揭示著絲粒內甲基化模式的一些有趣趨勢。

新的人類基因組序列來自一種名為CHM13的人類細胞系,填補了目前被稱為基因組參考聯盟構建38 (Genome Reference Consortium build 38, GRCh38)的參考基因組的許多空白。

為了完成所有CHM13染色體序列,T2T聯盟正在繼續進行研究。Miga說:「這是一個開放的聯盟,因此在許多方面,這是一個由社區推動的項目,許多人為此投入了時間和資源。」

【翻譯/前瞻經濟學人APP資訊組】

參考資料:https://phys.org/news/2020-07-scientists-human-chromosome.html

相關焦點

  • 首次獲得人類X染色體的完整序列
    科學家首次「從頭到尾」(從端粒到端粒)確認了人類X染色體的完整序列,其中不存在任何缺口,它的精確度達到了前所未有的水平。這一成果也標誌著,創造出精確到鹼基的完整人類染色體已經成為現實,基因組學研究或許將邁入新的時代。
  • 美國研究團隊首次合成人類X染色體完整序列
    中國航空報訊:美國研究團隊首次合成了完整的人類X染色體序列,這將有助於我們全面了解基因組功能,並指導基因組信息在醫療服務中的使用。美國國立衛生研究院(NIH)下屬的國家人類基因組研究所(NHGRI)的研究人員製造了人類染色體的第一個端對端DNA序列。
  • 裡程碑式成就,科學家首次獲得人類X染色體完整序列
    取而代之的是科學家只能將基因組切成更小的片段,然後分析每一個片段,每次產生幾百個鹼基的序列,然後將這些較短的DNA序列像拼圖一樣把它們重新組合在一起。這些較短的看起來幾乎一模一樣,而且重複的DNA序列,就像拼圖中存在大片藍天,科學家不知道這些片段是如何組合在一起的,也不知道重複多少次,這些大量重複的基因序列曾經被認為難以處理。
  • 科學家完成人類X染色體的完整組裝
    科學家完成人類X染色體的完整組裝 作者:小柯機器人 發布時間:2020/7/16 17:42:09 美國國立衛生研究院Adam M. Phillippy等研究人員合作完成了人類X染色體的完整組裝。
  • 科學家首次完成對人類X染色體的完整測序
    據外媒報導,儘管科學家已經完成了整個人類基因組的測序但仍有一些空白。現在,遺傳學家在一項具有裡程碑意義的新研究中帶來了一個重要的基因序列,即對整個人類X染色體從頭到尾進行測序並覆蓋了300多萬個此前沒有被繪製出來的鹼基對。
  • 科學家首次完成對人類X染色體的完整測序
    據外媒報導,儘管科學家已經完成了整個人類基因組的測序但仍有一些空白。現在,遺傳學家在一項具有裡程碑意義的新研究中帶來了一個重要的基因序列,即對整個人類X染色體從頭到尾進行測序並覆蓋了300多萬個此前沒有被繪製出來的鹼基對。人類基因組計劃是有史以來最雄心勃勃的科學事業之一。
  • 人類基因組X染色體被無死角解碼
    這是基因測序技術的一小步,卻有可能是人類基因工程學發展的一大步。近日,美國國立衛生研究院(NIH)人類基因組研究所(NHGRI)的研究人員宣布,終於獲得了人類X染色體的完整、無間隙、端對端的序列信息。這一突破性發現公布在《自然》雜誌上,這表明有可能生成一個人類染色體的精確鹼基序列,產生人類基因組的完整序列。
  • WLA年度發布 | 首次獲取完整的X染色體序列,人類越來越了解自己了
    2020年,研究人員首次「從頭到尾」(從端粒到端粒)確認了人類X染色體的完整序列,其中不存在任何缺口,精確度達到了前所未有的水平。這一成果意味著創造出精確到鹼基的完整人類染色體已經成為現實,基因組學研究或許將邁入新的時代,人類離揭秘遺傳信息又進了一步。2020年,由中、美、英、法、日、德等多國科學家參與的人類基因組計劃,公布了人類基因組工作草圖。人類基因組非常長,包含約60億個鹼基。
  • Nature發布首個人類X染色體完成圖,長讀長測序盡顯優勢
    而人類基因組完成圖則有望幫助我們加深對染色體功能和人類疾病的理解,對基因組變異的全面了解將改善目前使用短讀取映射到參考基因組的生物醫學中的驅動技術。在人類基因組測序組裝發展歷程中,科學家們陸陸續續發布一系列參考基因組版本。2001年人類基因組計劃公布了首個人類參考基因組,2009年,基因組參考聯盟(GRC)發布了人類參考基因組版本GRCh37。
  • Nature重大突破:生成完整的人類X染色體序列!
    "這一成就開啟了基因組學研究的新時代,"美國國家基因組研究所主任、醫學博士Eric Green說道。"產生真正完整的染色體和基因組序列的能力是一項技術壯舉,它將幫助我們獲得對基因組功能的全面理解,並為在醫療保健中使用基因組信息提供信息。"
  • 解碼人類基因組:人類基因組計劃後17年,X染色體被解碼了
    近年來,DNA讀取技術不斷改善,這些空缺被逐步填滿,研究人員得以進一步繪製完整的人類基因組圖譜。但還是有百餘個區域未得完成,其中就包括X染色體上的幾個部分。而近期發表於Nature的一項研究顯示,科學家首次確定從端粒到端粒的X染色體的完整序列,此成就能幫助科學家進一步了解多種遺傳條件。
  • 解碼人類基因組:人類基因組計劃後17年,X染色體被解碼了
    近年來,DNA讀取技術不斷改善,這些空缺被逐步填滿,研究人員得以進一步繪製完整的人類基因組圖譜。但還是有百餘個區域未得完成,其中就包括X染色體上的幾個部分。而近期發表於Nature的一項研究顯示,科學家首次確定從端粒到端粒的X染色體的完整序列,此成就能幫助科學家進一步了解多種遺傳條件。
  • 科學家第一次實現了人類X染色體的完整測序
    人類參考基因組(GRCh38)是人類有史以來取得的最準確、最完整的脊椎動物基因組。不過在這個基因組中,存在許多不準確或者未被讀取的地方,它們稱作缺口。即使經過二十多年的改進,仍有數百個未解決的缺口。現在,科學家們使用了新的方法,首次完成了人類染色體從一端到另一端的完整序列(「端粒到端粒」),沒有缺口,並且準確性達到空前水平。科學家通過納米孔測序技術,結合其他改進和驗證的互補技術,實現了對葡萄胎CHM13全基因組進行的高覆蓋、超長讀取。
  • 科學家第一次實現了人類X染色體的完整測序
    人類參考基因組(GRCh38)是人類有史以來取得的最準確、最完整的脊椎動物基因組。不過在這個基因組中,存在許多不準確或者未被讀取的地方,它們稱作缺口。即使經過二十多年的改進,仍有數百個未解決的缺口。問題在於人類基因組中有許多重複的片段,當讀取到許多重複小片段的時候,很難精確還原真正的基因組,畢竟誰也說不清楚到底是基因組是如何重複的。現在,科學家們使用了新的方法,首次完成了人類染色體從一端到另一端的完整序列(「端粒到端粒」),沒有缺口,並且準確性達到空前水平。
  • 人類X染色體被無死角解碼,最大功臣是它
    ◎ 科技日報記者 張曄這是基因測序技術的一小步,卻有可能是人類基因工程學發展的一大步。近日,美國國立衛生研究院(NIH)人類基因組研究所(NHGRI)的研究人員宣布,終於獲得了人類X染色體的完整、無間隙、端對端的序列信息。這一突破性發現公布在《自然》雜誌上,這表明有可能生成一個人類染色體的精確鹼基序列,產生人類基因組的完整序列。
  • 人類基因組草圖再添細節 X染色體被無死角解碼
    這是基因測序技術的一小步,卻有可能是人類基因工程學發展的一大步。  近日,美國國立衛生研究院(NIH)人類基因組研究所(NHGRI)的研究人員宣布,終於獲得了人類X染色體的完整、無間隙、端對端的序列信息。  這一突破性發現公布在《自然》雜誌上,這表明有可能生成一個人類染色體的精確鹼基序列,產生人類基因組的完整序列。
  • 人類基因組草圖再添細節X染色體被無死角解碼
    這是基因測序技術的一小步,卻有可能是人類基因工程學發展的一大步。近日,美國國立衛生研究院(NIH)人類基因組研究所(NHGRI)的研究人員宣布,終於獲得了人類X染色體的完整、無間隙、端對端的序列信息。這一突破性發現公布在《自然》雜誌上,這表明有可能生成一個人類染色體的精確鹼基序列,產生人類基因組的完整序列。NHGRI主任、醫學博士埃裡克·格林說:「這項成就開啟了基因組學研究的新紀元。」耗資30億美元、於1990年啟動的人類基因組計劃,經過十年努力,在2000年繪製出首個人類基因組工作草圖。
  • 人類基因組草圖再添細節 X染色體被無死角解碼
    本報記者 張 曄這是基因測序技術的一小步,卻有可能是人類基因工程學發展的一大步。近日,美國國立衛生研究院(NIH)人類基因組研究所(NHGRI)的研究人員宣布,終於獲得了人類X染色體的完整、無間隙、端對端的序列信息。這一突破性發現公布在《自然》雜誌上,這表明有可能生成一個人類染色體的精確鹼基序列,產生人類基因組的完整序列。
  • 人類基因組草圖再添細節 X染色體被無死角解碼---中國科學院
    這是基因測序技術的一小步,卻有可能是人類基因工程學發展的一大步。  近日,美國國立衛生研究院(NIH)人類基因組研究所(NHGRI)的研究人員宣布,終於獲得了人類X染色體的完整、無間隙、端對端的序列信息。  這一突破性發現公布在《自然》雜誌上,這表明有可能生成一個人類染色體的精確鹼基序列,產生人類基因組的完整序列。
  • 人工合成4條酵母染色體 我國科學家開啟「再造生命」新紀元
    國內外同行指出,這是繼合成原核生物染色體之後的又一裡程碑式突破,開啟人類「設計生命、再造生命和重塑生命」的新紀元。 為完成設計和化學再造完整的釀酒酵母基因組,國際科學界發起了釀酒酵母基因組合成計劃(Sc2.0計劃),這是合成基因組學(Synthetic genomics)研究的標誌性國際合作項目。該項目由美國科學院院士傑夫·伯克發起,有美國、中國、英國、法國、澳大利亞、新加坡等多國研究機構參與並分工協作,試圖重新設計併合成釀酒酵母的全部16條染色體(長約12Mb,1Mb是百萬鹼基對)。