科學家實現染色體尺度下、單體型解析度的人類基因組裝配

2020-12-22 科學網

科學家實現染色體尺度下、單體型解析度的人類基因組裝配

作者:

小柯機器人

發布時間:2020/12/9 13:24:14

美國哈佛醫學院Heng Li等研究人員合作實現染色體尺度下、單體型解析度的人類基因組裝配。相關論文於2020年12月7日在線發表在《自然—生物技術》雜誌上。

研究人員提出了一種稱為二倍體組裝(DipAsm)的方法,該方法對單個個體使用長而準確的讀長和長距離構象數據,可在1天之內生成染色體規模的定相組裝。DipAsm被應用於四個公共人類基因組,PGP1、HG002、NA12878和HG00733,DipAsm產生了單體型分辨的程序集,具有最小重疊群長度,可覆蓋50%的已知基因組(NG50)直至25 Mb,並在大約90.5%的雜合位點達到定相98-99%的準確性,且在連續性和定相完整性方面均優於其他方法。

研究人員證明了染色體規模的定相裝配對於發現結構變異(SV)的重要性,包括數千個新的轉座子插入,以及高度多態性和醫學上重要的區域,例如人白細胞抗原(HLA)和殺傷細胞免疫球蛋白樣受體(KIR)區域。DipAsm將促進高質量的精準醫療以及個體單體型變異和種群多樣性的研究。

據了解,單體型分辨或定相的基因組組裝可提供基因組及其複雜遺傳變異的完整圖譜。但是,當前用於定相裝配的算法要麼無法生成染色體尺度的定相,要麼需要譜系信息,這限制了它們的應用。

附:英文原文

Title: Chromosome-scale, haplotype-resolved assembly of human genomes

Author: Shilpa Garg, Arkarachai Fungtammasan, Andrew Carroll, Mike Chou, Anthony Schmitt, Xiang Zhou, Stephen Mac, Paul Peluso, Emily Hatas, Jay Ghurye, Jared Maguire, Medhat Mahmoud, Haoyu Cheng, David Heller, Justin M. Zook, Tobias Moemke, Tobias Marschall, Fritz J. Sedlazeck, John Aach, Chen-Shan Chin, George M. Church, Heng Li

Issue&Volume: 2020-12-07

Abstract: Haplotype-resolved or phased genome assembly provides a complete picture of genomes and their complex genetic variations. However, current algorithms for phased assembly either do not generate chromosome-scale phasing or require pedigree information, which limits their application. We present a method named diploid assembly (DipAsm) that uses long, accurate reads and long-range conformation data for single individuals to generate a chromosome-scale phased assembly within 1day. Applied to four public human genomes, PGP1, HG002, NA12878 and HG00733, DipAsm produced haplotype-resolved assemblies with minimum contig length needed to cover 50% of the known genome (NG50) up to 25Mb and phased ~99.5% of heterozygous sites at 98–99% accuracy, outperforming other approaches in terms of both contiguity and phasing completeness. We demonstrate the importance of chromosome-scale phased assemblies for the discovery of structural variants (SVs), including thousands of new transposon insertions, and of highly polymorphic and medically important regions such as the human leukocyte antigen (HLA) and killer cell immunoglobulin-like receptor (KIR) regions. DipAsm will facilitate high-quality precision medicine and studies of individual haplotype variation and population diversity.

DOI: 10.1038/s41587-020-0711-0

Source: https://www.nature.com/articles/s41587-020-0711-0

相關焦點

  • 科學家完成人類X染色體的完整組裝
    科學家完成人類X染色體的完整組裝 作者:小柯機器人 發布時間:2020/7/16 17:42:09 美國國立衛生研究院Adam M. Phillippy等研究人員合作完成了人類X染色體的完整組裝。
  • 科學家第一次實現了人類X染色體的完整測序
    X染色體之所以出現這麼多的缺口,是因為以前的基因測序技術一次只能讀取DNA的一個小片段,然後再將這些片段拼湊起來。問題在於人類基因組中有許多重複的片段,當讀取到許多重複小片段的時候,很難精確還原真正的基因組,畢竟誰也說不清楚到底是基因組是如何重複的。
  • 科學家首次完成對人類X染色體的完整測序
    據外媒報導,儘管科學家已經完成了整個人類基因組的測序但仍有一些空白。現在,遺傳學家在一項具有裡程碑意義的新研究中帶來了一個重要的基因序列,即對整個人類X染色體從頭到尾進行測序並覆蓋了300多萬個此前沒有被繪製出來的鹼基對。人類基因組計劃是有史以來最雄心勃勃的科學事業之一。
  • 原位測序技術實現人類基因組三維定位和加速超解析度成像
    原位測序技術實現人類基因組三維定位和加速超解析度成像 作者:小柯機器人 發布時間:2020/7/28 15:55:54 2020年7月27日上線的《自然—方法學》雜誌發表了美國科學家的一項最新研究成果。哈佛醫學院的C.
  • 首次獲得人類X染色體的完整序列
    科學家首次「從頭到尾」(從端粒到端粒)確認了人類X染色體的完整序列,其中不存在任何缺口,它的精確度達到了前所未有的水平。這一成果也標誌著,創造出精確到鹼基的完整人類染色體已經成為現實,基因組學研究或許將邁入新的時代。
  • 解碼人類基因組:人類基因組計劃後17年,X染色體被解碼了
    近年來,DNA讀取技術不斷改善,這些空缺被逐步填滿,研究人員得以進一步繪製完整的人類基因組圖譜。但還是有百餘個區域未得完成,其中就包括X染色體上的幾個部分。而近期發表於Nature的一項研究顯示,科學家首次確定從端粒到端粒的X染色體的完整序列,此成就能幫助科學家進一步了解多種遺傳條件。
  • 龍井茶樹染色體級別基因組組裝成功—新聞—科學網
    龍井43             中國農科院供圖 近日,《自然—通訊》在線發表了我國科學家在茶樹全基因組組裝和茶樹起源演化研究上取得的重要突破。 通訊作者楊亞軍介紹,他們首先以我國著名的優良茶樹品種龍井43為材料,利用他們自主開發的三代組裝軟體結合高通量染色體構象捕獲(Hi-C)等技術,克服了其基因組高度雜合、重複序列比例高等複雜基因組組裝難題,完成了龍井43染色體級別的基因組組裝。
  • 人類X染色體被無死角解碼,最大功臣是它
    ◎ 科技日報記者 張曄這是基因測序技術的一小步,卻有可能是人類基因工程學發展的一大步。近日,美國國立衛生研究院(NIH)人類基因組研究所(NHGRI)的研究人員宣布,終於獲得了人類X染色體的完整、無間隙、端對端的序列信息。這一突破性發現公布在《自然》雜誌上,這表明有可能生成一個人類染色體的精確鹼基序列,產生人類基因組的完整序列。
  • 哈佛醫學院Church等團隊開發新的方法,可快速組裝染色體
    單倍型解析或分階段的基因組組裝可提供基因組及其複雜遺傳變異的完整圖片。但是,當前用於分階段裝配的算法要麼不生成染色體尺度的定相,要麼需要譜系信息,這限制了它們的應用。1天之內生成染色體規模的分相組裝。人類包含每個染色體的兩個同源拷貝,並且推導每個拷貝的基因組序列對於正確理解等位基因特異性DNA甲基化和基因表達以及分析進化,法醫和遺傳疾病至關重要。然而,重建基因組序列的傳統從頭組裝算法通常將樣品表示為單倍體基因組。
  • 人類X染色體基因序列草圖公布
    由英國桑格實驗室領導的人類X染色體測序工作已基本完成,研究人員在17日出版的最新一期英國《自然》雜誌上公布了該染色體基因草圖。     研究人員完成了X染色體上99.9%基因的測序,並對人類X染色體的起源作出了解釋。
  • 為什麼人類不能實現永生?科學家:人類只是在給基因打工
    如果你這麼認為,那就大錯特錯了,當人類走進科技時代之後,對於永生的探索研究不僅沒有降低,反而越來越高。在科學家的眼裡,這個宇宙的一切都離不開科學,都能夠用科學來進行解釋。生命的生老病死自然也是一種科學法則,只要我們破解了生命的奧秘,那麼就有可能會實現永生。
  • 莊小威教授揭示人類染色體的三維結構
    2020年11月25日訊/生物谷BIOON/---在高中課本中,人類的染色體被描繪成X形狀,就像兩個熱狗卡在一起。但是,這些結構遠非準確。Jun-Han Su說,「在90%的情形下,染色體並不是這樣存在的。」
  • 物理所原核生物染色體DNA自組裝模式和機理研究獲進展
    在紛繁複雜的生物反應中,染色體DNA自組裝、複製和應時啟動轉錄處於細胞生命活動的中心位置。雖然人類基因組計劃已經完成,但是數以億計的DNA遺傳信息凝聚在十幾微米大小的細胞核內,目前,我們還沒有能力清晰理解這些信息是如何被細胞利用、提取、整合併最終發布成效應蛋白質來應對正常生命活動和細胞內外信號刺激。這些基本調控運轉機制正是攻克人類疾病和藥物醫療研發的必需前提。
  • 人類基因組草圖再添細節 X染色體被無死角解碼
    但是,承載人類遺傳密碼的「密卷」並未被百分之百地破譯,仍然存在大量未知的缺口。這些缺口為什麼遲遲不能補上?這次幫助科學家獲得X染色體完整序列的是什麼基因測序技術?剩餘的基因序列空白,能夠順利補上嗎?給人類基因組測序就像在拼圖如果你家裡有小朋友,或者你就是一個拼圖愛好者,挑戰更多片數、更大畫幅的拼圖一定是你追逐的目標。
  • 人類基因組草圖再添細節X染色體被無死角解碼
    但是,承載人類遺傳密碼的「密卷」並未被百分之百地破譯,仍然存在大量未知的缺口。這些缺口為什麼遲遲不能補上?這次幫助科學家獲得X染色體完整序列的是什麼基因測序技術?剩餘的基因序列空白,能夠順利補上嗎?參考基因組是一個由科學家組裝的核酸序列資料庫,作為物種的一個基因組參考模版。基因組參考聯盟(GRC)負責對參考基因組進行不定期更新。但目前參考基因組仍然不完整,其中的DNA序列存在許多缺口等待著填補。「由於人類基因組太長了,目前任何測序技術都無法一次性讀取所有的序列信息。
  • 龍井茶樹染色體級別基因組組裝成功
    近日,由我所和中國農業科學院深圳農業基因組研究所(以下簡稱基因組所)主導並攜手中國科學院昆明動物研究所(以下簡稱昆明動物所)及雲南省農業科學院茶葉研究所等單位,在茶樹全基因組組裝和茶樹起源演化研究上取得重要突破,相關研究成果以「群體測序增強對茶樹進化的認識」(「Population
  • 我國科學家「創造」世界首例單染色體真核細胞
    釀酒酵母基因1/3與人類同源  生物學教科書中,將自然界存在的生命體,分為真核生物和原核生物。所有真核生物細胞含有的染色體有多條,且都是線型結構,如人類、小鼠、釀酒酵母等都是真核生物。而原核生物細胞含有的染色體通常只有一條,且是環型結構,如大腸桿菌、破傷風菌等許多細菌。
  • 莊小威團隊發表《Cell》揭示人類染色體3D結構成像
    染色體長得不是你想的那樣! 在高中課本中,人類的染色體被描繪成X形,就像兩個熱狗卡在一起。Jun-Han Su說,「在90%的情形下,染色體並不是這樣存在的。」
  • X染色體首度完全測序,距離擁有完整人類基因組串行也許已不遠
    雖然人類的參考基因組(human reference genome)是目前最準確、最完整的脊椎動物基因組,但即使經過20年改進,完整的DNA串行始終存在缺口。現在,一組國際遺傳學團隊首次確定了人類X染色體從頭到尾(端粒到端粒)的完整串行,沒有空缺且準確性達到空前水準。
  • 我國科學家成功創建世界首例人工單染色體真核細胞
    2010年,美國科學家創建了世界上首個「人造生命」——原核生物支原體,引發世界關注。時隔八年,中國科學院研究團隊與國內多家單位合作,在國際上首次人工創建了單染色體的真核細胞,取得了合成生物學領域上具有裡程碑意義的重大突破。這一成果今天(2日)在國際權威學術期刊《自然》發表。