PNAS:測序組裝染色體技術

2020-11-25 生物谷

你有沒有試過在不知道最終圖案的情況下玩拼圖遊戲?這正是一些基因組研究人員在嘗試通過新一代DNA測序數據,拼接成染色體時所面臨的同樣問題。這些染色體能提供基因組組織和結構變異方面的信息,有助於解析進化歷史。為了能拼湊出這些染色體來,科學家們可以通過物理或者遺傳圖譜完成,但是對於許多物種而言,這種指導性的圖譜並不存在。

不過現在,一組來自美國伊利諾伊大學的研究人員開發出了一種新方法,能在沒有任何已有物理或遺傳圖譜的情況下,預測出物種染色體的相應組裝。這種方法被稱為輔助染色體組裝(reference-assisted chromosome assembly,RACA),其工作原理就是比較基因組信息和雙末端序列信息。

「我們設計的這種方法靶向基因組,或者說是基因組保守性,嘗試將其進一步融入到進化背景中去,」文章的通訊作者,伊利諾斯大學生物工程系助理教授馬健(Jian Ma,音譯)解釋道,「這樣就能分析出其構架,以及密切相關的其它基因組信息。」

通過BGI研究院科學家們的驗證分析,這一研究組預測出了藏羚羊可能的染色體片段組裝方法,為了完成這一目標,研究組成員利用BGI的SOAPdenovo組裝程序構建出了1434個序列支架,然後重建出了60個羚羊的染色體片段,其中16個片段與牛的染色體片段相似。

「在進行程序處理後,基因組質量得到了明顯的提高,」馬博士解釋道,「染色體片段大量減少,連續性延長,並且可以與其他物種進行比較分析了。而且我們之後也能糾正在這一過程中可能出現的組裝誤差。」

這一研究組面臨的主要挑戰之一還在於要找到一種能徹底評估分析結果,以及檢測其工具的方法,為此研究人員將RACA分析結果,與模擬基因組組裝,以及真實基因組組裝進行了比較,其中真實基因組組裝數據來自約翰霍普金斯大學完成的2012基因組組裝金標準評價(GAGE)。

「我們的數據基本上都來自(GAGE)研究,因為這些數據真實,反映了真正的情況,所以可以檢測分析工具,」馬博士說,「我們分析了他們研究中採用的各種組裝結果,結果我們發現,我們可以改善這些結果。」

馬博士表示,現在這項技術可以立即被用於類似Genome 10K之類的項目中,這是2009年發起的一項測定萬種脊椎動物基因組圖譜的項目,其目的在於研究生物多樣性和動物進化的機制。、

「大多數(基因組研究)都在使用NGS技術,因此我們認為這種方法可以用來系統地改善這些新物種基因組質量」,馬博士說。(生物谷Bioon.com)

Reference-assisted chromosome assembly

Jaebum Kima,b,1, Denis M. Larkinc,1, Qingle Caid, Asand, Yongfen Zhangd, Ri-Li Gee,2, Loretta Auvilf,g, Boris Capitanuf,g, Guojie Zhangd, Harris A. Lewina,h,2, and Jian Maa,i,2

One of the most difficult problems in modern genomics is the assembly of full-length chromosomes using next generation sequencing (NGS) data. To address this problem, we developed 「reference-assisted chromosome assembly」 (RACA), an algorithm to reliably order and orient sequence scaffolds generated by NGS and assemblers into longer chromosomal fragments using comparative genome information and paired-end reads. Evaluation of results using simulated and real genome assemblies indicates that our approach can substantially improve genomes generated by a wide variety of de novo assemblers if a good reference assembly of a closely related species and outgroup genomes are available. We used RACA to reconstruct 60 Tibetan antelope (Pantholops hodgsonii) chromosome fragments from 1,434 SOAPdenovo sequence scaffolds, of which 16 chromosome fragments were homologous to complete cattle chromosomes. Experimental validation by PCR showed that predictions made by RACA are highly accurate. Our results indicate that RACA will significantly facilitate the study of chromosome evolution and genome rearrangements for the large number of genomes being sequenced by NGS that do not have a genetic or physical map.

相關焦點

  • 我國率先完成草地貪夜蛾染色體基因組測序和組裝
    僅用25天,從害蟲採樣到論文發表,我國首次在全球完成對這種外來入侵者染色體級別的基因測序與組裝。  「草地貪夜蛾基因組的解讀和深層次回答,對進一步研究其亞型、耐藥性和長期防控具有重要意義。」中國科學院院士、華大基因學院院長楊煥明18日在昆明表示,入侵生物的耐毒性與遺傳機制、確定入侵中國的樣本類型、遷飛路線、基因防禦技術、雜食性遺傳機制等研究與應用,都離不開高質量參考基因組。
  • 20年磨一劍:納米技術完全測序人類X染色體
    即便如此,其中依然存在數以百計的空缺,尚無一條染色體被真正完成 [1]。 如今,科學家首次完成了一條 「從頭到尾」 真正完整的人類染色體測序。7月14日,《自然》雜誌上刊載了美國加利福尼亞大學聖克魯茲分校的 Karen Miga 教授團隊的研究成果[2]。該團隊使用最新的納米孔測序技術,首次完成了從端粒到端粒、完整無缺的人類X染色體序列。
  • 20年磨一劍:納米技術完全測序人類X染色體
    即便如此,其中依然存在數以百計的空缺,尚無一條染色體被真正完成 [1]。 如今,科學家首次完成了一條 「從頭到尾」 真正完整的人類染色體測序。7月14日,《自然》雜誌上刊載了美國加利福尼亞大學聖克魯茲分校的 Karen Miga 教授團隊的研究成果 [2]。該團隊使用最新的納米孔測序技術,首次完成了從端粒到端粒、完整無缺的人類X染色體序列。
  • 我國科學家完成草地貪夜蛾染色體級別的基因組測序和組裝
    新華社昆明6月19日電(記者白靖利)我國科學家完成草地貪夜蛾染色體級別的基因組測序和組裝,目前基因組數據已經面向全世界公開下載使用。科學家們還研究發現了多種防控草地貪夜蛾的有效「武器」。雲南農業大學、深圳華大基因、中國科學院動物研究所、中國農業科學院等研究機構通力合作,與國內各省區及美國樣本互動,共產出1.5太(TB)的基因組測序原始數據,目前已經完成了一雌一雄兩個染色體水平的基因組組裝,大小分布達到542.42兆和530.77兆。「無論是基因組完整性還是基因集的完整性都超過了目前已有版本。」
  • Molecular Ecology Resources精選 | 基於第三代測序的赤點石斑魚基因組的從頭組裝
    第二代測序通過大量短序列組裝基因組,會留下大量gap,相比而言,第三代測序的長讀長能夠最大限度地保證基因組的完整性
  • 科學家首次完成對人類X染色體的完整測序
    據外媒報導,儘管科學家已經完成了整個人類基因組的測序但仍有一些空白。現在,遺傳學家在一項具有裡程碑意義的新研究中帶來了一個重要的基因序列,即對整個人類X染色體從頭到尾進行測序並覆蓋了300多萬個此前沒有被繪製出來的鹼基對。
  • 科學家首次完成對人類X染色體的完整測序
    據外媒報導,儘管科學家已經完成了整個人類基因組的測序但仍有一些空白。現在,遺傳學家在一項具有裡程碑意義的新研究中帶來了一個重要的基因序列,即對整個人類X染色體從頭到尾進行測序並覆蓋了300多萬個此前沒有被繪製出來的鹼基對。人類基因組計劃是有史以來最雄心勃勃的科學事業之一。
  • Nature發布首個人類X染色體完成圖,長讀長測序盡顯優勢
    當地時間7月14日,由加州大學聖克魯茲分校(UCSC)和美國國家人類基因組研究所(NHGRI)研究人員領導的國際端粒到端粒聯盟(Telomere-to-Telomere Consortium,T2T)於《自然》(Nature)雜誌發表了重磅文章,利用Nanopore ultra-long、PacBio、10X Genomics等多種測序技術,成功組裝出首個端粒到端粒(Telomere-to-Telomere
  • 三代宏基因組測序探究人類腸道中染色體外的可移動基因元件
    目前宏基因組研究主要是通過二代測序來進行研究,隨著三代測序技術的發展,PacBio SMRT測序技術應用場景越來越廣泛。與二代測序方法相比,採用PacBio SMRT長讀長測序技術的三代宏基因組可以減少部分拼接錯誤,提高基因組組裝注釋的準確性和微生物群落鑑定的解析度。
  • 龍井茶樹染色體級別基因組完成組裝
    本報訊(記者李晨)近日,《自然—通訊》在線發表了我國科學家在茶樹全基因組組裝和茶樹起源演化研究上取得的重要突破。該研究由中國農業科學院茶葉研究所和中國農業科學院深圳農業基因組研究所主導,並攜手中國科學院昆明動物研究所等單位完成。該成果為茶樹基因組學和育種研究,以及茶樹遺傳和進化研究提供了豐富的素材。
  • 龍井茶樹染色體級別基因組組裝成功
    近日,由我所和中國農業科學院深圳農業基因組研究所(以下簡稱基因組所)主導並攜手中國科學院昆明動物研究所(以下簡稱昆明動物所)及雲南省農業科學院茶葉研究所等單位,在茶樹全基因組組裝和茶樹起源演化研究上取得重要突破,相關研究成果以「群體測序增強對茶樹進化的認識」(「Population
  • 科學家完成人類X染色體的完整組裝
    科學家完成人類X染色體的完整組裝 作者:小柯機器人 發布時間:2020/7/16 17:42:09 美國國立衛生研究院Adam M. Phillippy等研究人員合作完成了人類X染色體的完整組裝。
  • 基因組學新紀元:科學家首次完成人類X染色體的完整組裝序列
    該研究的主要作者、加州大學聖克魯茲基因組學研究所的研究科學家凱倫·米加(Karen Miga)說,這個項目之所以能夠完成,是因為新的測序技術使「超長讀取(ultra-long reads)」成為可能,比如加州大學聖克魯茲分校首創的納米孔測序技術。
  • 碧鳳蝶染色體水平基因組公布
    近日,中國科學院昆明動物研究所李學燕副研究員帶領的昆蟲研究團隊運用三代長讀長測序技術,結合高通量染色體構象捕獲(Hi-C)技術,成功地組裝了碧鳳蝶染色體水平的基因組,這是首個利用Hi-C技術完成的染色體水平的蝴蝶基因組。
  • 中國科學家完成草地貪夜蛾染色體水平基因組測序
    新華社昆明10月30日電(記者趙珮然、嚴勇)我國科學家近日完成了草地貪夜蛾染色體水平基因組的測序分析。相關研究成果日前在線發表於細胞生物學權威期刊《蛋白質與細胞》上。論文第一作者、雲南農業大學教授桂富榮介紹,該校研究團隊對草地貪夜蛾進行了染色體水平的基因組組裝,通過比較全球多個草地貪夜蛾種群基因重測序結果,發現中國和非洲的草地貪夜蛾種群與美國的種群之間有著顯著的遺傳分化,入侵中國的草地貪夜蛾種群極有可能來自非洲。同時,研究團隊還找到了草地貪夜蛾的耐藥基因。
  • X染色體首度完全測序,距離擁有完整人類基因組串行也許已不遠
    現在,一組國際遺傳學團隊首次確定了人類X染色體從頭到尾(端粒到端粒)的完整串行,沒有空缺且準確性達到空前水準。對一般人類來說,23對染色體中有一對稱為性染色體(決定性別),女性的性染色體中有2條X染色體(X chromosome),男性則X、Y染色體各有1條,然而這2個X染色體並不相同,它們的DNA串行存有許多差異。
  • 納米孔長讀長測序完成蜂鳥高度連續基因組組裝並提高異構體識別
    PromethION測序結合短讀長測序從頭組裝高度連續準確的紅喉蜂鳥基因組利用納米孔高通量測序儀PromethION,生成超過25 Gb的測序數據,N50大於40 Kb,結合短讀長測序,使用由Aleksey Zimin和約翰·霍普金斯大學的Salzberg實驗室開發的MaSuRCA工作流程進行基因組混合組裝, 「安娜的蜂鳥(Anna’s hummingbird)」作為參考基因組
  • 科學家第一次實現了人類X染色體的完整測序
    X染色體之所以出現這麼多的缺口,是因為以前的基因測序技術一次只能讀取DNA的一個小片段,然後再將這些片段拼湊起來。問題在於人類基因組中有許多重複的片段,當讀取到許多重複小片段的時候,很難精確還原真正的基因組,畢竟誰也說不清楚到底是基因組是如何重複的。
  • 科學家第一次實現了人類X染色體的完整測序
    之所以出現這麼多的缺口,是因為以前的基因測序技術一次只能讀取DNA的一個小片段,然後再將這些片段拼湊起來。現在,科學家們使用了新的方法,首次完成了人類染色體從一端到另一端的完整序列(「端粒到端粒」),沒有缺口,並且準確性達到空前水平。科學家通過納米孔測序技術,結合其他改進和驗證的互補技術,實現了對葡萄胎CHM13全基因組進行的高覆蓋、超長讀取。
  • 從組裝「龍井43」染色體基因組入手,我科學家揭示栽培茶樹進化史
    工人日報客戶端9月18日電 近日,由中國農科院茶葉研究所和深圳農業基因組研究所主導,攜手中國科學院昆明動物研究所及雲南省農業科學院茶葉研究所等單位,在茶樹全基因組組裝和茶樹起源演化研究上取得重要突破,組裝了「龍井43」染色體級別的基因組,並揭示了栽培茶樹的進化歷史。