哈佛醫學院Church等團隊開發新的方法,可快速組裝染色體

2020-12-25 中國生物技術網

單倍型解析或分階段的基因組組裝可提供基因組及其複雜遺傳變異的完整圖片。但是,當前用於分階段裝配的算法要麼不生成染色體尺度的定相,要麼需要譜系信息,這限制了它們的應用。

近日,哈佛醫學院Heng Li,George M. Church等人在Nature Biotechnology 在線發表題為「Chromosome-scale, haplotype-resolved assembly of human genomes」的研究論文,該研究提出了一種稱為二倍體組裝(DipAsm)的方法,該方法使用長而準確的讀數和長距離構象數據,以在1天之內生成染色體規模的分相組裝。DipAsm應用於四個公共人類基因組,PGP1,HG002,NA12878和HG00733,DipAsm產生了單倍型解析的程序集,具有最小重疊群長度,可覆蓋50%的已知基因組(NG50)直至25 Mb,並在大約90.5%的雜合位點分階段98-99%的準確性,在連續性和定相完整性方面均優於其他方法。

該研究證明了染色體規模的分階段裝配對於發現結構變異(SV)的重要性,包括數千個新的轉座子插入,以及高度多態性和醫學上重要的區域,例如人白細胞抗原(HLA)和殺傷細胞免疫球蛋白樣受體(KIR)區域。DipAsm將促進高質量的精準醫學以及個體單倍型變異和種群多樣性的研究。

另外,2020年11月30日,哈佛醫學院George M. Church及德國德勒斯登工業大學Volker Busskamp共同通訊在Nature Biotechnology 在線發表題為「A comprehensive library of human transcription factors for cell fate engineering」的研究論文,該研究提出了人TFome,這是一個全面的庫,其中包含1,564個TF基因和1,732 TF剪接亞型人TFome的大規模組合篩選將補充基於發育生物學和計算系統生物學的細胞工程其他策略(點擊閱讀)。

人類包含每個染色體的兩個同源拷貝,並且推導每個拷貝的基因組序列對於正確理解等位基因特異性DNA甲基化和基因表達以及分析進化,法醫和遺傳疾病至關重要。然而,重建基因組序列的傳統從頭組裝算法通常將樣品表示為單倍體基因組。對於二倍體基因組,例如人類基因組,這種摺疊的表示法導致基因組中一半雜合變異的喪失,可能在單倍型之間分開的區域引入裝配錯誤。

已經提出了幾種算法來生成單倍型解析的程序集,也稱為分階段程序集。FALCON-Unzip,Supernova等使用相對短距離的序列數據進行定相,並且只能解析高達9兆鹼基的單倍型人類樣品。這些方法無法逐步完成著絲粒或長重複。擴展FALCON-Unzip的FALCON-Phase使用Hi-C連接相控序列模塊,可以生成更長的單倍型,但無法實現染色體長的定相。

Trio binning是唯一可以做到這一點的方法,加上整個染色體的組裝和定相。它使用父母雙方的序列讀段對後代的長讀段進行分區,然後分別組裝每個分區。但是,Trio binning無法解析雜合區域,並將使這些區域保持非定相狀態。更重要的是,並非總是有父母提供的樣本,例如,對於在野外捕獲或父母去世的樣本。這限制了Trio binning的應用。因此,目前缺乏能夠為單個人準確地產生階段性裝配並與序列技術創新保持同步的方法。

該研究提出了一種稱為二倍體組裝(DipAsm)的方法,該方法使用長而準確的讀數和長距離構象數據,以在1天之內生成染色體規模的分相組裝。DipAsm應用於四個公共人類基因組,PGP1,HG002,NA12878和HG00733,DipAsm產生了單倍型解析的程序集,具有最小重疊群長度,可覆蓋50%的已知基因組(NG50)直至25 Mb,並在大約90.5%的雜合位點分階段98-99%的準確性,在連續性和定相完整性方面均優於其他方法。

該研究證明了染色體規模的分階段裝配對於發現結構變異(SV)的重要性,包括數千個新的轉座子插入,以及高度多態性和醫學上重要的區域,例如人白細胞抗原(HLA)和殺傷細胞免疫球蛋白樣受體(KIR)區域。 DipAsm將促進高質量的精準醫學以及個體單倍型變異和種群多樣性的研究。

參考消息:

https://www.nature.com/articles/s41587-020-0711-0

來源:iNature

相關焦點

  • 染色體原來長這樣!哈佛莊小威團隊發表染色質結構3D成像
    在高中生物學教材上,我們第一次認識了染色體的樣子——一個瘦高的X型。在大學的生物課上,它還是那個樣子。如今,它已經深深地印在了我們的腦海裡。北京時間11月18日,發表在《Cell》上的一項新研究中,來自哈佛大學霍華德休斯醫學院莊小威教授領導的研究團隊將之前標誌性的「X」變成了更複雜且更精確的3D結構成像,可以幫助科學家們解開染色體結構如何影響功能的謎團。
  • 科學家實現染色體尺度下、單體型解析度的人類基因組裝配
    科學家實現染色體尺度下、單體型解析度的人類基因組裝配 作者:小柯機器人 發布時間:2020/12/9 13:24:14 美國哈佛醫學院Heng Li等研究人員合作實現染色體尺度下、單體型解析度的人類基因組裝配。
  • 莊小威團隊發表《Cell》揭示人類染色體3D結構成像
    如今,在一項新的研究中,來自哈佛大學霍華德休斯醫學院莊小威教授領導的研究團隊將之前標誌性的「X」變成了更複雜且更精確的3D結構成像,這將有助於科學家們解開染色體結構如何影響基因組功能的謎團。 利用這種新的高解析度三維成像方法,莊小威團隊開始從46條染色體的廣角鏡圖像和每條染色體的一個部分特寫鏡頭構建染色體圖譜。
  • George Church開發CRISPR轉錄抑制新方法,極大增強抑制效率
    2018年7月17日,哈佛醫學院基因編輯大牛George Church研究組在Nature Methods在線發表題為:An enhanced CRISPR repressor for targeted mammalian gene regulation的研究論文。
  • 新發現挑戰染色體組裝經典模型
    圖片來自CC BY-SA 3.0/Wikipedia2017年8月1日/生物谷BIOON/---幾十年來,科學家們普遍認為染色體組裝是一個多層級高度有序的過程,即雙鏈DNA纏繞著組蛋白八聚體(H2A, H2B, H3和H4)組成核小體,DNA如細絲般將大量核小體串起,形成了11nm的「念珠狀」結構,它們按照螺線管或者Z字形排列堆砌成為
  • 科學家開發出超分子組裝新方法
    英國和日本研究人員合作開發出一種超分子組裝的新方法,有望帶來比矽材料性能更優越的分子電子設備,比如用巴基球製造的柔軟電視屏幕,為人們帶來全新的視聽體驗。研究人員認為,這種方法有著巨大應用潛力,有可能推動新材料生產的變革。相關論文發表在6月22日的《自然·化學》雜誌上。
  • 科學家研發出可高效組裝人基因組的方法
    科學家研發出可高效組裝人基因組的方法 作者:小柯機器人 發布時間:2020/5/6 14:22:10 美國加州大學聖克魯斯分校Benedict Paten及其課題組,利用納米孔測序和Shasta工具包完成了對11個人類基因組的高效從頭組裝
  • 龍井茶樹染色體級別基因組組裝成功
    近日,由我所和中國農業科學院深圳農業基因組研究所(以下簡稱基因組所)主導並攜手中國科學院昆明動物研究所(以下簡稱昆明動物所)及雲南省農業科學院茶葉研究所等單位,在茶樹全基因組組裝和茶樹起源演化研究上取得重要突破,相關研究成果以「群體測序增強對茶樹進化的認識」(「Population
  • 速度提高100萬倍,哈佛醫學院提出可預測蛋白質結構的新深度模型
    近日,來自哈佛大學醫學院的研究人員提出了一種基於胺基酸序列預測蛋白質結構的新方法,準確率可媲美當前最佳方案,但預測速度提升了100萬倍。生命所必需的每一次基礎生物學進展幾乎都是由蛋白質帶來的。蛋白質參與創建細胞和組織並保持著它們的形狀;構成維持生命所需化學反應的催化酶;充當分子工廠、轉運工具和馬達;充當細胞通訊的信號和接收器等等。
  • 龍井茶樹染色體級別基因組組裝成功—新聞—科學網
    龍井43             中國農科院供圖 近日,《自然—通訊》在線發表了我國科學家在茶樹全基因組組裝和茶樹起源演化研究上取得的重要突破。 通訊作者楊亞軍介紹,他們首先以我國著名的優良茶樹品種龍井43為材料,利用他們自主開發的三代組裝軟體結合高通量染色體構象捕獲(Hi-C)等技術,克服了其基因組高度雜合、重複序列比例高等複雜基因組組裝難題,完成了龍井43染色體級別的基因組組裝。
  • 哈佛醫學院 AI 新成果:0.1 秒內確定結核病菌的耐藥性
    雷鋒網(公眾號:雷鋒網)了解到,哈佛醫學院Blavatnik研究所的研究人員設計了一種算法,能夠檢測出治療前對常用結核病藥物的耐藥性。在實驗中,他們成功地在0.1秒之內準確預測了結核菌株對10種一線和二線藥物的耐藥性,而且比類似模型的預測精度更高。
  • 安斯泰來進軍基因治療領域,聯手哈佛醫學院開發視網膜色素變性(RP...
    2014年10月18日訊 /生物谷BIOON/ --日本藥企安斯泰來(Astellas)日前宣布,與全美國最優秀的醫學院——哈佛大學醫學院(HMS)達成研究合作,雙方已籤訂一項為期3年的合作協議,探索視網膜色素變性(retinitis
  • 中國獲得國際首個組裝到染色體水平的家驢基因組參考圖譜
    12月9日,《自然》子刊《自然·通訊》發表了中國科研團隊的一篇遺傳學研究論文。中國科學家聯合國內外多家單位,成功破譯了德州驢基因組,獲得國際首個組裝到染色體水平的家驢基因組參考圖譜。作為中國五大優良驢種之一,德州驢個體大、皮厚、出膠率高,是熬製阿膠的上等原料。
  • 莊小威教授揭示人類染色體的三維結構
    去年,在Su博士畢業之前,他和美國哈佛大學文理學院研究生院的三名在讀博士生---PuZheng、SeonKinrot和BogdanBintu---一起拍攝了人類染色體的高解析度三維圖像。如今,在一項新的研究中,哈佛大學的莊小威(XiaoweiZhuang)教授和她的研究團隊報告了一種新的方法:對染色質的結構和功能一起成像,然後將一些可以連接的位點(「基因組位點」)連接起來,這樣就可確定染色質的結構和功能中的一種如何影響另一種,以維持正常的功能或者導致疾病。
  • 抑制「多餘」染色體可治唐氏症候群
    染色體數目異常是唐氏症候群等很多遺傳疾病的主要原因。
  • 哈佛醫學院新實驗所用NMN原料為艾沐茵提供
    自從其抗衰老功效在 2013 年被哈佛醫學院的大衛·辛克萊教授團隊發現以來,短短幾年間,這種物質就迅速成為網紅產品。尤其是在被基因港公司實現工業化大規模生產推出平價版之後,就迅速佔領眾多消費者的眼球。最近幾年我國市場當中出現很多宣稱可以獨立生產NMN的商家,很多都在聲稱哈佛進行的NMN實驗原料由自己提供,那麼他們所用的原料究竟來自哪裡?
  • X 染色體首度完全測序,距離擁有完整人類基因組序列也許已不遠
    現在,一組國際遺傳學團隊首次確定了人類 X 染色體從頭到尾(端粒到端粒)的完整序列,沒有空缺且準確性達到空前水平。對一般人類來說,23 對染色體中有一對稱為性染色體(決定性別),女性的性染色體中有 2 條 X 染色體(X chromosome),男性則 X、Y 染色體各有 1 條,然而這 2 個 X 染色體並不相同,它們的 DNA 序列存有許多差異。
  • 哈佛大學研發溫度壓力雙控導電織物可用於醫療康復
    來自哈佛大學Wyss生物啟發工程研究所,約翰·保爾森工程與應用科學學院(SEAS)和化學與化學生物學系的高度跨學科研究人員團隊開發了可誘導產生熱能的智能熱紡織品(STATs)。通過電氣控制機器人紡織品中的液體-蒸汽相變來改變壓力,從而消除了對氣動繫繩的需求,並開闢了新的紡織品機器人應用領域。
  • X染色體首度完全測序,距離擁有完整人類基因組串行也許已不遠
    現在,一組國際遺傳學團隊首次確定了人類X染色體從頭到尾(端粒到端粒)的完整串行,沒有空缺且準確性達到空前水準。對一般人類來說,23對染色體中有一對稱為性染色體(決定性別),女性的性染色體中有2條X染色體(X chromosome),男性則X、Y染色體各有1條,然而這2個X染色體並不相同,它們的DNA串行存有許多差異。
  • 可抵抗顯性遺傳阿爾茨海默症的突變基因被發現
    可抵抗顯性遺傳阿爾茨海默症的突變基因被發現 作者:小柯機器人 發布時間:2019/11/5 14:45:53 近日,美國哈佛醫學院Yakeel T. Quiroz、Joseph F.