中國科學家將基因組分析速度提升5倍

2020-12-04 環球網

自基因組學技術問世以來,測序與分析一直是基因組學技術中最主要的兩個環節。實際上,與繁重的測序工作相比,基因組的分析也同樣複雜,需要耗費大量時間。

然而,隨著近年來基因組學技術發展突飛猛進,這種狀況正在逐步改變。

日前,中國農業科學院深圳農業基因組研究所阮珏團隊在《自然·方法學》上發表了第三代測序數據組裝算法Wtdbg,極大提高三代測序數據的分析效率,與今年4月發表在《自然·生物技術》上的Flye算法相比,分析速度提升了5倍,並首次將測序數據分析時間降低到少於測序數據產出時間。

基因組的測序與分析

DNA測序技術成熟於上世紀70年代中後期,1990年人類基因組計劃的提出,將基因組測序技術逐步由實驗室邁入商業化階段;到2004年人類基因組計劃完成時,第二代基因組測序技術已經相對成熟,開始大規模商業化應用;2013年,單分子等第三代測序技術出現,也預示著測序技術應用更廣,測序的成本越低。

「如今,完成一個人的全基因組測序是普通家庭都可以負擔起費用的『平常』事情了。以三代測序為例,完成個人全基因組測序僅需1天時間、費用低於5萬元。」論文作者、中國農業科學院深圳農業基因組研究所研究員阮珏告訴經濟日報記者。

在測序技術日新月異的同時,分析技術也在共同成長。以人類基因組組裝為例,在2014年需要消耗50萬個CPU小時,且只能在超大計算機集群上進行。因而,以全基因組組裝方式對群體進行測序分析已經成為生物醫學研究的趨勢。

關鍵鑰匙:模糊布魯因圖

Wtdbg算法的開發得益於一個新的組裝圖理論——模糊布魯因圖的提出。模糊布魯因圖借鑑了德布魯因圖的思想,將測序數據切分為固定長度的短串,再從短串構建出的圖上恢復出全基因組序列。

上世紀90年代,德布魯因圖被引入基因組組裝領域,其以速度優勢常用於第二代測序數據的組裝分析,但因測序噪音極高,從未成功應用在第三代測序數據。

2013年起,阮珏和美國哈佛醫學院的博士李恆在德布魯因圖基礎上,設計出一個新的組裝圖理論——模糊布魯因圖。通過重新對短串進行定義,它能夠容忍高噪音數據,並隨後對生成組裝圖和恢復基因組序列做了大量相應的重構,使其兼具高效率和高容錯的優點。

不斷進化的新算法

近年來,生物信息學領域的科學家們致力於改變這種數據產出速度遠高於數據分析速度的尷尬狀況,不斷開發出更高效的組裝分析算法。

2013年,阮珏與李恆合作開始了測序數據分析方法如組裝算法的開發,力求推動測序數據的分析速度更快、分析質量更高。2016年,他們的研究結束,並將研究成果Wtdbg對所有人免費開放使用。3年來,這項成果不僅被幾十篇學術論文引用,還被國內多家基因測序分析公司作為主要組裝分析工具,並且在2019年世界大學生超算競賽中作為性能測試賽題。

「我們收到大量反饋,不僅有助修訂算法軟體中的漏洞,還帶來了新想法和思路。算法需要不斷在實踐中完善,只有通過更多實際應用,我們才能更有效調整改進這套算法。目前的算法與2016年相比已經是2.0版本,而更高版本的算法於今年初也開始了研究。」阮珏告訴記者。

相關焦點

  • 中國科學家完成世界第一個家蠶基因組「框架圖」
    據了解,由於家蠶基因組研究意義重大,目前世界上不少國家都在投入巨資實施家蠶基因組計劃。中國科學家在國際競爭十分激烈的情況下,用短短三個餘月的時間率先完成了世界第一個家蠶基因組框架圖。  向仲懷表示,這張「框架圖」也是世界上第一個高質量的鱗翅目類昆蟲全基因「工作框架圖」,標誌著中國在鱗翅目基因組研究方面已居世界領先地位,該「框架圖」的完成將為世界鱗翅目昆蟲的基礎和應用性研究提供寶貴的數據化信息。
  • 充電速度提升5倍 南孚革命性電池亮相
    與傳統鎳氫電池相比,TENAVOLTS充電鋰電池擁有1.5V全程恆壓,2775mWh超大能量,1.8h極速快充三大顛覆式優勢,用戶使用體驗指數級提升,堪稱鎳氫電池終結者,充電電池用戶的福音。充電速度提升5倍 南孚革命性電池亮相一節TENAVOLTS充電鋰5號電池僅18g,比5號鎳氫電池輕得多。
  • 中國科學家首次揭示世界上海拔分布最高的蛇類基因組
    中國科學家首次揭示世界上海拔分布最高的蛇類基因組 2018-08-黃松 攝   中新網成都8月1日電 (記者 賀劭清)記者8月1日從中國科學院成都生物研究所獲悉,北京時間2018年8月1日凌晨,國際學術期刊PNAS(《美國科學院院刊》)在線發表了中國科學家關於溫泉蛇研究的最新成果「比較基因組學研究解析變溫動物蛇類對高海拔環境的適應」。溫泉蛇。
  • 中國科學家破譯世界首例古小麥全基因組
    中國科學家破譯世界首例古小麥全基因組 2019-06-25 22:來源:中國新聞網作者:${中新記者姓名}責任編輯:李泊靜   中新網長春6月25日電 (記者 郭佳)歷經十餘載研究,中國科學家測定並分析出了世界首例古小麥全基因組序列
  • 華為雲攜手峰科發布FPGA基因加速雲解決方案,基因測序性能提升5倍
    打開APP 華為雲攜手峰科發布FPGA基因加速雲解決方案,基因測序性能提升5倍 工程師曾玲 發表於 2018-07-09 14:14:00
  • 中國科學家繪製成首個完整中國人基因組圖譜
    2007-10-12 08:45:56 | 來源:新華網 | 作者:彭勇   中國科學家
  • 中國科學家首次發現線蟲基因組存在DNA甲基化現象
    中國科學家首次發現線蟲基因組存在DNA甲基化現象   中新社深圳10月18日電(記者 鄭小紅)中國科學家的最新研究首次證實線蟲基因組中存在DNA甲基化現象,從而改寫了傳統觀念中線蟲中沒有該表觀遺傳修飾的歷史,同時也使以DNA甲基化序列做靶標進行抗寄生蟲藥物研發成為可能,為抗旋毛形線蟲病的藥物開發提供了全新思路。
  • 中國科學家領銜的科研團隊成功繪製出鐵皮石斛全基因組圖譜
    央廣網深圳1月12日消息(記者鄭柱子 通訊員謝高昌)由中國科學家領銜的科研團隊成功繪製出鐵皮石斛全基因組圖譜,在藥用開發研究方面取得階段性成果,研究成果於1月12日在國際頂級學術雜誌Nature(自然)子刊Scientific Reports(科學報告)公開發表。這是世界蘭科植物基因組學研究的一個重要成果。
  • 蘋果官方詳解 Mac 首款 SoC 晶片 M1 :CPU 速度提升最高 3.5 倍...
    作為一款 SoC 晶片,M1 將眾多強大技術集於一身,並且採用統一內存架構,為性能和能效帶來巨大的提升。IT之家獲悉,M1 也是 Apple 首款採用先進 5 納米製程打造的個人電腦晶片,封裝了驚人的 160 億個電晶體,其數量為 Apple 所有晶片之最。
  • 中國科學家在真核生物基因組設計與合成中獲重大突破
    突破合成型基因組導致細胞失活的難題,設計構建染色體成環疾病模型,開發長染色體分級組裝策略,證明人工設計合成的基因組具有可增加、可刪減的靈活性……中國科學家完成的這些合成生物學領域最新研究成果形成了4篇論文,於3月10日以封面的形式在國際頂級學術期刊《科學》上發表。
  • 中國科學家實現 量子霸權!計算速度比超級計算機快100萬億倍
    >快一百萬億倍(「九章」一分鐘完成的任務,超級計算機需要一億年)等效地其速度比去年穀歌發布的53個超導比特量子計算原型機「懸鈴木」攝影:馬瀟漢,梁競,鄧宇皓根據目前最優的經典算法,「九章」對於處理高斯玻色取樣的速度比目前世界排名第一的超級計算機「富嶽」快一百萬億倍,等效地比谷歌去年發布的53比特量子計算原型機「懸鈴木
  • 育種效率將大幅提高!農科院(深圳)基因組所構建高雜合二倍體馬鈴薯基因組圖譜
    在此基礎上,揭示了雜合馬鈴薯基因組內部等位基因的序列差異和表達調控差異,為研究二倍體馬鈴薯自交衰退分子機制和培育二倍體自交系提供了數據基礎,也為其它雜合基因組的組裝和分析提供了借鑑。「優薯計劃」的實施為了加快馬鈴薯產業的發展,基因組所黃三文團隊發起了「優薯計劃」,旨在用二倍體雜交種代替同源四倍體,提高育種效率,縮短育種年限;並用種子替代種薯。二倍體馬鈴薯基因組高度雜合,解析難度大,嚴重製約了馬鈴薯基因組設計育種的研究進程。
  • 育種效率將大幅提高!農科院(深圳)基因組所構建高雜合二倍體馬鈴薯...
    在此基礎上,揭示了雜合馬鈴薯基因組內部等位基因的序列差異和表達調控差異,為研究二倍體馬鈴薯自交衰退分子機制和培育二倍體自交系提供了數據基礎,也為其它雜合基因組的組裝和分析提供了借鑑。雜合馬鈴薯RH據介紹,馬鈴薯作為世界第三大主糧作物,推動馬鈴薯產業發展對保障國家糧食安全有著極其重要的意義。
  • 英特爾、聯想攜手華大基因加速新型冠狀病毒基因組分析
    3月3日,英特爾、聯想以及華大基因宣布,三家公司正攜手加快COVID-19新型冠狀病毒的基因組特性分析。來自英特爾及聯想的專業技術與生命科學專家將通力合作,為華大基因的研究人員提供全新的大數據分析技術和計算資源,進一步提升其基因測序工具的分析能力,更高效地研究新型冠狀病毒的基因組特性。
  • NVIDIA手把手演示如何安裝使用基因組分析軟體Parabricks
    Parabricks基於著名的Genome Analysis Toolkit,可通過GPU將序列數據分析速度提高50倍。本次視頻,NVIDIA將一步一步演示如何安裝並使用Parabricks (中文字幕)目前,研究人員正在對新型冠狀病毒和COVID-19感染者的基因組進行測序,以了解疾病的傳播方式並確定易感染人群。但分析基因組序列需要耗費大量的時間和計算力。
  • 華大組裝完成人類二倍體基因組序列
    華大組裝完成人類二倍體基因組序列  5月26日,華大基因研究人員首次基於新一代測序技術,開發策略和方法組裝出迄今最完整的單倍體水平的二倍體基因組序列,為從頭組裝雜合度高的基因組奠定了基礎。該最新研究成果發表於《自然生物技術》。  人類基因組是二倍體,完整了解每個染色單體的變異對基因組信息的解讀具有重要意義。
  • 「優薯計劃」的最新成果:破譯雜合二倍體馬鈴薯基因組
    實現「優薯計劃」,可以將馬鈴薯的育種周期由原來的10~15年縮短至3~5年,繁殖係數提高1000倍,引領馬鈴薯產業的「綠色革命」。該項目被列為中國農業科學院科技創新工程「重大科研選題」之一。該研究首次完成了雜合二倍體馬鈴薯的單體型組裝,獲得了兩套染色體的基因組序列,並在此基礎上揭示了雜合基因組內豐富的序列變異、等位基因表達差異、甲基化修飾差異以及有害突變的分布模式,從而為培育優良自交系提供了新的知識基礎。
  • 速度將高達6000公裡/小時,速度是聲音的5倍
    起飛重量約為45噸,速度將高達6000公裡/小時,速度是聲音的5倍。而要達到這一速度,就必須要使用混合式渦輪衝壓發動機。除了基本功能外,這架飛機還可以充當偵察機的角色,還可以在高達35公裡的高度飛行近50個小時。作戰行動半徑達三千公裡。當然,飛機的機身是由複合材料製成的,主要原因是以減輕重量並提高隱身性能。
  • 迄今最完整的人類單倍體水平的二倍體基因組序列
  • 最大規模中國人基因組測序和分析完成
    這是由中國科學家主導,歷時兩年,對14餘萬中國人無創產前基因檢測數據進行深入研究的成果。據悉,這次研究不僅確認了與身高和身體質量指數(BMI)等表型有關的新的遺傳位點,還發現了中國人基因組中獨特的病毒DNA分布。