基因組學研究的未來之星——泛基因組

2020-10-15 安諾基因

高通量測序技術的迅猛發展,極大地推動了全基因組測序進程及物種的群體進化、遺傳多樣性、性狀定位等研究。但單一或者少數參考基因組中可能會缺少部分基因,不能完全覆蓋物種的全部遺傳信息,限制了基因組學研究的深入開展。泛基因組的提出,有效解決了該問題,成為了基因組學研究的新方向。

01 什麼是泛基因組?

泛基因組(Pan-genome)指的是同一物種的全部基因,包括在所有個體中都存在的核心基因組(Core genome)和個體特有的可變基因組(Dispensable genome)。核心基因組中的基因一般與物種穩定的生物學功能和表型特徵相關,多是一些House-keeping基因;可變基因組則由僅在單個樣本或部分樣本中存在的序列組成,與物種對特定環境的適應性或特有的生物學特徵相關。通過對不同材料進行基因組測序、組裝,對組裝的不同基因組進行比對、整合,得到的共有序列即為核心基因組,其餘為可變基因組(圖1A-F)。

圖1 泛基因組圖譜示意圖

02 泛基因組能做些什麼?

泛基因組圖譜的構建,不僅能得到該物種較為完整的遺傳信息,還可以通過將測序個體與參考基因組比對,獲得每個個體或群體的變異情況:從簡單的單核苷酸多態性(SNP)、插入缺失突變(InDel),到大片段的結構變異(SV)、拷貝數變異(CNV),以及存在/不存在(PAV)的變化。除此之外,還可以通過對核心/可變基因組中基因的功能、特性進行比較分析,對物種的共有、特有表型產生機制進行深入探究。

圖2 泛基因組分析流程

03 如何構建泛基因組?

目前比較主流的構建泛基因組圖譜的方法有以下三種:

1) 迭代組裝

將多個樣本的下機數據與參考基因組比對,未比對上的reads組裝成新的contigs,將這些contigs添加到原始的參考序列中,構建、獲得物種的泛基因組圖譜(圖3a),小麥泛基因組就是採用這種方法進行構建的[1]。該方法能夠快速得到泛基因組信息,適合大規模的群體研究,但在物種基因組較大,或者測序深度較低的情況下,該方式組裝的contigs連續性較差,準確性較低。

2) 基於基因組de novo

分別對多個個體進行從頭組裝、注釋,從全基因組層面識別SV/SNP/InDel/CNV及PAV,是目前泛基因組研究運用最廣的方法(圖3b),近期發表的油菜泛基因組就是基於該方法[2]。這種方法不依賴於參考基因組,可以避免因參考基因組質量問題引起的比對誤差,但需要比較高的測序深度(>50X),以確保從頭組裝的準確性。

3) 圖形泛基因組

圖形泛基因組是在基因組de novo的基礎上,基於圖論的組裝方法,利用有向圖將物種基因組分為核心基因組與可變基因組(圖3c),近期發表的大豆泛基因組即基於該方法[3]。與迭代組裝和基因組de novo相比,圖形泛基因組整合了多個基因組的變異信息,代表了該物種更全面的遺傳信息,基於此可進行更準確的變異信息挖掘。圖形泛基因組的技術和算法尚未成熟,目前應用還較少,是泛基因組的未來發展趨勢。

圖3 泛基因組圖譜構建方法[4]

04 HiFi reads在泛基因組學研究中有哪些優勢?

PacBio HiFi reads兼具了長讀長、高準確度的特點,用於基因組組裝時無需進行三代數據自糾錯及二代數據校正,有效節約了分析時間及計算資源,低深度(10-15X)HiFi reads組裝後即可進行泛基因組研究。相比高深度的二代數據,HiFi reads組裝效果更好,得到的泛基因組信息更加準確,可以進行全變異(SNP、InDel、SV、CNV、PAV)檢測,避免了二代數據讀長短和三代納米孔測序準確性低的弊端。

總 結

泛基因組圖譜的構建使我們能夠獲得更全面的物種基因組信息,高準確度的HiFi reads有效保障了泛基因組圖譜的準確性,進而獲得更精準的個體或群體遺傳變異信息,從基因組層面深入解析重要經濟價值/農藝性狀/表型等的產生機制。隨著泛基因組圖譜構建方式和分析策略的逐步完善,利用泛基因組解決功能基因組學的研究難題逐漸成為了一個新熱點。

參考文獻

[1] Montenegro JD, Golicz AA, Bayer PE, et al. The pangenome of hexaploid bread wheat[J]. Plant Journal, 2017, 90(5):1007.

[2] Song JM , Guan Z, Hu J, et al. Eight high-quality genomes reveal pan-genome architecture and ecotype differentiation of Brassica napus[J].Nature Plants, 2020, 6(1):1-12.

[3] Liu Y, Du H, Li P, et al. Pan-genome of wild and cultivated soybeans[J].Cell, 2020, 182(1).

[4] Bayer PE, Golicz AA, Scheben A, et al. Plant pan-genomes are the new reference[J]. Nature Plants, 2020, 6(8):1-7.

相關焦點

  • 人類基因組時代的泛基因組學
    薩爾茲伯格是一位橫跨計算機領域和生物學領域的專家,名氣很大,他是約翰霍普金斯大學計算生物學中心的主任,同時在計算機系和醫學院任職,專門從事基因測序和基因組學應用研究,人類基因組計劃的參與者之一,最近還主持了非洲裔美國人的基因組學項目等。開發過很多有名的生物信息算法,大家使用過的生信軟體如:bowtie、TopHat、cufflinks等都出自於他的實驗室,今天要談的泛基因組學也是他的研究內容之一。
  • 泛基因組資料庫:找到油菜的「好基因」
    「這些資料庫是基於單一品種基因組和注釋,並且缺乏多組學數據和群體變異信息。」 華中農業大學生物信息團隊教授陳玲玲說。據介紹,整合多種個體的泛基因組可以更加全面的檢測物種內部的遺傳變異,獲得各個樣本的共有和特有的基因集,結合不同樣本的表型差異可以為進一步挖掘重要的農藝性狀基因提供基礎。
  • 泛基因組資料庫:找到油菜的「好基因」—新聞—科學網
    今年初,華中農業大學一支科研隊伍公布了8個甘藍型油菜的高質量參考基因組。近日,他們在原有研究基礎上,通過整合1689份油菜的基因組及重測序數據,構建了首個油菜泛基因組和比較基因組生物信息平臺BnPIR。 有了這一平臺,研究人員可以更快捷、更方便地檢索和使用油菜泛基因組相關資源。為何建設油菜泛基因組平臺?這是一個什麼樣的資料庫?油菜相關的多組學數據研究進展情況如何?
  • 一作解讀|Mol Plant中國農大小麥研究中心提出泛基因組時代同源基因推斷新策略並構建小麥族同源基因資料庫
    基於小麥族物種基因組間和亞基因組間的共線性分析,該研究提出了六倍體普通小麥的「4A-5A-7B染色體重排」是兩次染色體易位事件的結果,並明確了重排的基因組區間的精細邊界;同時研究了春化基因Vrn2的複雜進化歷史,提出Vrn2同源基因在普通小麥基因組中的複雜分布是包含串聯重複、多倍化、染色體易位和基因丟失在內的一系列事件疊加的結果。
  • 華中農業大學構建油菜泛基因組資料庫助力油菜遺傳育種研究進入泛...
    研究團隊負責人介紹,參考基因組作為生命科學研究中的「標準地圖」,促進了動植物重要生產和經濟性狀相關的變異位點鑑定、關鍵基因的發掘與應用等研究。然而生物體在長期進化和人工選擇的作用下,同一物種各個株系在遺傳和表型等層面均積累了豐富的變異,單一參考基因組往往無法很好包含物種內豐富的遺傳變異信息。
  • 10分鐘帶你了解泛基因組做些什麼
    近年來,越來越多的研究表明,單一或者少數參考基因組不能涵蓋整個種群全部的遺傳信息,所以,構建物種的泛基因組成了當前基因組學研究的熱點和前沿。本篇文章,小編和大家一起來了解一下泛基因組的構建方式、泛基因組的熱點研究內容。
  • 小麥多組學網站上線「藏1817」基因組資源
    小麥多組學網站上線「藏1817」基因組資源 昨天,中國農業大學農學院小麥研究中心孫其信教授、倪中福教授和彭惠茹教授為論文通訊作者,郭偉龍副教授、辛明明教授和博士生3 基因組以及基因 blast小麥多組學網站(http://202.194.139.32/blast/viroblast.php)
  • 英國基因組學公司選擇WekaIO來加速基因組學研究
    加速500萬個基因組計劃的基因組研究。英國基因組學公司選擇WekaFS來滿足未來五年所需的預期容量擴展,同時為其DNA管道提供最高性能。英國基因組學歸英國衛生與社會保健部所有,負責執行500萬個基因組計劃。該項目的目的是對來自國家衛生局(NHS)的罕見病患者,其家庭以及常見癌症患者的500萬個基因組進行測序。
  • 作物基因組學研究進展
    隨著測序技術的發展,已經實現對重要農作物,如水稻、小麥、玉米、大豆、油菜、棉花、蔬菜等作物基因組的測序或重測序,在此基礎上完成對控制重要農藝性狀基因的克隆和鑑定。本文綜述了2017年度主要農作物基因組研究方面取得的一系列重要進展。1、基因組學領域論文分析在SCIE資料庫共獲得954篇基因組學研究相關的文獻。
  • 科研人員繪出大豆圖形結構泛基因組
    中科院遺傳發育所供圖 6月17日,《細胞》雜誌在線發表了中國科學院遺傳與發育生物學研究所研究員田誌喜等科研團隊關於大豆泛基因組的最新研究進展。該項成果突破了傳統線性基因組的存儲形式,在植物中首次實現了基於圖形結構基因組的構建,將引領全新的下一代基因組學研究思路和方法,被審稿人稱為「基因組學的裡程碑工作」。
  • 上海交大醫工交叉研究取得可喜成果 ——成功構建中國漢族人泛基因組分析流程
    該項研究成果於2019年7月31號在國際基因組學研究權威刊物Genome Biology在線發表(影響因子14.028)。該研究工作是由上海交大生命科學技術學院韋朝春教授課題組和醫學院附屬瑞金醫院於穎彥教授課題組聯合完成。韋朝春教授與於穎彥教授為該文章共同通訊作者,博士生段忠取為該文章第一作者。
  • 國家人類基因組北方研究中心授權中科軍美運營【1%人口基因組學國家計劃】
    日前,【1%人口基因組學國家計劃】惠民工程在京啟動,該計劃由國家人類基因組北方研究中心和中科軍美生物科技有限公司共同發起,項目選聘了國內知名人類基因研究的專家學者
  • 中國農業科學院作科所參與的大麥泛基因組構建研究成果在Nature發表
    中國農業科學院作物科學研究所小麥大麥優異種質資源發掘與創新利用創新團隊通過參與大麥泛基因組構建國際協作研究,在破譯大麥泛基因組方面取得了裡程碑意義的研究進展,將為未來開展大麥青稞種質資源鑑定、遺傳研究、種質創新及新品種選育提供有力支撐,相關研究成果北京時間11月26日在《自然(Nature)》雜誌在線發表。
  • 中國科學家繪成大豆圖形結構泛基因組圖譜
    基因組學研究迎來新突破!來自中國遺傳與發育生物學研究所等單位的研究人員,在大豆基因組研究方面取得重大進展。這項研究在植物中首次實現了基於圖形結構的基因組構建,突破了傳統線性基因組的存儲形式,將引領下一代基因組學研究思路和方法,被審稿人稱為「基因組學的裡程碑工作」。相關研究成果6月17日在線發表於國際權威學術期刊《細胞》雜誌上。 基因組學是生命科學研究的核心和基礎。傳統的基因組學研究將不同鹼基以線性的形式存儲於染色體上,並且多基於一個參考基因組來獲取一個物種的基因信息。
  • 十二位分子遺傳學家萬字長文,燭照遺傳學和基因組學的未來
    她領導團隊剖析基因組調控的基本原則以及基因如何在胚胎發育期間決定細胞命運,包括增強子如何在3D核內發揮組織協調功能。她的研究結合了遺傳學、單細胞測序基因組學、細胞成像和生物信息學,可應用於複雜的多細胞生物學研究。
  • 2018年基因組學研究盤點
    2018年12月21日/生物谷BIOON/---2018年即將過去,本期為大家帶來的是2018年度基因組學領域研究的相關盤點,希望讀者朋友們能夠喜歡。目前研究表觀基因組學的研究人員不得從成千上萬個細胞中提取DNA和相關的表觀遺傳學物質來得到一份樣本,隨後他們會對樣本進行生化分析來確定表觀遺傳學物質是否存在。本文中,研究人員學習了更多內容,比如他們通過研究鑑別出了健康細胞和疾病細胞表觀基因組學的差異。
  • 古老孑遺植物獨葉草基因組學研究獲進展
    獨葉草隸屬於毛茛目星葉草科,為星葉草科僅存的兩個物種之一。獨葉草對生境非常挑剔,分布範圍異常狹窄,僅在我國狹域分布,且分布範圍日漸縮小,為國家一級瀕危珍稀植物。中國科學院武漢植物園系統與進化學科組長期聚焦川東-鄂西物種多樣性研究。為探討獨葉草的瀕危機制,聯合植物生物信息學學科組,對獨葉草的全基因組進行測定以及組裝,獲得大小為1,004.7-Mb的基因組草圖,並進行相關分析。
  • 參與人類基因組計劃開啟基因組研究時代
    在基因組測序研究方面,令人印象最深刻的當屬我國參與了1990年正式啟動的"人類基因組計劃"。 楊煥明、汪建、於軍、劉斯奇等於1997年等組建了我國人類基因組中心,並於1999年6月26日正式提出加入"人類基因組計劃",承擔了整個"人類基因組計劃"的1%,對人類3號染色體上約3000萬個鹼基對測序。2000年6月26日,美、英、德、日、法、中六國聯合宣布,人類基因組工作框架圖已經繪製完成。2001年8月26日,國際"人類基因組計劃"中國部分"完成圖"提前兩年高質量地繪製完成。
  • 小麥基因定位與基因組研究平臺構建
    近日,中國農業科學院作物科學研究所(以下簡稱作科所)小麥基因資源發掘與利用創新團隊牽頭構建了小麥基因定位與基因組研究平臺-WheatGmap(https://www.wheatgmap.org),為高效克隆小麥功能基因提供了一個有效的數據利用、分析和共享平臺。近日,相關研究成果在線發表於《分子植物》。
  • 我國科學家構建小麥基因定位與基因組研究平臺
    新京報訊(記者 周懷宗)隨著科技的發展,分子生物學、基因組學等在育種中使用的越來越廣泛。近日,一個小麥基因定位與基因組研究平臺—WheatGmap構建成功,該平臺由中國農科院作科所小麥基因資源發掘與利用創新團隊牽頭構建。據介紹,這一成果為高效克隆小麥功能基因提供了一個有效的數據利用、分析和共享平臺。相關研究成果在線發表於《分子植物(Molecular Plant)》。