泛基因組資料庫:找到油菜的「好基因」

2020-10-28 光明科普

BnPIR平臺 華中農大供圖

油菜是世界第二大油料作物,也是我國最重要的油料作物之一。今年初,華中農業大學一支科研隊伍公布了8個甘藍型油菜的高質量參考基因組。近日,他們在原有研究基礎上,通過整合1689份油菜的基因組及重測序數據,構建了首個油菜泛基因組和比較基因組生物信息平臺BnPIR。

有了這一平臺,研究人員可以更快捷、更方便地檢索和使用油菜泛基因組相關資源。為何建設油菜泛基因組平臺?這是一個什麼樣的資料庫?油菜相關的多組學數據研究進展情況如何?《中國科學報》對此進行了採訪。

「標準地圖」有盲區

甘藍型油菜大約在7500年前由白菜和甘藍自然雜交形成,是非常「年輕」的多倍體植物。

「多倍體物種,尤其是年輕的多倍體植物中,往往存在大量的非同源染色體重組事件,這些重組事件導致甘藍型油菜內部的遺傳變異非常豐富。」華中農業大學生物信息團隊副教授楊慶勇說。

而在過去的幾十年裡,為了提高油菜的產量、品質及適應性等目標性狀,國內外油菜遺傳育種科學家持續地將白菜、芥菜等種質資源中控制重要性狀(如抗性等)的遺傳位點,通過雜交或者遠緣雜交等手段導入到甘藍型油菜中,進一步豐富了其物種的遺傳多樣性。

「現有的研究數據表明,甘藍型油菜基因組中7成以上基因都存在大的遺傳變異,也就是通常所說的結構變異。換句話說,對於油菜這樣的年輕多倍體物種,單一參考基因組往往無法很好地包含物種內豐富的遺傳變異信息。」楊慶勇進一步解釋道。

如何系統挖掘和揭示甘藍型油菜的遺傳變異?

楊慶勇介紹,傳統的遺傳變異檢測手段主要通過基因組重測序,然後將重測序的讀段比對到參考基因組,可以稱之為「按圖索異」。這裡的圖是指參考基因組(參考基因組作為生命科學研究中的「標準地圖」),而我們目前使用的「標準地圖」(單一參考基因組)仍然存在大量的「暗區和盲區」。

單一參考基因組為重要性狀相關遺傳位點和基因的挖掘與利用設置了重重障礙。為了克服這些困難,科學家提出了通過整合多個代表性種質資源的基因組信息,構建泛基因組的研究思路和策略。

首個油菜泛基因組

甘藍型油菜是研究植物多倍化和進化的模式物種。遺憾的是,甘藍型油菜一直缺乏專門的基因組資料庫,研究人員不得不藉助蕓薹屬資料庫(BRAD)和其他公共資料庫(Genoscope和Ensembl等)來獲取甘藍型油菜的基因組數據。

「這些資料庫是基於單一品種基因組和注釋,並且缺乏多組學數據和群體變異信息。」 華中農業大學生物信息團隊教授陳玲玲說。

據介紹,整合多種個體的泛基因組可以更加全面的檢測物種內部的遺傳變異,獲得各個樣本的共有和特有的基因集,結合不同樣本的表型差異可以為進一步挖掘重要的農藝性狀基因提供基礎。

2020年1月,華中農業大學油菜團隊與生物信息團隊合作,在《自然—植物》上發布了8個甘藍型油菜種質基因組序列,並通過比較基因組分析鑑定了大量SNPs(單鹼基多態性)、PAVs(存在/缺失變異)等變異,構建了大小約為1.8Gb泛基因組,包含約15萬個基因。通過基於PAVs的全基因組關聯分析直接鑑定到了與角果長度、種子重量和開花時間相關的結構變異。研究發現,多個FLC基因上的PAVs與開花時間和生態型分化緊密相關。

華中農業大學油菜團隊教授劉克德介紹,該研究為進一步解析甘藍型油菜的基因組結構和加速遺傳改良提供了資源,泛基因組的建立對鑑定與重要農藝性狀關聯的結構變異有重要意義。

為了讓油菜遺傳育種研究人員能夠快捷、方便地檢索和使用油菜泛基因組相關資源,研究人員進一步結合1689份油菜的基因組及重測序數據,構建了甘藍型油菜泛基因組資料庫BnPIR。相關論文10月17日在線發表於《植物生物技術雜誌》。

泛基因組資料庫BnPIR

楊慶勇介紹,BnPIR是基於基因信息模塊的綜合平臺,以泛基因組瀏覽器和多基因組共線性為核心,包含多組學數據和常見的生物信息學工具。BnPIR包含基因組序列、基因注釋、系統發育關係、表達數據、PAVs 信息、基因分類,品種信息和常用多組學工具,並提供快速搜索和可視化的集成。

BnPIR為油菜分子生物學和育種提供豐富資源,有助於油菜研究人員在泛基因組背景下搜索和可視化其結果,並為其他物種的泛基因組分析提供有價值的模板和平臺。

同時,研究人員也指出,「目前我們用於構建泛基因組的代表性油菜品系僅9個,未來將收集、組裝和收集更多代表性油菜品系的基因組及其變異信息,整合到BnPIR泛基因組資料庫中。」

此外,除了主要聚焦在檢索變異層面的BnPIR,現在他們還已完成了基於圖形結構泛基因組的構建,並應用這個新構建的泛基因組進行全基因組關聯分析及進化分析等研究工作。

當前,我國科學家在十字花科作物育種領域發表外文論文總量排名世界第一,並且產生了大量優良的遺傳材料,以及基因組、轉錄組和代謝組等多組學數據。如何實現多組學數據復用和共享,將數據轉化成知識、專利、品種及生產力,一直是科研人員思考和努力的方向。

「泛基因組資料庫僅僅是個開端,目前我們與國內的多個油菜研究團隊合作,已經完成了油菜泛轉錄組資料庫的構建,很快就會與大家見面。油菜代謝組資料庫相關構建工作也已開展。」華中農業大學油菜團隊教授郭亮說。

華中農大的研究人員希望,未來通過與國內油菜科學家更加緊密的交流與合作,為油菜遺傳育種提供更加系統全面、準確高效和友好的資料庫和生物信息平臺服務工作。(王方)

相關論文信息:https://doi.org/10.1038/s41477-019-0577-7

https://doi.org/10.1111/pbi.13491

相關焦點

  • 泛基因組資料庫:找到油菜的「好基因」—新聞—科學網
    今年初,華中農業大學一支科研隊伍公布了8個甘藍型油菜的高質量參考基因組。近日,他們在原有研究基礎上,通過整合1689份油菜的基因組及重測序數據,構建了首個油菜泛基因組和比較基因組生物信息平臺BnPIR。 有了這一平臺,研究人員可以更快捷、更方便地檢索和使用油菜泛基因組相關資源。為何建設油菜泛基因組平臺?這是一個什麼樣的資料庫?油菜相關的多組學數據研究進展情況如何?
  • 華中農業大學構建油菜泛基因組資料庫助力油菜遺傳育種研究進入泛...
    近日,華中農業大學生物信息團隊陳玲玲和楊慶勇課題組與廣西大學合作在植物學期刊Plant Biotechnology Journal在線發表了題為「BnPIR: Brassica napus Pan-genome Information Resource for 1,689 accessions」的論文,構建了首個油菜泛基因組和比較基因組生物信息平臺
  • 中國農科院油料所破譯油菜基因組密碼 構建油菜基因轉錄資料庫
    湖北日報訊(記者孟靜、通訊員童超波、劉勝毅)8月28日,記者從中國農業科學院油料作物研究所獲悉,近日油料所油料作物基因組學與抗病性改良創新團隊成功破譯了油菜基因組的全轉錄信息密碼,構建了油菜10萬餘個基因的轉錄全景圖,使得油菜基因功能研究第一次有了相對標準的可參考的基因轉錄資料庫
  • 中國農科院繪製油菜基因組轉錄全景圖,構建功能基因資料庫
    中國農科院繪製油菜基因組轉錄全景圖,構建功能基因資料庫 劉志偉 童超波 劉勝毅/科技日報 2020-07-31 07:45
  • 我國科學家構建油菜功能基因資料庫
    記者從中國農科院油料所獲悉,該所油料作物基因組學與抗病性改良創新團隊成功破譯了油菜基因組的全轉錄信息密碼,構建了油菜10萬餘個基因的轉錄全景圖,使得油菜基因功能研究第一次有了標準的可參考的基因轉錄資料庫,將有力支撐油菜功能基因的相關研究。該成果最近發表在國際知名期刊《植物》上。
  • 我科學家構建油菜功能基因資料庫
    記者30日從中國農科院油料所獲悉,該所油料作物基因組學與抗病性改良創新團隊成功破譯了油菜基因組的全轉錄信息密碼,構建了油菜10萬餘個基因的轉錄全景圖,使得油菜基因功能研究第一次有了標準的可參考的基因轉錄資料庫,將有力支撐油菜功能基因的相關研究。該成果最近發表在國際知名期刊《植物》上。
  • 首個油菜基因轉錄資料庫構建成功
    中國農科院油料所,油料作物基因組學與抗病性改良創新團隊成功破譯了油菜基因組的全轉錄信息密碼,構建了油菜10萬餘個基因的轉錄全景圖,使得油菜基因功能研究第一次有了標準的可參考的基因轉錄資料庫,將有力支撐油菜功能基因的相關研究。該成果在線發表於國際知名期刊《植物學報》(The Plant Journal)。
  • 中國科研人員構建油菜基因轉錄資料庫
    新華社武漢8月2日電(記者侯文坤)記者日前從中國農業科學院油料作物研究所獲悉,該所油料作物基因組學與抗病性改良創新團隊成功破譯了油菜基因組的全轉錄信息密碼,構建了油菜10萬餘個基因的轉錄全景圖,使得油菜功能基因研究第一次有了相對標準的可參考的基因轉錄資料庫,為相關研究提供了有力支撐。該項研究成果日前在線發表在國際知名期刊《The Plant Journal》上。
  • 中國科研人員構建油菜基因轉錄資料庫
    記者日前從中國農業科學院油料作物研究所獲悉,該所油料作物基因組學與抗病性改良創新團隊成功破譯了油菜基因組的全轉錄信息密碼,構建了油菜10萬餘個基因的轉錄全景圖,使得油菜功能基因研究第一次有了相對標準的可參考的基因轉錄資料庫,為相關研究提供了有力支撐。
  • 基因組學研究的未來之星——泛基因組
    高通量測序技術的迅猛發展,極大地推動了全基因組測序進程及物種的群體進化、遺傳多樣性、性狀定位等研究。但單一或者少數參考基因組中可能會缺少部分基因,不能完全覆蓋物種的全部遺傳信息,限制了基因組學研究的深入開展。泛基因組的提出,有效解決了該問題,成為了基因組學研究的新方向。01 什麼是泛基因組?
  • 人類基因組時代的泛基因組學
    薩爾茲伯格2010年,華大基因提出了人類泛基因組學的概念,發表了關於泛基因組學的重要文章,那時我剛剛到華大基因實習,雖然未參與過該項目,但多多少少還是有所了解,後來在丹麥人基因組中也對此進行了探索。這裡我參照薩爾茲伯格的綜述文章將內容分為以下 6 個部分,同時也融入部分我對泛基因組學的理解:單一「參考基因組」分析模式的局限;「泛基因組學」概念的由來和定義構建物種泛基因組的意義;人類泛基因組的構建;泛基因組參考序列的記錄和表示方式;
  • 一作解讀|Mol Plant中國農大小麥研究中心提出泛基因組時代同源基因推斷新策略並構建小麥族同源基因資料庫
    通過融合序列相似性和基因共線性信息開發了適用於植物泛基因組時代同源基因推斷的新策略(GeneTribe),並構建了以小麥族物種為核心的「小麥族同源基因資料庫」(Triticeae-GeneTribe, http://wheat.cau.edu.cn/TGT/)。
  • 10分鐘帶你了解泛基因組做些什麼
    近年來,越來越多的研究表明,單一或者少數參考基因組不能涵蓋整個種群全部的遺傳信息,所以,構建物種的泛基因組成了當前基因組學研究的熱點和前沿。本篇文章,小編和大家一起來了解一下泛基因組的構建方式、泛基因組的熱點研究內容。
  • ...白菜 全基因組測序 基因組圖譜 科學家 油菜品種 異源四倍體...
    東方網10月14日消息:由中國科學家領銜的白菜、甘藍和油菜全基因組測序項目取得階段性重大成果,項目組日前獲得了白菜全基因組的精細圖,甘藍和油菜全基因組的框架圖。  白菜、甘藍和油菜全基因組測序項目於去年9月啟動,吸引了中國農科院、華中農業大學、湖南大學等多所國內研究機構以及韓、英、加、澳、美等國的相關研究機構科研人員參與,其中中國農科院蔬菜花卉研究所和油料作物研究所為項目主持單位。此次測序所用材料為大白菜品種Chiifu、中國自主培育的甘藍品系11-02和油菜品種中雙11號。
  • 浙江大學全球油菜基因資源數位化利用交互式網站上線
    近日,浙江大學作物所發布了全球油菜基因資源數位化利用資料庫與交互式網站BnaSNPDB,該網站的原始碼、利用說明以及簡明語音教程的連結等詳盡信息於2020年9月30日在線發表於計算與結構生物領域具有較高影響力的Computation and Structural Biotechnology Journal 雜誌(論文連結:https
  • 中國農大提出同源基因推斷新策略,並構建小麥族同源基因資料庫
    該工作為泛基因組時代的植物比較基因組學研究和功能基因挖掘提供了新思路。植物中許多物種已經從「一個物種,一個基因組」的時代進入了「一個物種,多個基因組」的「泛基因組時代」(pan-genomic era)。特別是如小麥、玉米和水稻等主要作物,在近緣種、亞種、個體水平都已經完成多個參考基因組的組裝和基因的注釋。在泛基因組時代,如何整合諸多的參考基因組信息並將這些寶貴的數據利用起來,是我們目前面臨的新挑戰。
  • 利用泛基因組方法開發鐮刀菌枯萎病分子標記檢測方法
    選取63個來自公共資料庫的子囊菌門真菌(包含致病和非致病真菌),其中48個含有基因模型;剩餘的不含基因模型的基因組,需進行基因預測,基因預測採用AUGUSTUS +MAKER 分析方法。2.2、泛基因組分析篩選Fusarium屬特有的目的基因利用GET_HOMOLOGUES軟體尋找直系同源基因和旁系同源基因,OrthoMCL軟體對同源基因進行基因家族聚類。根據基因家族聚類結果,尋找只存在於Fusarium 屬的特異基因,以及Fusarium屬內各種間的特異基因。
  • 上海科學家繪製出水稻泛基因組圖譜 基因"導航地圖"助力提升水稻產量
    原標題:上海科學家繪製出水稻泛基因組圖譜 基因「導航地圖」助力提升水稻產量  畫一個人的特徵容易,要畫一群人的特徵,就難了。基因組研究也是如此。儘管國際水稻基因組計劃早在2002年就獲得了水稻「日本晴」的精細基因圖譜,可水稻有數千個品種,「日本晴」又怎能以偏概全?
  • 新的基因組資料庫為調控DNA尋找靶基因
    最近開展的大型基因組研究計劃將有助於疾病的研究。科學家們多年以來就意識到,基因組並不僅僅只是編碼蛋白質的一系列遺傳密碼。它同時也是一塊巨大的「開關板」,充滿著可控制基因活性的DNA序列。基因組在調控方面的複雜性極大地阻礙了研究者們對疾病遺傳學基礎的探索,也阻礙了製藥商們去尋找能夠針對性地靶向於致病性DNA的藥物。
  • 北京基因組所等開發完成基於K-mer的基因組組分分析資料庫
    為此,中國科學院北京基因組研究所基因組科學與信息重點實驗室於軍組和英國倫敦大學學院(UCL)腫瘤研究所王大鵬合作開發了一套基於K-mer算法的基因組組分分析資料庫KGCAK。此項研究於近期發表在Biology Direct 雜誌。