科學網—玉米多組學資料庫上線了

2020-12-05 科學網

▲嚴建兵課題組在武漢田間春播後休息

▲玉米種質資源中的表型變化 華中農大供圖

 

本報記者 張楠 通訊員 蔣朝常

近日,華中農業大學教授嚴建兵課題組成功整合了來自同一玉米群體的多組學數據,構建了玉米屬綜合資料庫ZEAMAP,相關成果發表於iScience雜誌。

該資料庫內嵌了基因組「瀏覽器」和「搜尋引擎」,從而實現了對相關組學生物大數據的高度集成、快速檢索和智能分析。

此前,我國玉米基礎研究取得了顯著成績,但在其研究材料和數據的共享平臺建設上有待加強。該資料庫的建立,不僅幫助用戶提升了對作物組學數據挖掘的時間效率,更實現了多維組學大數據之間的聯繫,在打通信息「孤島」上邁出有力一步。

多組學信息整合破壁壘

談及搭建玉米多組學資料庫的動因,論文通訊作者嚴建兵介紹,他曾在國際玉米小麥改良中心學習、工作4年多。「該中心的使命就是向全世界無償分發種質資源。這段經歷對我產生了很大影響。」從2010年底回國開展工作第一天,嚴建兵就把建立玉米多組學資料庫提上了日程。

此外,國內學者基礎研究的材料和數據收集、分享工作長期依賴於國際資料庫,如美國國家生物信息中心(NCBI)、歐洲分子生物學實驗室(EMBL)等建立的資料庫。嚴建兵對《中國科學報》表示:「這些國際資料庫極大促進了後來者的科學研究,為全球科技進步作出了重要貢獻。」

不過,「隨著高通量測序技術的快速發展,生物學數據朝著多組學、多維度的層面快速積累。以玉米為例,現有資料庫大多關注一種或幾種特定組學數據,不同資料庫之間難以有效整合利用。」嚴建兵指出。

於是,這些數據成了一座座「孤島」。論文第一作者桂松濤告訴《中國科學報》,有的玉米組學資料庫只包含了基因的注釋信息,有的只記錄了遺傳變異信息。僅通過這兩個孤立的資料庫資源難以判斷出某個遺傳變異是否會對附近的基因表達造成影響。

為了突破信息壁壘、提高研究效率,嚴建兵課題組以其自身牽頭收集並被國內外同行廣泛使用的玉米關聯群體為基礎,整合了該群體的基因組、轉錄組、表型組、代謝組、表觀基因組、遺傳變異以及遺傳定位結果等多組學大數據,構建了玉米屬綜合資料庫ZEAMAP。

在該平臺,用戶可根據相應的條目連結,在不同組學大數據之間進行跳轉訪問,實現信息互聯。

目前,ZEAMAP收錄了4個玉米基因組和1個大芻草基因組,並對每個基因組中數萬個預測基因予以詳細的功能注釋。該資料庫還整合了玉米關聯群體507份自交系中數百萬遺傳變異的基因型信息,並整合了遺傳變異與數十種農藝表型、數百種籽粒代謝產物以及上萬個基因表達量的遺傳定位結果。

ZEAMAP內嵌基因組「瀏覽器」以及豐富的數據檢索、分析和展示工具,用戶可直觀地對比較基因組、基因共線性區塊、表達模式聚類、遺傳變異基因型、連鎖圖譜、遺傳定位結果、染色質交互、組蛋白修飾以及群體水平的DNA甲基化等多組學數據進行檢索和分析。

數據分享與數據安全都不能缺

「從用戶角度來說,ZEAMAP極大降低了用戶對作物組學數據挖掘的時間成本。」華中農業大學教授李林主要利用生物大數據進行玉米株型建成分子機制研究。他指出,目前全球已有的幾乎都是單一組學大資料庫,ZEAMAP則在一定程度上實現了多維組學大數據之間的聯繫,立足於完整反映遺傳信息的整個鏈條,超越了存儲層面的資料庫。

嚴建兵進一步解釋說:「我們收集、整合的同時,還做了很多關聯分析。如果你做了基因組學的實驗,那麼通過與代謝組學或遺傳組學的結果比對,可以查驗你的結論受到支持還是反對。對於入門研究者來說,可以清晰明了地看到,其他學者已經做過哪些相關研究。」

也就是說,該資料庫可以幫助學者直觀了解到,他們感興趣的基因與附近的哪些遺傳變異有關聯。同時也可以根據這些遺傳變異和相關表型的遺傳定位結果,去尋找可能的從遺傳變異到基因表達,再到表型改變之間的關係。

據不完全統計,已有超過60個國內外實驗室使用嚴建兵課題組資源,產生了一大批基礎研究成果。「即便不是我們自己產出的成果,但是數據和種質資源的分享,對整個玉米研究領域的發展是非常有益的,對於農作物的遺傳改良、作物育種非常重要。」嚴建兵說。

不僅僅是資料庫類型單一的問題需要關注,去年上半年發生的一次事件也提醒科學家,當前的組學資料庫過於集中在歐美國家。由於美國政府預算未被國會批准,政府相關機構停擺,美國玉米基因組和遺傳學資料庫(www.maizeGDB.org)被關停,導致研究者無法及時獲取完整數據。而類似事件並不少見。

「學界缺乏能夠真正服務於中國作物學研究的資料庫。」李林強調,「如果能夠具有多樣化的選擇,那對數據安全、研究的方便程度都會更有利。」

維護更新須持之以恆

李林也正嘗試建立網絡大資料庫,深知其中不易:「大數據時代,信息很多也很全面,但同時也會帶來『噪聲』,整合起來非常麻煩。嚴建兵課題組是通過10年積累,多位研究人員、研究生接力實現的。而資料庫搭建完成後,對其維護更新也是件持之以恆的事。」

對此,嚴建兵坦陳,在國際上一些成熟資料庫會有專職人員進行維護,從幾人到幾百人的規模都有。而國內無論從項目體系還是評價體系,都暫時沒有相應支持,做資料庫只能靠兼職。

「研究人員搭建資料庫,不僅要具備深度的專業知識,能夠對基因、轉錄、蛋白等組學數據進行挖掘分析,還要對計算機語言、資料庫搭建規則等有所掌握。」嚴建兵說。

從另一個角度看,搭建生物組學資料庫,不僅是促進科學事業發展的公益性工作,同時也是培養交叉學科人才的過程。第一位幫助嚴建兵從零開始搭建資料庫的博士生劉海軍,目前已經在奧地利科學院格雷戈爾·孟德爾研究所從事博士後研究。

桂松濤從事生物組學資料庫工作一年半時間,鑽研了許多搭建工具,從做實驗慢慢轉到做生物信息,經歷了收穫也經歷了許多嘗試和妥協。

「搭建資料庫與傳統科研工作有很大差別,不僅要解決技術上的問題,還要考慮展示邏輯,考慮用戶對數據的了解程度,以及用戶體驗。資料庫平臺在簡單、直觀、易用的同時,最好還要儘量美觀。」桂松濤說。

「我們期待這一雲端集成檢索,能有效促進現有玉米組學數據資源的利用率,幫助科學家深入理解玉米遺傳變異、表型和基因之間的關係,輔助玉米的遺傳育種和改良。」嚴建兵團隊已經發出邀請,期待學者們上傳數據,共同完善該資料庫。

相關論文信息:https://doi.org/10.1016/ j.isci.2020.101241

《中國科學報》 (2020-07-21 第3版 農業科技)

相關焦點

  • 文獻之聲丨HMPDACC—最新人體微生物多組學資料庫上線了
    人體微生物與疾病表型的基礎研究已經進入了成熟期,更加側重微生物與宿主的交互調控機制研究,由此人類微生物組計劃(Human Microbiome Project, HMP)也邁入了第二階段人類微生物組整合計劃(Integrative Human Microbiome Project,iHMP),並業已取得了顯著的科研成果,為通過微生物開展臨床治療提供了更加豐富的數據支持。
  • 動物所等建立衰老生物學多組學資料庫
    近年來,隨著衰老相關研究成果的不斷增多以及高通量測序技術的日益發展,衰老相關多組學數據層出疊見。然而,目前尚缺乏綜合性的整合衰老生物學多組學數據的數據資源庫。中國科學院動物研究所劉光慧研究組、曲靜研究組,與北京基因組研究所(國家生物信息中心)鮑一明研究組、張維綺研究組合作建立了Aging Atlas資料庫(https://bigd.big.ac.cn/aging/index)。
  • 科學家合作建立衰老研究多組學資料庫
    近年來,隨著衰老相關研究成果的不斷增多以及高通量測序技術的日益發展,衰老相關多組學數據層出疊見。然而,目前尚缺乏一個綜合性的整合衰老生物學多組學數據的數據資源庫。該資料庫從常規轉錄組、單細胞轉錄組、表觀基因組、蛋白質組及藥物基因組等不同層面整合了衰老相關數據集(下圖),實現了不同條件下基因表達調控隨衰老變化趨勢的匯聚融合
  • 多組學與藥物敏感分析的資料庫
    今天小編就來給大家介紹一個與藥物敏感性相關的RNA的資料庫:RNAactDrug(http://bio-bigdata.hrbmu.edu.cn/RNAactDrug/)。該資料庫通過對三個大型藥物基因組資料庫(GDSC,CellMiner和CCLE)的綜合分析在4個分子水平上(表達,拷貝數變異,突變和甲基化)來探索藥物敏感性和RNA分子的相關性。目前,RNAactDrug已存儲了4 924 200多個RNA分子和藥物敏感性的關聯,涵蓋了19 770個mRNA,11 119個lncRNA,438個miRNA和4155種藥物。
  • 植物科學常用資料庫和生物信息學工具
    在所有開展植物科學相關研究的科研工作者的日常中,無法避免會使用到各類資料庫和分析平臺。這些資料庫和分析平臺的建立和更新維護為植物的組學、功能、進化以及遺傳育種等方面研究提供了豐富的資源。以下是一些植物科學常用的資料庫和生物信息學工具,分享給大家,希望對大家有用。
  • 【學術前沿】劉光慧/鮑一明/曲靜/張維綺建立衰老生物學多組學資料庫
    【學術前沿】劉光慧/鮑一明/曲靜/張維綺建立衰老生物學多組學資料庫 2020-10-30 16:23 來源:澎湃新聞·澎湃號·政務
  • 植物科學常用資料庫和生物信息學工具
    http://epigenome.genetics.uga.edu/PlantMethylome/   植物DNA甲基化資料庫    http//bioinfo.sibs.ac.cn/plant-regulomics 從植物多組學數據中檢索獲取上遊調控因子的數據驅動平臺
  • 小麥多組學網站上線「藏1817」基因組資源
    小麥多組學網站上線「藏1817」基因組資源 昨天,中國農業大學農學院小麥研究中心孫其信教授、倪中福教授和彭惠茹教授為論文通訊作者,郭偉龍副教授、辛明明教授和博士生3 基因組以及基因 blast小麥多組學網站(http://202.194.139.32/blast/viroblast.php)
  • 聚焦組學「三國」 演義一流期刊—新聞—科學網
    聚焦「三國」創新刊 21世紀之交,在人類基因組計劃的帶動下,全球風靡基因組測序。借著這股「東風」,GPB誕生了。 這並不容易。創建一本期刊,從學科發展到基礎支撐再到人才的到位,「天時、地利、人和」缺一不可。
  • 常用資料庫和生物信息學工具,值得收藏
    集成植物基因組學、表型和遺傳學數據的共享型平臺http://harvest.ucr.edu/作物EST序列及相關分子信息數據平臺http://www.gramene.org/ Gramene:用於作物和模式物種的比較功能基因組學分析的綜合平臺
  • 植物科學常用資料庫和生物信息學工具 2020正式版
    http://epigenome.genetics.uga.edu/PlantMethylome/   植物DNA甲基化資料庫    http//bioinfo.sibs.ac.cn/plant-regulomics 從植物多組學數據中檢索獲取上遊調控因子的數據驅動平臺
  • 泛基因組資料庫:找到油菜的「好基因」—新聞—科學網
    這是一個什麼樣的資料庫?油菜相關的多組學數據研究進展情況如何?《中國科學報》對此進行了採訪。 「標準地圖」有盲區 甘藍型油菜大約在7500年前由白菜和甘藍自然雜交形成,是非常「年輕」的多倍體植物。 首個油菜泛基因組 甘藍型油菜是研究植物多倍化和進化的模式物種。遺憾的是,甘藍型油菜一直缺乏專門的基因組資料庫,研究人員不得不藉助蕓薹屬資料庫(BRAD)和其他公共資料庫(Genoscope和Ensembl等)來獲取甘藍型油菜的基因組數據。 「這些資料庫是基於單一品種基因組和注釋,並且缺乏多組學數據和群體變異信息。」
  • 植物科學常用資料庫和生物信息學工具,趕緊收藏,遲早用得到
    http://ppdb.tc.cornell.edu/default.aspx擬南芥和玉米蛋白質組資料庫http://atted.jp/ATTED-II :基於互秩指數統計特性的植物共表達資料庫http://ibi.zju.edu.cn/plantcircbase
  • 生物質譜譜圖資料庫支撐蛋白質組學研究
    段會龍說,目前的蛋白質組質譜研究依賴於蛋白質序列資料庫和檢索引擎產生的理論譜圖。蛋白質序列資料庫是由基因組系列數據基於現有理論的衍生;檢索引擎再基於蛋白質序列,以及內切酶、翻譯後修飾產生可能的肽段,衍生出其理論圖譜。 「理論圖譜的應用在對蛋白質組學的發展起到積極作用的同時,也限制了其推廣。」 段會龍說,限制主要體現在三個方面。
  • 微擬球藻設計與合成資料庫建立—新聞—科學網
    為促進全球微擬球藻研究群體的資源共享和通力合作,加速工業產油微藻合成生物學和分子育種技術的進展,中科院青島生物能源與過程研究所單細胞中心聯合中外14個實驗室組成國際聯合團隊,發布了「微擬球藻設計與合成資料庫」(NanDeSyn:http://www.nandesyn.org),該工作近日發表於《植物學期刊》
  • 蛋白組學/代謝組學如何快速從主流資料庫中獲取人/小鼠數據?
    生物信息學的應用變得尤為重要,在生物領域從基因測序,到基因編輯,再到基因療法的精準醫療,由生物科技引發的又一場變革正悄然而至。試問大家做好準備迎接它到來了嗎? 本次分享的主題為:如何快速獲取海量數據? 點擊下載基因組或蛋白組FASTA
  • 蛋白組學/代謝組學如何快速從主流資料庫中獲取人/小鼠數據?
    生物信息學的應用變得尤為重要,在生物領域從基因測序,到基因編輯,再到基因療法的精準醫療,由生物科技引發的又一場變革正悄然而至。試問大家做好準備迎接它到來了嗎?本次分享的主題為:如何快速獲取海量數據?如下所示:點擊下載基因組或蛋白組FASTA序列,直接會彈出下載連結,選擇保存文件的位置即可開始下載;還可以下載NCBI上的基因組注釋GFF文件(Ensembl資料庫也可以下載物種的GFF文件,後面會給大家講到)物種 人和小鼠
  • 玉米木質部汁液蛋白組的情況是如何呢?
    木質部汁液中除了含有水分和礦質養分之外,還含有植物激素、多胺、碳水化合物、有機酸、胺基酸和蛋白質,其組成成分隨植物種類的不同而有所差別。自 Biles和 Abeles(1991)首次在木質部汁液中發現源於根系的過氧化物酶開始,關於木質部汁液中蛋白質組學的研究呈現出迅猛發展的趨勢,先後定性鑑定出油菜、玉米、大豆和白楊木等植物木質部汁液中的蛋白質組分。
  • 科學網— 聚焦組學「三國」 演繹一流期刊
    聚焦「三國」創新刊 世紀之交,在人類基因組計劃的帶動下,基因組測序全球風靡。借著這股「東風」,GPB誕生了。 這並不容易。創建一本期刊,從學科發展到基礎支撐再到人才到位,「天時、地利、人和」缺一不可。
  • 作物基因組學研究進展
    隨著測序技術的發展,已經實現對重要農作物,如水稻、小麥、玉米、大豆、油菜、棉花、蔬菜等作物基因組的測序或重測序,在此基礎上完成對控制重要農藝性狀基因的克隆和鑑定。本文綜述了2017年度主要農作物基因組研究方面取得的一系列重要進展。1、基因組學領域論文分析在SCIE資料庫共獲得954篇基因組學研究相關的文獻。