新全基因組研究資料庫公布 開創數據共享裡程碑

2021-01-09 生物谷

生物谷報導:來自美國國立衛生研究院NIH12月13日的消息,NIH部門之一:美國國立醫學圖書館(National Library of Medicine,NLM)宣布推出dbGaP——一個有關全基因組範圍(genome wide association,GWA)內資料檔案的全新資料庫。

GWA研究揭示了特異基因(基因型信息)與顯著表型,比如血壓,體重之間的關聯,以及一種疾病或者情況(表型信息)是否會發生,表型和基因型數據之間的聯繫也告訴了我們一些也許影響疾病過程或者情況的基因信息,這對於更好的了解基因,以及發展治療方法和手段十分重要。

dbGap,基於基因型和表型相關數據,可以第一時間提供給感興趣的研究人員所有的研究資料,以及測定變量(measured variables)的摘要(以組織性的或者搜索性網頁形式),也可以提供一些基因與篩選表型之間統計相關性水平的pre-computed分析。其中基因型數據主要是利用高通量基因分型晶片進行目標DNA單核苷酸多態性分析(SNPs)。

dbGaP最開始將開放兩項研究內容:由國立眼科研究所(National Eye Institute)資助的衰老相關眼疾研究(the Age-Related Eye Diseases Study,AREDS),以及國立神經失序與中風帕金森症研究院(the National Institute of Neurological Disorders and Stroke Parkinsonism)的相關研究。前者包含了老年黃斑病變(Age-related Macular Degeneration,簡稱AMD)和老年性白內障(age-related cataracts)臨床過程多通道預期研究,包含600份資料。後者則是聚集DNA,細胞系樣品和詳細表型數據的2573份資料。

這一資料庫將由國家生物技術中心(National Center for Biotechnology)管理和發展。NLM主任Donald Lindberg認為這一計劃是「數據分享的裡程碑」,並且「是獲得之前不能獲得的基因型-表型關聯研究內容的一種方法」,「也許會引導大量假說產生」。
(生物谷:張迪)

附:
United States National Library of Medicine 
NLM;美國國立醫學圖書館 
創建機構: U.S. National Library of Medicine 

美國國立醫學圖書館(National Library of Medicine,NLM)是世界上最大的醫學圖書館,收錄有生物醫學和健康關懷等各方面資料,包括書籍、期刊、技術報告、手稿、縮微膠片、聲像資料、資料庫等。其主頁共提供如下五個方面的信息服務:

(1)衛生信息(Health Information)其下為按主題排列的醫學信息超級連結,也可由此進入NLM幾個知名的醫學資料庫:①MEDLINEplus;
②MEDLINE via PubMed;
③ClinicalTrials.gov;
④衛生組織名錄DIRLINE;
⑤美國國立醫學圖書館館藏書目、雜誌、聲像製品查詢系統LOCATORplus,用戶可通過該系統查詢NLM的館藏;
⑥可檢索多個NLM檢索系統的網絡接NLM Gateway; 
⑦數位化生命科學文獻庫PubMed Central;⑧關於毒理學、環境衛生和有毒化學物質的資料庫TOXNET。

(2)圖書館服務(Library Services)提供了有關目錄、Medical Subject Headings(MeSH)、資料庫、出版物、服務、培訓及基金等方面的連結,服務項目包括:編目(Cataloging)、館際互借(DOCLINE(r) 和 Loansome Doc(r))、保藏和收藏管理、參考諮詢和讀者服務、系列項目和服務。

(3)研究項目(Research Programs)提供了進入NCBI和LH_NCBI兩個研究中心的連結,也提供了有關計算分子生物學、醫學信息學、數位化計算與交流、數位化圖書館研究、醫學信息學培訓等方面信息的連結。

(4)新聞(New and Noteworthy)提供了有關NLM的新聞和聲明、展覽會及熱門話題等信息。 

相關焦點

  • 泛基因組資料庫:找到油菜的「好基因」
    今年初,華中農業大學一支科研隊伍公布了8個甘藍型油菜的高質量參考基因組。近日,他們在原有研究基礎上,通過整合1689份油菜的基因組及重測序數據,構建了首個油菜泛基因組和比較基因組生物信息平臺BnPIR。有了這一平臺,研究人員可以更快捷、更方便地檢索和使用油菜泛基因組相關資源。
  • 全基因組單核苷酸變異資料庫建立
    有助推動我國及周邊國家人群的進化遺傳和醫學研究 中國科學院上海營養與健康研究所/馬普計算生物學研究所徐書華團隊新近建立的全基因組單核苷酸變異資料庫有助於更深入解析人類基因組變異的功能、表型效應,對我國及周邊國家人群的進化遺傳和醫學研究具有重要價值。
  • 泛基因組資料庫:找到油菜的「好基因」—新聞—科學網
    今年初,華中農業大學一支科研隊伍公布了8個甘藍型油菜的高質量參考基因組。近日,他們在原有研究基礎上,通過整合1689份油菜的基因組及重測序數據,構建了首個油菜泛基因組和比較基因組生物信息平臺BnPIR。 有了這一平臺,研究人員可以更快捷、更方便地檢索和使用油菜泛基因組相關資源。為何建設油菜泛基因組平臺?這是一個什麼樣的資料庫?油菜相關的多組學數據研究進展情況如何?
  • 我國建成全球第四個綜合基因組權威資料庫
    、再到轉化)的研究論文被國際學術期刊《核酸研究》(Nucleic Acids Research)在線發表。這是我國首次以數據中心為模式整體發布我國生命組學數據資源建設情況,標誌著我國建設綜合性基因組數據資源獲得國際同行認可。 北京基因組研究所有關人員表示,此前,國際上被認可的生物組學數據中心主要有美國的NCBI、歐洲的EBI及日本的DDBJ,要想在國際期刊發表論文,需要先將自己的原始數據提交到這三個官方指定的資料庫中。
  • 中科院:與美國同步共享5株新型冠狀病毒基因組序列
    (NGDC)首批自主收錄的5株2019新型冠狀病毒基因組序列實現與美國NCBI核酸資料庫GenBank數據同步與共享。中科院官網截圖全文如下:國家生物信息中心(CNCB)/國家基因組科學數據中心(NGDC)首批自主收錄的5株2019新型冠狀病毒基因組序列實現與美國NCBI核酸資料庫GenBank數據同步與共享。
  • 中科院:與美國同步共享5株2019新型冠狀病毒基因組序列
    【環球網綜合報導】中國科學院7日在官網上發文披露,國家生物信息中心(CNCB)/國家基因組科學數據中心(NGDC)首批自主收錄的5株2019新型冠狀病毒基因組序列實現與美國NCBI核酸資料庫GenBank數據同步與共享。
  • 微生物分類學研究利器:模式微生物基因組資料庫
    由國家微生物科學數據中心(世界微生物數據中心)建立的模式微生物基因組資料庫(gcType)http://gctype.wdcm.org/,是為分類學家進行基因組研究、新種鑑定的一個非常有價值的工具平臺。
  • 微生物分類學研究利器:模式微生物基因組資料庫
    由國家微生物科學數據中心(世界微生物數據中心)建立的模式微生物基因組資料庫(gcType)http://gctype.wdcm.org/,是為分類學家進行基因組研究、新種鑑定的一個非常有價值的工具平臺。
  • 揭開人類基因組變異研究新時代
    為了反映這種多樣性並以前所未有的規模捕捉大群體個體間的基因變異程度,基因組聚合資料庫 (The Genome Aggregation Database,gnomAD) 應運而生。gnomAD目前已經收集了15,708個全基因組和125,748個外顯子組的數據。目前,gnomAD資料庫中的大規模數據已對公眾開放。
  • 裡程碑!Nature重磅發布迄今最全面的癌症全基因組圖譜,涉及38種...
    該研究整體描述了通過使用計算雲進行國際數據共享來促進PCAWG基因組資源的生成。研究團隊分析了來自38種腫瘤類型的2658個腫瘤全基因組,展示了PCAWG項目相關數據的廣度與深度。結合編碼和非編碼基因組元件分析,平均每個癌症基因組攜帶有4~5個驅動突變,然而大約5%的案例中沒有發現任何驅動突變,表明目前對於驅動突變的了解或者發現並不完全。
  • 《核酸研究》:高質量模式微生物基因組資料庫及分析平臺
    近日,《核酸研究(Nucleic AcidsResearch)》在線發表了國家微生物科學數據中心(中國科學院微生物研究所微生物資源與大數據中心、世界微生物數據中心)團隊關於全球模式微生物基因組資料庫gcType的文章。gcType是由我國牽頭的全球模式微生物基因組測序計劃的重要成果。
  • 《核酸研究》:高質量模式微生物基因組資料庫及分析平臺
    )》在線發表了國家微生物科學數據中心(中國科學院微生物研究所微生物資源與大數據中心、世界微生物數據中心)團隊關於全球模式微生物基因組資料庫gcType的文章。由國家微生物科學數據中心(世界微生物數據中心)建立的模式微生物基因組資料庫(gcType)http://gctype.wdcm.org/,是為分類學家進行基因組研究、新種鑑定的一個非常有價值的工具平臺。
  • 天津大學:新型冠狀病毒基因組注釋資料庫向全球開放
    從天津大學獲悉,該校生物信息中心新型冠狀病毒基因組注釋資料庫上線,並納入中國國家基因組科學數據中心向全球開放服務。面對疫情蔓延,我國科技界正在爭分奪秒與病毒抗爭,開展病毒防治相關藥物的研發。鑑於目前在美國NCBI網站上公布的新型冠狀病毒全基因組序列,很大一部分缺少詳細的基因組注釋,尤其是對多聚蛋白酶切位點的注釋,天津大學生物信息中心的高峰教授、羅昊博士採用已研發的ZCURVE_CoV系列軟體對包括新型冠狀病毒(2019-nCoV)在內的兩千餘株冠狀病毒的基因組進行了基因識別和酶切位點預測,並以資料庫(ZCURVE_CoV Database)的形式提供網上服務。
  • 手把手教你提交微生物基因組序列數據
    感受數據提交服務亮點:線上全流程數據匯交,為您帶來便捷提交新體驗+包括生物項目數據(BioProject),即生物學研究項目信息進行收集整理的資料庫,可以根據所產生的數據類型來識別一個項目;生物樣本數據(BioSample)為一個中心位置,可與項目庫連結,也可獨立,用於收集病毒、細菌、真菌等微生物的菌株及樣本、微生物環境樣本(元基因組)描述信息;核酸序列數據(NucleotideSeq)收集16S rRNA、rRNA-ITS等特徵基因片段以及其他微生物相關的核酸序列
  • 2001年10月12日 水稻基因組研究獲重大進展 「工作框架圖」和數據...
    「工作框架圖」和資料庫完成   中國科學院、國家計委、科技部2001年10月12日在京聯合宣布,中國水稻(秈稻)基因組「工作框架圖」和資料庫已經完成,並將公布數據,供全球無償共享。
  • 【中疾控公布北京新發地新冠疫情及病毒基因組序列數據】記者從...
    2020-06-19 09:05:16來源:FX168 【中疾控公布北京新發地新冠疫情及病毒基因組序列數據】記者從中國疾控中心獲悉,6月18日晚,該中心已通過「新型冠狀病毒國家科技資源服務系統」正式發布2020年6月北京新發地新冠疫情及病毒基因組序列數據。
  • 全球冠狀病毒組學數據共享與分析系統
    為做好新型冠狀病毒感染的肺炎疫情防控和科研工作支撐,2020年2月18日,中國科學院微生物研究所主持的國家微生物科學數據中心發布「全球冠狀病毒組學數據共享與分析系統」(http://nmdc.cn/#/coronavirus)。
  • 如何負責任的共享基因數據?Nature 帶你破局
    ■ 基因數據共享的價值基因組學研究具有良好的數據共享文化,從人類基因組計劃向全世界開放第一例人類基因組數據開始,到多國合作的千人基因組計劃都為生命科學研究提供了重要價值的參考數據生命科學研究人員強烈期望全基因組數據、轉錄組數據和相關元數據的共享,這些豐富的數據可以用於他們感興趣的研究方向以及應用開發。基因數據共享的價值主要體現在減少重複研究、提高科研實用性、挖掘研究內容、提升科研透明性以及與其他鄰域的交叉研究。
  • 一作解讀|Mol Plant中國農大小麥研究中心提出泛基因組時代同源基因推斷新策略並構建小麥族同源基因資料庫
    通過融合序列相似性和基因共線性信息開發了適用於植物泛基因組時代同源基因推斷的新策略(GeneTribe),並構建了以小麥族物種為核心的「小麥族同源基因資料庫」(Triticeae-GeneTribe, http://wheat.cau.edu.cn/TGT/)。
  • 數據分析:創建統一的公有基因組數據平臺
    使用雲服務要通過網際網路,而且計算資源是共享的,這就引起了很多科研資助機構的疑慮,他們擔心雲計算的使用會洩露樣本提供者的隱私。NIH取消不準上傳到雲端的規定是因為基因組學研究中正面臨著現實問題:如何獲取資料庫中的大量數據。這已經阻礙了科研人員的工作,尤其是當研究工作涉及到現有的數據信息時。