全基因組單核苷酸變異資料庫建立

2020-10-18 華曦鑑定

有助推動我國及周邊國家人群的進化遺傳和醫學研究

 中國科學院上海營養與健康研究所/馬普計算生物學研究所徐書華團隊新近建立的全基因組單核苷酸變異資料庫(PGG.SNV),收集了超過20萬個基因組,涵蓋了800多個現存人類族群和來源於古DNA研究的100多個已消亡人類族群,有助於更深入解析人類基因組變異的功能、表型效應,對我國及周邊國家人群的進化遺傳和醫學研究具有重要價值。

相關研究論文日前在線發表在國際學術刊物《基因組學與應用生物學》上。

  徐書華團隊通過全基因組深度測序技術,收集、整合公共人類基因組數據,獲得2.5億以上人類單核苷酸變異,進行了變異頻率、基因多樣性、群體分化、功能效應、進化保守性、自然選擇信號、連鎖不平衡等方面的解析和注釋,對人類孟德爾遺傳疾病關聯變異的頻率進行了分析。

研究發現,7%的此前報導的罕見病風險變異在很多人群中處於高頻狀態,提示疾病分析中突變的稀有性不是確定該變異與疾病關聯的金標準;孟德爾疾病突變在不同族群中頻率存在差別,表明不同族群的遺傳負荷存在差異。

  研究中,科研人員還將PGG.SNV資料庫與目前廣泛使用的gnomAD資料庫進行了比較,認為由西方學者主導的gnomAD資料庫未能很好地代表人類族群的多樣性。

近一半的基因組來自西方人群,遺傳多樣性最高的非洲人群的基因組僅佔9%,缺乏代表性亞洲人群的數據。尤其是當研究對象為特定的亞洲人群時,gnomAD資料庫的實際應用價值有限。

相關焦點

  • 華中農業大學發布首個多作物遺傳變異參考面板資料庫
    多物種遺傳變異資料庫  近日,華中農業大學信息學院生物信息團隊在Nucleic Acids Research中發表題為「Plant-ImputeDB: an integrated multiple plant reference panel database for genotype imputation」的研究論文。
  • OncoKB:腫瘤藥物靶點相關基因組變異資料庫
    OncoKB收集了腫瘤發生發展相關的,具有臨床意義的基因組變異信息,對於每個變異,提供了其對應的生物學效應,藥物互作,預後和治療意義等詳細信息,對應的文章連結如下http://ascopubs.org/doi/full/10.1200/PO.17.00011資料庫的網址如下
  • 泛基因組資料庫:找到油菜的「好基因」
    「這些資料庫是基於單一品種基因組和注釋,並且缺乏多組學數據和群體變異信息。」 華中農業大學生物信息團隊教授陳玲玲說。據介紹,整合多種個體的泛基因組可以更加全面的檢測物種內部的遺傳變異,獲得各個樣本的共有和特有的基因集,結合不同樣本的表型差異可以為進一步挖掘重要的農藝性狀基因提供基礎。
  • 泛基因組資料庫:找到油菜的「好基因」—新聞—科學網
    遺憾的是,甘藍型油菜一直缺乏專門的基因組資料庫,研究人員不得不藉助蕓薹屬資料庫(BRAD)和其他公共資料庫(Genoscope和Ensembl等)來獲取甘藍型油菜的基因組數據。 「這些資料庫是基於單一品種基因組和注釋,並且缺乏多組學數據和群體變異信息。」 華中農業大學生物信息團隊教授陳玲玲說。
  • 變異形式專題-SNP多態性
    幾乎所有常見的單核苷酸多態性(SNP)位點只有兩個等位基因。單核苷酸多態性(SNP)位點的分布是不均勻的,在非編碼區比在編碼區更常見。一般來說,自然選擇傾向於保留最利於遺傳適應性的單核苷酸多態性(SNP)位點。其他因素,如基因重組和突變率也可判斷單核苷酸多態性(SNP)位點的密度。
  • 揭開人類基因組變異研究新時代
    為了反映這種多樣性並以前所未有的規模捕捉大群體個體間的基因變異程度,基因組聚合資料庫 (The Genome Aggregation Database,gnomAD) 應運而生。gnomAD目前已經收集了15,708個全基因組和125,748個外顯子組的數據。目前,gnomAD資料庫中的大規模數據已對公眾開放。
  • 昆明動物所在樹鼩基因組研究中取得進展
    基於此版樹鼩基因組數據,姚永剛課題組建立了首個樹鼩基因組資料庫(TreeshrewDB v1.0),實現了樹鼩基因組數據的自由訪問和共享,促進了樹鼩研究領域的發展。與包括人類、獼猴和小鼠的基因組結構變異(genomic structural variation)對比分析後發現,相比較於人類,樹鼩基因組中含有221個結構變異,獼猴基因組中有188個結構變異,而小鼠基因組中的結構變異多達
  • 中科院昆明動物研究所研究團隊完成最新版樹鼩基因組高精度測序組裝及注釋
    基於此版樹鼩基因組數據,姚永剛課題組建立了首個樹鼩基因組資料庫(TreeshrewDB v1.0, http://www.treeshrewdb.org/),實現了樹鼩基因組數據的自由訪問和共享,很好地促進了樹鼩研究領域的發展。由於二代測序讀長過短等技術局限,第一版樹鼩基因組中存在一些問題,如拼裝的基因組中缺口(Gaps)多達223607個,其中位於基因編碼區的缺口有2091個。
  • 《自然》發表人類遺傳變異體大型資料庫研究成果
    新華社倫敦5月27日電(記者張家偉)英國《自然》雜誌及其子刊27日在線發表了基因組聚集資料庫(gnomAD)團隊的系列研究論文,介紹了研究人員對這個大型資料庫的多方面分析,其結果有助人們深入認識人類基因功能,提升對罕見和常見遺傳病的理解。基因組聚集資料庫(gnomAD)是一個大規模的人類遺傳變異體資料庫,匯集了來自不同人群的外顯子組數據和全基因組數據,全球多國研究人員參與分析。
  • Nature發布迄今最大規模人類遺傳變異資料庫
    當地時間5月27日,國際期刊《Nature》及其子刊在線發表了基因組聚集資料庫(gnomAD)團隊的系列研究論文。據悉,這份匯集了逾14萬人的公開目錄,是迄今為止最大規模的人體遺傳變異體資料庫,將有助於人們深入了解人類基因功能,增強對罕見和常見遺傳病的理解。基因組聚集資料庫(gnomAD)項目是一個大規模的人類遺傳變異體資料庫,通過各種大型人群測序項目匯集數據,來鑑定各種功能喪失型變異體。
  • DGV:人類基因組結構變異資料庫
    DGV資料庫收錄了健康樣本中大於50bp以上的基因組結構變化信息,對應的文章發表在Nucleic Acids Research上,連結如下https://academic.oup.com/nar/article/42/D1/D986/1068860資料庫的網址如下
  • 天津大學:新型冠狀病毒基因組注釋資料庫向全球開放
    從天津大學獲悉,該校生物信息中心新型冠狀病毒基因組注釋資料庫上線,並納入中國國家基因組科學數據中心向全球開放服務。面對疫情蔓延,我國科技界正在爭分奪秒與病毒抗爭,開展病毒防治相關藥物的研發。鑑於目前在美國NCBI網站上公布的新型冠狀病毒全基因組序列,很大一部分缺少詳細的基因組注釋,尤其是對多聚蛋白酶切位點的注釋,天津大學生物信息中心的高峰教授、羅昊博士採用已研發的ZCURVE_CoV系列軟體對包括新型冠狀病毒(2019-nCoV)在內的兩千餘株冠狀病毒的基因組進行了基因識別和酶切位點預測,並以資料庫(ZCURVE_CoV Database)的形式提供網上服務。
  • 我國建成全球第四個綜合基因組權威資料庫
    人民網北京12月20日電(趙竹青)近日,中國科學院北京基因組研究所生命與健康大數據中心團隊題為「The BIG Data Center: from deposition to integration to translation」(北京基因組研究所生命與健康大數據中心:從存儲到整合
  • 深度:新冠病毒都發生了哪些變異?哪些變異是重要的?
    病毒都發生了哪些變異?其中又有哪些變異是重要的?等系列問題都有待於回答。要回答這些問題,很大程度上依賴於遺傳流行病學,即對病毒全基因組序列的分析和基於人群的調查。自1月12日我國向國際上首次分享第一個新冠病毒全基因組序列以來
  • 全球首個作物黃萎病菌資源和基因組資料庫正式上線
    新京報訊(記者 周懷宗)近日,全球首個作物黃萎病菌資源和基因組資料庫搭建成功並正式上線。該資料庫由中國農業科學院植物保護研究所作物黃萎病研究團隊與美國加州大學戴維斯分校聯合完成,用戶可在該網站查閱收錄的菌種資源信息、測序基因組可視化展示、數據挖掘和分析等工作。
  • 個性化癌症治療:綜合的基因組分析方法及其在臨床的應用
    我們用冷凍的正常樣本和腫瘤樣本進行全外顯子基因組測序(WES, 譯者註:測所有表達基因的序列)和基於基因晶片的單核苷酸多態性分析(SNPProfiling), 並進一步做了RNA測序,來分析識別腫瘤的突變,拷貝數變化(CNV),基因表達(Gene Expression)的變化,基因融合,以及胚系變異(Germline Mutation)等數據。
  • 國家基因組科學數據中心首次公開新型冠狀病毒全基因組序列
    此前科學家陸續獲得的2019新型冠狀病毒基因組序列一般遞交到全球流感序列資料庫(GISAID)和美國國家生物技術信息中心(NCBI)的GenBank資料庫。此前的1月22日,國家基因組科學數據中心正式發布2019新型冠狀病毒信息庫。
  • 新全基因組研究資料庫公布 開創數據共享裡程碑
    生物谷報導:來自美國國立衛生研究院NIH12月13日的消息,NIH部門之一:美國國立醫學圖書館(National Library of Medicine,NLM)宣布推出dbGaP——一個有關全基因組範圍(genome wide association,GWA)內資料檔案的全新資料庫。
  • 中國科學家發現胞嘧啶單鹼基編輯器存在全基因組範圍的脫靶效應...
    中國科學家發現胞嘧啶單鹼基編輯器存在全基因組範圍的脫靶效應
  • 桑樹全基因組圖譜繪製完成 西南大學團隊推動現代桑樹學科建立
    2013年,桑樹全基因組圖譜面世。繼繪製完成世界上第一張家蠶基因組框架圖及精細圖譜之後,西南大學家蠶基因組生物學國家重點實驗室的研究團隊再次引人矚目。  在中國工程院院士向仲懷的帶領下,家蠶基因組生物學國家重點實驗室何寧佳教授領銜的研究小組聯合浙江省農業科學院、廣東省農業科學院等單位的專家,歷時三年完成了桑樹基因組研究,為桑樹學科發展發揮了重要作用。