首個全球人群基因組多樣性和祖源信息資料庫發布

2020-12-05 科學網

 

11月3日,《核酸研究》(NAR)在線發表了中國科學院上海生科院(人口健康領域)計算生物學研究所徐書華課題組的研究成果「PGG.Population: a database for understanding genomic diversity and genetic ancestry of human populations」。該研究分析了涵蓋全球範圍107個國家的356個人類族群的基因組多樣性和祖源信息,並發布了開放獲取的專門資料庫——「PGG.Population」 (群體基因組學·族群,網址:https://www.pggpopulation.org/)。PGG.Population是迄今唯一在基因組水平專門解析人類族群遺傳關係和祖源信息的公開資料庫,同時也是目前收集族群數量最大的群體基因組資料庫,為研究人員、臨床醫生及學生和公眾理解不同人群的遺傳背景提供一個查詢和分析平臺。

 

人類族群多樣性的形成是一個遷移、隔離、分化、再接觸和交流的複雜演化過程。同時,長期對特定環境的適應也可能影響特定的性狀以及基因組局部區域的多樣性變化。相對來講,人群的基因組多樣性在很大程度上決定了其表型多樣性——這也是族群特異性的表型可以世代傳承的原因。因此,要真正理解人類不同族群在膚色、體質以及疾病等性狀上的差異,最終需要回到基因組、追溯人群的演化歷程。眾多大型國際計劃(比如人類單倍體型圖計劃和千人基因組計劃)以及我國此前完成的各類全基因組關聯研究(GWAS) 都集中於關注常見主體人群。而對各地少數族群(大多是土著人群)的研究還很缺乏。一些研究者逐漸意識到,在一個人群研究中的困惑,往往在另一個人群的研究中找到答案。對比了青藏高原人群的基因組,我們才了解為何平原人群無法像藏族人那樣舒適地生活在高原上。專家認為,這就是多樣性的魅力,也是進化留給我們的財富。

 

PGG.Population 正是在這樣的大背景下建立起來。研究人員通過測序或者收集眾多人類群體基因組研究數據,對每個族群的基因組重新整合與分析(包括人群的地理語言歸屬等基本信息、Y染色體與線粒體譜系、群體間親緣關係、群體遺傳結構、遺傳混合以及自然選擇印記等),同時建立了資料庫,以開放獲取的方式向公眾展示每個族群的基因組多樣性與祖源信息。截止目前,該資料庫包括7122個個體的基因組數據,覆蓋來自107個國家的356個族群的,每個族群都有自己的「故事」 。該資料庫以理解每個人群的基因組多樣性與遺傳背景為主,同時對其他研究領域也具有重要的學術意義和應用價值。人類群體基因組資料庫建設任重道遠。全世界有超過2000多個族群,而該庫目前只包括世界族群的1/6強。 課題組正在收集或產生更多的來自不同族群基因組數據,以覆蓋更多的族群,以期用於全面探索亞洲人群尤其是東亞、東南亞族群的演化歷史和自然選擇等遺傳和演化問題。同時可供遺傳學、語言學、體質人類學、醫學等行業參考和使用,應用於生物醫學等多個領域的研究。此外,研究者們同時希望公眾通過訪問和查詢該資料庫對人類基因組多樣性和人群祖源等方面的知識和信息有更廣泛和深入的理解。

 

該工作是上海生科院(人口健康領域)計算生物學研究所徐書華課題組博士研究生張超、高揚(上海科技大學)完成,研究人員陸豔、鄧戀以及博士研究生劉姣姣(上海科技大學)、馮啟迪、田壘、薛者等參與了該項工作。該項工作得到了中國科學院戰略性先導科技專項(B類)、國家自然科學基金委重大研究計劃及國家傑出青年科學基金、中科院青年促進會、上海市科委等多項基金的資助,同時得到國家遺傳與發育協同創新中心支持。 (來源:

中國科學院上海生命科學研究院

 

 

 

PGG.Population資料庫網站主界面

 

 

 

 

 

特別聲明:本文轉載僅僅是出於傳播信息的需要,並不意味著代表本網站觀點或證實其內容的真實性;如其他媒體、網站或個人從本網站轉載使用,須保留本網站註明的「來源」,並自負版權等法律責任;作者如果不希望被轉載或者聯繫轉載稿費等事宜,請與我們接洽。

相關焦點

  • 全球首個作物黃萎病菌資源和基因組資料庫正式上線
    新京報訊(記者 周懷宗)近日,全球首個作物黃萎病菌資源和基因組資料庫搭建成功並正式上線。該資料庫由中國農業科學院植物保護研究所作物黃萎病研究團隊與美國加州大學戴維斯分校聯合完成,用戶可在該網站查閱收錄的菌種資源信息、測序基因組可視化展示、數據挖掘和分析等工作。
  • 我國建成全球第四個綜合基因組權威資料庫
    人民網北京12月20日電(趙竹青)近日,中國科學院北京基因組研究所生命與健康大數據中心團隊題為「The BIG Data Center: from deposition to integration to translation」(北京基因組研究所生命與健康大數據中心:從存儲到整合
  • Sci Rep:國內首個基於消費級基因數據構建的中國人高精度父系祖源...
    該工作基於來自消費級基因檢測的 2139 名中國男性 Y 染色體數據,構建了更高精度的中國人父系祖源圖譜。對於人類基因組來說,Y 染色體是決定人類性別的染色體,因其只在男性中出現,而且不會有同源重組現象,可以忠實地保留父系信息,在分子人類學中,對研究人類的起源和遷徙有著重要意義。
  • 全基因組單核苷酸變異資料庫建立
    有助推動我國及周邊國家人群的進化遺傳和醫學研究 中國科學院上海營養與健康研究所/馬普計算生物學研究所徐書華團隊新近建立的全基因組單核苷酸變異資料庫有助於更深入解析人類基因組變異的功能、表型效應,對我國及周邊國家人群的進化遺傳和醫學研究具有重要價值。
  • 免費祖源基因檢測培育市場「23魔方」蓄力打造國內最大基因資料庫
    從全球範圍來看,2010-2017年,消費級基因測序市場規模逐年擴張,年均複合增速高達22.79%。2018年,全球基因測序市場仍繼續保持增長,保守估計市場規模在117億美元左右。公司從2015年推出首代產品,就致力於依託網際網路+基因檢測構建一個國內最大的生命大資料庫。目前,「23魔方」的消費級基因檢測服務可以對九大類遺傳指標進行檢測,採集手段主要是通過使用「23魔方」提供的專業唾液採集樣盒,將用戶的唾液樣本回寄到「23魔方」檢測中心,待檢測結果出爐後,用戶只需要登錄「23魔方」的APP就可以拿到自己的基因檢測報告了。
  • 中國海洋大學發布國際首個軟體動物綜合基因組資料庫
    本報訊 10月23日,中國海洋大學海洋生物遺傳學與育種教育部重點實驗室包振民院士團隊在國際資料庫領域頂級期刊《核酸研究》在線發表了國際首個軟體動物綜合基因組資料庫「MolluscDB:系統整合功能和進化組學資源的軟體動物超大類群基因組資料庫」。
  • 全球首個藥用昆蟲基因組圖譜發布
    全球首個藥用昆蟲基因組圖譜發布     四川擬在昆蟲類藥品引入全基因組測序    本報訊(記者 寇敏芳)12月10日,好醫生藥業集團和四川大學共同在北京發布了美洲大蠊全基因組研究的階段性成果
  • 泛基因組資料庫:找到油菜的「好基因」
    今年初,華中農業大學一支科研隊伍公布了8個甘藍型油菜的高質量參考基因組。近日,他們在原有研究基礎上,通過整合1689份油菜的基因組及重測序數據,構建了首個油菜泛基因組和比較基因組生物信息平臺BnPIR。有了這一平臺,研究人員可以更快捷、更方便地檢索和使用油菜泛基因組相關資源。
  • 中國海洋大學科研團隊發布國際首個軟體動物綜合基因組資料庫
    2020年10月23日,中國海洋大學海洋生物遺傳學與育種教育部重點實驗室包振民院士團隊在國際資料庫領域頂級期刊Nucleic Acids Research(《核酸研究》)在線發表了國際首個軟體動物綜合基因組資料庫「MolluscDB: an integrated functional and evolutionary genomics database for the hyper-diverse
  • 我國首個國家基因庫運營在即 將成全球最大生命信息平臺
    國家基因庫由生物信息資料庫和生物樣本資源庫組成,已經實現對基因信息數據總量達60PB的訪問支持;制定基因信息數據採集、儲存和管理相關標準和技術規範國家基因庫創新性提出採用生物資源樣本庫(溼庫)和生物信息資料庫(幹庫)相結合的建設模式,收集全球生物物種和樣本並進行儲存,且把這些資源信息數位化,使之能夠支撐科研和應用。 這一優勢使得國家基因庫成為既有數據、又有實體的新一代生物資源庫、信息庫、知識庫和工具庫,與傳統的「乾濕分離」的基因庫相比,具有極強的競爭優勢。
  • 全球基因組生物多樣性聯盟2020大會將在深圳國家基因庫舉辦
    關注中國綠髮會,訂閱綠色未來近日,全球基因組生物多樣性聯盟(GGBN)正式宣布:GGBN 2020大會、亦即全球基因組生物多樣性聯盟第四屆大會,將於2020年5月11日至15日在中國深圳舉行,由深圳國家基因庫主辦。
  • 泛基因組資料庫:找到油菜的「好基因」—新聞—科學網
    今年初,華中農業大學一支科研隊伍公布了8個甘藍型油菜的高質量參考基因組。近日,他們在原有研究基礎上,通過整合1689份油菜的基因組及重測序數據,構建了首個油菜泛基因組和比較基因組生物信息平臺BnPIR。 有了這一平臺,研究人員可以更快捷、更方便地檢索和使用油菜泛基因組相關資源。為何建設油菜泛基因組平臺?這是一個什麼樣的資料庫?油菜相關的多組學數據研究進展情況如何?
  • 「區塊鏈技術助力共建中國人群基因變異解讀標準資料庫」發布
    計算生命大數據」,分享大數據對醫學研究、應用的重要性,目前在基因測序方面取得的階段性成果,並在會上聯合發布「區塊鏈技術助力共建中國人群基因變異解讀標準資料庫」。「人類基因組大約3萬到4萬個基因,約30億個鹼基對,這是比任何大數據都更有意義的生命大數據。」論壇剛開始,深圳華大基因科技有限公司執行董事、營運長路軍發表演講時說,在人體40萬億到60萬億個細胞中,每個細胞中間最核心的是細胞核,也就是通常所說的基因。
  • 華中農業大學發布首個多作物遺傳變異參考面板資料庫
    多物種遺傳變異資料庫  近日,華中農業大學信息學院生物信息團隊在Nucleic Acids Research中發表題為「Plant-ImputeDB: an integrated multiple plant reference panel database for genotype imputation」的研究論文。
  • 科學網—全球首個「萬種原生生物基因組計劃」啟動
    本報訊(記者魯偉)12月30日,全球首個「萬種原生生物基因組計劃」正式對外發布。
  • 科學家呼籲關注全球基因組資料庫汙染
    科學家呼籲關注全球基因組資料庫汙染樣品處理有可能是導致DNA資料庫廣泛汙染的最主要原因
  • 微生物分類學研究利器:模式微生物基因組資料庫
    平臺不僅集成了目前所有公共來源的模式微生物物種和基因組數據,還發布了大量自測模式微生物基因組數據,是目前國內外模式微生物基因組數據最為豐富的平臺。並且集合了數據搜索下載,新種鑑定,基因組拼接與注釋等在線分析工具,為全球各個保藏中心和廣大分類學家提供一個分類學研究的利器。
  • 微生物分類學研究利器:模式微生物基因組資料庫
    平臺不僅集成了目前所有公共來源的模式微生物物種和基因組數據,還發布了大量自測模式微生物基因組數據,是目前國內外模式微生物基因組數據最為豐富的平臺。並且集合了數據搜索下載,新種鑑定,基因組拼接與注釋等在線分析工具,為全球各個保藏中心和廣大分類學家提供一個分類學研究的利器。
  • 國際首個、頂級期刊!海大包振民院士團隊發布軟體動物綜合基因組資料庫
    青島日報社/觀海新聞10月30日訊 日前,中國海洋大學海洋生物遺傳學與育種教育部重點實驗室包振民院士團隊取得重要成果,在國際資料庫領域頂級期刊《核酸研究》在線發表了國際首個軟體動物綜合基因組資料庫。構建系統便捷、功能全面的基因組學資料庫在解決這一難題上發揮著重要作用。當前,國際上廣泛使用的大型公共基因組資料庫仍主要聚焦並服務於人類醫學及小鼠、斑馬魚、果蠅等模式生物研究。
  • 《核酸研究》:高質量模式微生物基因組資料庫及分析平臺
    2018年,微生物所牽頭組織發起了全球模式微生物基因組測序計劃,從全球微生物資源保藏中心選擇目前未進行測序的模式微生物菌株(包括細菌、古菌和可培養真菌),預計5年內完成超過10,000種的細菌、真菌、古菌模式菌株基因組測序,建立全球微生物模式菌株基因組測序合作網絡,現已有來自美國的ATCC、日本JCM和NBRC、韓國的KCTC等超過12個國家的26個微生物資源保藏中心正式加入該計劃並形成了重要了階段性成果