科學家呼籲關注全球基因組資料庫汙染

2021-01-10 科學網
科學家呼籲關注全球基因組資料庫汙染 樣品處理有可能是導致DNA資料庫廣泛汙染的最主要原因

 

2月16日發表在《公共科學圖書館·綜合》(PLoS ONE)期刊上的一份研究報告稱康乃狄克大學的遺傳學家Mark Longo及同事發現由頂級公共測序機構提供的測序結果構建的基因組資料庫中的大約1/5的細菌、植物和非靈長類動物基因組數據受到了人類DNA的汙染,樣品處理有可能是導致DNA資料庫廣泛汙染的最主要原因。這一研究報告引起了生物研究人員及各大權威媒體的高度關注,《科學家》(The Scientist)雜誌以及《自然》(Nature)雜誌均在其官方網絡上第一時間對這一事件進行了報導。

 

Mark Longo等在報告中呼籲科學家們需更加努力以確保測序獲得的基因組不受到汙染,並應對來自公共基因組資料庫的基因組進行潛在汙染檢測。

 

「基因組汙染是一個大問題,但卻不是一個新問題,」加州大學進化生物學家、美國能源部聯合基因組研究所系統發育基因組學計劃負責人Jonathan Eisen說:「這篇論文或可幫助提醒人們注意這一問題。」

 

汙染有可能在測序的任何一個階段導入到基因組序列中。有可能是空氣中的細菌落到了樣品中,或是滅菌後仍殘留在試劑中的DNA片段。但最常見的汙染原因則可能是科學家自身,譬如在擴增前將自身的一個細胞落入了樣品中。

 

「研究人員戴手套進行實驗操作不僅是對自身的保護,並且也可避免樣品受到自身的汙染,」論文的作者之一、康乃狄克大學分子遺傳學家Rachel O'Neill說道。

 

O'Neill實驗室的一位大學生在對基因組資料庫進行保守序列篩查時,興奮地發現大量物種間均存在一個相同的序列。然而當他嘗試在實驗室重複這些結果時卻失敗了。這位學生不禁開始質疑資料庫基因組是否存在汙染,於是他與實驗室的同事合作對四個公共資料庫(UCSC Genome Browser資料庫,NCBI的GenBank資料庫,DOE Joint Genome Institute資料庫以及Ensembl)中保存的所有非靈長類基因組進行了人類特異性重複序列Alu元件的篩查。

 

在搜索的2057個原始序列基因組中,研究人員發現有454個存在人類Alu元件序列的汙染,約佔總數的22.39%。「我們發現汙染的水平高到足以應引起人們注意的程度,」O'Neill說;「而這還僅只是來自於人類的汙染,可以想像會有多少來自實驗室常見物種例如大腸桿菌等的汙染存在。」

 

Eisen指出:「大量論文曾報導過物種間的水平基因轉移,如今不禁讓人質疑是否都僅是人類DNA汙染數據所致。人類汙染的頻率將要求科學家們不得不完成一些超過標準的實驗以確證他們的實驗結果。」

 

「當涉及到人類測序時,高水平的序列汙染有可能會引發嚴重的後果,」O'Neill說:「在一個魚樣本中找到Alu元件非常的簡單。但是在一個人類樣本中尋找另一個人的樣本就非常的困難。根據如此高汙染的序列來決定個體化治療的策略有可能會導致難以想像的悲劇。「

 

「隨著研究的不斷推進,科學家們必須投入更多的資金進行質量控制,然而在追求研究數據的壓力下質量控制的重要性卻被人拋在了腦後,」Eisen說:「如果每個人都能意識到數據質量的重要性將會有多好啊,但是目前這似乎很難做到。」

 

 

 

 

特別聲明:本文轉載僅僅是出於傳播信息的需要,並不意味著代表本網站觀點或證實其內容的真實性;如其他媒體、網站或個人從本網站轉載使用,須保留本網站註明的「來源」,並自負版權等法律責任;作者如果不希望被轉載或者聯繫轉載稿費等事宜,請與我們接洽。

相關焦點

  • 我國建成全球第四個綜合基因組權威資料庫
    人民網北京12月20日電(趙竹青)近日,中國科學院北京基因組研究所生命與健康大數據中心團隊題為「The BIG Data Center: from deposition to integration to translation」(北京基因組研究所生命與健康大數據中心:從存儲到整合
  • 在暫停人類種系基因組編輯提議遭反對後 WHO呼籲建立中央登記處
    在世界衛生組織(WHO)最近呼籲全球暫停進行人類種系基因組編輯的臨床應用之後,一些科學家反對這一想法,暗示全面禁止是多餘的和有問題的。
  • 首個全球人群基因組多樣性和祖源信息資料庫發布
    該研究分析了涵蓋全球範圍107個國家的356個人類族群的基因組多樣性和祖源信息,並發布了開放獲取的專門資料庫——「PGG.Population」 (群體基因組學·族群,網址:https://www.pggpopulation.org/)。
  • 天津大學:新型冠狀病毒基因組注釋資料庫向全球開放
    從天津大學獲悉,該校生物信息中心新型冠狀病毒基因組注釋資料庫上線,並納入中國國家基因組科學數據中心向全球開放服務。面對疫情蔓延,我國科技界正在爭分奪秒與病毒抗爭,開展病毒防治相關藥物的研發。鑑於目前在美國NCBI網站上公布的新型冠狀病毒全基因組序列,很大一部分缺少詳細的基因組注釋,尤其是對多聚蛋白酶切位點的注釋,天津大學生物信息中心的高峰教授、羅昊博士採用已研發的ZCURVE_CoV系列軟體對包括新型冠狀病毒(2019-nCoV)在內的兩千餘株冠狀病毒的基因組進行了基因識別和酶切位點預測,並以資料庫(ZCURVE_CoV Database)的形式提供網上服務。
  • 全球首個作物黃萎病菌資源和基因組資料庫正式上線
    新京報訊(記者 周懷宗)近日,全球首個作物黃萎病菌資源和基因組資料庫搭建成功並正式上線。該資料庫由中國農業科學院植物保護研究所作物黃萎病研究團隊與美國加州大學戴維斯分校聯合完成,用戶可在該網站查閱收錄的菌種資源信息、測序基因組可視化展示、數據挖掘和分析等工作。
  • 泛基因組資料庫:找到油菜的「好基因」
    這裡的圖是指參考基因組(參考基因組作為生命科學研究中的「標準地圖」),而我們目前使用的「標準地圖」(單一參考基因組)仍然存在大量的「暗區和盲區」。單一參考基因組為重要性狀相關遺傳位點和基因的挖掘與利用設置了重重障礙。為了克服這些困難,科學家提出了通過整合多個代表性種質資源的基因組信息,構建泛基因組的研究思路和策略。
  • 微生物分類學研究利器:模式微生物基因組資料庫
    平臺不僅集成了目前所有公共來源的模式微生物物種和基因組數據,還發布了大量自測模式微生物基因組數據,是目前國內外模式微生物基因組數據最為豐富的平臺。並且集合了數據搜索下載,新種鑑定,基因組拼接與注釋等在線分析工具,為全球各個保藏中心和廣大分類學家提供一個分類學研究的利器。
  • 微生物分類學研究利器:模式微生物基因組資料庫
    由國家微生物科學數據中心(世界微生物數據中心)建立的模式微生物基因組資料庫(gcType)http://gctype.wdcm.org/,是為分類學家進行基因組研究、新種鑑定的一個非常有價值的工具平臺。
  • 《核酸研究》:高質量模式微生物基因組資料庫及分析平臺
    近日,《核酸研究(Nucleic AcidsResearch)》在線發表了國家微生物科學數據中心(中國科學院微生物研究所微生物資源與大數據中心、世界微生物數據中心)團隊關於全球模式微生物基因組資料庫gcType的文章。gcType是由我國牽頭的全球模式微生物基因組測序計劃的重要成果。
  • 《核酸研究》:高質量模式微生物基因組資料庫及分析平臺
    近日,《核酸研究(Nucleic AcidsResearch)》在線發表了國家微生物科學數據中心(中國科學院微生物研究所微生物資源與大數據中心、世界微生物數據中心)團隊關於全球模式微生物基因組資料庫>、古菌模式菌株基因組測序,建立全球微生物模式菌株基因組測序合作網絡,現已有來自美國的ATCC、日本JCM和NBRC、韓國的KCTC等超過12個國家的26個微生物資源保藏中心正式加入該計劃並形成了重要了階段性成果。
  • 泛基因組資料庫:找到油菜的「好基因」—新聞—科學網
    今年初,華中農業大學一支科研隊伍公布了8個甘藍型油菜的高質量參考基因組。近日,他們在原有研究基礎上,通過整合1689份油菜的基因組及重測序數據,構建了首個油菜泛基因組和比較基因組生物信息平臺BnPIR。 有了這一平臺,研究人員可以更快捷、更方便地檢索和使用油菜泛基因組相關資源。為何建設油菜泛基因組平臺?這是一個什麼樣的資料庫?油菜相關的多組學數據研究進展情況如何?
  • OncoKB:腫瘤藥物靶點相關基因組變異資料庫
    OncoKB收集了腫瘤發生發展相關的,具有臨床意義的基因組變異信息,對於每個變異,提供了其對應的生物學效應,藥物互作,預後和治療意義等詳細信息,對應的文章連結如下http://ascopubs.org/doi/full/10.1200/PO.17.00011資料庫的網址如下
  • 全球三大蛋白質資料庫將合而為一
    新華網華盛頓10月30日電(記者毛磊)美國和歐洲有關機構最近宣布,將把全球三大主要蛋白質資料庫資源集中起來,建設一個新的蛋白質資料庫,以方便各國研究人員更好地利用不斷膨脹的人類基因組和蛋白質科研信息。    新的「聯合蛋白質資料庫」預計在三年內建成,美國國家衛生研究所已決定為這項計劃斥資1500萬美元。
  • 科學家開發出評估病毒基因組質量和完整性的新工具
    科學家開發出評估病毒基因組質量和完整性的新工具 作者:小柯機器人 發布時間:2020/12/22 22:27:01 美國勞倫斯伯克利國家實驗室Nikos C.
  • ...結果今日發布:經與全球資料庫中新冠病毒全基因組序列進行比對...
    【廣東發布陸豐疫情病毒溯源結果】陸豐疫情病毒溯源結果今日發布:經與全球資料庫中新冠病毒全基因組序列進行比對分析,發現屬於香港本地流行的HK1分支,與香港流行毒株的病毒序列高度同源,同源百分率達99.99%。
  • 全基因組單核苷酸變異資料庫建立
    有助推動我國及周邊國家人群的進化遺傳和醫學研究 中國科學院上海營養與健康研究所/馬普計算生物學研究所徐書華團隊新近建立的全基因組單核苷酸變異資料庫相關研究論文日前在線發表在國際學術刊物《基因組學與應用生物學》上。
  • 中外科學家呼籲加強對海洋微塑料的汙染研究和管控—新聞—科學網
    來自美國、俄羅斯、西班牙、挪威、日本、越南、中國等國家的海洋塑料汙染研究領域的專家教授和環保人士等在為期3天的研討會期間,圍繞海洋微塑料在海洋中的來源和歸趨、海洋微塑料與化學汙染物的相互作用、微塑料對海洋生物的生態效應、公民科學家參與解決海洋垃圾問題及海洋微塑料防治措施等議題進行探討交流。 「海洋塑料垃圾汙染已成為人類迫切亟待應對解決的重大全球性海洋環境問題。」
  • 細胞是否被交叉汙染或錯誤辨識
    旗下雜誌將從5 月開始要求作者鑑定論文中所用細胞系;2015年6月有報導稱一科學家由於用錯細胞系,撤銷Nature論文。其實關於細胞汙染問題不少機構、學者一直呼籲各個實驗室及相關機構重視。同時也看到不少人在網上諮詢細胞STR鑑定,因此今天特將本人整理的資料和大家分享。據統計約30%細胞系被交叉汙染或錯誤辨識[1-6],因使用了交叉汙染或錯誤辨識的細胞而導致研究結論錯誤、結果不可重複、臨床細胞治療災難性後果……,這浪費大量時間、精力和金錢。
  • 中國農科院繪製油菜基因組轉錄全景圖,構建功能基因資料庫
    中國農科院繪製油菜基因組轉錄全景圖,構建功能基因資料庫 劉志偉 童超波 劉勝毅/科技日報 2020-07-31 07:45
  • 新晉諾貝爾生理學或醫學獎獲得者呼籲:給青年科學家更多的關注...
    此外,他還將出席世界頂尖科學家青年論壇,給後輩提供自己的經驗和建議,倡議扶持青年科學家成長。阿爾特出生在紐約市,1956年在羅徹斯特大學獲得文學士學位,1960年在該校得到醫學學位。四年後與1976年諾貝爾生理學或醫學獎得主巴魯克·塞繆爾·布隆伯格發現了澳大利亞抗原,後證實與B肝病毒有關。阿爾特還以動物模型來研究人體免疫缺陷病毒,並確定了C型肝炎病毒。