「垃圾基因」資料庫收穫全球遺傳學家「粉絲」—新聞—科學網

2021-01-10 科學網
上線一個月就有來自22個國家的1446次訪問 「垃圾基因」資料庫收穫全球遺傳學家「粉絲」

 

「打個比喻,如果我們的遺傳信息是一座山,遺傳學家知道這山裡面有金子,但他們用的是鋤頭。我們的工作就是給他們打造『挖礦機』,幫他們把這些金子更快地挖出來;並把我們已經挖到的東西展現出來,構建成資源庫,方便他們使用。」華中農業大學信息學院、生物醫學與健康學院教授龔靜這樣解釋他們的研究。

龔靜的團隊最近在英國《核酸研究》雜誌先後發表3篇文章。他們通過對多種癌症中遺傳變異的功能進行深入分析,發現了大量可調控非編碼核糖核苷酸(ncRNA)和可選擇性多聚腺苷酸化(APA)的遺傳變異位點,構建了在線資料庫,並開放給全球的研究者共享。

「其中一個資料庫上線1個多月,就已經有22個國家1446次的訪問了!」龔靜接受科技日報記者採訪時表示,她為自己的這一項研究能收穫世界各地的粉絲而感到欣慰。

從「垃圾基因」裡面「挖」寶

龔靜對其中一項研究進行了詳細的解釋,她說:「表達數量性狀座位(eQTL)是指基因組上可以影響基因表達的遺傳變異位點。eQTL分析是解析遺傳功能和尋找致病基因的重要方法之一,已廣泛用於遺傳研究中。」

基因分為編碼基因和非編碼基因。然而,目前大部分研究專注於編碼基因相關的eQTL鑑定, 非編碼相關的eQTL系統分析非常少。龔靜表示,非編碼比編碼基因數據更龐大。十年前大家覺得不重要,甚至有人把它稱為「垃圾基因」,但現在大家發現它有越來越多的功能,甚至參與到癌症的發生發展過程。

從事生物信息技術研究多年的龔靜,一年前正是看到了非編碼相關eQTL系統分析的欠缺,決定帶領團隊來填補這一空白。他們使用癌症基因組圖譜(TCGA)近1萬多個樣本的基因組和非編碼表達量信息,系統分析了33種癌症中遺傳變異與非編碼表達量之間的關係。

通過大樣本、多組學分析,在33種癌症中,他們一共鑑定得到與長非編碼相關的600多萬種順式eQTLs和70多萬種反式eQTLs。他們進一步將已鑑定的eQTLs和癌症病人生存信息關聯並分析後,確定了與患者總生存時間相關的8235個長非編碼RNA-eQTLs和116個microRNA-eQTLs。

在此基礎上,他們構建了一個在線資料庫。在這個網站上,其他研究者可以方便地瀏覽及查詢多種癌症相關的eQTL數據。

這些eQTL數據,將有助於理解遺傳風險等位基因如何促進腫瘤的發生和發展,幫助遺傳學家更好地認識非編碼基因在癌症進展中的作用和生物學機理,為潛在的癌症靶標的開發提供新思路。

還可以擴展到動物和植物

本科學醫和博士選擇生物信息學的背景,讓龔靜有了更多的跨學科思維。她認為,生物信息學家的一個重要責任就是為生物學家和遺傳學家,以及臨床工作者提供更方便的工具和數據資源。

龔靜說:「因為非編碼相關的eQTL研究很少,這也就意味著能供我們參考的研究方法也比較少,所以方法的選擇、數據的收集分析、相關資料庫的構建等需要我們知難而進。為了提高我們研究的可信度和可行度,我們使用的都是來自專業癌症資料庫的表型樣本和存活信息,這些都是經過業界認證的可靠數據。」

在資料庫建設方面,怎樣體現專業科學的同時又讓用戶易用易懂?這花費了他們大量的時間。他們更迭了多個版本,從配色、排版和內容的填充都經過多次討論,目的就是給其他科研人員提供一個直觀的資料庫,盡最大努力呈現一個專業資料庫應有的特徵。

他們的遺傳研究方法不僅可以用於癌症還可以擴展到其他的疾病。同時,還可以擴展到對動物和植物的研究。近期,他們通過廣泛收集動物的基因組測序數據並進行處理,構建了13個物種的基因組參考面板,打造了一個用於動物遺傳數據填補的資料庫。這個資料庫可以廣泛應用到動物遺傳育種及品質改良等研究中。資料庫中的數據及提供的工具可以極大地節省研究的成本和時間,大大提高科研效率。

龔靜說,後期他們將繼續維護並持續更新這些資料庫,希望能讓更多研究者受益。另外,他們也考慮根據已開發的資料庫和已鑑定的有潛在功能的遺傳位點,將他們的研究進一步深化。

具體來說,就是將生物信息方法得到的結果與人群分子流行病學、分子生物學相結合,深入挖掘遺傳位點的功能,希望通過多維度的分析尋找並鑑定某種癌症相關的生物標誌物或者藥物靶標,真正實現產學研結合,推動臨床生物醫學實踐,以此造福大眾。

 

特別聲明:本文轉載僅僅是出於傳播信息的需要,並不意味著代表本網站觀點或證實其內容的真實性;如其他媒體、網站或個人從本網站轉載使用,須保留本網站註明的「來源」,並自負版權等法律責任;作者如果不希望被轉載或者聯繫轉載稿費等事宜,請與我們接洽。

相關焦點

  • 泛基因組資料庫:找到油菜的「好基因」—新聞—科學網
    首個油菜泛基因組 甘藍型油菜是研究植物多倍化和進化的模式物種。遺憾的是,甘藍型油菜一直缺乏專門的基因組資料庫,研究人員不得不藉助蕓薹屬資料庫(BRAD)和其他公共資料庫(Genoscope和Ensembl等)來獲取甘藍型油菜的基因組數據。 「這些資料庫是基於單一品種基因組和注釋,並且缺乏多組學數據和群體變異信息。」
  • 微擬球藻設計與合成資料庫建立—新聞—科學網
    為促進全球微擬球藻研究群體的資源共享和通力合作,加速工業產油微藻合成生物學和分子育種技術的進展,中科院青島生物能源與過程研究所單細胞中心聯合中外14個實驗室組成國際聯合團隊,發布了「微擬球藻設計與合成資料庫」(NanDeSyn:http://www.nandesyn.org),該工作近日發表於《植物學期刊》
  • 基因是如何被調節的?—新聞—科學網
    瑞士日內瓦大學遺傳學家、項目團隊成員Emmanouil Dermitzakis說,這項耗資1.5億美元的項目研究了數百名最近去世的人的50多種組織,在近日發表在《科學》《科學進展》《細胞》等期刊的論文中,GTEx項目研究人員介紹了對這些數據的最終分析。 這些論文構成了迄今為止影響基因表達變異的最全目錄。
  • 全基因組測序重現小麥「家世」—新聞—科學網
    在短短的幾千年時間裡,小麥便從起源地西亞的「肥沃新月地帶」擴展到全球各地不同的生長環境中,成為世界上種植最廣泛的作物之一。 小麥為何能如此成功的適應不同生長環境?「祖先」小麥又是如何進化為現代小麥的?小麥遺傳學家們不斷探索,試圖揭示小麥的「家世」。
  • 江西一醫院發現RH血型新基因型!刷新全球資料庫
    刷新全球資料庫 2020-10-16 12:48 來源:澎湃新聞·澎湃號·媒體
  • 疫情之下,博物館設法自救—新聞—科學網
    因為疫情,加州科學院的科研人員無法在實驗室工作,但一年一度的珊瑚排卵期不容錯過,他們利用紅外攝像頭觀測並直播,收穫了160萬粉絲。哈佛大學比較動物學博物館的許多職工在家辦公,他們忙著增加資料庫中的標本記錄,為數百萬個標本添加經緯度坐標。 史密森尼國家歷史博物館藏有大量植物標本的高清圖像,研究人員可在線仔細查閱這些內容。
  • 基因編輯可能導致人類胚胎染色體嚴重混亂—新聞—科學網
    澳大利亞國立大學遺傳學家Gaétan Burgio表示,這些靶向效應更重要、更難以消除。 編輯人類胚胎來預防遺傳病的安全爭論一直在持續,因為這樣做會對基因組造成永久、可遺傳的改變。「如果把以生殖為目的的人類胚胎基因編輯活動比作是太空飛行,那麼最新的研究相當於把發射臺上未起飛的火箭給炸了。」美國加州大學伯克利分校研究基因編輯的Fyodor Urnov說。
  • 東亞人為何有「更多」尼安德特血統—新聞—科學網
    10年來,遺傳學家一直在講述尼安德特人或他們的DNA序列如何在今天的歐洲人、亞洲人及其後代中存在的故事。
  • —新聞—科學網
    未參與該研究的英國劍橋大學人口遺傳學家Aylwyn Scally說:「我相信非洲南部是人類進化的一個重要地區。」但是,對現存人類DNA的研究並不能揭示我們祖先的確切位置。「如果我們這個時代所有人的祖先都出現在一個小區域,那將是令人震驚的。」
  • 沙特人類基因組計劃旨在找出治病新途徑—新聞—科學網
    剛從美國回國的Alkuraya是一位年輕的遺傳學家。 在這些家庭將DNA樣本提供給他數月後,Alkuraya找出了答案:所有4位父母都攜帶一種完全相同的致病突變——基因ADAT3發生了變化。儘管這種突變對父母是無害的,但嚴重影響了繼承兩個有誤基因的兒童。結果是,他們的細胞無法產生能將DNA轉化成蛋白質的酶。
  • 2019全球華人遺傳學大會在復旦大學舉行—新聞—科學網
    25日,以題為「遺傳學:技術創新與協同發展」2019全球華人遺傳學大會在復旦大學舉行。海內外華人遺傳學家就人類遺傳與表型組學、生殖發育與幹細胞生物學、植物遺傳與農業科學、基因組與生物信息學、基因編輯與前沿技術等進行廣泛、深入的交流和探討,把脈國際遺傳學發展趨勢。   復旦大學黨委書記焦揚在開幕式上致辭。
  • 科學家發現無可識別基因的最怪病毒—新聞—科學網
    研究小組在bioRxiv預印本伺服器上報告說,當研究人員對其基因組進行測序時,發現沒有一個基因與之前科學家遇到的相匹配。 在廢水和呼吸系統中搜尋病毒的美國紐約大學的Elodie Ghedin對這種病毒並不感到驚訝。
  • 科學家呼籲關注全球基因組資料庫汙染
    科學家呼籲關注全球基因組資料庫汙染 Mark Longo等在報告中呼籲科學家們需更加努力以確保測序獲得的基因組不受到汙染,並應對來自公共基因組資料庫的基因組進行潛在汙染檢測。 「基因組汙染是一個大問題,但卻不是一個新問題,」加州大學進化生物學家、美國能源部聯合基因組研究所系統發育基因組學計劃負責人Jonathan Eisen說:「這篇論文或可幫助提醒人們注意這一問題。」
  • 刷新全球血型資料庫!江西一醫院發現RH血型新基因型
    江西省兒童醫院15日發布消息稱,該院近日發現了RH血型系統的一種新型D等位基因型,並已通過美國國立生物技術信息中心專家審核,刷新了全球血型資料庫。今年9月26日,江西省兒童醫院所提交的該變異基因特異性核酸序列在美國國立生物技術信息中心的「GenBank資料庫」進行了公布,核酸序列號為MN845955。
  • 新聞人物:遺傳學家、小麥育種專家李振聲院士
    新聞人物:遺傳學家、小麥育種專家李振聲院士 2007年02月27日 10:26 來源:中國新聞網
  • 新的基因組資料庫為調控DNA尋找靶基因
    休斯頓大學(University of Houston,位於美國德克薩斯州)的進化遺傳學家Dan Graur就並不是大科學的狂熱者。麻薩諸塞州坎布裡奇市的計算生物學家Simon Xi目前在自己的藥物研發工作中運用GTEx數據,他認為這些資料庫是至關重要的,但是他也指出,這些資料庫應當為用戶提供更友好的界面:「我們面臨著一個艱巨的挑戰——該如何整合所有這些數據呢?」
  • 前瞻基因產業全球周報第40期:重大突破!科學家治癒帶宮頸癌細胞小鼠
    RNA數據的深度挖掘,對這些植物中的miRNA進行系統鑑定、注釋和分析,構建了迄今為止世界上最為綜合全面的植物miRNA資料庫——PmiREN。時隔4個月 華大智造再訴美國測序儀廠商侵犯專利10月8日,《每日經濟新聞》從華大智造方面獲悉:國慶假期前一天(9月30日),華大智造旗下公司Complete Genomics(以下簡稱CG)在美國北加州地區法院提起訴訟,反訴Illumina公司侵犯其專有的規則陣列載片技術(Patterned array)。
  • 基因讓尼安德特人「很怕疼」—新聞—科學網
    近日發表在《當代生物學》上的一項研究發現,這些遠古人類親屬的蛋白質NaV1.7的編碼基因有3個突變,該蛋白質會向脊髓和大腦傳遞疼痛感。他們還發現,在英國人樣本中,那些遺傳了尼安德特人版本NaV1.7的人往往比其他人的疼閾值更低。 「對我而言,這是第一個使用現代人的基因改造模型了解尼安德特人的生理機能的例子。」德國馬普學會進化人類學研究所的 Svante Paabo說。
  • 新方法讓「沉默」基因「說話」—新聞—科學網
    研究人員通常使用活細胞內編碼基因的標記技術,將螢光蛋白精確插入蛋白編碼框研究基因的功能,但該方法往往對lncRNAs等非編碼基因和低豐度轉錄基因束手無策。 近日,中國科學院腦科學與智能技術卓越創新中心(神經科學研究所)、上海腦科學與類腦研究中心、神經科學國家重點實驗室研究員楊輝研究組和周海波研究組合作,通過內源基因的啟動子驅動嚮導RNA(sgRNA)表達,結合SPH—OminiCMV螢光報告系統,成功實現lncRNAs基因和低豐度基因表達的動態示蹤。
  • 大型基因組研究揭示失眠機理—新聞—科學網
    與抑鬱症、心血管疾病有關