非編碼RNA預測:rRNA

2021-01-16 微生態與微進化

非編碼RNA(ncRNA)是指一類本身不攜帶翻譯為蛋白質的遺傳信息(也即非mRNA),但可以執行多種生物學功能的RNA分子,對於微生物而言,非編碼RNA主要包括核糖體RNA(rRNA)、轉運RNA(tRNA)、細胞核小分子RNA(snRNA)、核仁小RNA(snoRNA)、細胞質小分子RNA(scRNA)、微小RNA(miRNA)、小分子幹擾RNA(siRNA)等。按照長度劃分大致可以分為兩類:小於50nt的miRNA、siRNA和50-500nt的rRNA、tRNA、snRNA、snoRNA等。對於細菌而言,ncRNA主要指tRNA、rRNA、sRNA三種,其中常見以tRNA和rRNA為主。

在往期文章基因組編碼基因預測中介紹了CDS的預測,今天為大家介紹ncRNA的預測。由於ncRNA種類繁多,特徵各異,缺少編碼蛋白質的基因所具有的典型特徵,現有的ncRNA預測軟體一般專注於搜索單一種類的ncRNA,如tRNAScanSE搜索tRNA、snoScan搜索帶C/D盒的snoRNAs、SnoGps搜索帶H/ACA盒的snoRNAs、mirScan搜索microRNA等等。rRNA是細胞內含量最多的一類RNA,約佔RNA總量的82%。它與蛋白質結合而形成核糖體,其功能是在mRNA的指導下將胺基酸合成為肽鏈。根據分子量不同,原核生物的rRNA可分三類:5S rRNA、16S rRNA和23S rRNA。真核生物的rRNA則有四類:5S rRNA、5.8S rRNA、18S rRNA和28S rRNA。原核生物和真核生物的核糖體均由大、小兩種亞基組成。

RNAmmer為一款專門的rRNA預測工具,該軟體所使用的隱馬爾科夫模型的訓練數據集選用5S rRNA資料庫和歐洲rRNA資料庫,具有極高的準確率。它既可以用來預測原核生物的5S、16S、23S rRNA,也可以用來預測真核生物的5S、5.8S、18S、28S Rrna,而且是不基於參考序列的從頭預測。該工具官網主頁如下:

http://www.cbs.dtu.dk/services/RNAmmer/

最新下載地址:

https://services.healthtech.dtu.dk

要想下載本地使用需首先在網站填寫姓名、郵箱、機構等信息進行申請,之後會將軟體下載連結會發送至郵箱。需要首先安裝Hmmer,然後RNAmmer軟體包下載解壓後就可使用。其使用方法如下所示:
rnammer -S bac -m lsu,ssu,tsu -xml out.xml -gff out.gff -h out.hmmreport -f out.rRNA.fasta genome.fasta-S    指定輸入序列的物種所屬的界:古菌arc、細菌bac或真核euk;-m    所需要預測的rRNA種類:'tsu'為5/8s rRNA,'ssu'為16/18s rRNA,'lsu'為23/28s rRNA。如果全部進行預測,則設置為為'tsu,ssu,lsu';-multi  並行運算,預測正反兩條鏈上所有的rRNA,最多並行運行6個計算,相當於-m lsu,ssu,tsu;-f    生成的rRNA的fasta結果文件名-h    生成的hmm結果報告文件名-gff    生成的rRNA的gff2文件名-xml  生成的xml結果文件名

rnammer -S bac -m lsu,ssu,tsu -gff twk.rRNA.gff -f twk.rRNA.fasta -h twk.rRNA.hmmreport new.scaffolds.fasta

在gff和fasta文件中可以看到5S、16S、28S rRNA的預測結果及其序列,如下所示:

在細菌基因組中,一般23S rRNA與5S rRNA是緊挨在一起的,而其與16S 人RNA之間則隔著較長的序列片段。

相關焦點

  • 非編碼RNA研究園地 | 一種大環肽與腫瘤發生的自然通訊
    在這裡我們發現長的非編碼RNA(IncRNA)LINC 00266-1編碼71個胺基酸肽.該肽主要與rna結合蛋白(包括m6A)相互作用。10種具有編碼潛力的INcRNAs的預測肽Rna結合蛋白rna m6a讀取器IGF2bp1特別有趣,因為IGF2bp1的蛋白質評分在已鑑定的rbp相互作用體rna m中排在前5位。
  • 史上最全非編碼RNA合集,擁有2021的第一篇SCI
    非編碼RNA的前世今生多年來,人們已經清楚的認識了一系列結構RNA和調節RNA。ncRNA的由來研究熱點近些年的研究熱點還是在LincRNA上面,未來還會發現更多的非編碼分子miRNA的研究方法長鏈非編碼RNA(LncRNA
  • 最強攻略2: 史上最全非編碼RNA資料庫匯總解讀
    長鏈非編碼RNA(Long non-coding RNA, lncRNA)是長度大於 200 個核苷酸的非編碼RNA。研究表明, lncRNA 在劑量補償效應、表觀遺傳調控、細胞周期調控和細胞分化調控等眾多生命活動中發揮重要作用,成為遺傳學研究熱點。
  • 崔慶華:在長非編碼RNA的世界中,一定存在著長非編碼RNA中的P53, PTEN
    編者按:去年年底,來自北京大學的研究人員在世界上首次創建並發布了長非編碼RNA疾病資料庫( LncRNADisease),這一資料庫收錄了160多種和長非編碼RNA有關的疾病,併集成了一個生物信息學工具用以預測新的人類長非編碼RNA和疾病的關係。
  • 非編碼RNA+m6A雙熱點
    m6A作為國自然的研究熱點,相關研究在各種高水平雜誌上頻頻出現;非編碼RNA作為國自然的寵兒,研究熱度同樣只增不減。相信今天的非編碼RNA+m6A雙熱點的思路可以彌補你沒有搶佔到m6A研究先機的困擾。m6A相關的lncRNAs是預測低級別膠質瘤患者總體生存率的潛在生物標誌物
  • 中國科大發現新型非編碼RNA - 非編碼RNA專區 - 生物谷
    最近,中國科學技術大學單革教授實驗室在國際知名雜誌《自然-結構和分子生物學》(Nature Structural & Molecular Biology)發表研究性論文,報導了其實驗室發現的一類新型非編碼RNA以及此類非編碼RNA的功能和功能機理。非編碼RNA是一大類不編碼蛋白質而在細胞中起著調控作用的RNA分子。
  • 【盤點】非編碼RNA與癌症關聯性研究進展
    隨著基因組學和生物信息學的發展,尤其是高通量測序技術的大量應用,科學家發現了越來越多的非蛋白編碼的轉錄單元(即非編碼RNA,ncRNAs),長非編碼RNA在許多重要的生物進程中都起著重要作用,在哺乳動物早期發育過程中lncRNA能調節多種細胞中的基因表達,癌細胞中lncRNAs的改變也被發現與腫瘤形成、發展和轉移密切相關,近期的研究還發現,非編碼RNA
  • 工具篇|coding and non-coding RNA,都到我碗裡來
    然而,近期的大量研究表明,許多先前注釋的ncRNA其實具有蛋白質編碼功能,而大量mRNA被證明具有非編碼功能,且該功能與其編碼的蛋白質無關。這一類同時具有蛋白編碼和非編碼功能的RNA可能是一類現階段更具探索價值的RNA群體,被稱為「雙功能RNA」或「cncRNA(coding and non-coding RNA)」。
  • 揭示反義長鏈非編碼RNA順式調控基因轉錄的新模式
    沈曉驊課題組在《細胞幹細胞》發表論文揭示反義長鏈非編碼RNA順式調控基因轉錄的新模式  清華新聞網3月18日電 3月17日,清華大學醫學院沈曉驊課題組在《細胞幹細胞》(Cell Stem Cell)在線發表了題為《反義長鏈非編碼RNA調控基因表達和多能幹細胞分化
  • 2月長非編碼RNA和環狀RNA研究推薦
    長非編碼RNA研究推薦1.Nature Medicine: 調控巨噬細胞膽固醇穩態及動脈粥樣硬化的長非編碼RNA該研究首次證明長非編碼RNA可以通過揭示了長非編碼RNA在心血管疾病中的重要作用,為該類疾病的治療提供了新的思路。
  • 我國學者揭示長鏈非編碼RNA順式調控基因表達的新模式
    RNA調控基因表達和多能幹細胞分化),系統揭示了長鏈非編碼RNA順式調控基因組上鄰近基因的表達,以及它們在幹細胞分化和發育中的作用。LncRNA的功能分類及預測,是非編碼RNA領域一直追尋和探索的重要問題,它對於認識非編碼RNA生物學功能和存在的意義具有重要作用。沈曉驊研究組發現,lncRNA在基因組上的分布不是隨機的,並根據它們在基因組上與鄰近蛋白編碼基因的位置關係進行了分類。其中,反義長鏈非編碼RNA(divergent lncRNAs)與鄰近蛋白基因在基因組上以頭對頭的方式反向排列和轉錄。
  • 環狀RNA(circRNA)資料庫大匯總,快來看看有沒有你需要的!
    此外,更新後的資料庫包含了人類和小鼠之間環狀 rna 的保守性分析。該資料庫預測了已知的 109 個 RNA 結合蛋白數據集與 circbase 中的 circRNA 的結合位點,並利用 Targetscan 軟體預測了 miRNAs 與 circRNA 的潛在結合位點。
  • 非編碼RNA研究技術大盤點
    非編碼RNA可火了,miRNA大火燒了十幾年,現在慢慢地把lncRNA的領域也給點著了。現在可能連實驗室的插槍頭阿姨都知道絕大多數的RNA分子並不翻譯,這非編碼RNA(noncoding RNA),包括miRNA、lncRNA等。
  • 新技術「解密」非編碼RNA
    作者| 韓揚眉增強子—啟動子RNA連結圖 薛願超供圖人類基因組計劃研究表明,人類基因組中只有不到2%的蛋白質編碼序列,而剩餘98%為非編碼核酸序列。這些非編碼序列可能有功能,也可能僅僅是副產物,曾被稱為「垃圾DNA」或者「暗物質」。
  • 2017年不能錯過的長非編碼RNA研究推薦
    2017年即將過去,這一年的非編碼RNA研究取得了很多重磅級成果。與早先的主要是在不同類型的疾病(癌症)中大規模鑑定非編碼RNA,今年的研究是對非編碼RNA機制的更深入探索,給我們展現了作用方式更豐富多彩的非編碼RNA世界。
  • 環狀RNA:非編碼RNA中的一顆明星
    已有研究證明circRNAs在 動脈粥樣硬化血管疾病、神經紊亂、感染疾病和癌症中具有重要作用,在直腸癌和胰腺管惡性腫瘤中異常表達,這暗示circRNAs可以作為預測或檢測某些疾病的生物標記分子。與miRNA和lncRNA相似,circRNAs已經成為RNA研究領域的一大熱點,廣泛參與到生命的各個反應中。本文簡單介紹了miRNA的種類、形成、特點,講述了其潛在功能及與一些疾病的關係。
  • 德州學院在《核酸研究》發布功能性長非編碼RNA資料庫升級版
    該研究創建了一個升級版實驗驗證綜合長非編碼RNA資料庫,包含了124個物種、1082種疾病等相關的4010個實驗證實的功能性長非編碼RNA,並研究了長非編碼RNA的物種分布、與癌症和其他疾病的關係,以及與其他生物大分子的相互作用信息等,對長非編碼RNA特徵提取、預測器發展和新功能認識具有重要意義。王吉華教授為該論文通訊作者。
  • RNA Biol:章張等發表長非編碼RNA分類問題綜述文章
    近日,中國科學院北京基因組研究所基因組科學與信息重點實驗室的「百人計劃」研究員章張及其團隊,與沙特阿卜杜拉國王科技大學(King Abdullah University of Science and Technology)開展科研合作,對長非編碼RNA的分類問題進行了系統綜述,相關論文在RNA Biology發表。
  • Cell|長非編碼RNA種屬特異性加工決定其功能差異
    RNA在不同物種來源幹細胞中的特異性加工是其發生適應性功能變化的重要機制,為深入理解長非編碼RNA的功能及進化提供了新思路。序列及基因組位置保守的長非編碼RNA在人胚胎幹細胞中更多的定位在細胞質內,而在鼠胚胎幹細胞中則更多的滯留在細胞核內。值得一提的是,多個定位在人胚胎幹細胞細胞質中的長非編碼RNA參與維持人幹細胞自我更新,而相應的基因組位置保守的長非編碼RNA則更趨向於定位在鼠胚胎幹細胞核內,對幹細胞維持沒有明顯作用。