長鏈非編碼RNA(Long non-coding RNA, lncRNA)是長度大於 200 個核苷酸的非編碼RNA。研究表明, lncRNA 在劑量補償效應、表觀遺傳調控、細胞周期調控和細胞分化調控等眾多生命活動中發揮重要作用,成為遺傳學研究熱點。以下是針對長鏈非編碼lncRNA的資料庫:
http://www.cuilab.cn/lncrnadisease
LncRNADisease資料庫整理了實驗支持的lncRNA-疾病關聯數據的資源,還整合了用於預測新型lncRNA-疾病關聯的工具該數據,旨在提供人類lncRNA的全面功能注釋。此外,LncRNADisease還可以在各種水平上促進lncRNA相互作用,包括蛋白質,RNA,miRNA和DNA,目前提供1564個人類lncRNAs對疾病的預測結果。
詳情請戳:LncRNADisease:IncRNA相關疾病資料庫
http ://bioinfo.life.hust.edu.cn/lncRNASNP
IncRNASNP 是提供人、小鼠長鏈非編碼RNA(lncRNA)中單核苷酸多態性(SNP)的全面資源的資料庫。它包含lncRNA中的SNP位點,探究SNP對lncRNA結構的影響,lncRNA中的突變以及lncRNA:miRNA結合,分析SNP位點對於lncRNA與miRNA結合的影響。lncRNASNP2資料庫中人類lncRNA和SNP的數量已更新為141,353和10,205,295。
詳情請戳:lncRNASNP:LncRNA相關SNP突變資料庫
http : //www.bio-bigdata.net/lnc2cancer/
Lnc2Cancer是一個手動管理的資料庫,作者在PUBMED搜集了超過6500篇文獻中LncRNA與癌症之間的關聯,完善了lncRNA-癌症關聯並進行了注釋,可提供lncRNA或circRNA與人類癌症之間全面的實驗支持關聯進行評分以及能夠瀏覽癌症中LncRNA譜的高通量實驗。
詳情請戳: Lnc2Cancer:腫瘤相關lncRNA資料庫
http://www.rna-society.org/rnalocate
RNALocate是提供一個RNA亞細胞定位的高效的處理、瀏覽和分析的資源庫。當前版本的RNALocate記錄了超過190,000個與RNA相關的亞細胞定位條目,並提供了實驗和預測證據,涉及65種物種中超過105,000個具有44個亞細胞定位的RNA,主要包括智人,小家鼠和釀酒酵母等,有超過21800條RNA(9種RNA類型,包括mRNA, miRNA, lncRNA等等)和42種亞細胞定位(主要包括細胞核、細胞質、內質網和核糖體等)。
詳情請戳:RNALocate:非編碼RNA亞細胞定位檢索工具
LNCipedia是一個公共資料庫,用於存儲較長的非編碼RNA(lncRNA)序列和注釋。該資料庫整合了多個人類(Human)lncRNA資料庫信息,很大程度上解決了lncRNA資料庫各自為政的問題。整合的資料庫包括LncRNAdb、Broad Institute、Ensembl、Gencode、Refseq等,並賦予了它們統一ID,同時還包含ncRNA轉錄本在基因組位置、長度、結構、miRNA結合、lncRNA在其他資料庫中相關記錄等信息。使用者可以在該資料庫中錄入、搜索和下載lncRNA相關信息現在已經升級到5.3版本。
詳情請戳:LNCipedia:人類lncRNA資料庫
http://annolnc.gao-lab.org/
AnnoLnc是一個系統地注釋新的人類lncRNA的一站式網站。目前是該工具基於700多個數據資源和各種工具鏈,AnnoLnc的系統性注釋涵蓋了基因組位置,二級結構,表達模式,轉錄調控,miRNA相互作用,蛋白質相互作用,遺傳關聯和進化。
詳情請戳:Annolnc:一站式lncRNA查詢資料庫
MicroRNA(miRNA )是一類內生的、長度約為20-24個核苷酸的小 RNA,其在細胞內具有多種重要的調節作用。每個 miRNA 可以有多個靶基因的表達,而幾個 miRNA 也可以調節同一個基因的表達。據推測,miRNA 調節著人類三分之一的基因。以下是針對miRNA的資料庫:
http://ngs.ym.edu.tw/ym500v2/index.php
YM500v2是用於個人smRNA-seq數據集的miRNA定量,是鑑定miRNA 和新型miRNA預測的集成資料庫。YM500v2中包含了YM500之後開發的與miRNA相關的新算法,納入了8000多個與癌症相關的smRNA-seq數據集,可用於microRNA研究,是miRNA的表達譜數據以及相關分析。YM500v2可用於靶基因預測、組間差異表達等分析進行處理。
詳情請戳:YM500v2:用於人類癌症miRNA研究的小型RNA測序資料庫
http://starbase.sysu.edu.cn/
Starbase結合源自10882個RNA-seq和10546個miRNA-seq數據的32種癌症的基因表達數據,ENCORI允許研究人員對RNA-RNA和RBP-RNA相互作用進行泛癌分析,還提供平臺進行miRNA,lncRNA,假基因和mRNA的存活和差異表達分析。不僅可以分別顯示多個miRNA靶基因預測結果,還囊括了多種miRNA的功能信息和其在腫瘤中表達情況。
詳情請戳:Starbase:研究RNA,有人不知道它嗎
http://mirwalk.umm.uni-heidelberg.de/
miRWalk是一個綜合性的miRNA靶基因資料庫,收錄了Human、Mouse、Rat、Dog、cow等多個物種的miRNA靶基因信息,不僅僅記錄了基因全長序列上的miRNA結合位點,也會將其與已有的12個miRNA靶標預測程序的預測結合信息集合進行結合關聯。
詳情請戳:miRwalk:搞定miRNA靶點預測及驗證的寶藏網站
http://diana.imis.athena-innovation.gr/DianaTools/index.php
DIANA tools,是一個集合了miRNA和lncRNA相關研究的資料庫,目的是提供一種算法資料庫和軟體,用於在系統框架中解釋和歸檔數據,範圍包括從深度測序數據的表達調控分析。該資料庫能夠分析miRNA與靶基因,miRNA與信號通路,miRNA與lncRNA的相關分析,以及自動分析數據,並且可以直接根據序列(新miRNA)預測靶基因,我們還能夠查詢miRNA發表的相關文章,miRNA相關的啟動子、調控因子、轉錄因子內容也是有的。
詳情請戳:DIANA Tools:全能型miRNA研究選手
http://compbio.uthsc.edu/SomamiR/home.php
SomamiR是microRNA(miRNA)及其靶點中癌症體細胞突變的資料庫,集成了多種類型的數據,用於研究體細胞和種系突變對癌症中miRNA功能的影響。資料庫還提供了存在miRNA靶序列體細胞突變與腫瘤相關的基因及其參與的通路。
詳情請戳:SomamiR:腫瘤細胞miRNA突變位點專用資料庫
http://rhesus.amu.edu.pl/mirnest/copy/
miRNEST是一個整合了動物,植物和病毒microRNA數據的綜合資料庫,這是一個集成的microRNAs資源。資料庫的核心部分是作者根據225種動物和202種植物的表達序列標籤(EST)進行的miRNA預測。其中包括生效的miRNA序列,小RNA測序數據,表達,多樣性,靶標數據和進入外部miRNA資源的連結。
詳情請戳:miRNEST:動植物多物種miRNA資料庫
http://www.targetscan.org/vert_72/
TargetScan是一款預測miRNA結合位點的軟體,對於哺乳動物中miRNA結合位點預測的效果很好。在預測miRNA靶基因之前,首先需要確定轉錄本的3』UTR區域,TargetScan資料庫通過一種名為3P-seq的測序技術,確定轉錄本對應的3』UTR區(哺乳動物中的miRNA通過結合轉錄本序列的3』UTR區,從而發揮轉錄後調控作用),並且結合該技術的分析結果和NCBI中已有的3』UTR注釋,提供一個綜合的3』UTR區序列。
詳情請戳:TargetScan: miRNA靶基因資料庫
http ://bioinfo.life.hust.edu.cn/lncRNASNP
miRcode-基於全面的GENCODE基因注釋,提供了「整個轉錄組」人類microRNA靶標預測,覆蓋完整的GENCODE注釋的轉錄組,包括10419條已經註冊的lncRNA,轉錄本注釋來源於Gencode v11版本,並將轉錄本劃分成了不同類別.miRcode還涵蓋了編碼基因,包括非典型區域,例如5'UTR和CDS。miRcode與TargetScan相比,主要增加了ncRNA和非3』UTR區的檢索。
詳情請戳:miRcode:轉錄組miRNA靶點預測圖譜
環狀RNA(circRNA)是一類特殊的非編碼RNA分子(在活體中有時也有表達),也是RNA領域最新的研究熱點。與傳統的線性RNA(linear RNA,含5』和3』末端)不同,circRNA分子呈封閉環狀結構,不受RNA外切酶影響,表達更穩定,不易降解。大概在2010年開始,RNA-seq技術的發展以及專門的計算管道開發,引爆了circRNA 研究。以下是針對circRNA的資料庫:
circBase 是一個環狀RNA的資料庫,收錄多個物種的circRNA信息,採用了find_circ軟體來預測去核糖體文庫中的circRNA,資料庫可以單個環狀和列表形式對環狀RNA進行搜索,還可以把全部環狀RNA下下來,部署到本地伺服器上面,還可以像UCSC一樣使用序列進行blat比對。
詳情請戳:circBase 資料庫:研究環狀RNA,怎能忘記它
http://www.picb.ac.cn/rnomics/circpedia
CIRCpedia v2是一個更新的綜合資料庫,其中包含來自六個不同物種(人、大小鼠、果蠅、斑馬魚)的180多個RNA-seq數據集的circRNA注釋,識別262782個環狀RNA。還可以通過物種,細胞系,基因名稱或者基因組位置,circpedia中的circRNA進行檢索,資料庫會給出環狀RNA ID來源基因,對應的線性轉錄本,表達量,外顯子的起始和終止位置,細胞系,保守性等信息,並可以用熱圖或者散點圖的形式展現環狀RNA在不同組織或者細胞系中的表達量。
詳情請戳:CIRCpedia v2:circRNA注釋及表達資料庫
http://cgga.org.cn:9091/circRNADisease/
circRNADisease是基於已有實驗驗證的circRNA和疾病關聯的在線資料庫,系統地核實了800多個已發表的文獻,並收集整理了330種circRNA和48種疾病。circRNADisease中的每個條目均包含有關circRNA-疾病關聯的詳細信息,包括circRNA和疾病名稱,circRNA表達模式,以及關於circRNA的簡要功能說明和其他注釋信息,注釋物種主要是人。