Co-LncRNA:lncRNA與蛋白編碼基因的共表達網絡資料庫

2020-10-18 生信修煉手冊

有多項研究表明lncRNA與眾多生物學過程,複雜疾病相關,為了進一步探究lncRNA在這些生命活動中的具體作用,我們需要對lncRNA的功能進行分析。

在生物信息學中,對於基因功能的挖掘,通常的做法就是利用GO和KEGG等功能資料庫,但是這些資料庫中都是蛋白編碼基因的功能,為了利用這些資料庫中的信息,我們需要在lncRNA與mRNA之間建立起聯繫,常見的思路有以下幾種

  1. 通過lncRNA和mRNA之間的相互作用
    很多文獻和資料庫中都有報導的lncRNA與mRNA之間相互作用,也可以通過軟體來預測二者之間的結合,通過lncRNA的靶標mRNA, 來研究lncRNA的功能。

  2. 通過lncRNA與mRNA的共表達
    通常認為共表達基因集參與同一通路,或者受到同樣的調控,具有相似的生物學功能,利用表達譜數據尋找與lncRNA共表達的mRNA,從而來研究lncRNA的功能。

  3. 通過ceRNA調控機制
    ceRNA是近幾年很火的一個概念,指的是各種RNA分子通過競爭性結合miRNA從而發揮調控作用,對於lncRNA而言,通過lncRNA-miRNA-mRNA這種ceRNA機制,將lncRNA關聯到mRNA上來,從而去探究lncRNA的功能。

Co-LncRNA通過分析查找與lncRNA共表達的mRNA,構建lncRNA與mRNA之間的共表達網絡,並通過共表達的mRNA對應的GO和KEGG來研究lncRNA的功能,該資料庫的網址如下

http://bio-bigdata.hrbmu.edu.cn/Co-LncRNA/

從GEO和TCGA中收集了來自28個組織/細胞系, 共6500個樣本的RNA-seq數據,然後通過經典的 tophat+cufflinks+RSEM策略分別對mRNA和lncRNA進行定量,通過斯皮爾曼相關性分析和線性回歸,分析lncRNA與mRNA之間的共表達,構建lncRNA與mRNA的共表達網絡。對於lncRNA, 對其共表達的mRNA做GO和KEGG富集分析,採用的方法是費舍爾檢驗,將功能富集的結果當做該lncRNA的注釋,完整流程示意如下

CEGs代表共表達基因Co-Expressed Genes,通過這個菜單可以瀏覽共表達分析的結果,示意如下

選擇數據集和共表達分析的方法,設置閾值,通過mRNA或者lncRNA的名字來查找對應的共表達基因,點擊pattern可以查看詳細的分析結果,示意如下

通過CEGsFuncs查看lncRNA的共表達mRNA的功能富集結果,示意如下

對於KEGG富集的結果,點擊可以查看具體的通路圖,在通路圖上,會將共表達的蛋白編碼基因用紅色標記,示意如下

通過CEGsNet, 可以查看lncRNA與mRNA的共表達網絡,示意如下

該網站還支持上傳自己的lncRNA和mRNA表達譜,然後進行共表達分析,界面示意如下

該資料庫中的數據是免費下載的,通過該資料庫,我們不僅可以查找已有的lncRNA與mRNA的共表達分析結果,還可以對自己的數據進行共表達分析。

·end·

相關焦點

  • 史上最全的lncRNA資料庫大全及心得分享
    雖然老談一直默默覺得部分lncRNA就是伸長了的miRNA,其作用機制比較類似,但有關所有lncRNA全方面的功能研究還需要進一步的探索。小夥伴們更需要裝配研究的利器,幫助我們在尋求相關lncRNA信息時能夠手到拈來,不費吹灰之力!今天老談就跟大家分享一些研究lncRNA的資料庫,幫助大家做好科研準備工作。當然lncRNA資料庫較之於miRNA可能相對較少,畢竟後者的研究已經非常成熟。
  • 常用生物資料庫大合集
    MGD : http://www.informatics.jax.org/ 小鼠基因組2.蛋白資料庫UniProt :https://www.uniprot.org/   蛋白信息SMART : http://smart.embl-heidelberg.de/  信息/結構域/修飾/互作CR2Cancer : http://cis.hku.hk/CR2Cancer
  • 【收藏】生物資料庫大合集
    MGD : http://www.informatics.jax.org/ 小鼠基因組2.蛋白資料庫UniProt :https://www.uniprot.org/   蛋白信息SMART : http://smart.embl-heidelberg.de/  信息/結構域/修飾/互作CR2Cancer : http://cis.hku.hk/CR2Cancer
  • 生物資料庫大合集還不趕快收藏起來!!!!
    MGD : http://www.informatics.jax.org/ 小鼠基因組2.蛋白資料庫UniProt :https://www.uniprot.org/   蛋白信息SMART : http://smart.embl-heidelberg.de/  信息/結構域/修飾/互作CR2Cancer : http://cis.hku.hk/CR2Cancer
  • 一站式 lncRNA 查詢資料庫|lncRNA|資料庫|亞細胞|查詢|序列|預測|...
    1 表達情況關於基因的表達情況,資料庫使用了GETx資料庫裡面的正常組織、CCLE裡面的癌症細胞系以及ENCODE資料庫裡面的數據來進行查看的,在結果呈現當中,也是分成了正常組織和癌症組織分類來查看的。
  • 一站式 lncRNA 查詢資料庫
    1 表達情況關於基因的表達情況,資料庫使用了GETx資料庫裡面的正常組織、CCLE裡面的癌症細胞系以及ENCODE資料庫裡面的數據來進行查看的,在結果呈現當中,也是分成了正常組織和癌症組織分類來查看的。
  • 突破認知:LncRNA、circRNA編碼啦!
    事實上,兩種非編碼RNA(ncRNA)的另一種共有屬性還未被廣泛發現,那就是「編碼」! 一、非編碼RNA"編碼"概況 納尼?非編碼還能編碼,這是什麼新特性!確實,根據許多標準,它們不太可能編碼功能蛋白。這些標準包括缺乏長的ORF,缺乏胺基酸序列保守性和缺乏已知的蛋白質結構域1。
  • lncRNA的一些基礎知識
    在GENCODE Release (version 32)的LncRNA信息據ENCODE (Encyclopedia of DNA Elements)項目統計,人類基因 組中約75%區域都可以轉錄。其中1%為編碼蛋白外顯子,40% 為蛋白編碼基因(外顯子+內含子)轉錄區域,剩下絕大多數轉 錄區域產生lncRNA。
  • 這些lncRNA研究套路,你未必知道!
    而在ceRNA這種基因表達調控模式種,lncRNA因也存在與mRNA類似的miRNAs反應元件(MREs),可競爭性結合miRNA以達到調節mRNA水平的目的。一般當ceRNA表達沉默時,mRNA則在miRNA介導的沉默複合體(RISC)作用下降解;而當ceRNA表達激活後,可競爭結合RISC複合物,降低miRNA抑制功能,上調靶基因的表達量。
  • 動物所建立靈長類特異新基因資料庫並系統預測新基因功能
    )只能注釋部分靈長類特異基因的蛋白編碼能力。富集於各共轉錄網絡並佔據網絡較核心位置的PSG可能推動了精子發生、免疫反應、母胎互作以及胎腦發育等快速演化的生命過程。其中,254個基因有不同程度的蛋白支持證,該集合也包含了41個錯誤注釋的假基因(如MYH16)。  基於GenTree中所整合的轉錄組數據,該研究通過共表達分析推測了846個PSG的功能。與此前的認識相符,PSG經常呈現睪丸特異或睪丸偏好的表達;但PSG也呈現骨髓或胎盤偏好的表達譜。有意思的是,雖然PSG在成年腦中的表達量較低,但在孕中期胎腦表達上調(圖3)。
  • 文獻解讀|LncRNA經典研究思路
    INcRNA的分類和分子功能(A)根據它們相對於鄰近蛋白質編碼基因的基因組位置分類:雙向的、基因間的、反義的、內含子的、增強子的、感重疊的。(B)圖的左下角代表了如何轉錄調節INcRNA的活動。在活化轉錄(基本為I部分或炎症II部分)過程中,INcRNA可以抑制基因(mRNA基因A和C)或激活基因(mRNA基因A和B)。IncRNA可以是轉錄因子增強活化的支架,也可以是染色質重構蛋白打開或關閉染色質的支架。INcRNA還可以通過影響穩定性、改變剪接活性、修改修改或甚至影響成熟mRNA的上限來調節mRNA轉錄的轉錄第三部分。
  • 研究lncRNA的常見技術及原理 | LncRNA專題
    應用:① 已知基因或序列的染色體定位;② 未克隆基因或遺傳標記及染色體畸變的研究。是了解轉錄後調控網絡動態過程的有力工具,能幫助我們發現miRNA的調節靶點。CHIRP-Seq 是一種檢測與 RNA 綁定的 DNA 和蛋白的高通量測序方法。
  • Annolnc:一站式lncRNA查詢資料庫
    目前是該工具基於700多個數據資源和各種工具鏈,AnnoLnc的系統性注釋涵蓋了基因組位置,二級結構,表達模式,轉錄調控,miRNA相互作用,蛋白質相互作用,遺傳關聯和進化。該網站具有直觀的Web界面,可用於通過桌面和行動裝置進行交互式分析,程式設計師可以通過標準的基於JSON的Web服務APIs進一步將AnnoLnc集成到他們的分析流程中。
  • TSGene:腫瘤抑癌基因資料庫
    /TSGene/最新版本為v2.0版本,共收錄了1217個human TSGs, 其中包含1018個蛋白編碼基因和199個lncRNA,同時對這些基因進行了多種注釋,包括表達量,突變位點,蛋白相互作用等注釋信息。
  • circRNA編碼蛋白研究必備
    今天我們再來聊聊circRNA研究領域常見研究思路中最後一個,也是最難做的一個方向—circRNA編碼蛋白。今天我們的主角circRNADb資料庫在這一方面就發揮著重要的作用。circRNA作為非編碼RNA,在20世紀70年代才首次被人們發現,之後幾十年內一直被斷斷續續地進行研究,探索其在基因表達調控中發揮的作用。
  • 昆明動物所阿爾茨海默病基因表達譜與調控網絡研究獲進展
    基因表達是一種介於基因型(genotype)和表型(phenotype)之間重要的中間表型。現有GWAS發現的疾病風險位點約80%都位於基因組非編碼區,這些位點很可能是通過調控基因表達,影響機體正常的基因調控網絡,進而影響疾病的發生發展。因此,對AD表達譜的研究,能夠增加我們對於AD遺傳變異與AD發生之間關聯的理解,並有望發現新的生物學標記和潛在的治療分子靶標。
  • 010期抑鬱症研究簡報:基因共表達網絡分析揭示抑鬱症新調控基因
    2標題:基於多種腦組織的基因共表達網絡分析揭示了抑鬱症的新基因和分子途徑譯者:Ayden Lee抑鬱症是一種常見且嚴重的精神疾病,它有著多基因遺傳結構。全基因組關聯研究已經成功鑑定出多個和抑鬱症相關的獨立遺傳基因位點,但確切的致病基因和其生物學機制在很大程度上還是未知的。組織特異性網絡方法可以識別抑鬱症的分子機制,並為整合分析提供生物學基礎。我們使用多個人腦組織和全血的全基因組關聯匯總統計結果和基因表達信息,從而為識別個體風險基因和基因共表達網絡提供了一個框架。
  • circRNADb:首個匯總編碼蛋白環狀RNA的資料庫
    10月11日,Nature出版集團子刊Scientific Reports在線發表了南京醫科大學Li Yan團隊的一項重要環狀RNA研究成果,介紹開發了首個匯總可編碼蛋白的環狀RNA的資料庫:circRNADb(Chen et al., 2016)。
  • 老套路也得學:lncRNA–miRNA–mRNA調控網絡預測
    預測肝硬化患者肝癌發生的候選lncRNA-miRNA-mRNA網絡:綜合生物信息學分析摘要目的:本研究通過生物信息學分析,探索潛在的競爭性內源性RNA (ceRNA)網絡在肝硬化患者HCC發展中的作用。方法:利用GEO和TCGA資料庫的數據挖掘,挖掘mRNA、lncRNA和miRNA差異表達譜。