研究利器 OncoLnc:TGCA數據挖掘工具

2021-01-19 艾博思

研究利器| OncoLnc:TGCA數據挖掘工具


oncoLnc是一個交互式工具可以探索生存相關性,下載臨床數據後,將其與mRNA,miRNA和lncRNA表達數據進行偶聯分析。



oncoLnc的網址:

http://www.oncolnc.org


oncoLnc包含的數據:

OncoLnc包含8647個病人的生存數據,它們來自TCGA的21種癌症研究,其中mRNA和miRNA來自TCGA的RNA-seq表達數據,lncRNA表達來自MiTranscriptome beta數據。分類數據能夠讓用戶能夠通過基因表達獲取病人信息,隨後製作Kaplan-Meier plots或者下載相應數據做進一步分析。





mRNAs: Use a modern HUGO gene symbol or Entrez ID


miRNAs: mature miRBase name or accession number


lncRNAs: MiTranscriptome Beta name or transcript ID



在 MiTranscriptome Beta 和TCGA Tier 3 data數據之間名字會有一些衝突




Rank(排名): Where the gene ranks by p-value compared to all other genes in that cancer study.  mRNAs, miRNAs, lncRNAs are ranked separately.


Median expression(中位表達水平): Median expression of the gene.  If a patient had more than one expression file they were averaged.


Mean expression(均值表達水平): Mean expression of the gene.  If a patient had more than one expression file they were averaged.


Kaplan(生存分析圖): Go to an interactive Kaplan-Meier plotter


輸入搜索詞:neat1



繪製曲線



繪圖所使用的數據信息:



MiTranscriptome Beta:

Normalized expression was used and I believe they were normalized across cancers.


TCGA Tier 3 mRNAs:

Normalized expression was used.  I do not know if it is safe to compare expression across cancers.


TCGA Tier 3 miRNAs:

Expression was not normalized across cancers, it is not recommended to compare across cancers.





回復關鍵字,查看你感興趣的內容:

回復「lncRNA技術專欄」查看相關文章

回復「exosome」查看相關文章

回復「miRNA必備的知識」查看相關文章

回復「ceRNA」查看相關文章

回復「tRNA」查看相關文章




核酸研究,找艾博思生物!
核酸

艾博思生物專注於核酸研究,關注請加微信號:ibsbio或掃描下方二維碼。








相關焦點

  • 12款實用的數據挖掘工具
    免費的數據挖掘工具包括從完整的模型開發環境如Knime和Orange,到各種用Java、c++編寫的庫,最常見的是Python。數據挖掘中通常涉及到四種任務:分類:將熟悉的結構概括為新數據的任務聚類:在數據中以某種方式查找組和結構的任務,而不需要在數據中使用已注意的結構。
  • 辦公必備的大數據分析利器,數據分析工具推薦
    說到數據分析,很多小夥伴可能第一時間聯想到複雜的算法,龐大的數據,甚至是讓人眼花繚亂的代碼。但實際上,運營做數據分析並不需要懂這些,關鍵是你對業務流程的理解,以及用數據解決問題的思維。本文將介紹在一些領域被高頻率使用,且不可缺少的大數據分析利器,使用尚可的數據分析工具。
  • 使用OncoLnc進行TCGA生存分析
    通過收集整理TCGA中不同腫瘤患者的生存數據和基因表達譜信息,OncoLnc提供了一個生存分析的web服務,對應文章的連結如下https://peerj.com/articles/cs-67/網址如下http://www.oncolnc.org/OncoLnc收集了TCGA中21種腫瘤,共8647個病人的生存數據
  • TCGA資料庫生存分析的網頁工具哪家強
    但是我沒有想到,同樣的基因在同樣的癌症的生存分析結果,在不同的網頁工具裡面居然是千差萬別。oncoln首先我們看看http://www.oncolnc.org很明顯這個基因在這個癌症,如果是按照表達量分成高低兩個組別, 那麼生存分析是不顯著的。
  • 辦公必備的大數據分析利器,值得推薦數據分析工具
    說到數據分析,很多小夥伴可能第一時間聯想到複雜的算法,龐大的數據,甚至是讓人眼花繚亂的代碼。但實際上,運營做數據分析並不需要懂這些,關鍵是你對業務流程的理解,以及用數據解決問題的思維。本文將介紹在一些領域被高頻率使用,且不可缺少的大數據分析利器,使用尚可的數據分析工具。
  • 網頁工具可以搞定的結論你非要花十幾萬科研經費復現一遍
    bing搜索了CD105 (Endoglin) ,發現一個有意思的研究。OncoLnc是最簡單的TCGA生存分析網頁工具如果我們按照默認參數來進行網頁工具查詢,可以看到, CD105表達量高低對病人分組呢,沒有統計學顯著的結果:http://www.oncolnc.org/kaplan/?
  • 數據分析基礎內容介紹 — 模型、工具、統計、挖掘與展現
    第四層是Data Mining數據挖掘層,數據挖掘與數據分析(統計分析)有什麼區別呢,數據分析往往是統計量和算法比較清楚,數據挖掘往往是目標不是很清楚,在實現目標的過程中採用什麼方法不能確定,所以數據挖掘比數據分析難度要高很多。
  • 腫瘤免疫浸潤分析工具匯總-數據挖掘新高度
    還有就是那個通路分析,網絡分析基因表達與免疫浸潤的關係,從轉錄組數據提取出免疫浸潤數據。其實早已有大佬開發出相關軟體,甚至網頁工具,助力數據挖掘。計算免疫浸潤的軟體工具從算法層面主要分為三類,包括基於Marker gene的算法,基於partial deconvolution,以及complete deconvolution。從咱們無生物信息背景的科研凡人視角來看,咱就分為網頁版工具
  • 大數據_數據挖掘技術分類及應用
    市場和趨勢分析:利用數據挖掘工具和統計模型對數據倉庫的數據仔細研究,以分析顧客的購買習慣、廣告成功率和其它戰略性信息。利用數據倉庫通過檢索資料庫中近年來的銷售數據,作分析和數據挖掘,可預測出季節性、月銷售量,對商品品種和庫存的趨勢進行分析。還可確定降價商品,並對數量和運作作出決策。
  • 【乾貨】數據挖掘中算法學習的2條進擊路線
    這說明你尚不具備深入開展數據挖掘算法學習的能力。你會發現到處都是門檻,很難繼續進行下去。 用於數據挖掘的工具應用層面,R、MATLAB和Python都是做數據挖掘的利器,另外一個基於Java的免費數據挖掘工具是Weka,這個就只要點點滑鼠,甚至不用編代碼了。
  • 數據挖掘與統計分析的區別
    最起碼它表明我們應該:在我們的雜誌上發表這類文章;在我們的本科課程中講授一些這方面的內容,在我們的研究生中講授一些相關的研究課題。我們的博士生專業課就有《多元統計》一課;給那些這方面較優秀的人提供一些獎勵(工作,職稱,獎品)。答案並不明顯,在統計學的歷史上就忽略了許多在其它數據處理相關領域發展的新方法。如下是一些相關領域的例子。
  • KDNuggets:數據科學家使用工具調查
    工具/產品/解決方案是數據科學家洞察數據的利器。KDNuggets網站對此觀點進行了年度調查,來分析數據科學家在用哪些類型的工具,並提供了調查的匿名原始數據。
  • 即搜即用的TCGA資料庫挖掘網站匯總
    零代碼下載TCGA資料庫第二期:UCSC-XENA工具零代碼TCGA資料庫下載第三期:cBioPortal網頁零代碼下載TCGA資料庫第四期:Fire Browse工具手把手教你用R語言下載TCGA資料庫:UCSCXenaTools手把手教你用R語言下載TCGA資料庫:GDCRNAtools
  • 給大家推薦12個非常有效的關鍵字研究與挖掘工具
    多年來,我一直使用關鍵詞研究來不斷為自己和客戶帶來有價值的,有針對性的長期流量。它可以在SEO最大的土地爭奪戰機會之一-如果你知道這個工具的使用以及如何使用這些工具。對於這篇文章,我不僅要分享12個最好的關鍵字挖掘與研究工具 - 但是使用它們的方法我以前從未在其他地方分享。我已經使用下面的方法之一來幫助客戶在短短六個月內增加他們的博客流量20次 - 所有這些都是通過知道在哪裡尋找機會(當然假設你可以執行10倍的內容值得排名)。
  • 大數據中數據挖掘的基本步驟
    導讀 數據挖掘基本步驟,數據挖掘過程定義問題、建立數據挖掘庫、分析數據、準備數據、建立模型、評價模型和實施。
  • 什麼叫數據挖掘_數據挖掘技術解析
    數據挖掘(data mining)是指從大量的資料中自動搜索隱藏於其中的有著特殊關聯性的信息的過程。在全世界的計算機存儲中,存在未使用的海量數據並且它們還在快速增長,這些數據就像待挖掘的金礦,而進行數據分析的科學家、工程師、分析員的數量變化一直相對較小,這種差距稱為數據挖掘產生的主要原因。
  • 數據產品經理之數據分析與挖掘
    本文主要跟大家講講,如何通過數據分析和數據挖掘從數據中獲取相關信息和挖掘價值,enjoy~自2014年以來,「大數據」連續六年進入國務院政府工作報告,彰顯出國家對於大數據戰略的重視。其中,作為數據產品經理必備的專業知識之一的數據分析可以分為廣義的數據分析和狹義的數據分析,廣義的數據分析就包括狹義的數據分析和數據挖掘,人們常常提到的數據分析是指狹義的數據分析,數據挖掘和數據分析都是從數據中提取一些有價值的信息,但互相的側重點又有所不同。
  • 乾貨 面向大數據的時空數據挖掘
    IBM SPSS Modeler 是參照行業標準 CRISP-DM 模型設計而成的數據挖掘工具,可支持從數據到更優商業成果的整個數據挖掘過程。通過結合時空數據和其他商業數據,並且運用數據挖掘工具 IBM SPSS Modeler 對時間和空間屬性進行觀測分析,進而獲得對數據的充分理解,並將其應用於商業活動,從而改進決策過程。
  • 數據挖掘(DataMining)概述
    1.數據挖掘的定義數據挖掘:指從大量的數據中通過算法搜索隱藏於其中信息的過程。數據挖掘在面向用戶的網際網路產品中發揮著及其重要的作用。,縮小處理範圍,提高數據挖掘的質量;數據預處理:檢查數據的完整性及一致性,消除噪聲。
  • 電磁頻譜數據挖掘丨天地一體頻譜認知智能領域研究前沿
    ,緊緊圍繞「電磁頻譜數據日益豐富而知識十分貧乏」這一瓶頸問題,結合數據挖掘、機器學習、認知科學的理論方法與電磁頻譜的時-空-頻-能等多維屬性特徵,系統地介紹了電磁頻譜數據挖掘理論及應用的代表性研究成果。