Oncomine:腫瘤晶片資料庫

2020-10-18 生信修煉手冊

腫瘤作為人類健康的頭號殺手,其研究的重要性不言而喻。隨著晶片和NGS技術的發展,發表了很多的腫瘤相關數據。然而這些數據來自不同的組織和團隊,由於缺乏統一的數據管理和組織,這些數據在發表之後就沒有再利用了,為了提高數據利用率,促進腫瘤研究的發展,Oncomine的開發團隊收集了各種來源的腫瘤相關的晶片數據,用標準化的分析流程處理這些數據,數據分析的結果通過web服務查詢和可視化,對應的文章連結如下

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1635162/

資料庫的網址如下

https://www.oncomine.org/resource/main.html

該網站只對科研工作者免費開放,需要學術郵箱註冊對應的帳號。該資料庫中主要收錄了以下兩種類型的腫瘤晶片數據

  1. mRNA  expression

  2. DNA copy number

每批晶片數據用dataset表示,所有晶片數據對應的腫瘤類型和樣本數示意如下

對於晶片數據,主要進行了以下幾種類型的分析

  1. coexpression analyses

  2. differential expression analyses

  3. outlier analyses

首頁的面板分成了3個部分,示意如下

最左側的部分用於對數據進行檢索或者篩選,中間的面板用於展示所有的數據集,最右側的面板用於顯示數據集的詳細結果。最基本的展現形式是熱圖,示意如下

1. 共表達分析

在search框中指定一個感興趣的基因,然後可以查看在特定數據集中與該基因存在共表達的基因結果,示意如下

correlation從0到1,越接近於0, 說明相關性越高。

2. 差異分析

有以下兩種差異分析

  1. cancer_vs_cancer

  2. cancer_vs_normal

差異分析的熱圖示意如下

給出了差異的pvalue, fold change等統計學指標,對於多個基因的差異分析,用上述的熱圖形式展現,對於單個基因的差異分析結果,展現形式如下

用柱狀圖的形式展示基因在每個樣本中的表達量,每個柱子代表一個樣本。

3. outlier 分析

由於腫瘤樣本的異質性,會出現原癌基因只在部分樣本中過表達的例子,當用所有樣本進行差異分析時,這部分基因的差異分析結果並不顯著,為此專門開發了一種離群值分析的算法,全稱如下

cancer  outlier profile analysis

簡稱COPA, 來識別只在部分腫瘤樣本中高表達的潛在的原癌基因。結果示意如下

COPA值越高,說明該基因越可能是一個真實的離群基因。通過Oncomine資料庫,可以方便的探究腫瘤相關的DNA拷貝數和基因表達譜數據。

·end·

相關焦點

  • 腫瘤全面分析資料庫:oncomine使用介紹
    常用的資料庫就是GEO了,但是使用GEO還要一個一個數據集找,這樣又很浪費時間。所以有沒有簡單的方法呢?今天就給大家介紹一個匯總了多個癌種,多個數據集的綜合性分析基因表達和臨床相關性的資料庫:oncomine(https://www.oncomine.org/)。
  • 「oncomine」——如何在大數據時代挖掘腫瘤數據
    這是一場革命,龐大的數據資源使得各個領域開始了量化進程,無論學術界、商界還是政府,所有領域都將開始這種進程。--by老談  在生物學領域,大數據的整合分析更是亟不可待。到目前為止,在腫瘤方面已有oncomine和TCGA這兩個資料庫,可供分析參考。
  • oncomine資料庫的申請和使用
    網站:https://www.oncomine.org/首先需要去申請帳號:一般需要學校edu
  • 傳說中的Oncomine! 【基因數據挖掘專題第十三期】
    ,顧名思義,就是挖掘腫瘤方面的生物學信息。它結合了TCGA、GEO、ArrayExpress等資料庫,經過一系列加工、標準化和分析後匯集而成。這有什麼好處?我們平時做的晶片數據往往來自於一個或兩個數據集,偶爾會因為樣本的批次、平臺的差異、實驗的條件等因素使結果與我們預期的不一樣。
  • Oncomine:癌基因晶片數據挖掘平臺系列介紹(一)
    同時還可以進行藥物敏感性、突變或甲基化引起的表達變化等方面的分析。Oncomine可進行一個或多個基因的查詢,結果可視化。數據來源和數據類型Oncomine中僅包括研究表達變化的mRNA表達譜晶片和研究拷貝數的aCGH晶片。
  • 腫瘤經典資料庫Oncomine,腫瘤研究的萬金油,看這篇就夠了
    因為它和咱們之前討論過的TCGA一樣,都是腫瘤領域應用較廣的資料庫。不過Oncomine和TCGA相比的優勢就是,它除了數據,還提供了一些簡潔易操作的分析工具,如差異表達分析、共表達分析等,分析後可以直接出圖用在文章裡。另外它還整合了TCGA和GEO的部分數據。缺點是,免費版的數據不能下載,收費又天價。不過辦法還是有的,先賣個關子。
  • 常用生物資料庫大合集
    /cosmic/ 癌症體細胞突變資料庫二.樣本資料庫1.樣本存儲資料庫GEO : https://www.ncbi.nlm.nih.gov/geo/ (2020)大型/眾多疾病TCGA : https://portal.gdc.cancer.gov/ (2020)腫瘤ICGC : https://dcc.icgc.org (2020)腫瘤CGGA
  • 【收藏】生物資料庫大合集
    /cosmic/ 癌症體細胞突變資料庫二.樣本資料庫1.樣本存儲資料庫GEO : https://www.ncbi.nlm.nih.gov/geo/ (2020)大型/眾多疾病TCGA : https://portal.gdc.cancer.gov/ (2020)腫瘤ICGC : https://dcc.icgc.org (2020)腫瘤
  • 世界上最大的癌基因資料庫—Oncomine來了
    (1)網址登陸:https://www.oncomine.org/resource/login.html(2)Oncomine是什麼?Oncomine是目前世界上最大的癌基因晶片資料庫以及癌基因數據挖掘平臺,整合了GEO、TCGA和已發表文獻等來源的RNA和DNA-seq數據;該資料庫擁有全世界最全面的癌症突變譜、基因表達數據以及相關的臨床信息,可用作發現新的生物邊際物或尋找新的治療靶點。
  • 生物資料庫大合集還不趕快收藏起來!!!!
    /cosmic/ 癌症體細胞突變資料庫二.樣本資料庫1.樣本存儲資料庫GEO : https://www.ncbi.nlm.nih.gov/geo/ (2020)大型/眾多疾病TCGA : https://portal.gdc.cancer.gov/ (2020)腫瘤ICGC : https://dcc.icgc.org (2020)腫瘤
  • Oncomine數據挖掘快速發文捷徑
    但是現在不一樣了,現在進入了數據大時代,特別是生物信息學方面的數據,資料庫越來越多,像GEO,TCGA,Oncomine。雖然專業搞生信都要會編程,當然GEO,TCGA也離不開編程,但是這裡有一個資料庫不用編程的,這個資料庫是Oncomine,差異表達分析,共表達分析,Outlier分析等等Oncomine自己都會分析,不用任何代碼,我們只要會點滑鼠就可以了。接下讓我們一起看一下到底是怎麼樣操作?
  • TSGene:腫瘤抑癌基因資料庫
    TSGene是一個從文獻中收集整理的抑癌基因資料庫,文章發表在Nucleic Acids Research,連結如下https://academic.oup.com/nar/article/41/D1/D970/1074154資料庫的網址如下https://bioinfo.uth.edu
  • The Cancer Immunome Atlas:腫瘤免疫圖譜資料庫
    腫瘤免疫療法在多種惡性腫瘤的臨床治療上取得了顯著效果,然而還是存在大部分患者對於免疫療法沒有響應的問題。為了更好的理解腫瘤和免疫細胞相互作用,科學家對來自TCGA和其他幾個大型腫瘤研究項目,共20種實體瘤的NGS數據進行分析,對應文章連結如下https://linkinghub.elsevier.com/retrieve/pii/S2211124716317090為了更好的查看分析結果,將相關數據整理成了一個資料庫,網址如下
  • OncoKB:腫瘤藥物靶點相關基因組變異資料庫
    OncoKB收集了腫瘤發生發展相關的,具有臨床意義的基因組變異信息,對於每個變異,提供了其對應的生物學效應,藥物互作,預後和治療意義等詳細信息,對應的文章連結如下http://ascopubs.org/doi/full/10.1200/PO.17.00011資料庫的網址如下
  • 滬建首個兒童血液腫瘤資料庫
    □記者 許沁晚報訊 今天上午,上海交通大學醫學院附屬上海兒童醫學中心兒童血液腫瘤中心大樓奠基。與此同時,上海兒童醫學中心還將建立國內首個兒童血液腫瘤診治信息資料庫,將收集血液腫瘤患兒在發病症狀、醫療過程、預後情況,以及生活情況長期追蹤等方面的信息,用於幫助分析來自不同區域的病兒在疾病發展上的各種情況、治療效果和生活質量。
  • 突破 | 中國學者建立大規模腫瘤免疫單細胞資料庫
    腫瘤免疫療法在控制腫瘤方面療效顯著,但臨床試驗表明,該療法僅對部分患者有效,多項研究表明這是由高度複雜的腫瘤微環境所導致的,解析腫瘤微環境的生物學特徵將有助於提高腫瘤免疫療法的實用性【2】。傳統的測序技術只能在群體水平進行測序,單細胞轉錄組測序技術的出現,極大地提高了腫瘤微環境圖譜的解析度,使得研究人員可以在單細胞層面探究腫瘤微環境中的細胞組成以及基因表達調控的異質性。近幾年腫瘤病人組織的單細胞轉錄組數據迅速累積,但目前還沒有一個綜合的資料庫將這些已有的數據資源整合起來。
  • Martin Murphy談腫瘤資料庫
    腫瘤是人類的公敵,攻克腫瘤是大家共同奮鬥的目標。無論在中國還是全球,我們看到腫瘤的發病率都在逐年攀升,這是全球也是CSCO關注的焦點。在中國,每年約有3百萬新發診斷的癌症患者,2百萬患者每年會死於癌症。CSCO的任務和宗旨就是如何改變這一現狀。
  • TCPA:腫瘤RPPA蛋白晶片數據中心
    蛋白組學數據的分析是腫瘤病理生理學領域常用的手段之一,在TCGA項目中,廣泛使用了反相蛋白晶片reverse-phase protein arrays(RPPA)技術來進行腫瘤蛋白質組的研究。通過該晶片, 能夠有效分析多種標記蛋白在樣本中的表達量及其變化趨勢,是一種經濟高效的腫瘤蛋白質組學研究手段。
  • 腫瘤相關的甲基化高通量數據介紹
    繼而生物學過程,疾病發生發展的過程啦,當然腫瘤也不例外。在人的基因組中大約有2800萬個CpG位點,高通量技術的誕生使得全基因組範圍內的甲基化分析成為可能。提及高通量技術很容易聯想到兩類,即晶片與測序,兩者各自都有優缺點。