Oncomine 是目前世界上最大的癌基因晶片資料庫和整合數據挖掘平臺,旨在挖掘癌症基因信息。到目前為止,該資料庫已經收集了729個基因表達數據集,90000多個癌症組織和正常組織的樣本數據。Oncomine可用於比較癌症和正常組織的差異表達分析,也可以用於探索各種癌症亞型以及基於臨床和病理學的比較分析。同時還可以進行藥物敏感性、突變或甲基化引起的表達變化等方面的分析。Oncomine可進行一個或多個基因的查詢,結果可視化。
數據來源和數據類型
Oncomine中僅包括研究表達變化的mRNA表達譜晶片和研究拷貝數的aCGH晶片。這些晶片數據來源於美國 NCBI的Gene Expression Omnibus (GEO) 、EBI的ArrayExpress,斯坦福基因晶片資料庫( Stanford Microarray Database, SMD ), 癌症和腫瘤基因圖譜(TCGA)以及文獻。
圖1 Oncomine中數據來源和數據類型
癌症類型
Oncomine中包括乳腺癌、膀胱癌、肺癌等20種癌症類型,共有729個數據集和90,000多個樣本的數據。
圖 2 Oncomine中的癌症類型及其數據集數
分析類型
Oncomine是對同個數據集內的樣本進行計算的,常用的分析分為4種:
差異表達分析:根據樣本類型或臨床數據對樣本進行分組,然後比較分析不同組內基因的變化(表達變化或者是拷貝數變化)。差異表達分析是Oncomine中主要的分析方法,差異分析除cancer vs. normal analysis以外,還包括cancer vs. cancer analysis、 clinical outcome analysis、pathway and drug analysis、drug sensitivity analysis等差異分析類型。
圖3 差異分析類型
協同表達分析:Oncomine採用層次聚類的方法可查詢到在特定癌症中某個基因與哪些基因表達模式相似。層次聚類方法會產生一個相關性(Correlation)的值,值越大,相關性越大。
Outlier 分析:可確定在部分癌症樣本中異常表達的基因。由於腫瘤異質性的存在,常規的t檢驗方法已不適應,Oncomine團隊建立了COPA分析方法來篩選在某些癌症中的部分樣本中異常表達的基因。
Concept分析:Oncomine內置第3方的數據,如GO 資料庫、KEGG資料庫、Transfac Transcription Factor Targets、picTar predicted miRNA target genes、COSMIC等。
優勢
節省成本:
豐富的癌症基因晶片數據,內容豐富,知識龐大 ;
臨床數據豐富,包括預後、轉移、TMN、用藥等臨床資料;
內置了豐富的第三方注釋數據,如GO、KEGG、COSMIC等 ;
用戶可以上傳自己的數據進行分析,免去了繁雜和重複的分析過程。
節省時間:
內置常見的晶片分析算法,分析結果直接可用 ;
操作簡便,結果可視化
在科研中的應用
確定癌症研究的目的基因
指導癌症研究的科研方向
幫助篩選潛在的腫瘤標記物
對前期實驗結果行驗證,補充文章依據。
利用Oncomine數據,
中翰金諾可以做的分析如下:
分析類型
具體分析項目
差異分析
分析單個基因在特定癌症中的差異表達/拷貝數變異
分析單個基因在多個癌症中的差異表達/拷貝數變異
分析多個基因在特定癌症中的差異表達/拷貝數變異
分析特定癌症中差異表達/拷貝數變異
共表達分析
獲取單個基因在特定癌症中的共表達基因
Meta分析
比較單個基因特定癌症中的表達
比較單個基因在多個癌症中的表達
比較多個癌症中差異表達基因
比較特定癌症不同亞型中差異表達基因
outlier分析
分析特定癌症部分樣本中異常表達基因
concept分析
分析特定基因集在特定癌症中的表達
綜合分析
meta分析和concept分析結合篩選目的基因
差異分析、meta分析和concept分析結合篩選藥物靶點
與GEO資料庫結合進行個性化分析
中翰金諾在Oncomine數據挖掘方面有著豐富的經驗,我們秉承一諾千金的服務理念竭誠為您提供可靠的,真實的,可視化的,有指導意義的數據結果。
說明:本文為中翰金諾原創作品,其他公眾號或網站轉載請聯繫zhuye@joingenome.com
中翰金諾業務聯繫方式:
浙江地區:於經理 18767167378
全國地區:陳經理 18767167375