腫瘤全面分析資料庫:oncomine使用介紹

2021-01-14 醫學資料庫百科

    在做腫瘤研究的時候,我們現在都知道可以提前查一下基因的表達和臨床特徵有沒有相關性 ,這樣對我們的下一步實驗也是一個預測的方向。經典的我們可以使用TCGA的數據來進行分析,我們之前介紹的GEPIA就可以來進行分析。但是對於測序的結果而言,其檢測的結果不管是基於人種或者其他的原因,可能和我們的實驗結果有可能存在偏差。這個時候其實多分析幾個結果,多看個數據集的結果會更好一些。常用的資料庫就是GEO了,但是使用GEO還要一個一個數據集找,這樣又很浪費時間。所以有沒有簡單的方法呢?今天就給大家介紹一個匯總了多個癌種,多個數據集的綜合性分析基因表達和臨床相關性的資料庫:oncomine(https://www.oncomine.org/)。

    由於這個資料庫還是很重要使用起來也是很簡單的,所以這裡就從註冊帳號開始,很詳細的介紹一下這個資料庫的功能吧。


1.  註冊與登陸:

要想順利使用Oncomine,首先得有個帳號,其中免費註冊僅限非營利機構郵箱(院校或科研機構)。


點擊上圖紅色方框處Not a user? Register now!進行註冊。

根據上圖提示,輸入相關信息,提交。要注意檢查一下自己郵箱,系統會發送帳號密碼過來,我們使用郵件提供的帳號密碼登陸oncomine,系統會提示修改密碼,按照指示操作即可。注意,修改密碼後系統會再次發送一封確認修改密碼的驗證郵件,其中包含確認連結,我們必須點擊連結後才可正常使用。


2.  基因表達譜差異分析

登陸帳號後,選擇數據集(研究對象):在左邊的 「Primary Filter」 中依次選擇Analysis Type →Differential Analysis → Cancer vs. Normal Analysis → Gastric Cancer vs. Normal Analysis(7)。頁面自動跳轉為胃癌及癌旁對照的晶片數據子集。


其中數字7代表該資料庫包含7個胃癌相關相關數據集。

此處默認顯示的是第一個數據子集的數據表達情況,我們可以通過選擇其他數據子集來查看相應數據。詳細介紹如上圖所示,其中熱圖的每個格子代表一個樣本的表達數據,滑鼠置于格子上時,會顯示該樣本的對應數據信息。

點擊研究名稱(此處為Chen Gastric(132)),可以查看該研究中的數據情況,如下圖。

當然,我們也可以進行多數據集整合檢索基因表達差異(Meta分析)。

根據研究目的,選擇數據集,比如我們這裡想看一下與腸型胃癌相關的差異表達基因。勾選該資料庫包含所有腸型胃癌的數據子集後,點擊上方Compare按鈕。

右側頁面將會顯示所選數據集的meta分析結果。其中Median Rank代表中位秩,即秩的中位數。


3.  特定基因表達差異分析

Oncomine支持幾乎所有蛋白編碼基因,部分研究較多的非編碼 RNA也能搜索到。這裡我們以編碼基因TP53為例,進行後續介紹。在搜索欄中輸入TP53,點擊搜索按鈕,頁面如下:

我們可以根據表格上方的篩選條件(p值、變化倍數等)擴大或縮小篩選範圍。

Outlier分析是基於腫瘤異質性進行的離群值或異常值的分析,即只在腫瘤的某些亞型或特定群體中異常表達。比如10%胃癌中TP53表達顯著升高,但如果是在全部樣品中分析TP53的表達差異顯著性,不會有顯著性差異,但是僅在這10%的樣品中有差異,我們可以分析這10%的樣品有何共同之處,從而找出影響TP53顯著變化的因素。

對於圖中的小方格,藍色代表TP53在對應的腫瘤低表達,紅色代表高表達,灰色代表沒有數據。其中數字表示符合篩選條件的研究數量。

滑鼠置于格子上方,會顯示對應的信息。點擊小方格可以直接進入該研究的數據頁面。比如這裡點擊胃癌,可以進入TP53在胃癌中的表達數據頁面。

Reporter代表探針。一般晶片對同一基因可能會設計多個探針(分別針對基因的不同位置的序列),不同的探針會返回不同的信號值,因此選擇不同的探針,分析的結果就會不同,當然,不同的探針的結果不能放在一起進行比較(當成是同一探針)。檢索時Oncomine會自動顯示P值最小的結果。

頁面最下方顯示數據來源。如上圖中所選擇的分析來源是GEO資料庫中的GSE13911研究。我們一般要使用這個研究的數據時,除了引用Oncomine之外,還要引用這個分析來源(原始文獻)。

當然,我們也可以進行單基因的Meta分析。輸入目的基因後,根據研究目的,選擇相應數據集,比如我們這裡依舊想看一下TP53與腸型胃癌的關係。勾選該資料庫包含所有腸型胃癌的數據子集後,點擊上方Compare按鈕。

Meta分析結果顯示TP53在腸型胃癌中的表達情況,P值<0.05。勾選的分析名稱前面的數字對應Meta分析結果裡的序號。Meta分析的的意義在於整合比較該基因在不同研究和不同分析中的表達情況,結果可以直接用於文章中。


4.  基因表達與臨床相關性

說起基因表達,那必須要研究生存呀。這裡我們想看TP53在胃癌中的生存情況,輸入基因名稱後,依次選擇左側欄的篩選條件,頁面自動跳轉。

由於我們是免費版本,所以這些數據不能下載,要手動摘錄樣品名稱、基因表達、生存狀態及生存時間數據後再利用其他軟體(SPSS、GraphPad、R等)做生存分析。

數據少的話尚不費力,但碰到巨多樣本的時候怎麼辦?一個個摘錄就沒意思啦。這裡告訴大家一個小竅門,我們上文數次提到數據來源,這個很重要,我們可以根據數據來源來直接下載數據。如下圖:根據Pubmed連結可直接連結至該文章,一般在補充材料部分作者會上傳該項研究的基因表達及臨床相關信息,包括臨床病理參數及生存情況。這時候我們下載後便可以進行後續分析啦。當然,有的上傳部分或者乾脆沒有上傳的也無可厚非,大家可以先自行找一下。

如果有臨床病理參數數據的話,自然也可以進行基因表達與臨床病理參數的相關分析,比如腫瘤分期分級、突變、藥物敏感性等。操作過程同上,輸入目的基因後,選擇癌症類型,選擇病理亞型。


5.     基因共表達分析

輸入目的基因TP53,依次選擇左側篩選框內的篩選條件後,頁面跳轉如下:

圖中顯示,與TP53表達相關係數最高為0.753,我們可以進一步檢索這些高相關性基因的功能,必要時進行實驗驗證。

我們要注意的是Oncomine中的共表達不能對多個研究進行比較(Meta分析)。因為不同的研究中,與目標分子共表達的基因大多是不同的,所以在選擇研究名稱時,儘量選擇「cell line」的研究,因為在細胞系中檢測,相對於臨床組織樣本,個體差異更小,幹擾更小,後期實驗可預期性會更好。

好啦,今天給大家介紹了Oncomine的大部分功能,整體不難,傻瓜式的點點點,具體還有更多更為詳盡的功能等著大家去發掘,而不僅限於查看一個基因是否差異表達喲!


相關焦點

  • oncomine資料庫的申請和使用
    網站:https://www.oncomine.org/首先需要去申請帳號:一般需要學校edu
  • Oncomine:腫瘤晶片資料庫
    然而這些數據來自不同的組織和團隊,由於缺乏統一的數據管理和組織,這些數據在發表之後就沒有再利用了,為了提高數據利用率,促進腫瘤研究的發展,Oncomine的開發團隊收集了各種來源的腫瘤相關的晶片數據,用標準化的分析流程處理這些數據,數據分析的結果通過web服務查詢和可視化,對應的文章連結如下https://www.ncbi.nlm.nih.gov/pmc/articles
  • 「oncomine」——如何在大數據時代挖掘腫瘤數據
    這是一場革命,龐大的數據資源使得各個領域開始了量化進程,無論學術界、商界還是政府,所有領域都將開始這種進程。--by老談  在生物學領域,大數據的整合分析更是亟不可待。到目前為止,在腫瘤方面已有oncomine和TCGA這兩個資料庫,可供分析參考。
  • 傳說中的Oncomine! 【基因數據挖掘專題第十三期】
    今天,我們要介紹一個全新的、大名鼎鼎的資料庫——Oncomine為了更加形象地幫大家理解這個詞,我們不妨解釋為Oncology Mining它結合了TCGA、GEO、ArrayExpress等資料庫,經過一系列加工、標準化和分析後匯集而成。這有什麼好處?我們平時做的晶片數據往往來自於一個或兩個數據集,偶爾會因為樣本的批次、平臺的差異、實驗的條件等因素使結果與我們預期的不一樣。
  • 腫瘤經典資料庫Oncomine,腫瘤研究的萬金油,看這篇就夠了
    因為它和咱們之前討論過的TCGA一樣,都是腫瘤領域應用較廣的資料庫。不過Oncomine和TCGA相比的優勢就是,它除了數據,還提供了一些簡潔易操作的分析工具,如差異表達分析、共表達分析等,分析後可以直接出圖用在文章裡。另外它還整合了TCGA和GEO的部分數據。缺點是,免費版的數據不能下載,收費又天價。不過辦法還是有的,先賣個關子。
  • ​腫瘤差異分析、互作分析神器,這個資料庫到底有多好用?
    >http://syslab4.nchu.edu.tw/) 這個資料庫的主要數據是來源於TCGA資料庫,另外對於少數腫瘤還有GEO的數據。這次小編為什麼要給大家介紹這個資料庫呢?說來都是一把辛酸淚,曾經小編在做TCGA差異分析的時候,相比較腫瘤各分期與正常的差異以及腫瘤各分期之間的差異,得做好多次差異分析,實在不忍心看到解螺旋的小夥伴們跟小編一樣經歷這樣的心累感,今天小編向大家介紹一個超級省心的資料庫CRN,相信大家使用了這個資料庫之後,對於TCGA腫瘤的差異分析和互作分析減少一點點心累感。
  • 世界上最大的癌基因資料庫—Oncomine來了
    (1)網址登陸:https://www.oncomine.org/resource/login.html(2)Oncomine是什麼?Oncomine是目前世界上最大的癌基因晶片資料庫以及癌基因數據挖掘平臺,整合了GEO、TCGA和已發表文獻等來源的RNA和DNA-seq數據;該資料庫擁有全世界最全面的癌症突變譜、基因表達數據以及相關的臨床信息,可用作發現新的生物邊際物或尋找新的治療靶點。
  • The Cancer Immunome Atlas:腫瘤免疫圖譜資料庫
    為了更好的理解腫瘤和免疫細胞相互作用,科學家對來自TCGA和其他幾個大型腫瘤研究項目,共20種實體瘤的NGS數據進行分析,對應文章連結如下https://linkinghub.elsevier.com/retrieve/pii/S2211124716317090為了更好的查看分析結果,將相關數據整理成了一個資料庫,網址如下
  • 滬建首個兒童血液腫瘤資料庫
    □記者 許沁晚報訊 今天上午,上海交通大學醫學院附屬上海兒童醫學中心兒童血液腫瘤中心大樓奠基。與此同時,上海兒童醫學中心還將建立國內首個兒童血液腫瘤診治信息資料庫,將收集血液腫瘤患兒在發病症狀、醫療過程、預後情況,以及生活情況長期追蹤等方面的信息,用於幫助分析來自不同區域的病兒在疾病發展上的各種情況、治療效果和生活質量。
  • UniProt 資料庫介紹
    如果只有比較少的序列,可以通過與近緣物種或模式物種的已知功能的序列進行同源比對,得到序列可能的功能信息;但很多時候我們得到了大量的未知功能的序列,只與一兩個物種的功能序列進行比對,這樣注釋很不全面,這個時候,可以通過與各類功能資料庫進行大批量的序列比對,獲取序列可能的注釋信息。
  • 常用生物資料庫大合集
    CSCD : http://gb.whu.edu.cn/CSCD/  腫瘤特異性分析circRNADisease : http://cgga.org.cn:9091/circRNADisease/ pub/疾病TRCirc : http://www.licpathway.net/TRCirc/view/index  轉錄因子-circENCORI
  • 突破 | 中國學者建立大規模腫瘤免疫單細胞資料庫
    傳統的測序技術只能在群體水平進行測序,單細胞轉錄組測序技術的出現,極大地提高了腫瘤微環境圖譜的解析度,使得研究人員可以在單細胞層面探究腫瘤微環境中的細胞組成以及基因表達調控的異質性。近幾年腫瘤病人組織的單細胞轉錄組數據迅速累積,但目前還沒有一個綜合的資料庫將這些已有的數據資源整合起來。
  • Oncomine:癌基因晶片數據挖掘平臺系列介紹(一)
    數據來源和數據類型Oncomine中僅包括研究表達變化的mRNA表達譜晶片和研究拷貝數的aCGH晶片。這些晶片數據來源於美國 NCBI的Gene Expression Omnibus (GEO) 、EBI的ArrayExpress,斯坦福基因晶片資料庫( Stanford Microarray Database, SMD ), 癌症和腫瘤基因圖譜(TCGA)以及文獻。
  • 【收藏】生物資料庫大合集
    CSCD : http://gb.whu.edu.cn/CSCD/  腫瘤特異性分析circRNADisease : http://cgga.org.cn:9091/circRNADisease/ pub/疾病TRCirc : http://www.licpathway.net/TRCirc/view/index  轉錄因子-circENCORI
  • TSGene:腫瘤抑癌基因資料庫
    TSGene是一個從文獻中收集整理的抑癌基因資料庫,文章發表在Nucleic Acids Research,連結如下https://academic.oup.com/nar/article/41/D1/D970/1074154資料庫的網址如下https://bioinfo.uth.edu
  • Martin Murphy談腫瘤資料庫
    腫瘤是人類的公敵,攻克腫瘤是大家共同奮鬥的目標。無論在中國還是全球,我們看到腫瘤的發病率都在逐年攀升,這是全球也是CSCO關注的焦點。在中國,每年約有3百萬新發診斷的癌症患者,2百萬患者每年會死於癌症。CSCO的任務和宗旨就是如何改變這一現狀。
  • 生物資料庫大合集還不趕快收藏起來!!!!
    CSCD : http://gb.whu.edu.cn/CSCD/  腫瘤特異性分析circRNADisease : http://cgga.org.cn:9091/circRNADisease/ pub/疾病TRCirc : http://www.licpathway.net/TRCirc/view/index  轉錄因子-circENCORI
  • 環狀RNA常用資料庫使用介紹
    下面我們介紹環狀RNA相關的幾個重要資料庫。circBase資料庫1、選擇感興趣的circRNA這裡以「HIPK3」基因為例,打開circBase網站(http://circrna.org/),在搜索框中輸入興趣基因「HIPK3」名稱,點擊「search」按鈕。
  • 高分生信必備的TCGA資料庫一站式分析神器!真捨不得告訴你
    一文學會使用TCGA資料庫的網絡分析工具——KRAB ZNF explorer癌症基因組圖譜(The Cancer Genome Atlas,TCGA)早已在全世界廣為知曉,這項計劃包含了人類全部癌症的基因組變異圖譜,通過數據挖掘能夠很好地了解癌症發生和發展的機制,是腫瘤研究中重要的資料庫。