今天,我們要介紹一個全新的、大名鼎鼎的資料庫
——Oncomine
為了更加形象地幫大家理解這個詞,我們不妨解釋為Oncology Mining,顧名思義,就是挖掘腫瘤方面的生物學信息。它結合了TCGA、GEO、ArrayExpress等資料庫,經過一系列加工、標準化和分析後匯集而成。這有什麼好處?我們平時做的晶片數據往往來自於一個或兩個數據集,偶爾會因為樣本的批次、平臺的差異、實驗的條件等因素使結果與我們預期的不一樣。而這個資料庫,可以讓我們站在更高的一個位置來觀察所有相關研究的晶片結果,這一點會在這一節講課中會為大家展示。
另外,據統計,該資料庫收集了約500種腫瘤的基因表達和樣本數據。意味著無論你是研究什麼方向,只要是腫瘤方面的,在這裡都能找到屬於你自己的菜。最後的最後,告訴大家的是,oncomine可以進行在線分析,這對於我們一些非生物信息學專業的同志們來說是個極好的消息。那廢話不多說,我們還是來點實實在在的乾貨。
首先打開主頁:
https://www.oncomine.org/resource/login.html
第一步我們就需要進行帳號註冊,這裡需要提醒大家的是,註冊過程中需要非營利性機構的郵箱(大學或研究機構),類似QQ、新浪郵箱是不接受的。其他步驟大家只要按照說明依次操作既可。
註冊成功後,我們就輸入帳號和密碼,進入下面這個界面。
在頁面的左側紅色方框內是我們進行篩選的地方,主要的操作就是在這裡完成的。
接下來,我們假設想驗證一下EGFR這個因子在腦膜瘤中的表達情況。這時,我們得在下面的紅色框內輸入EGFR,並點擊旁邊的「放大鏡」。
此時就會跳出右側這張圖,它反應了EGFR在各種腫瘤內的一個表達情況,其中紅色代表高表達,顏色越深,則表達越高。藍色就代表低表達。這個就有點類似我們之前在GEO裡面學的熱圖。但是第一行分別表示的是不同研究中的組織對照的情況,這裡分別是癌灶Vs.正常組織,癌灶Vs.癌症,癌灶亞型分析等等。
接下來我們點擊上圖中箭頭所指的地方。得到下面這個界面。表示EGFR在神經系統腫瘤與正常組之間的一個表達情況。
方框一指的是我們的過濾條件,一般默認既可。第二個紅色方框表示的是不同神經系統腫瘤與正常組的研究,按照generank由大到小排列。什麼是generank?比方說第一個研究的generank為24,也就意味著在該項研究中有23個其他基因比EGFR更具有顯著性。
這裡由於有很多類型的腫瘤,我們假設只考慮神經膠質瘤,那麼我們把所有的GlionlastomaVs. Normal都選上,進行綜合分析,如下圖。
然後點擊compare即可。
可以很容易看到之前我們選的7個研究,EGFR都是表現為高表達的。同樣地,我們可以去考察其他的亞型是否能得到相似的結果。
這裡小編索性將所有神經系統的腫瘤都納入進來,可以發現有的研究EGFR表達無明顯的統計學差異,顏色上表現為白色。其他則表現為高表達。
好了,今天的內容先介紹到這裡。大家是不是覺得非常簡單呢?但是由於操作的界面有很多選項,所以建議大家還是自己操作一遍會印象深刻。接下去,小編還會繼續跟大家分享這個資料庫的其他功能,希望大家再接再厲!
溫馨提醒:如需查詢既往「豪斯醫生基因數據挖掘專題」推文及視頻,請關注「醫學方」公眾號後點擊「精品專題」進入
「醫學方」始終致力於服務「醫學人」,將最前沿、最有價值的臨床、科研原創文章推送給各位臨床醫師、科研人員醫學方已推出「臨床數據挖掘」、「基因數據挖掘」、「R語言教程」、「醫學統計學」、「微創動物實驗培訓」等多個專題課程,如需了解課程詳細推文,可關注「醫學方」公眾號,點擊「精品專題」進入
想了解「醫學方」最新視頻課程動態?可登陸騰訊課堂或網易雲課堂收看
目前已有課程:
(1)醫學方|醫學統計學公開課|石小白老師教您輕鬆學統計(公益免費課程)
(2)醫學方|醫學數據挖掘精品課程|豪斯醫生手把手教您如何數據挖掘
騰訊課堂:https://medfun.ke.qq.com
網易雲課堂:http://study.163.com/u/ykt1467466791112
客服電話:15821255568
客服微信:yixuefang1234
微信公眾號:
如果你覺得文章還不錯,就請點擊右上角選擇發送給朋友或者轉發到朋友圈。您的支持和鼓勵是我們最大的動力。喜歡就請關注我們吧~
長按二維碼
關注我們