(1)網址登陸:
https://www.oncomine.org/resource/login.html
(2)Oncomine是什麼?
Oncomine是目前世界上最大的癌基因晶片資料庫以及癌基因數據挖掘平臺,整合了GEO、TCGA和已發表文獻等來源的RNA和DNA-seq數據;該資料庫擁有全世界最全面的癌症突變譜、基因表達數據以及相關的臨床信息,可用作發現新的生物邊際物或尋找新的治療靶點。
劃重點來了:Oncomine免費使用,但需要使用學術研究機構(例後綴為.edu的郵箱)的郵箱註冊
(3)帳號註冊
登錄界面(頁面1):點擊紅框進行註冊,跳轉頁面2
所有選框必填(頁面2),填寫完整後點擊submit,會將帳號和臨時密碼發送到填寫的郵箱中。註冊完畢後,登錄進入主界面,跳轉頁面3
(4)Oncomine數據展現基本操作
主界面(頁面3),其中有搜索框,並且可以設置篩選類型,其中有很多可選項,如紅色框所示:
以LACTB基因為例(頁面4):在search框輸入基因名稱LACTB,在filter框選擇分析類型(analysis type)以及癌症類型(cancer type);之後再閾值選擇部分(threshold)選擇P-值(P-VALUE)、倍數(FOLD-CHANGE)、GENE RANK值分別為1E-4/2/10%,如下圖紅框4所示:
選擇Hong Colorectal選項(頁面5),就可得到右側的圖,展示每個樣本中TP53的表達結果:
點擊紅色框1可以轉換結果表達形式(頁面6)在這裡,我們以箱圖數據為例,演示操作教程;點擊紅框2可以得到該數據集的基本屬性總結,包含主體、作者、機構、實驗類型、數據連結等:
(5)數據集下載
頁面6中點擊紅框2得到數據集基本屬性(頁面7),其中包含數據連結(Data Links):
點擊數據連結進入GEO界面,跳轉至頁面8,點擊「Analyze with GEO2R」分析按鈕(紅色框):
點擊Define Groups(紅色框),新建兩個組名tumor和normal並將數據加入對應的組,如下圖(頁面9),藍色背景數據被加入tumor組,共70條,紅色背景數據被加入normal組,共12條。
頁面9往下拖,點擊profile graph,進入頁面10,輸入基因在該晶片裡的代號(代號可以在Oncomine界面裡的篩選結果中找到,下圖中reporter旁邊的紅框裡),然後點擊頁面10的set, 得到頁面10展示結果。
點擊紅框1裡的sample values,出現頁面11所示結果,得到作圖的最終數據(紅框2)。
複製紅框2數據到excel表格文件中,就可以使用其他作圖工具做出其他類型的圖,例如專業作圖工具graphpad。
總結:因為Oncomine所提供的的數據展示方法的局限(僅箱圖展示),本教程僅介紹了如何從Oncomine資料庫中導出所需要的基因表達數據,使得研究者可以利用其它作圖工具(例:graphpad或python編程作圖包matplotlib等)作出相較於箱圖更利於表達分析結果的圖表類型。