我們把基礎科研的層次分為四部分:臨床、細胞、動物和分子,在臨床樣本出發的研究中,我們介紹過三步驟:1. 找差異;2. 分析相關性 3. 預後分析。對大家來說,臨床部分常常遇到的問題就是樣本量不夠,比如自己只能收到20對樣本,這時我們還有兩個選擇:
1. 從商業化的公司購買樣本,比如組織晶片;
2. 從公共資料庫(比如TCGA)中挖掘數據。
其實,我們看到的高分文章常常就是把這三部分整合起來用,比如:CCR這篇文章:
第一個figure:
甚至直接只用資料庫的結果,今天我們就從一篇文章開始說起:
這篇文章是2017年3月份發表在Oncotarget雜誌的文章,說的是STAT家族的七個分子作為乳腺癌標誌物的主題,我們看文章的內容:
fig1 七個STAT因子在不同腫瘤中的表達(數據來源於Oncomine)
fig2 七個STAT因子與SBR(Scarff Bloom & Richardson grade status)的關係
fig3 七個STAT因子與乳腺癌預後(RFS)的關係(KM Plotter)
fig4 乳腺癌中STAT3表達與突變(預後)分析(cBioPortal)
就這樣,大家已經看到了,文章用了Oncomine,KM plotter,TCGA等資料庫,挖掘下來就把4個圖給找出來了,是不是一方面覺得Oncotarget名副其實的灌水(鄙夷臉),另一方面在想:即使是灌水,我要是也能灌幾篇也可以(沉思臉)。
所以,今天我們就來用工具跟大家說說這些圖的做法,今天我們說的這個是:fig 3 七個STAT因子與乳腺癌預後(RFS)的關係(KM Plotter)中如何用網站直接做:
這個網站是:Kaplan Meier Plotter(http://kmplot.com/analysis/),打開後頁面如下:
劃重點了,網站可以進行四個癌種:乳腺癌、卵巢癌、肺癌、胃癌的mRNA表達和乳腺癌miRNA的預後分析。
下面我們看怎麼把fig3的圖給重複出來,我們以P值小於0.05的STAT2 為例:
接下來:
選好最後的Draw Kaplan-Meier Plot後就出來了:
跟文章裡面的結果有些不同,是由於資料庫更新造成的,不過logrank P都小於0.05,都有意義:
其它的內容我們下次再說,大家感興趣的也可以通過課程來聽,小張都放到課程裡面了:
關於課程大家可以掃碼或者單擊閱讀原文。
長按二維碼識別關注「小張聊科研」
關注後獲取《科研修煉手冊》1.0、2.0、3.0、4.0、基金篇精華合集