轉眼間已經步入2017年,小編祝大家雞年大吉,一切順利。作為新年的第一帖,今天向大家介紹一款非常有用的腫瘤學研究軟體:OncoLnc。我們知道,曾幾何時,通過晶片或者測序篩選腫瘤組織中異常表達基因包括mRNA, miRNA, lncRNA是許多腫瘤科研工作的第一步,也是一種發表SCI論文的便易方法,當然也是燒錢的一種境界,但是現如今由於TCGA資料庫的存在,讓這種套路已漸漸成為歷史。TCGA資料庫,簡而言之,就是一個包括不同腫瘤差異基因表達的資料庫,關於TCGA的使用方法,當前網上有許多教程,大家可以自行翻閱,TCGA資料庫中包含了許多基因在相關腫瘤中的表達水平,但是TCGA資料庫並未涉及這些基因對患者的生存影響,那麼如何分析這些基因在腫瘤患者中的預後意義呢?我們可以通過今天介紹的OncoLnc軟體完成,OncoLnc是一款基於TCGA資料庫的在線生存分析軟體,網址為http://www.oncolnc.org 。
例:分析ALK基因表達對肺腺癌患者生存的影響
第一步:打開網址,在Your Favorite gene中填寫你所感興趣的基因包括mRNA, miRNA以及LncRNA,如本例中我們填寫「ALK」這個基因,點擊Submit;
第二步:進入COX regression results for ALK 界面,第一列Cancer為腫瘤類型,每一個腫瘤都有一個簡稱如LUAD為Lung Adenocarcinoma, 可通過Cancer上標中「i」查詢,Cox Coefficient為COX回歸係數,P-Value為COX分析結果p值,FDR Corrected為校正後陰性發現率(這種生物信息學方面一個常用指標,小編不是十分懂,暫且這麼翻譯吧),RANK為該基因在影響該腫瘤的所以基因中的排序,值越小說明對預後影響越大,Median Expression與Mean Expression為中位表達值與平均表達值;
第三步:點擊LUAD行,Plot Kaplan列 「Yes Please」,進入下一界面;Lower Percentile 與Upper Percentile,意思為選擇比較的兩組,Lower Percentile為選擇多少比例的低表達患者,Upper Percentile為選擇多少比例的高表達患者;
如本例中,按ALK表達水平將LUAD患者分為四等份,我們選擇比較低表達的25%患者與高表達的25%患者之間的生存分析,得到Kaplan Plot(Go to PDF導出該Kaplan Plot),顯示P-value=0.0244, 說明兩組間生存時間存在差異。OncoLnc網站的recommendation為:如果病倒數足夠多的話,可以選擇25% vs 25%, 或33.3% vs 33.%,但如果病例數不足,應選擇50% vs 50%; 不要問我多少病例數算足夠,因為小編也不知道。
第四步:可點擊Click Here導出上述兩組數據,數據包括Patient的代碼,Days隨訪時間(天),Status狀態(生/死),Expression為相對表達水平。
PS:個人覺得OncoLnc有兩個重要的意義:第一,如果你有一個明確的目標基因,可通過OncoLnc分析其表達水平的高低是否會影響腫瘤患者的預後;第二,如果你沒有明確的目標基因,可通過OncoLnc得到影響患者預後的某些個潛在基因,理論上這些基因會通過調控腫瘤的相關生物學特徵影響其預後,因此可作為下一步研究的選擇。
訂閱「臨床科研那點事」,共同探討臨床科研技巧,共同學習臨床科研思路,共同掌握臨床科研方法。