生信精講|TCGA&GEO挖掘,預測腎細胞癌患者預後,精彩

2020-11-10 啟帆醫學BioSCI


題目:Construction and Validation of a 9-Gene Signature for PredictingPrognosis in Stage III Clear CellRen

譯名:預測Ⅲ期透明細胞腎癌預後的9基因信號的構建與驗證


摘要


目的

建立一個多基因信號,以幫助更好地III期腎細胞癌(RCC)患者的預後進行預測。

方法

★從GEO資料庫中下載GSE53757數據集,包括14對癌症和正常組織的表達數據,從TCGA資料庫中下載16對mRNA,表達譜數據(下載的是RNA-seq測序數據,需要提取mRNA數據)。

★差異表達分析,對共同差異表達基因進行進一步分析。

★對TCGA中選擇腎癌Ⅲ期病例 (N=122)進性lasso cox回歸,篩選和建立預後多基因信號。在FUSCC資料庫中選擇腎癌Ⅲ期病例(N=77)對多基因信號進行驗證。

★對所有病例(N=199)預測總體生存時用C-index和time-dependent ROC檢驗多基因信號的有效性。


結果

1.TCGA和GEO兩個數據集中共找到1370個差異表達基因。

2. Lasso cox 回歸模型找到9個mRNA,構建分類器將腎癌III期病人分為高風險組和低風險組,在TCGA患者(N122)中、FUSCC患者 (N=77)中、以及TCGA和FUSCC所有患者(N = 199)中預後差異非常顯著(p<0.01)。

3.對完整數據(N=199)進行多因素cox比例回歸,發現9個基因信號分類的風險組、診斷時的年齡、pNstage、ISUP grade為總體生存的獨立的預後因子。


介紹


腎癌是全世界最常見的泌尿系腫瘤之一,2018年美國估計有近65 340例新病例和14 970人死亡。腎細胞癌的發病率(RCC)在中國也在增加。目前,預後預測主要是根據RCC患者的病理分期。

目前,臨床上推薦採用腫瘤轉移(TNM)分類系統進行腫瘤分期。然而,各亞組之間存在看明顯的生存差異。四型腎感患者(T3NOM0,5年生存率:20-70%;T1-3N1MO,5年生存率:0-20%)(5)。雖然UICC/AICC TNM分期系統的最新版本(第8版)已經發布,但這個問題仍然存在,未解決,從而限制了該系統在判斷預後方面的應用,以指導臨床實踐因此,需要有更好的信號來幫助預測III期腎癌患者的預後。

此外,III期RCC患者的全身治療仍在發展中。幾項研究聲稱,在手術後接受索拉非尼或舒尼替尼的III期患者有更好的療效。與安慰劑相比,無疾病生存期(DFS),但總生存期(OS)相似。據報導,PazopanibNivolumumab在轉移性RCC患者中有效,局部晚期腎癌患者的輔助治療安慰劑沒有顯示出保護作用。佐劑和新佐劑nivolumab臨床試驗仍在進行中,但希望它們能顯示出良好的效果。ipilimumab的使用也可能是有希望的。因此,建立更準確的III期腎癌患者預後分類系統,對指導更好的管理策略具有重要意義。


材料和方法

病人和公共資料庫

GSE53757、14對癌症和正常組織樣品。

TCGA資料庫(通過UCSU-Xena下載)level3 mRNA數據,16對腎癌III期患者癌症和癌旁組織樣品。

●TCGA中122例腎癌III期患者有完整的臨床和生存信息,訓練集。

FUSCC資料庫中77例接受根治性腎切除術的患者,驗證集。

●共研究就199名腎癌III期患者基因表達數據和臨床信息。


公共數據的處理

★GEOquery包下載晶片數據、gcrma包對數據進行標準化.

★探針ID轉換為EntrezGenelD,多個探針匹配到一個EntrezGenelD,取均值。


識別差異表達基因

★對GEO數據使用paired t-test識別差異基因,並用FDR矯正p-value,p-value < 0.01並且[logFC|>1為差異表達

基因、TCGA數據做同樣分析(也可以用limma包),取共同差異表達基因。


RNA提取、反轉錄、qRT-PCR

在FUSCC驗證集中提取77名患者的總RNA,進行RT-PCR,以ATCB基因作為內參基因,ACt表示基因的表達水平,△Ct(A gene)= Ct(A gene) - Ct(ATCB gene),Ct值越大表示模板的初始濃度越低,也就是gene的表達量越低。所以△Ct值越高,初始表達量越低。


風險得分計算和統計分析(TCGA數據)

生存時間:

data of surgery to the date of death

last follow-up


差異表達基因篩選:

lasso cox 回歸(R-glmnet包)對差異表達基因進行篩選,減少差異表達基因的數量,並且得到篩選後的基因的回歸係數。


★ 根據風險得分將患者分組:

☉根據篩選後的基因的表達量和患者總生存時間,通過X-tile軟體,對篩選後的每個基因分別尋找最佳cutoffs。

☉然後根據各自cutoffs,將篩選的基因分為高表達基因和低表達基因,一般高表達基因用1表示,低表達基因用0表示。

☉根據每個基因的回歸係數與表達狀態(高/低表達)計算每個患者的風險得分,使用風險得分中位數將患者分為高風險組和低風險組。


生存分析:

使用KM法驗證高風險組和低風險組的患者生存時間是否有差異,生存信息來自TCGA資料庫患者和FUSCC資料庫患者,分別對訓練集(TCGA) 驗證集(FUSCC),整合數據(TCGA + FUSCC)進行生存分析。


COX回歸分析:驗證風險組是否為獨立預後因子。

Time dependent ROC:在每個數據集中評估風險得分的預測準確度。

C-index:表示一些預後因子的影響。


歡迎關注公眾號啟帆醫學BioSCI, 創始人之一為留美海歸生物醫學博士,經過數年積累,匯聚了大批國內外頂級名校的教授、博士、博士後以及其他科研人員等強大人脈資源。公眾號專注於生物醫學研究、科研課題設計、SCI論文寫作等領域的知識梳理和資料分享,為廣大醫務工作者提供便利。

相關焦點

  • 肉瘤樣腎細胞癌的診治經驗
    本文由醫脈通節選自《中華泌尿外科雜誌》2016年7月第37卷第7期原文作者:王坤、趙晨明、陳志強作者單位:華中科技大學同濟醫學院附屬同濟醫院泌尿外科 肉瘤樣腎細胞癌發展迅速,預後極差,單純手術治療對肉瘤樣腎細胞癌療效不佳。
  • 【中國科學報】研究發現促進腎透明細胞癌增殖與轉移的機制
    發現腎透明細胞癌預後指示  基於TCGA的多種類型腫瘤的大數據分析,顧殷敏等人發現DMDRMR的低甲基化與高表達只在腎透明細胞癌中表現出較差的預後,這意味著DMDRMR在該腫瘤中具有較為明顯的臨床意義。  「DMDRMR的診療作用在另外5個不同來源的腎透明細胞癌患者隊列中得到驗證。
  • 如何進行血清外泌體的miRNA標誌物的生信數據挖掘?本文告訴你研究套路!
    而通過生物信息學手段挖掘疾病標誌物已經有很多文章,那麼外泌體的標誌物又怎樣去通過生信分析呢?在這裡,總結了最近剛剛發表的幾篇血清外泌體的RNA標誌物文章,分析其中用到的思路,工具和研究套路。第一篇文獻是發表於期刊《Journal of Cancer》,影響因子3.182,核心是通過生信+實驗驗證手段,去發現肝轉移(LM)的結直腸癌(CRC)患者的新型循環外泌體miRNA標誌物。
  • 中大附一院發現:Numb蛋白可能是食管鱗狀細胞癌患者的治療靶點
    目前對Numb在食管鱗狀細胞癌(ESCC)中的作用知之甚少,ESCC是亞洲人群中主要的組織學食管癌。 這項研究的主要關注的是在ESCC背景下Numb的表達和生物學功能。通過對212例患者的組織晶片分析發現,與相應的非癌組織相比,ESCC組織中的Numb顯著上調。
  • 第六節 腎腫瘤
    第六節 腎腫瘤   一、腎細胞癌   腎細胞癌(renal cell carcinoma)是腎原發腫瘤中最多見的,約佔腎惡性腫瘤的80%~90%。多發生於60歲左右的老年人。男性多於女性,約為2:1。腎細胞癌來源於腎小管上皮細胞,故又稱為腎腺癌。
  • 李彥宏權威學術期刊發醫學論文 聚焦食管鱗狀細胞癌
    來源:澎湃新聞原標題:百度李彥宏權威學術期刊發醫學論文 聚焦食管鱗狀細胞癌去年衝刺中國工程院院士落選的李彥宏近日參與完成了一項重要研究。研究報告了食管鱗狀細胞癌(ESCC)基因組分析的最大圖譜,對508例食管鱗癌患者進行全基因組測序,發現與預後不良相關的關鍵分子特徵,認為該數圖譜對於開發ESCC特異性的診斷和治療生物標誌物非常有用。值得注意的是,這篇論文有3位通訊作者,百度公司創始人、董事長兼執行長李彥宏(Yanhong Li)位列其中。李彥宏此番並非普通作者之一,而是最具分量的通訊作者之一。
  • 百度李彥宏權威學術期刊發醫學論文 聚焦食管鱗狀細胞癌
    來源:澎湃新聞原標題:百度李彥宏權威學術期刊發醫學論文,聚焦食管鱗狀細胞癌去年衝刺中國工程院院士落選的李彥宏近日參與完成了一項重要研究。研究報告了食管鱗狀細胞癌(ESCC)基因組分析的最大圖譜,對508例食管鱗癌患者進行全基因組測序,發現與預後不良相關的關鍵分子特徵,認為該數圖譜對於開發ESCC特異性的診斷和治療生物標誌物非常有用。值得注意的是,這篇論文有3位通訊作者,百度公司創始人、董事長兼執行長李彥宏(Yanhong Li)位列其中。
  • 百度李彥宏權威學術期刊發醫學論文,聚焦食管鱗狀細胞癌
    研究報告了食管鱗狀細胞癌(ESCC)基因組分析的最大圖譜,對508例食管鱗癌患者進行全基因組測序,發現與預後不良相關的關鍵分子特徵,認為該數圖譜對於開發ESCC特異性的診斷和治療生物標誌物非常有用。值得注意的是,這篇論文有3位通訊作者,百度公司創始人、董事長兼執行長李彥宏(Yanhong Li)位列其中。
  • MCB:可預測乳腺癌患者預後的新型生物標記物
    2014年8月29日 訊 /生物谷BIOON/ --近日,刊登在國際雜誌Molecular and Cellular Biology上的一篇研究論文中,來自麥基爾大學的研究人員通過研究表明,一種名為p66ShcA的蛋白質或許可以作為一種生物標記物來幫助鑑別乳腺癌患者的預後不良
  • SEER數據挖掘4.8分SCI發文思路
    生信做膩了嗎?或者不做生信數據挖掘的,可以嘗試一下別的發文思路,例如挖掘SEER資料庫的臨床數據進行發表SCI。本次分享的範文發表在FRONT ONCOL上,影響因子:4.848,中科院分區:2區。這項回顧性研究旨在調查患有初始骨轉移的乳腺癌患者的臨床特徵,預後因素和手術獲益。研究方法:從2010年到2015年,從SEER資料庫中分析了6,860名被診斷患有初始骨轉移的乳腺癌患者。採用單因素Cox和多因素Cox分析來確定預後因素。根據從Cox回歸結果中選擇的因素進行列線圖。根據不同的亞型,轉移負擔和通過列線圖區分的風險組繪製生存曲線。
  • 鱗狀細胞癌抗原哪些情況會升高?這 13 種疾病要牢記!
    今天的腫瘤標誌物將為大家解讀鱗狀細胞癌抗原: 它的本質是什麼? 它有哪些功能? 臨床上有哪些應用? 鱗狀細胞癌抗原的本質是什麼?
  • 蛋白基因組又一力作:揭示頭頸部鱗狀細胞癌分型及治療靶標
    在所有頭頸部鱗狀細胞癌患者中佔比75%左右的HPV陰性群體擁有獨特的分子特徵及較差的臨床預後,而對其系統性的分子層面研究缺仍然相對較少。 近日,來自貝勒醫學院、約翰·霍普金斯大學和美國國家癌症研究所的科學家們在國際著名期刊Cancer Cell上面發表重要研究,其中Steven A. Carr也是作者之一。
  • 領星發表論文,初探突變特徵在中國肺癌患者的分布及對預後的預測
    此研究發現了一個新的預測LUAD患者預後的分子標誌物——Mutational Signature 4。此項研究納入了401例肺腺癌(LUAD)患者和92例肺鱗癌(LUSC)患者,通過全外顯子基因組測序分析突變特徵在肺癌患者中的整體分布情況,以及具有相應突變特徵的患者人群是否表現出不同的預後狀態。
  • 生信分析幫你湊!學會深度挖掘快速發文章
    這個時候需要的是生信分析——深度的數據挖掘和分析處理,可以幫助臨床醫生不耗費大量的時間通過實驗攢數據,而是通過數據處理得到自己想要的信息,更快速地發文章。 學習哪種生信分析的工具?
  • 預測肺動脈高壓患者預後有新指標!上海市肺科醫院研究 - 瀟湘名醫
    同濟大學附屬上海市肺科醫院研究人員在本刊發文報告,對於此類患者,有創右心導管測得的平均右心房壓和無創心肺運動試驗中的二氧化碳通氣當量(VE/VCO2)斜率可很好地預測其預後,兩者聯合預測價值更高。研究者指出,在臨床工作中,一旦發現這兩項指標均升高的患者,需加以警惕。
  • 什麼是scc鱗狀細胞癌抗原 抗原偏高怎麼辦
    隨著現在快節奏的生活,越來越多的人感覺到力不從心,感覺身體是一天不如一天了,就連年輕人都有這樣的想法,那你知道什麼是scc鱗狀細胞癌抗原嗎,scc鱗狀細胞癌抗原的意義有哪些呢,scc鱗狀細胞癌抗原偏高怎麼辦,一起來看文章介紹吧。
  • 高分生信必備的TCGA資料庫一站式分析神器!真捨不得告訴你
    於是,GEPIA等基於TCGA資料庫的可視化網絡平臺給我們帶了極大的便利,能夠簡單快速的預測或分析繪圖。這款工具是發表於今年2月的生信老牌期刊Bioinformatics,2019KRAB-ZNFs參與癌症發展,因此可能支持未來探索krabi - znf作為生物標誌物或抗癌靶點在患者管理機制中的功能和潛在效用的研究。
  • VAV2促進皮膚和頭頸部鱗狀細胞癌的再生性增殖
    VAV2促進皮膚和頭頸部鱗狀細胞癌的再生性增殖 2020-10-05 06:55 來源:澎湃新聞·澎湃號·湃客
  • 文章解讀 | 細胞外基質在非小細胞肺癌預後預測中的相關指標
    在個性化醫療時代,早期的非小細胞肺癌(NSCLC)患者的輔助化療(ACT)的預後和預測效果仍然比較差。ROC曲線進一步比較了不同分類方法的預後表現,AUC分析顯示在10年生存率的預測中EPPI風險評估系統要比無監督層次聚類方法能夠更好的根據患者不同的生存結果進行分類(Fig.3c),通過比較AUC進行最佳閾值的篩選。