大家好!今天跟大家分享的文獻是2020年10月發表在Journal of Translational Medicine (IF=4.124)雜誌上的一篇文獻。文章利用GEO和TCGA資料庫中的早期肺腺癌患者的數據,分析並確定了免疫相關的預後特徵並進行驗證。
題目:Development and validation of a robust immune-related prognostic signature in early-stage lung adenocarcinoma
早期肺腺癌免疫相關的預後特徵的開發與驗證
摘要
背景:隨著高危人群篩查計劃的進行,Ⅰ期和Ⅱ期肺腺癌(LAUD)的發病率可能會有所增加。作者的目的是開發一個免疫相關的預後特徵用於輔助早期肺腺癌患者的個體化治療。
方法:從GEO和TCGA資料庫中下載LUAD數據集。使用Cox比例風險回歸模型篩選預後基因。使用風險評分防禦開發預後特徵。K-M曲線和ROC曲線評估預後特徵的性能。此外,使用驗證集驗證預後特徵的穩健性。
結果:使用訓練集構建一個包含21個免疫相關基因的免疫預後特徵。根據總生存期(OS),將患者分為高風險組和低風險組。多因素Cox回歸分析表明,這21個基因可以作為OS的獨立預後因素。ROC曲線表明免疫特徵對預測早期LUAD的OS的性能較好。此外,將免疫特徵和腫瘤分析結合可以為預後預測和治療提供更精確的分類。
結論:作者的研究提出了一種預測早期LUAD患者總生存期的免疫相關預後特徵,有助於對早期LUAD患者進行精確的生存風險分層和個體化臨床治療。
流程圖
1. 數據的獲取和整理
本文從GEO資料庫中篩選早期LUAD患者的晶片數據包括訓練集GSE30219,GSE31210和GSE50081以及驗證集GSE72094。從TGCA資料庫中篩選TCGA-LUAD的轉錄組數據用於驗證。
2.鑑定訓練集中21個免疫相關預後基因
分析數據集共包含413個患者的訓練集數據和678個患者的驗證集數據。在innateDB數據集中得到的1051個免疫相關基因中,在驗證集中鑑定到920個。分別在GSE30219,GSE31210和GSE50081中鑑定到173,300和146個與OS顯著相關的基因。其中有21個共有基因,包括14個風險基因和7個保護基因。
3.21個基因的免疫相關預後特徵
根據風險打分作者將患者分為高風險組和低風險組。K-M生存曲線表明高風險組患者的OS較差(圖1a)。此外,GSE30219數據集1年、3年和5年的AUC分別為0.75、0.80和0.82,GSE31210數據集的AUC分別為0.78、0.75和0.81,GSE50081數據集的AUC分別為0.73、0.75和0.74(圖1b),表明這21個基因的預後特徵在預測早期LUAD生存情況方面性能較好。對合併數據集進行K-M生存曲線分析,結果表明高風險組患者的OS較差(圖2a)。其1年、3年和5年的AUC分別為0.66、0.66和0.7(圖2b),表明這21個基因的預後特徵在合併數據集中有較好性能。
21個基因的預後特徵和訓練集總生存期之間的相關性
4.21個基因預後特徵的驗證
為驗證這21個基因預後特徵的穩健性,作者計算了TCGA-LUAD和GSE72094數據集的風險打分。根據優化閾值作者將患者分為高風險組和低風險組。與訓練集的結果一致,TCGA-LUAD和GSE72094數據集的低風險組OS較差(圖3a)。TCGA-LUAD的1年、3年和5年的AUC分別為0.61、0.66和0.62,GSE72094的AUC分別為0.70、0.64和0.94(圖3b),結果表明預後特徵在預測OS方面有良好的的性能。以上結果表明,這21個基因的預後特徵在早期LUAD預後預測中性能較好並且可用於晶片和轉錄組測序數據集。
21個基因的預後特徵和驗證集總生存期之間的相關性
5. 21個基因的預後特徵可以作為獨立的預後因子
使用單因素和多因素Cox分析研究這21個基因的預後特徵是否可以作為早期LUAD患者的獨立預後因子。單因素回歸分析和多因素分析表明預測特徵與OS顯著相關(表1和表2)。以上結果表明,基於21個基因的預後特徵可以作為早期LUAD患者的獨立預後因子。
表1 單因素和多因素Cox回歸分析訓練集中21個基因特徵和OS
表2 單因素和多因素Cox回歸分析驗證集中21個基因特徵和OS
6.結合21個基因的預後特徵和腫瘤分析進行預後預測
多因素分別表明預後特徵和腫瘤分期都是獨立的預後因子。因此,作者構建一個結合預後特徵和腫瘤分期的預後模型用於預測生存期。根據基因風險打分和腫瘤分期將患者分為六組,分別為1組(ⅠA期和低風險),2組(ⅠA期和高風險),3組(ⅠB期和低風險),4組(ⅠB期和高風險),5組(Ⅱ期和低風險)和6組(Ⅱ期和高風險)(圖3)。對各組進行K-M生存分析,結果表明2組,3組,4組,5組和6組患者的預後比1組差,而1組預後最好6組預後最差(圖3)。2組和3、4、5組患者的預後沒有顯著區別。這些結果表明,ⅠA期高風險組和ⅠB期、Ⅱ期低風險組患者的預後相似。此外,根據早期LUAD患者的腫瘤分期和預後特徵的分組情況可能為早期LUAD患者的預後預測特供更精確的治療方案。
7.21個預後基因的功能注釋和富集分析
為鑑定這21個基因參與的生物學過程和通路,作者進行了GO富集分析和KEGG通路分析。結果表明,這些基因主要富集在細胞因子正調節(GO:0001819),免疫效應過程調節(GO:0002697)和內在凋亡信號通路(GO:0097193),這些基因主要富集在癌症蛋白多糖等通路(圖5)。
結論
作者基於GEO和TCGA數據構建了一個免疫相關基因的預後特徵,可以預測早期LUAD患者的總體生存期。此外,作者將預後特徵和腫瘤分期結合構建預測模型可以準確評估患者預後。這些發現可以為LUAD患者的治療提供新的治療靶點並有希望提高早期LUAD患者的生存期。本文的亮點在於使用免疫相關基因構建了預測模型預後肺腺癌患者的預測情況,得到了較好的預測效果並使用外部數據及進行了驗證。
版權聲明:本文轉自「生信發文助手」,文章轉載只為學術傳播,無商業用途,版權歸原作者所有,如涉及侵權問題,請聯繫我們,我們將及時修改或刪除。
沃斯(WOSCI)由耶魯大學博士團隊匠心打造,專注最新科學動態並提供各類科研學術指導,包括:前沿科學新聞、出版信息、期刊解析、論文寫作技巧、學術講座、論文潤色等。