單個預後模型太單薄?lncRNA+mRNA,真香

2020-11-10 事事聊生信

預後分析總能玩出新花樣,不久之前生信人公眾號推過診斷模型+預後模型的文章,預後風險評分中包含預後相關lncRNA和mRNA的也不少,今天這篇文章通過與疾病相關基因突變分組篩選差異的lncRNA和mRNA,構建共表達網絡,然後分別構建了mRNA風險評分+lncRNA風險評分,踐行了好事成雙的大道理。希望讀後你能有所啟發

High Expression of the SH3TC2-DT/SH3TC2 Gene Pair Associated With FLT3 Mutation and Poor Survival in Acute Myeloid Leukemia: An Integrated TCGA Analysis

急性髓系白血病中SH3TC2-DT/SH3TC2基因對的高表達與FLT3突變和低生存率相關:一項完整的TCGA分析

Fms樣酪氨酸激酶3(FLT3)突變是急性髓細胞性白血病(AML)中最常見的突變之一。但是,FLT3突變對生存的影響目前還沒有被充分研究,並且其致白血病的機制仍在進一步研究中。那麼該研究的目的就是識別FLT3突變AML中的差異表達基因(DEG),並找到其表達水平與預後相關的關鍵DEG,隨後進行了一系列的分析。讓我們一起來看一看作者都做了哪些研究吧~

一.材料和方法

1.1數據收集與預處理

該研究的工作流程圖如圖1所示。從TCGA中下載了151種人類AML樣本的數據,包括從IlluminaHiSeq_RNASeq平臺獲得的RNA測序數據和臨床隨訪數據,包括年齡,生存時間等。

圖1.流程圖

1.2 識別差異表達的lncRNA和mRNA

TCGA-LAML數據集由43個FLT3突變AML和108個FLT3野生型AML樣本組成。使用R包「 edgeR」來篩選FLT3突變體和FLT3野生型樣本之間的差異表達基因(DEG)。使用FDR來矯正多重假設檢驗的q值。FC≥2以及矯正後的P<0.05具有統計學意義。根據人類基因組GRCh38.93將 基因 ID轉換為基因symbol。使用R包「gplots」對DElncRNA和DEmRNA繪製了火山圖。

1.3 功能富集分析

使用R包「 clusterProfiler」進行KEGG分析。使用GSEA來鑑定SH3TC2-DT或SH3TC2高表達表型顯著富集的基因集。

1.4加權基因共表達網絡分析

使用R包WGCNA來構建DEG的共表達模塊。應用平均連鎖法和pearson相關性對TCGA-LAML的樣本進行聚類。基因i和j之間的加權鄰接矩陣定義為aij = | Cij | β(aij:基因i和基因j之間的鄰接關係,Cij:pearson相關性,β:閾值= 4)。將鄰接矩陣轉換成拓撲重疊矩陣(TOM)。最後,利用DynamicTreeCut算法構建平均連鎖層次聚類樹狀圖,將表達相似的基因分為相同的模塊。為了確定每個模塊的臨床意義,計算了基因意義(GS)來量化單個基因與臨床特徵的關聯。模塊重要性(MS)定義為模塊特徵基因(MEs)與基因表達譜之間的關聯。然後將不同的MEs與臨床特徵相關聯。

1.5 COX比例風險回歸分析

通過單變量Cox比例風險回歸評估每個黃色模塊基因的預後意義。然後,應用多變量Cox回歸分析從與預後相關的lncRNA構建一個3-lncRNA預後風險模型。對於mRNA來說,首先進行了最小絕對收縮和選擇算子(LASSO)回歸分析來選擇mRNA。然後,應用多元Cox回歸分析從選定的mRNA構建3-mRNA預後風險模型。根據風險評分中位數,將AML樣本分為高風險和低風險組。通過Kaplan–Meier分析來鑑定風險模型的預後價值。通過R包「 survivalROC」繪製ROC曲線來評估風險模型的預測準確性。通過多變量Cox回歸分析的結果繪製了列線圖以預測總體生存期(OS)。


1.6 SH3TC2-DT / SH3TC2基因對分析

對於單基因來說,應用t檢驗進行差異表達分析,應用Logistic回歸來分析SH3TC2-DT / SH3TC2表達與臨床特徵之間的關聯。為了預測SH3TC2的靶標,通過R包「edgeR」分析了SH3TC2高表達組(n = 76)和SH3TC2低表達組(n = 75)之間的DEG。然後,通過DAVID的「 Protein_Interactions」功能下的「 UCSC_TFBS」模塊對DEGs列表進行注釋。識別了DEG中顯著富集的轉錄因子(TFs)並應用Cytoscape進行了可視化。


從Vizome和TCGA下載BeatAML數據集的RNA測序數據和臨床隨訪數據,來驗證FLT3-ITD和FLT3-野生型AML之間SH3TC2-DT / SH3TC2的差異表達。同樣地計算DEG。應用GSE37642-GPL570 AML數據集來驗證SH3TC2表達水平與OS之間的關聯。根據SH3TC2的中位表達值,將136個AML樣本分為兩組。應用Kaplan–Meier曲線比較SH3TC2表達高低兩組樣本之間的OS。以上的這些統計檢驗和繪圖都是通過R和GraphPad Prism 7.0進行。


二.結果展示

2.1 FLT3-突變型和FLT3-野生型AML之間的DEmRNA和DElncRNAs

作者應用R包「 edgeR」對FLT3野生型AML和FLT3突變AML之間進行差異表達分析,共識別到差異表達的619個lncRNA(113個上調和506個下調)和1,428個mRNA(194個上調和1,234個下調)(圖2A,B) 。KEGG分析顯示DEmRNAs富集到與腫瘤發生密切相關的通路,如Wnt信號通路,PI3K-Akt信號通路和Ras信號通路(圖2C),表明FLT3突變在AML發病機制中的可能作用。

圖2. 在FLT3突變體和FLT3野生型AML之間識別DElncRNA和DEmRNA

2.2 加權共表達網絡的構建及與生存相關的模塊的識別

應用R包「 WGCNA」來構建DEG的共表達模塊,並進一步確定與預後相關的模塊。通過平均連鎖和Pearson相關性的方法對TCGA-LAML樣本進行聚類(圖3A)。軟閾值參數設置為β= 4(圖3B)。

圖3. 層次聚類樹和軟閾值估計

合併具有高度相似性的模塊後,通過平均連鎖層次聚類(圖4A)生成了總共27個模塊,模塊的基因數目大小從31到327個不等。其中非共表達的基因被分組為「灰色」模塊,並排除在進一步的分析中。隨機選擇的400個DEGs的熱圖顯示每個模塊中共表達基因的高度拓撲重疊(圖4B)。特徵基因鄰接熱圖顯示了27個共表達模塊之間的關係(圖4C)。最後,確定了這些模塊與臨床特徵之間的相關性(圖4D)。

圖4. 共表達基因和模塊與性狀關係的網絡構建

其中黃色模塊與骨髓高白細胞(WBC)計數和胚細胞百分比相關,但與年齡,性別,突變計數,細胞遺傳風險或分子遺傳風險無關。並且該模塊與較差的無病生存期(DFS)和OS有較高的關聯,因此選擇進行進一步的分析。


2.3黃色模塊中每個基因的預後意義

通過單變量Cox比例風險回歸,黃色模塊中共有43個基因與OS顯著相關。其中,12個lncRNA和31個mRNA的高表達與OS較差相關(圖5)。然後對這些lncRNA和mRNA進行進一步的構建lncRNA或mRNA預後風險模型。

圖5.基於黃色模塊中基因表達的生存分析

2.4 lncRNA預後風險模型的建立

通過多變量Cox比例風險回歸分析,作者建立了3-lncRNA預後風險模型來預測AML患者的OS,風險評分=(0.006899×SH3TC2-DT的表達值)+(0.00026×AF064858.1的表達值) +(0.016446×AL133353.1的表達值)(表1)。其中SH3TC2-DT是與預後最相關的lncRNA(表1)。

表1. lncRNA預後風險評分模型

根據風險評分的中位數,148例患者被分為高危(N = 74)和低危(N = 74)組(圖6A–C)。高危患者的OS顯著更低(圖6D)。多因素Cox回歸分析顯示,年齡和lncRNA風險評分是影響OS的獨立預後因素。lncRNA風險評分對生存的影響較大(圖6E)。ROC曲線下的面積為0.664,表明該風險模型具有較高的預測價值(圖6F)。繪製Nomogram以可視化多元Cox回歸分析的結果(圖6G)。此外,Kaplan–Meier曲線還證實這三個lncRNA是OS的預測指標(圖5A–C)。

圖6.lncRNA的Cox比例風險回歸分析

2.5 mRNA預後風險模型的建立

為了提高預後風險模型的預測準確性,首先進行了LASSO回歸分析,並從黃色模塊中具有預後價值的31個mRNA中選擇了四個mRNA(SH3TC2,ENPP2,TMEM273和PRDM16)進行進一步分析。通過多變量Cox比例風險回歸分析,確定了一個3-mRNA預後風險模型來預測AML病例中的OS,風險評分=(0.000612×SH3TC2的表達值)+(0.000507×ENPP2的表達值)+( 0.000277×TMEM273的表達值)(表2)。

表2.mRNA預後風險評分模型

同樣地,根據風險評分的中位數,148例患者被分為高危(N = 74)和低危(N = 74)組(圖7A–C)。高危組患者的OS率顯著更低(圖7D)。多因素Cox回歸分析顯示,年齡,白細胞計數,分子風險和mRNA風險評分是影響OS的獨立預後因素。mRNA風險評分對生存的影響更大(圖7E)。ROC曲線下的面積為0.744,表明該風險模型具有較高的預測價值(圖7F)。最後,繪製Nomogram以可視化多元Cox回歸分析的結果(圖7G)。此外,Kaplan–Meier曲線還證實了這三種mRNA是OS的預測指標(圖5D–F)。

圖7.mRNA的Cox比例風險回歸分析

2.6 SH3TC2-DT / SH3TC2基因對是AML的獨立預後因素

在這一部分作者研究了SH3TC2-DT和SH3TC2表達的臨床意義。該研究表明,SH3TC2-DT和SH3TC2在FLT3突變AML樣本中協同高表達(圖8A,9A),表明SH3TC2-DT可能在AML發病過程中調節SH3TC2表達。並且SH3TC2-DT或SH3TC2的高表達與OS差有關(圖8B,9B)。兩者的ROC曲線都顯示出較高的預測值(圖8C,9C)。多變量Cox回歸分析顯示SH3TC2-DT和SH3TC2表達均為獨立的預後因素(圖8D,9D)。此外,應用邏輯回歸分析將SH3TC2-DT / SH3TC2基因對與臨床特徵相關聯,發現SH3TC2-DT和SH3TC2的高表達均與較高的WBC計數,分子遺傳風險以及FLT3突變有關。SH3TC2的高表達也與年齡有關(表3、4)。

表3. SH3TC2-DT表達與臨床特徵之間的關聯(logistic回歸)

表4. SH3TC2表達與臨床特徵之間的關聯(logistic回歸)

GSEA顯示,伴有FLT3-ITD的AML基因集在SH3TC2-DT和SH3TC2高表達表型中富集(圖8E、9E)。

圖8. SH3TC2-DT表達與總生存率和基因集富集的關係

圖9. SH3TC2表達與總生存率和基因集富集的關

作者發現與幹細胞特性或白血病發生相關的TF顯著富集於SH3TC2高表達組和SH3TC2低表達組之間的DEG,表明這些TF 可能是AML中SH3TC2的潛在靶標(圖10)。

圖10. TFs 調控網絡

最後就是驗證部分了,作者分析了BeatAML(Vizome)數據集,發現SH3TC2-DT和SH3TC2在FLT3突變AML中均顯著高表達。此外, GSE37642-GPL570還顯示,SH3TC2的高表達與AML中OS差有關。


好啦,這篇文章的內容就這麼多啦~總結一下文章是總-分-總的模式:1、篩選FLT3野生型和突變型白血病差異因子,構建lncRNA、mRNA共表達網絡,篩選預後marker;2、分別構建lncRNA、mRNA預後風險評分模型;3、篩選疾病關鍵的lncRNA-mRNA調控軸生存分析;4、外部數據驗證。內容該有的都有,故事完整連貫,再加點其它分析(eg:浸潤、免疫治療等)就更完美了。話不多說心動嗎,心動不如行動:


相關焦點

  • 真香定律你了解多少
    (正經臉)所謂的真香定律:真香定律(the L .aw of Delicious),是由我國著名心理學家、數學家王境澤(WangJingze)提出的一項著名的永恆定律,其具體內容即&34;。經研究表明,在正常情況下沒有任何一個具有動能的單個生物體能違反真香定律。2014年6月,王境澤為了得出真香定律的公式,帶領助手進入中國西部的偏遠山區進行研究。為了快速得出公式,不惜以&34;為實驗代價進行快速推理。
  • 第五人格:模型來了!真香警告?兩隻兔子可愛,而愛麗絲也不錯!
    非對稱性對抗競技手遊第五人格官方終於正式公布第九賽季精華二寶箱裡面的一金兩紫時裝的模型情況了。從圖片來看,它們的設計質量並沒有玩家們想像中的那麼差,甚至是超過預想。首先是新監管者26號守衛邦邦的限定金皮三月兔,作為一隻大兔子,手中的權杖和隨身物品是亮點!
  • 科學家發現剪接mRNA前體的秘密
    趙和她的同事通過實驗提出了一個統一的模型來解釋所有這三種現象(內含子定義、外顯子定義、反向剪接),而不需要用不同的剪接體解釋不同的過程,這一點也得到了生化實驗的支持。研究人員說,雖然這項工作重點是酵母剪接體E複合體,但這個發現適用於所有真核生物,接下來他們將在其他系統中進行實驗,以了解剪接過程的機制和規律。
  • 論文模板丨這篇8分+基於免疫細胞特徵預後模型
    文章利用了從TCGA資料庫、GEO資料庫等多種資料庫以及最新文獻中搜集的乳腺癌患者表達譜數據進行了免疫細胞特徵的分析,開發了IRRS風險評分預後模型並從多方面證明了該模型的預後預測價值。說明了該風險評分模型可以作為可靠的預後生物標誌物,為新型化學療法和免疫療法的開發提供治療評價,並且可能有助於乳腺癌患者的臨床決策。
  • 瘋狂統計學 | 生存資料預後模型的建立及Nomogram的繪製方法
    事實上本章討論的構建預後模型也是一種「算命」,只是這是一種更為科學的 「算命」。筆者作為一個腫瘤專科醫生,在日常工作中也經常會遇到如下的情況:一位55歲的男性中晚期食管癌患者絕望地詢問我:「周醫生,請問我還能活多久?」
  • 論文技巧丨免疫相關預後模型如何發4分+2區期刊?
    作者的目的是開發一個免疫相關的預後特徵用於輔助早期肺腺癌患者的個體化治療。方法:從GEO和TCGA資料庫中下載LUAD數據集。使用Cox比例風險回歸模型篩選預後基因。使用風險評分防禦開發預後特徵。K-M曲線和ROC曲線評估預後特徵的性能。此外,使用驗證集驗證預後特徵的穩健性。結果:使用訓練集構建一個包含21個免疫相關基因的免疫預後特徵。
  • 【學術成果】NGS血液腫瘤臨床轉化醫學應用:完善老年AML患者預後評價模型
    為此,浙江大學附屬第一醫院血液病科金潔教授團隊聯手世和基因,通過NGS檢測分析老年CN-AML基因突變特徵並結合臨床特徵,成功構建了更為完善的預後評價模型!為此,浙江大學附屬第一醫院血液病科金潔教授團隊聯手世和基因,通過NGS檢測分析老年CN-AML基因突變特徵並結合臨床特徵,成功構建了更為完善的預後評價模型!成果已經於11月 29日發表到International Journal of Cancer(IF:6.513)。
  • 免疫相關lncRNA預測模型想發7分+,你需要這樣分析
    文章利用TCGA資料庫中的肝癌病人患者的轉錄組數據,分析並確定了患者的免疫相關lncRNA特徵並建立了預測模型,預測病人的預後情況、腫瘤免疫浸潤和化學治療方法的效率。此外,本文修改了Lasso算法,得到了更為可靠的模型。計算了5年ROC曲線的AUC值和Akaike信息標準(AIC)值,並確定了分界點,從而建立了區分肝細胞癌患者高低風險的最佳模型。然後,本文從生存率、臨床病理特徵、浸潤腫瘤的免疫細胞、化學治療效果和免疫抑制的生物標誌物的角度重新評估了模型。鑑定出36個DEirlncRNA對,其中12個包含在Cox回歸模型中。
  • 紅杉魚這樣做真好吃,香辣下飯,比吃紅燒肉過癮,太香了
    紅杉魚這樣做真好吃,香辣下飯,比吃紅燒肉過癮,太香了。世間唯有美食不可辜負,大家好,今天給大家分享一道美味佳餚,學會之後自己在家就能吃到五星級酒店的味道,而且營養價值豐富,話不多說,一起來學習一下它的做法吧!
  • 免疫檢查點評分系統提高胃癌預後評估準確性
    既往研究顯示,腫瘤浸潤性淋巴細胞(TILs)狀態與預後營養指數(PNI)評分顯著相關,PNI評分是營養狀態和全身免疫能力的一項指標。PNI評分較高的患者相比於評分較低的患者在腫瘤組織中更有可能具有較強的淋巴細胞浸潤性。然而,目前尚不清楚較高的PNI評分是否會對免疫抑制性腫瘤微環境的患者有益。
  • 「真香」英語怎麼說?so delicious?別鬧!
    用手機看視頻的時候 總有這樣的彈幕: 真香預警,真香預告,真香~ 那「真香」什麼意思?英語怎麼說? 難道要說so delicious嗎?
  • 真香定律是什麼梗 王境澤定律真香是什麼意思出自哪裡
    「真香定律」是什麼梗?  在抖音中最近很多人都比較喜歡評論「真香定律」,不過很多人可能還不知道這個真香定律是什麼意思,下面我們就一起來了解下這個梗的意思以及出處吧。真香定律是什麼梗  這個估計是2018最熱門的一個梗,這個梗主要來自於參加湖南衛視《變形記》裡的一位主人翁王境澤,當初王境澤去變形計時的梗,到了農村後說我就算從這跳下去,摔死在這裡也不會吃你們一口飯一口水。然後晚上就餓的吃起了飯,還說了句,真香。所以後來就有了真香這個梗。
  • 《只狼:影逝二度》免費新PS4主題:高清永真小姐姐 太香了
    《只狼:影逝二度》免費新PS4主題:高清永真小姐姐 太香了   今日,PS4推出了《只狼:影逝二度》的免費「動感假日」主題,背景圖是遊戲中幾名主要角色的高清大圖,其中永真小姐姐清冷利落
  • 逃不掉的「真香定律」?
    何謂「真香」定律 大言不慚立下flag 隨後用實際行動否決自己之前的想法 「真香」與「打臉」 似乎有異曲同工之妙 很多人都逃不過「真香定律」
  • 老套路也得學:lncRNA–miRNA–mRNA調控網絡預測
    應用Kaplan-Meier法顯示預後價值。結果:通過對GEO和TCGA數據集中的差異表達基因(DEGs)進行交叉分析和Pearson相關性分析,鑑定出20個mRNA、24個miRNAs和41個lncRNAs。
  • 深度學習新應用:在PyTorch中用單個2D圖像創建3D模型
    文本通過探索,將深度學習擴展到了單個 2D 圖像的 3D 重建任務中,並成功實現了這一應用。近年來,深度學習在解決圖像分類、目標識別、語義分割等 2D 圖像任務方面的表現都很出色。不僅如此,深度學習在 3D 圖像問題中的應用也取得了很大的進展。本文試著將深度學習擴展到單個 2D 圖像的 3D 重建任務中,這是 3D 計算機圖形學領域中最重要也是最有意義的挑戰之一。
  • 【臭臭】煲仔飯,真香!
    為了尋求刺激,我們尋找了幾樣「真香」配料:螺螄粉、臭豆腐、榴槤。欲知口味如何,且聽我細細說來。挖一勺冰激凌質感般的果肉和焦香的米飯攪拌,慢食咀嚼會嘗到清甜的米香和濃鬱的果肉香在嘴巴交織纏綿。還真別說,用砂鍋煮出的螺螄粉更有味,恆溫特性也讓粉絲保持了滾燙的熱度。 但要記得從灶爐取下砂鍋後,要放在木製鍋墊或鐵架上,以防砂鍋接觸冰冷臺面發生炸裂。
  • 免疫調控受體TIGIT在「怒」模型大鼠胸腺及外周血單個核細胞表達的意義
    目的:探討免疫調控受體TIGIT在「怒」模型大鼠胸腺細胞及外周血單個核細胞中的表達情況及TIGIT與免疫功能的相關意義。以曠場試驗、攻擊行為試驗觀察大鼠行為學變化,記錄試驗前後體質量變化及胸腺指數,應用免疫組織化學法觀察各組大鼠胸腺及外周血單個核細胞中TIGIT陽性表達情況,流式細胞術測試外周血CD4+、CD8+ T細胞亞群表達水平,並進行胸腺細胞及外周血單個核細胞上TIGIT表達與外周血CD4+T/CD8+T淋巴細胞比值的相關性分析。實驗方案經江西中醫藥大學動物實驗倫理委員會批准。
  • 我們天天說的,「真香」「我酸了」用英語怎麼說?
    我們看彈幕,看評論的時候,經常會見到「真香」「我酸了」真樣的網絡用詞,在我們的生活中,也會這樣表達,但是用英語應該怎麼表達,你會嗎?今天,趣趣君就和大家一起看一看。NO.1「真香」英語怎麼說?so delicious?
  • Cell:單個活細胞mRNA穩定性研究新技術!
    2015年7月15日訊 /生物谷BIOON/ --本文亮點: 在活細胞內利用雙光子螢光技術檢測了單個RNA與蛋白質的結合 對細胞不同區域內與mRNA結合的蛋白質進行了定量檢測 在不同時空條件下對mRNA與ZBP1和核糖體的相互作用進行了定量檢測 ZBP1