今天和大家分享的是2020年3月發表在Frontiers in Genetics(IF:3.517)上的一篇文章,「Modulator-Dependent RBPs Changes Alternative Splicing Outcomes in Kidney Cancer」,文章中作者使用TCGA資料庫中的腎透明細胞癌數據集,以MISO軟體計算可變剪接事件的包含率,進一步通過構建調節劑-RBP-AS三元組,分析調節劑對RBPs的AS調控功能的影響。
Modulator-Dependent RBPs Changes Alternative Splicing Outcomes in Kidney Cancer
腎癌中調節劑依賴的RBPs改變可變剪接的結果
一、研究背景
腎細胞癌(RCC)是一種是一種常見的惡性腫瘤,佔所有新發癌症病例的4.2%,具有放療和化療耐藥性,目前手術仍是一線治療方案。並且經過早期手術治療仍有30%的患者最終發生轉移,而轉移性的腎透明細胞癌(KIRC)的患者2年生存率不到20%。RNA可變剪接(AS)失調的產物被認為是潛在的生物標誌物,在疾病中具有關鍵作用。AS事件很大程度上受到RNA結合蛋白(RBPs)的調控,而RBP的調控作用受到特定細胞刺激下調節劑(如信號蛋白,miRNA,lncRNA等分子)的影響。作者希望揭示調節劑、RBPs與AS之間的關係。
二、分析流程
三、結果解讀
1.調節劑-RBP-AS三元組的構建方法與調節劑作用的分類方法
數據來源:RBPs與調節劑表達數據:TCGA-KIRC資料庫中下載的480名KIRC患者的RNA-seq數據。AS的量化數據:使用MISO軟體計算樣本中AS事件的包含率(PSI,percent spliced isoform),保留在全部480個樣本中至少100個樣本PSI值大於0.1的事件,對原始AS事件進行處理以生成高置信度事件(總樣本的約21%)。本研究僅關注外顯子跳躍skipped exon(SE)事件。RBPs的結合信息:從ENCODE資料庫下載的150個RBPs的ECLIP-Seq數據作為結合信息。從Ensemble下載hg19參考基因組。數據過濾:僅保留 log2 (CPM) >= 1的表達數據以及在全部480個樣本中至少100個樣本PSI值大於0.1,且PSI的變異係數(CV)大於0.1的事件。使用線性回歸模型預測可能的triplets(三元組)
Ytarget為目標基因的AS結果,Xrbp和Xm分別為RBP和調節劑對AS結果的單獨作用,XrbpXm為二者的共同作用,如果RBP與調節劑的互作可以影響AS結果,那麼模型中β3不為0。作者篩選出其中β3不為0的三元組進行下一步分析。接著作者在每一個三元組中根據調節劑的表達水平將樣本分為高和低(前33%和後33%)兩組,分別計算RBP表達量與AS結果的PSI值的皮爾遜相關係數PCCs。最後比較兩組間的ΔPCCs來確定調節劑的功能模式:「attenuates splicing」 ,「enhances splicing」,「inverts splicing」(減弱,增強,反轉)。如表一所示,作者根據|PCClow|、|PCChigh|以及p值將調節功能定義為減弱/增強外顯子排除/包含,外顯子包含/排除反轉為排除/包含這6種模式。
圖1:工作流程圖,調節劑-RBP-AS triplets的構建與調節劑作用分類
表1:調節劑介導的RBP剪接調控類別
2.確定腎癌中QKI的調節劑
作者使用上述方法在TCGA-KIRC數據中鑑定了1,040,254個FDR<=0.01的潛在三元組,經過數據過濾後最終確定了調控AS結果數量最多的RNA結合蛋白Quaking (QKI),對應2,014個Modulator-QKI-Splicing三元組(包含1,101個調節劑,187個剪接事件和130個相應基因)。作者對這些調節劑的功能進行了分析。
圖A展示了2,014個三元組的調節作用在6個模式中的分布。作者發現作用於多個剪接事件的調節劑大多數具有多種作用模式,並且同一調節劑作用於QKI的不同AS事件,結果可能是相反的。比如在ARMH4-QKI-CLTC中,ARMH4低表達時QKI的表達量增加與CLTC外顯子的包含有關,ARMH4高表達時QKI的表達量增加與CLTC外顯子的排除有關。而在ARMH4-QKI-STIM1中,ARMH4從低表達到高表達時,QKI表達量與STIM1外顯子包含率的相關性是增加的。作者認為這一發現表明不同的調節模式依賴於調節劑-RBP-AS三元組,而不是特定的RBP或目標基因,即調節劑的表達水平可以影響RBPs對AS結果的調控功能。作者以調節劑的作用模式對三元組進行聚類,同一組中的調節劑傾向於以同種模式對QKI的剪接作用進行調節(圖B),表明這些調節劑可以作為QKI的拮抗劑或激活劑來影響AS結果。作者進一步發現許多調節劑作用於相同的QKI剪接目標,提示這些調節劑可能在相關途徑中共表達或者具有相似的功能。圖C展示了QKI調節劑的相關性熱圖,可以看到結果聚為明顯的四類。KEGG通路富集結果顯示這些調節劑在細胞因子-細胞因子受體相互作用,Th1和Th2細胞分化等通路中顯著富集(圖D)。圖E展示了根據基因的生物類型和特徵對QKI調節劑的分類結果(包括免疫相關基因,轉錄因子和lncRNA)。
圖2:RNA結合蛋白QKI相關調節劑的鑑定
3.QKI調節劑的功能分析
作者從三類調節劑中挑選了六個,包括免疫基因(CCL3,HLA-F,AGER),轉錄因子(ARMH4,STAT4)和lncRNA(LINC01268),展示QKI-splicing-調節劑之間的調節關係。三維散點圖中藍色和紅色分別表示調節劑表達低和高兩組的樣品,並擬合了QKI-splicing-調節劑的回歸平面。(圖3)
圖3:QKI-splicing-調節劑的相關性
作者進一步研究AS失調與KIRC發展之間的關係,在TCGA-KIRC數據集中分析了腎癌樣本與正常樣本間的調節劑表達差異以及生存差異,結果顯示大部分調節劑具有表達差異並與生存相關。
圖A,B展示其中對目標基因AS影響最為顯著的10個調節劑。可以看到箱線圖中腫瘤組織(紅色框)與正常組織(灰色框)調節劑表達水平具有顯著差異。生存分析中以調節劑表達水平中值將樣本分為高表達組和低表達組,可以看到組間具有顯著生存差異。KEGG通路富集顯示,QKI調節劑在腫瘤進展相關通路中存在富集(圖C)。GO富集分析顯示調節劑在轉錄調控相關的過程中富集,包括RNA剪接、細胞生長和蛋白結合等(圖D-F)。作者認為富集結果表明QKI主要在剪接水平對基因進行調控,當調節劑對QKI表達水平進行幹擾時,QKI的RNA結合、剪接和調控等功能失調。圖G中作者使用Network of Cancer Genes (NCG) 和 Tumor suppressor gene database (TSGene) 資料庫鑑定調節劑中的腫瘤相關基因。結果顯示149(13%)個調節劑基因為NCG中的腫瘤驅動基因,77(7%)個為TSGene中的蛋白質編碼抑癌基因。
圖4:QKI調節劑的功能分析
4.分析腎癌中調節劑影響的CTNND1剪接結果
CTNND1的第20號外顯子剪接是相關調節劑最多的AS事件:「chr11:57582866: 57582972: + @ chr11: 57583387:57583473: + @ chr11:57583769: 57586652:+」,已有研究顯示CTNND1編碼Armadillo蛋白家族中的一個成員,該成員在細胞黏附與信號轉導中發揮作用。多種CTNND1剪接亞型在細胞中表達,僅表達full-length CTNND1的細胞具有侵襲性。
在CTNND1的相關調節劑中鑑定出了107個減弱外顯子排除和7個增強外顯子排除的調節劑。圖A為剪接調控示意圖。圖B中作者展示了其中四種調節劑的作用,可以看到調節劑高低表達組中QKI的剪接調控作用明顯不同。TNFRSF14低表達組中QKI表達量與CTNND1 PSI之間的相關係數為-0.38 (p = 1.7e-05),而在TNFRSF14高表達組中兩者不具有相關性(correlation = 0.001, p = 0.98),表明TNFRSF14的高表達可能抑制QKI的剪接活性。以上結果表明差異表達的調節劑可以改變QKI在調控CTNND1剪接結果中的作用,作者認為這種調節模式為研究疾病相關的AS失調提供了新的思路。
圖5:KIRC中CTNND1的剪接結果受相關調節劑表達水平的影響
小結
這篇文章中作者主要是使用一種新穎的工作框架研究調節劑-RBPs-AS結果之間的調節作用,在可變剪接的調控中提供了一條新的研究思路。首先作者使用MISO軟體計算TCGA-KIRC中480例樣本的AS事件的PSI,接著計算RBPs表達水平與PSI的相關性係數PCC,並以線性回歸模型建立調節劑-RBPs-AS結果三元組,然後以調節劑表達水平將三元組中的樣本分為高低兩組,計算組間的PCC差值,從而確定調節劑的調控模式。作者進一步選出其中調控AS最多的RNA結合蛋白QKI和對應最多調節劑的AS事件,對三元組的調控關係進行了展示,並對調節劑基因進行了KEGG和GO富集,分析其在KIRC中的可能作用,最後得出KIRC中調節劑影響RBPs的AS調控作用,且AS的失調與腫瘤進展相關。