今天和大家分享的是2020年4月發表在Cancers(IF:6.162)上的一篇文章,「The Circular RNA Landscape of Non-Small Cell Lung Cancer Cells」,作者組裝了FL3C數據集,使用rRNA耗竭的方法檢測circRNA;在基因水平和反向剪接位點水平描述circRNA表達的數據;對 circTNFRSF21的翻譯進行驗證,隨後構建過表達載體,細胞克隆實驗探究過表達的circRNA與增值表型和組織學亞型之間的關係。
The Circular RNA Landscape of Non-Small Cell Lung CancerCells
非小細胞肺癌細胞的環狀RNA格局
一、 研究背景
環狀RNA(circRNA)與傳統的線性RNA(linear RNA)不同,通過共價鍵將首尾相連呈封閉環狀結構,不受RNA外切酶影響,表達更穩定。由於其高穩定性,circRNA被認為是新的生物標誌物的良好候選者。同時,circRNA可能作為對治療反應的良好預測性生物標誌物。而肺癌是常見的癌症類型,最常見的是非小細胞肺癌(NSCLC),NSCLC可以進一步分為腺癌(LAUD)和鱗狀細胞癌(LUSC)亞型。作者命名了FL3C的細胞數據集,並欲通過FL3C描述circRNA在NSCLC細胞系中的格局,從而綜合分析circRNA與非小細胞肺癌中的特定表型和基因型的關係。
二、 分析流程
三、 結果解讀
1. 肺癌細胞在rRNA消耗殆盡後進行circRNA的檢測
作者將自己組建的數據集(FL3C)與公共資料庫CCLE中的數據進行比較。二者使用了不同的circRNA檢測方法。結果證實二者的檢測量有顯著差異:使用rRNA-方法的FL3C數據集檢測量25倍大於poly(A)富集方法的CCLE數據集;在耗盡rRNA之後進行RNA的測序,檢測circRNA是可行的。
圖1:不同方法檢測到的circRNA讀數
2. FL3C數據集的一般特徵
作者在此進行了分組,基因水平(gene level)按照circRNA是否衍生於同一個基因分組,反向剪接位點水平(backsplice level)則根據是否衍生於同一個反向剪接位點分組。
A展示了FL3C數據集的構成:60個人肺細胞系,其中50個肺腺癌細胞系,7個非腺癌的NSCLC細胞系,3個是未轉化的肺細胞系。B展示了每個基因衍生的circRNA數量。其中對FL3C數據集中那些至少在30個細胞系表達circRNA的基因進行分組。C和D展示了circRNA在基因/反向剪接位點水平的頻數分布。E和F展示了基因/反向剪接位點產生的circRNA在不同細胞系的表達情況。x軸表示細胞系的數量。
圖2:FL3C數據集特徵
3. circRNA的第一個和最後一個外顯子是被貧化的。
作者分析了circRNA中沿mRNA表達的外顯子,發現第一個和最後一個外顯子很少在circRNA中表達。
A展示了反向拼接(backsplice)的示意圖:受體外顯子首先出現在線性mRNA中,隨後的供體外顯子被反向剪接。B和C是針對受體外顯子位置繪製的頻數分布圖。B是外顯子位數,C是mRNA位置的百分數分段。可以看出最前端的外顯子/mRNA分段的內容作為受體外顯子的概率要遠遠小於第二位置的外顯子。D和E是針對供體外顯子位置繪製的頻數分布圖。D是外顯子的位數,E是mRNA位置的百分數分段。可以看出最後一位的外顯子/mRNA分段的內容作為供體外顯子的概率遠遠小於倒數第二位。
圖3:circRNA中外顯子的使用頻率
4. circRNA的表達可以區分肺癌細胞和未轉化的肺細胞
作者在基因水平和反向剪接位點水平進行了聚類和主成分分析(PCA)。篩選了在基因和反向剪接位點水平最高表達的100個circRNA進行分析。
A和B對篩選出來的circRNA表達進行聚類分析。可見未轉化的細胞系在基因和反向剪接水平上都聚集。C和D對篩選出來的circRNA表達進行PCA。降維數據,描述了非轉化細胞系與腺癌和非腺癌NSCLC細胞系分別成簇(對應藍色,粉色,綠色)。在較小程度上,非腺癌細胞系也成簇。E和F對細胞系複製後聚類。反應絕大多數細胞系複製的高重複性。
圖4:circRNA表達的聚類和可重複性
5. circRNA和線性RNA的表達正相關
由於circRNA是從線性RNA中衍生而成的,因此作者對二者進行相關性分析,繪製下述相關性分布的圖像。在這裡total RNA(總RNA)即線性RNA。
A和C:在基因和反向剪接位點水平上繪製的相關性分布。可見基因水平上相關係數中位數是+0.27,而反向剪接位點水平,也就是獨立探討單個circRNA,相關係數中位數只有+0.06。B:在≥30個細胞系中表達的RNA的基因和反向剪接水平上,circRNA和總RNA之間的相關性分布。可見相比較於A,這裡兩種水平的相關性差異減少。因此,大多數表達良好的circRNA與線性RNA的表達正相關,只有極少數的例子是負相關的。D:基因和反向剪接水平的相對circRNA /總RNA比率(相對單位)。可見circRNA和總RNA的比率有很大的差異
圖5:circRNA與總(線性)之間的相關性
6. 癌基因產生更多的circRNA
作者採用了COSMIC資料庫(ver90)中的CGC,將FL3C數據集內的基因分成癌基因和非癌基因。癌基因與非癌基因相比,在基因水平更能顯示出circRNA的特性。
A:在基因的水平,對標準化的circRNA進行求和:可見癌基因在讀取量方面佔優勢,2.1倍。T-test p = 1.8×105。B:在反向剪接位點水平,求和後發現,高達8.4%的circRNA來源於癌基因,但平均讀取量優勢不如基因水平的顯著。C:對circRNA/總RNA的CGC和非CGC基因之間circRNA數量差異的頻率分布。可見circRNA比率低的基因座更少見於癌基因。
圖6:癌基因(CGC)中的circRNA表達
7. 某些circRNA的表達展示出與細胞增值的相關性
在之前的研究表明,circRNA的表達量與FL3C細胞系中的細胞增值速率有關。作者將細胞根據增殖速率分成快速增殖細胞(72小時內細胞計數增加≥5倍,有11個),緩慢增殖細胞(72小時內細胞計數≤3倍,有21個),其他細胞共三組。
A和B:circRNA的表達跟細胞增值的相關性的分布曲線C和D:篩選在30個細胞系以上表達的circRNA,circRNA的表達跟細胞增值的相關性的分布曲線。與上述A,B進行互相比較。E和F進行相關性分析的正交分析。根據增殖速率的分組,發現有些circRNA僅在緩慢增值細胞系中表達,有些僅在快速增值細胞系中表達。這種特徵在多細胞系表達的circRNA中更顯著。
圖7:circRNA與細胞增殖的相關性
接下來作者進行了進一步的分組,選取滿足CGC中癌基因以及在>30個細胞系表達的基因進行下一步的分析。這些circRNA表達水平與細胞增值之間顯現出很強烈的正相關和/或負相關性。
SMAD2和MET的circRNA以及總RNA表達水平與細胞增值呈正相關。對於SMAD2的反剪接位點而言,兩種同工型與增值正相關。DEK中,增值與circRNA負相關-0.34,與總RNA無關,反剪接位點水平而言,兩種同工型負相關。
圖8:在快速增殖細胞系和緩慢增殖細胞系中驗證與增殖相關的circRNA
8. circRNA的表達與組織學或遺傳學分類相關
作者根據組織學亞型,遺傳背景等計算了circRNA的表達差異。數據經過統計學處理,火山圖的垂直虛線表示倍數變化為零。水平虛線描繪了針對多次測試校正後的p值閾值。總體而言,某些circRNA與肺細胞的轉化狀態,組織學,基因型相關。
A:比較NSCLC細胞系和非轉化細胞系的數據,發現128個circRNA的差異表達達到統計學意義的顯著。B:比較NSCLC細胞系中是否為肺腺癌進行分類,進行組織學的對比。可見腺癌的circRNA表達量更高。C,D,E,F是根據基因亞型的研究。EGFR和KARS基因型的研究,二者的表達差異均不顯著(C和D)。TP53突變後某些circRNA的表達明顯增加(如circSBDS),BRAF突變後總體顯示較低的circRNA表達。
圖9:根據轉化狀態,組織學亞型或基因型在基因水平上的circRNA火山圖
9. circRNA在有Laccase2內含子的NSCLC細胞系中有效表達
作者進一步對NSCLC細胞系中的circRNA表達量進行探究。對12個基因選用擁有Laccase2內含子進行過表達載體的構建。
A圖展示了過表達載體的構建概況。B和C:RT-PCR實驗,繪圖展示12個基因的過表達情況。圖E表示不同的基因過表達載體導致其circRNA的增值跟線性RNA的增值是不等的。F分析circRNA過表達後,與總RNA的比率變化相關性。發現內源性circRNA/總RNA讀計數比與circRNA /總RNA比率在過表達時發生負相關(R = -0,38)
圖10:circRNA的過表達
10. circTNFRSF21的翻譯兩次跨反剪接位點,形成大小為42kDa的蛋白質
circTNFRSF21是在腫瘤細胞和非腫瘤細胞的表達有顯著差異的circRNA。
A和B:PCR和電泳後的條帶濃度(RT-表示沒有反向轉錄酶),反應該蛋白的表達與反向剪接位點有關。B圖展示凝膠電泳後的條帶信號強度。比較過表達與控制樣品的蛋白含量,表明過表達未改變內源性TNFRSF21蛋白表達。C圖為蛋白質印記實驗,展示circTNFRSF21的過表達對蛋白質合成的影響。觀察到在大42kDa的地方有一條突出的條帶。接著作者檢測不同細胞系中TNFRSF21的內源蛋白表達,發現在這些細胞系中也有這個的表達(圖D)在NCBI的ORFfinder,發現circTNFRSF21的ORF是跨越了兩次反向剪接位點的讀取框。剛好形成一個42kDa大小的分子。
圖11:circTNFRSF21的翻譯
11. circRNA的過表達影響NSCLC細胞系的克隆形成
作者篩選了在細胞系中原本表達量低的基因進行過表達操作,進行細胞克隆實驗。證明了某些circRNA有對細胞增殖有功能性的影響。
A:對PVTI過表達的細胞實驗。PVT1是致癌的cirRNA,它的過表達顯著提高了細胞的克隆增殖能力。B:circERBB2:是肺癌的知名致癌因子,它的過表達顯著提高了細胞的克隆增殖能力。C:對非CGC的致癌基因HIPK3過表達,也提示細胞的克隆增值能力提升。D和E分別對細胞周期相關的基因和轉化狀態差異大的基因進行過表達,均發現circRNA的高表達與克隆水平增加有關。
圖12:circRNA過表達對肺癌細胞系克隆形成的影響
小結
作者在FL3C數據集中,使用rRNA-耗竭的方法檢測circRNA,描述了circRNA在NSCLC細胞系中的表達格局:大多數circRNA表現出高細胞特異性,並與線性RNA的表達呈正相關;癌症相關細胞產生更多的circRNA;主成分分析和聚類分析提示circRNA的模式可以用於細胞系的分類,或反應腫瘤組學,基因型和增值率。此外,CircTNFRSF21可以轉化為大小為42kDa 蛋白。總之,這種對FL3C這類肺細胞係數據集的研究有助於我們了解circRNA表達,並將有助於今後對circRNA在肺癌中的功能和相關性進行研究。