這麼熱的circRNA如何結合生信發文章?

2020-12-04 科研菌

今天和大家分享的是2020年4月發表在Cancers(IF:6.162)上的一篇文章,「The Circular RNA Landscape of Non-Small Cell Lung Cancer Cells」,作者組裝了FL3C數據集,使用rRNA耗竭的方法檢測circRNA;在基因水平和反向剪接位點水平描述circRNA表達的數據;對 circTNFRSF21的翻譯進行驗證,隨後構建過表達載體,細胞克隆實驗探究過表達的circRNA與增值表型和組織學亞型之間的關係。

The Circular RNA Landscape of Non-Small Cell Lung CancerCells

非小細胞肺癌細胞的環狀RNA格局

一、 研究背景

環狀RNA(circRNA)與傳統的線性RNA(linear RNA)不同,通過共價鍵將首尾相連呈封閉環狀結構,不受RNA外切酶影響,表達更穩定。由於其高穩定性,circRNA被認為是新的生物標誌物的良好候選者。同時,circRNA可能作為對治療反應的良好預測性生物標誌物。而肺癌是常見的癌症類型,最常見的是非小細胞肺癌(NSCLC),NSCLC可以進一步分為腺癌(LAUD)和鱗狀細胞癌(LUSC)亞型。作者命名了FL3C的細胞數據集,並欲通過FL3C描述circRNA在NSCLC細胞系中的格局,從而綜合分析circRNA與非小細胞肺癌中的特定表型和基因型的關係。

二、 分析流程

三、 結果解讀

1. 肺癌細胞在rRNA消耗殆盡後進行circRNA的檢測

作者將自己組建的數據集(FL3C)與公共資料庫CCLE中的數據進行比較。二者使用了不同的circRNA檢測方法。結果證實二者的檢測量有顯著差異:使用rRNA-方法的FL3C數據集檢測量25倍大於poly(A)富集方法的CCLE數據集;在耗盡rRNA之後進行RNA的測序,檢測circRNA是可行的。

圖1:不同方法檢測到的circRNA讀數

2. FL3C數據集的一般特徵

作者在此進行了分組,基因水平(gene level)按照circRNA是否衍生於同一個基因分組,反向剪接位點水平(backsplice level)則根據是否衍生於同一個反向剪接位點分組。

A展示了FL3C數據集的構成:60個人肺細胞系,其中50個肺腺癌細胞系,7個非腺癌的NSCLC細胞系,3個是未轉化的肺細胞系。B展示了每個基因衍生的circRNA數量。其中對FL3C數據集中那些至少在30個細胞系表達circRNA的基因進行分組。C和D展示了circRNA在基因/反向剪接位點水平的頻數分布。E和F展示了基因/反向剪接位點產生的circRNA在不同細胞系的表達情況。x軸表示細胞系的數量。

圖2:FL3C數據集特徵

3. circRNA的第一個和最後一個外顯子是被貧化的。

作者分析了circRNA中沿mRNA表達的外顯子,發現第一個和最後一個外顯子很少在circRNA中表達。

A展示了反向拼接(backsplice)的示意圖:受體外顯子首先出現在線性mRNA中,隨後的供體外顯子被反向剪接。B和C是針對受體外顯子位置繪製的頻數分布圖。B是外顯子位數,C是mRNA位置的百分數分段。可以看出最前端的外顯子/mRNA分段的內容作為受體外顯子的概率要遠遠小於第二位置的外顯子。D和E是針對供體外顯子位置繪製的頻數分布圖。D是外顯子的位數,E是mRNA位置的百分數分段。可以看出最後一位的外顯子/mRNA分段的內容作為供體外顯子的概率遠遠小於倒數第二位。

圖3:circRNA中外顯子的使用頻率

4. circRNA的表達可以區分肺癌細胞和未轉化的肺細胞

作者在基因水平和反向剪接位點水平進行了聚類和主成分分析(PCA)。篩選了在基因和反向剪接位點水平最高表達的100個circRNA進行分析。

A和B對篩選出來的circRNA表達進行聚類分析。可見未轉化的細胞系在基因和反向剪接水平上都聚集。C和D對篩選出來的circRNA表達進行PCA。降維數據,描述了非轉化細胞系與腺癌和非腺癌NSCLC細胞系分別成簇(對應藍色,粉色,綠色)。在較小程度上,非腺癌細胞系也成簇。E和F對細胞系複製後聚類。反應絕大多數細胞系複製的高重複性。

圖4:circRNA表達的聚類和可重複性

5. circRNA和線性RNA的表達正相關

由於circRNA是從線性RNA中衍生而成的,因此作者對二者進行相關性分析,繪製下述相關性分布的圖像。在這裡total RNA(總RNA)即線性RNA。

A和C:在基因和反向剪接位點水平上繪製的相關性分布。可見基因水平上相關係數中位數是+0.27,而反向剪接位點水平,也就是獨立探討單個circRNA,相關係數中位數只有+0.06。B:在≥30個細胞系中表達的RNA的基因和反向剪接水平上,circRNA和總RNA之間的相關性分布。可見相比較於A,這裡兩種水平的相關性差異減少。因此,大多數表達良好的circRNA與線性RNA的表達正相關,只有極少數的例子是負相關的。D:基因和反向剪接水平的相對circRNA /總RNA比率(相對單位)。可見circRNA和總RNA的比率有很大的差異

圖5:circRNA與總(線性)之間的相關性

6. 癌基因產生更多的circRNA

作者採用了COSMIC資料庫(ver90)中的CGC,將FL3C數據集內的基因分成癌基因和非癌基因。癌基因與非癌基因相比,在基因水平更能顯示出circRNA的特性。

A:在基因的水平,對標準化的circRNA進行求和:可見癌基因在讀取量方面佔優勢,2.1倍。T-test p = 1.8×105。B:在反向剪接位點水平,求和後發現,高達8.4%的circRNA來源於癌基因,但平均讀取量優勢不如基因水平的顯著。C:對circRNA/總RNA的CGC和非CGC基因之間circRNA數量差異的頻率分布。可見circRNA比率低的基因座更少見於癌基因。

圖6:癌基因(CGC)中的circRNA表達

7. 某些circRNA的表達展示出與細胞增值的相關性

在之前的研究表明,circRNA的表達量與FL3C細胞系中的細胞增值速率有關。作者將細胞根據增殖速率分成快速增殖細胞(72小時內細胞計數增加≥5倍,有11個),緩慢增殖細胞(72小時內細胞計數≤3倍,有21個),其他細胞共三組。

A和B:circRNA的表達跟細胞增值的相關性的分布曲線C和D:篩選在30個細胞系以上表達的circRNA,circRNA的表達跟細胞增值的相關性的分布曲線。與上述A,B進行互相比較。E和F進行相關性分析的正交分析。根據增殖速率的分組,發現有些circRNA僅在緩慢增值細胞系中表達,有些僅在快速增值細胞系中表達。這種特徵在多細胞系表達的circRNA中更顯著。

圖7:circRNA與細胞增殖的相關性

接下來作者進行了進一步的分組,選取滿足CGC中癌基因以及在>30個細胞系表達的基因進行下一步的分析。這些circRNA表達水平與細胞增值之間顯現出很強烈的正相關和/或負相關性。

SMAD2和MET的circRNA以及總RNA表達水平與細胞增值呈正相關。對於SMAD2的反剪接位點而言,兩種同工型與增值正相關。DEK中,增值與circRNA負相關-0.34,與總RNA無關,反剪接位點水平而言,兩種同工型負相關。

圖8:在快速增殖細胞系和緩慢增殖細胞系中驗證與增殖相關的circRNA

8. circRNA的表達與組織學或遺傳學分類相關

作者根據組織學亞型,遺傳背景等計算了circRNA的表達差異。數據經過統計學處理,火山圖的垂直虛線表示倍數變化為零。水平虛線描繪了針對多次測試校正後的p值閾值。總體而言,某些circRNA與肺細胞的轉化狀態,組織學,基因型相關。

A:比較NSCLC細胞系和非轉化細胞系的數據,發現128個circRNA的差異表達達到統計學意義的顯著。B:比較NSCLC細胞系中是否為肺腺癌進行分類,進行組織學的對比。可見腺癌的circRNA表達量更高。C,D,E,F是根據基因亞型的研究。EGFR和KARS基因型的研究,二者的表達差異均不顯著(C和D)。TP53突變後某些circRNA的表達明顯增加(如circSBDS),BRAF突變後總體顯示較低的circRNA表達。

圖9:根據轉化狀態,組織學亞型或基因型在基因水平上的circRNA火山圖

9. circRNA在有Laccase2內含子的NSCLC細胞系中有效表達

作者進一步對NSCLC細胞系中的circRNA表達量進行探究。對12個基因選用擁有Laccase2內含子進行過表達載體的構建。

A圖展示了過表達載體的構建概況。B和C:RT-PCR實驗,繪圖展示12個基因的過表達情況。圖E表示不同的基因過表達載體導致其circRNA的增值跟線性RNA的增值是不等的。F分析circRNA過表達後,與總RNA的比率變化相關性。發現內源性circRNA/總RNA讀計數比與circRNA /總RNA比率在過表達時發生負相關(R = -0,38)

圖10:circRNA的過表達

10. circTNFRSF21的翻譯兩次跨反剪接位點,形成大小為42kDa的蛋白質

circTNFRSF21是在腫瘤細胞和非腫瘤細胞的表達有顯著差異的circRNA。

A和B:PCR和電泳後的條帶濃度(RT-表示沒有反向轉錄酶),反應該蛋白的表達與反向剪接位點有關。B圖展示凝膠電泳後的條帶信號強度。比較過表達與控制樣品的蛋白含量,表明過表達未改變內源性TNFRSF21蛋白表達。C圖為蛋白質印記實驗,展示circTNFRSF21的過表達對蛋白質合成的影響。觀察到在大42kDa的地方有一條突出的條帶。接著作者檢測不同細胞系中TNFRSF21的內源蛋白表達,發現在這些細胞系中也有這個的表達(圖D)在NCBI的ORFfinder,發現circTNFRSF21的ORF是跨越了兩次反向剪接位點的讀取框。剛好形成一個42kDa大小的分子。

圖11:circTNFRSF21的翻譯

11. circRNA的過表達影響NSCLC細胞系的克隆形成

作者篩選了在細胞系中原本表達量低的基因進行過表達操作,進行細胞克隆實驗。證明了某些circRNA有對細胞增殖有功能性的影響。

A:對PVTI過表達的細胞實驗。PVT1是致癌的cirRNA,它的過表達顯著提高了細胞的克隆增殖能力。B:circERBB2:是肺癌的知名致癌因子,它的過表達顯著提高了細胞的克隆增殖能力。C:對非CGC的致癌基因HIPK3過表達,也提示細胞的克隆增值能力提升。D和E分別對細胞周期相關的基因和轉化狀態差異大的基因進行過表達,均發現circRNA的高表達與克隆水平增加有關。

圖12:circRNA過表達對肺癌細胞系克隆形成的影響

小結

作者在FL3C數據集中,使用rRNA-耗竭的方法檢測circRNA,描述了circRNA在NSCLC細胞系中的表達格局:大多數circRNA表現出高細胞特異性,並與線性RNA的表達呈正相關;癌症相關細胞產生更多的circRNA;主成分分析和聚類分析提示circRNA的模式可以用於細胞系的分類,或反應腫瘤組學,基因型和增值率。此外,CircTNFRSF21可以轉化為大小為42kDa 蛋白。總之,這種對FL3C這類肺細胞係數據集的研究有助於我們了解circRNA表達,並將有助於今後對circRNA在肺癌中的功能和相關性進行研究。

相關焦點

  • 一篇NC文章告訴你circRNA研究新思路
    但是今天分享的這篇NC文章提供了新思路!circRNA可以結合蛋白,阻止蛋白行使功能,產生生物學效應。 文章思路 發現circANRIL在不同程度的動脈粥樣硬化的斑塊內表達不同,與病重程度呈負相關。 circANRIL沒有ceRNA的作用,也沒有cis作用。
  • 環狀RNA(circRNA)資料庫大匯總,快來看看有沒有你需要的!
    2018 年是環狀RNA大爆發的一年, 據統計, 2018 年國內外環狀 RNA 領域發表 SCI 文章高達 8167 篇, 比 2017 年增長了 10 多倍, 產量呈現指數性地暴漲。國內外環狀 RNA 領域發表 SCI 文章對於研究 circRNA 的小夥伴們來說, 總有那麼幾個讓他們愛不舍手的助力神器, 今天小編就來給大家匯總幾個常用的 circRNA 資料庫或在線軟體
  • 屏蔽自封袋制袋機熱封口發脆及脆斷如何解決?
    屏蔽自封袋制袋機熱封口發脆及脆斷如何解決?上期諾世德一一給大家介紹了屏蔽自封袋熱封翹邊的原因及對策小夥伴們看懂了嗎,今天諾世德一一就為大家解答屏蔽自封袋發脆的問題屏蔽自封袋熱封時發脆的原因:(1)屏蔽自封袋熱封時發脆的熱封溫度過高;
  • 科普文章「高貴妃就這麼走了」網上熱傳,作者是上海一家醫院
    近日,宮鬥劇《延禧攻略》熱播,一篇名為「《延禧攻略》的高貴妃就這麼走了?如果能送到瑞金醫院……」的文章在網上熱傳。該文一夜點擊量就已突破10W+,甚至還得到了高貴妃扮演者譚卓的轉發和評論。文末那一句「高貴妃若是送到瑞金醫院搶救一下,《延禧攻略》可能還會再多30集吧」更成為網友槽點之一。
  • 柴西發了一張熱圖,卻引來巨大爭議,幕刃事件的影響是止不住了
    前言:英雄聯盟自從賽事正規化以來,越來越多的電競自媒體噴湧而出,誕生了非常多便於玩家遊玩的節目或者APP,有的能查詢選手Rank記錄的,看看職業哥如何出裝,有的能迅速看到近期發生的八卦事的,也有像靠譜盤點這樣用娛樂的方式給比賽做總結的。
  • 四五十歲女人發質差想燙髮,熱燙好還是冷燙好?如何選擇更靠譜?
    很多人都在糾結熱燙好還是冷燙好這樣的問題,尤其是經常燙染髮質有不是很好的中老年人,大都不知道如何選擇適合自己的燙髮方式。其實,熱燙和冷燙都是最常規的燙髮方式,作為消費者不需要考慮具體的操作方法,因為方法是髮型師來決定。但現在很多美髮店把燙髮按照類型收費,熱燙冷燙的價格不同,這樣消費者就有些不知所措。
  • 今年為什麼會這麼熱?別怕,明年會更熱!
    相信大家都有這樣一種感覺,今年比去年熱,其實這不是錯覺,這是實實在在存在的現狀。我們可以比較去年,前年,我們就會發現,今年的夏天的確要比之前的年份熱。在今年的七月份,我國各地的溫度明顯比去年的同期溫度要高,甚至在東北的遼寧,吉林等地也是氣溫比去年上升了2攝氏度,這是很難出現的情況,甚至在吉林還出現的高溫預警。
  • 是否有轉錄因子調控我研究的circRNA, 如何尋找?
    關注閱讀更多RNAseq信息circRNA的轉錄因子分析環狀RNA研究越來越火熱,大多數的機制在ceRNA機制,結合蛋白,翻譯蛋白上,主要是circRNA的下遊機制,上遊機制怎麼研究呢,我們可以找找哪些轉錄因子調控circRNA表達,哪些RNA剪切因子影響circRNA的表達,比如這個老師也是這麼想的
  • 靜電紡絲研究這麼熱,其工業化程度究竟如何?
    靜電紡絲研究這麼熱,其工業化程度究竟如何?
  • 產品經理,你真的懂熱圖嗎?
    產品經理經常使用各式圖表來提取或者表達信息 ,其中熱圖是常見的一種;尤其是在站點管理、界面優化、互動設計等場合,熱圖更是被產品經理們廣泛應用。然而產品經理,你真的懂熱圖嗎?熱圖有哪些類型?背後的原理又是什麼?產品經理該如何用好熱圖呢….. 今天,我們就來一探究竟。熱圖這麼多,產品經理該選哪一種?
  • 為什麼地核會這麼熱? 地球內部為啥那麼熱
    地殼內部的溫度有4000~6800℃,它之所以這麼熱,是由於以下熱源產生的熱量:1、放射性元素衰變產生的熱量。2、摩擦加熱,由密度較大的核心物質下沉到地心引起的。3、地球形成和膨脹時產生熱量尚未流失。
  • 熱巴工作室公布行程,發男友視角美照含情脈脈,英語配音驚豔眾人
    熱巴工作室公布行程,發男友視角美照含情脈脈,英語配音驚豔眾人新的一個月又開始了,藝人們又要開始新的一輪工作,在熱巴工作室中公布了熱巴的二月行程。在這個月熱巴的行程看起來少了很多,主要就是拍攝工作,而且都是集中於下半個月,看來其餘的時間熱巴能夠好好放鬆一下了。想起熱巴之前的行程可是滿到幾乎要「溢出來」了,在去年十月份的時候,大家都在開心的度過自己的十一小長假,而熱巴卻是在劇組拍戲,工作非常忙。如今熱巴拍戲告一段落,希望她能夠在充電的時候也要好好休息。
  • 這麼熱的天,戴口罩怎麼辦?
    這麼熱的天,戴口罩怎麼辦? 開局一張圖表達小編今天的感受是的,你也感受到了宜昌這天氣越來越熱了
  • 一腳「蹬」上熱搜!「毒舌」塗磊道歉,他如何從公司高管跨界成為...
    一腳「蹬」上熱搜!「毒舌」塗磊道歉,他如何從公司高管跨界成為主持人? 都在用的報告小程序 寫文章
  • Ptengine網頁熱圖原來姿勢這麼多,輕鬆做洞察,流量變用戶!
    利用網站熱力圖,企業知曉如何行動才能讓用戶獲得更好的體驗,讓用戶更加認可自身產品的價值。這樣一來,市場營銷人就能簡單快速地看出流量與落地頁的匹配程度,訪客對頁面內容與網頁設計的喜好,做出簡單的調整就能大幅提升業務的轉化率,降低獲客成本。利用熱力圖帶來的價值,有些企業能夠在原有廣告預算的基礎上節省30%的費用去拓展新渠道,實現營銷效果的最大化。
  • 抖音評論怎麼發圖片 如何在抖音的評論裡發表情包
    18183首頁 抖音評論怎麼發圖片 如何在抖音的評論裡發表情包 抖音評論怎麼發圖片 如何在抖音的評論裡發表情包 來源
  • 如何泡發乾海參?
    但問題是,很多人不相信外面發的海參。這是真的。有些為了保證發出的海參色澤美觀,會加入一些添加劑。我來教你在家裡怎麼泡發乾海參。一:我們需要準備一個無油不鏽鋼鍋。一定要沒有油的,家裡的炒菜鍋就不能用,即使你覺得刷的很乾淨,因為海參有一個特點,一沾油就容易化成水。二:將幹海參用清水洗淨兩次,去除表面雜質。
  • 既然太陽這麼熱,為什麼太空卻很冷?
    不得不驚嘆,這麼遠的一個熱源,熱量竟能投射到如此遠的距離。有意思的是,雖然地球在億萬公裡外被灼燒,但是外層空間卻仍然寒冷無比,。那麼問題來了,既然太陽這麼熱,為什麼太空會這麼冷呢?高中物理學習過,這種熱傳遞可以通過三種方式發生:傳導、對流和輻射。熱傳導在固體與固體中發生。當固體分子被加熱時,它們開始振動並相互碰撞,在這個過程中將熱能從較熱的顆粒傳遞到較冷的顆粒。
  • 微信公眾號發文章排版,如何在圖片上添加文字?
    微信圖文排版指南-如何在圖片上添加文字? 編輯排版公眾號文章的時候,排版經常會選擇圖片和文字相結合,那如何在圖片上添加文字呢? 二、直接使用樣式素材 (一)如何找到樣式素材
  • 為什麼地核會這麼熱?
    穿過外核,我們就到達了地球最熱的部分——內核。內核的溫度高得難以想像,從5000到7200攝氏度不等。最令人驚訝的是,即使在如此高的溫度下,內核仍然完全是固體的,厚度大約有1200千米。地球各個構造層的剖面圖為什麼地核會這麼熱?