由中山大學、復旦大學、暨南大學、美國安德森癌症中心等多家單位聯合在Nature Communications上發表一項發現:
使用翻譯組測序技術,在腦膠質瘤細胞中發現了數千種可能翻譯的環狀RNA(circRNA),其中320個有差異表達現象,並具體驗證了一種名為LINC-PINT的環狀RNA可編碼長度為87個胺基酸的蛋白質PINT87aa,該蛋白質在癌細胞中低表達可抑制多種癌基因的轉錄延伸而發揮抑癌作用。
該研究證明了真核生物circRNA可以通過其翻譯產物在蛋白質水平發揮重要的生物學功能。而達成這項突破性發現的工具,是翻譯組測序(RNC-seq),本研究中的翻譯組測序由承啟生物首席科學家暨南大學張弓教授團隊完成。
環狀RNA由於缺乏經典的翻譯起始元件,除少數具有IRES位點的circRNA被認為有可能翻譯外,其餘circRNA都被認為不可翻譯。迄今為止 circRNADb資料庫中僅有46個circRNA被認為有蛋白質證據,而且基本都達不到人類蛋白質組計劃所要求的證據質控標準。轉錄組測序無法確認circRNA是否有翻譯,而蛋白質組限於各種技術限制也很難對circRNA翻譯出的蛋白質進行可信的鑑定。
以往曾有人試圖用Ribo-seq方法來研究可編碼circRNA,但效果不彰,其原因主要來源於Ribo-seq自身的局限性。Ribo-seq使用核酸酶降解未被核糖體保護的mRNA片段,然後測序被核糖體保護的26-30nt的mRNA片段,稱之為「核糖體足跡」(RFP或RPF)。理論上一個RFP代表一個核糖體,但這種方法研究circRNA就很悲劇了。
如果切碎成小片段,circRNA和普通線性mRNA的差別僅在於成環接頭處(backsplice),因此必須要能找到測序數據中正好覆蓋backsplice位點的短reads才能證明是circRNA在翻譯。Ribo-seq的讀長很短,僅有26-30nt,覆蓋到通常表達量不高的circRNA的backsplice位點的概率很低,而且由於讀長過短,信息十分有限,帶有剪切比對能力的算法處理這麼短的reads都力不從心,準確度和靈敏度都很低。
另外,Ribo-seq方法天生的弊病是會有許多核糖體實際並未翻譯的mRNA片段也會被Ribo-seq測到:lncRNA大牛Eric Lander和「Ribo-seq之父」Jonathan Weissman曾在Cell上發表文章,指出大量的lncRNA上有RFP但實際上並不能翻譯成蛋白質(Cell 154: 240-251),說明Ribo-seq存在著大量的假陽性,這些所謂的「RFP」實際上是從其他地方來的RNA碎片。也因此,前人試圖用Ribo-seq來尋找可翻譯的circRNA,極少能給出像樣的蛋白質證據。
而翻譯組測序技術(準確稱呼為「全長翻譯中mRNA測序」,簡稱RNC-seq),顧名思義,測定的是翻譯中的全長mRNA,並不用核酸酶去降解。這帶來了長讀長的優勢,使得覆蓋circRNA backsplice位點的概率上升至少1-2個數量級,同時更長的讀長讓算法能更準確地處理跨剪切點的reads,大大增加判定的準確度和靈敏度。更長的讀長也很好地規避了細胞中大量存在的短片段RNA碎片,不至於像Ribo-seq那樣弄出一大堆假陽性。因此,用於circRNA翻譯的研究,RNC-seq要遠遠優於Ribo-seq。 因此,該論文強調「翻譯組測序是目前可編碼circRNA研究中最為可靠的技術」。
早在2014年,承啟生物首席科學家、暨南大學張弓教授團隊即提出可以使用翻譯組測序技術來輔助蛋白質組的鑑定,用於找到已知和未知編碼基因的翻譯證據,被人類蛋白質組織(HUPO)列為當年人類蛋白質組計劃的首要突出貢獻,且被列為人類蛋白質組計劃的核心支柱之一。2016年,HUPO主席Omenn博士在AOHUPO大會上宣布,發現新蛋白必須提供其翻譯證據。
大量具有翻譯潛能的circRNA有待進一步的發現和挖掘,本研究也為circRNA的翻譯研究提供了一個行之有效的方案,為circRNA的研究開闢一片新的天地。
轉自生物通