譯者丨沈勵澤
2020年2月,來自普林斯頓大學化學系的Kleiner博士在Elsevier出版社旗下的Current Opinion in Chemical Biology雜誌發表綜述,總結了目前RNA與蛋白互作的高通量測序的各種技術手段。Kleiner博士長期致力於m6A甲基化研究中各種與測序和質譜相關的方法學優化工作,力求為m6A甲基化研究竭盡全力。
RNA-蛋白質相互作用在轉錄後基因調控中至關重要。隨著RNA測序技術和高效液相質譜聯用的蛋白質組學技術的快速發展,將這些創新的化學生物工具與生物學研究相結合,預示了在細胞水平研究分子的互作將成為可能。本文作者描述了蛋白質組學和轉錄組學方法在開發和應用細胞RNA-蛋白質互作方面的最新研究進展,重點聚焦基於測序技術和RNA結合蛋白的蛋白質組學分析技術,以及闡釋RNA修飾在蛋白質-RNA結合事件中擔任的重要角色。
轉錄後基因調控在生物過程中起著十分重要的作用。很大程度上,潛在的分子機制是由RNA轉錄本與大量RNA結合蛋白(RNA binding proteins, RBPs)在物理層面的互作介導的,這些蛋白調節RNA剪接(splicing)、穩定性(stability)、核轉運(nuclear export)和翻譯(translation)等特性。因此,闡釋這些RBPs的RNA結合偏好並繪製RBPs蛋白質組圖有助於揭示RNA-蛋白質結合互作的生物學功能。
另外,最新研究表明RNA修飾作為RNA-蛋白質複合物的調節元件,增加了互作的複雜性。儘管RNA-蛋白質相互作用的早期研究僅限於單個蛋白複合物的研究,但是RNA測序和蛋白質組學在技術層面的進步使得研究人員能夠從轉錄組和蛋白質組兩個維度進行分析。
值得注意的是,在完整的生物樣品如細胞和動物組織中進行UV介導的蛋白質-RNA複合物光交聯,在開發以高通量測序研究RBP-RNA互作的方法中發揮了重要作用。此外,化學生物學方法如用人工核苷酸進行代謝標記,生物正交化學(bio-orthogonal chemistry)和蛋白質工程學,也都應用到闡明蛋白質-RNA互作組學數據研究中。本文作者將重點介紹細胞中RNA-蛋白質互作的高通量組學技術最新進展,並展望該領域未來的研究發展方向。
理解RBP生物學功能和分子機制的關鍵是鑑定所有RNA轉錄本的集合。此外,RBP的RNA結合位點或「足跡」(footprint)也可以幫助我們進一步了解其生物學活性。因此早期的研究主要依靠體外選擇,利用RBP對固定序列結合的偏好性在隨機RNA庫中尋找特定規律。這種方法能夠鑑定出某種或某類RBP對哪種規律序列有結合偏好性,這種高親和力的結合序列也稱為motif,此方法可以在轉錄組測序中挖掘出相關的RNA序列。體外選擇方法操作簡單易行,然而並不能鑑定到生理條件下真實RNA-蛋白互作事件,因此只能限定在對從活體樣本中分離的RNA-蛋白複合物的鑑定應用上。
圖1. 三類主流的RNA-蛋白結合位點高通量測序鑑定方法
Darnell等人在2008年發表了公認的第一篇RNA-蛋白互作高通量測序方法論文(Pubmed ID:18978773),這種方法被稱為HITS-CLIP或CLIP-seq。HITS-CLIP結合了幾種關鍵方法,通過高交聯和免疫沉澱分離天然RNA-蛋白質複合物。該方法的核心是紫外線誘導的光交聯,該交聯可以在完整細胞上操作,並且交聯的RNA-蛋白質互作效率比蛋白質-蛋白質的效率高很多。RNA-蛋白質發生交聯後,就可以在嚴格的免疫沉澱條件下分離出低親和度的蛋白質-RNA互作,並通過逆轉錄cDNA和測序來鑑定相關的RNA。
通常在免疫沉澱之前和之後對RNA進行部分酶消化,以更精確地定位RBP足跡。HITS-CLIP是許多基於UV-光交聯的CLIP方法的先驅,這些方法的目的是為了繪製單個RBP在轉錄組範圍內的RNA結合圖譜。圖1a還羅列了包括CRAC、PAR-CLIP、iCLIP和eCLIP以及對原有HITS-CLIP進行改進的方法。這些改進通常分為以下幾類:
(1)利用4-硫尿苷(4-SU)或6-硫鳥嘌呤(6-SG)對細胞RNA進行代謝標記從而增強光交聯作用;
(2)優化免疫沉澱和分離條件;
(3)改進cDNA文庫建庫方法和生物信息分析算法,旨在繪製具有單核苷酸解析度的RBP結合位點信息(通常依賴於交聯誘導突變的鑑定)。
當前,這些改進的CLIP方法代表了在整個轉錄組中繪製RBP足跡的最新技術,並已被廣泛應用。儘管UV交聯是可以應用於幾乎所有RBP研究,但是RNAm5C甲基轉移酶的獨特催化機制使其能夠通過化學手段與底物RNA交聯。圖1b報導了兩種交聯方法來繪製m5C甲基轉移酶底物,即Aza-IP和miCLIP。在Aza-IP方法中,RNA-蛋白質交聯是由5-氮雜胞苷(5-azacytidine)介導的,通過代謝標記在轉錄組範圍內整合。而在miCLIP方法中,通過使用突變甲基轉移酶與其底物胞苷殘基結合交聯後,運用類似UV交聯的CLIP流程方法進行後續的免疫沉澱和RNA測序分析。
非交聯策略也已應用於RBP結合RNA圖譜相關研究中。圖1c中的TRIBE原理是當腺苷脫氨酶(ADARs)接近RNA轉錄本時,能夠催化腺苷對肌苷(A:I)編輯(例如通過與感興趣的RBP融合)。此方法不需要純化RNA-蛋白複合物,因為在逆轉錄過程中肌苷主要轉化為C,並且通過測序和生物信息學分析可以直接確定它的存在。圖1c中使用更活躍的ADAR突變體的方法叫HyperTRIBE,是TRIBE的增強版。Wickens等人開發了另一種非交聯的方法,名為「RNA標籤」(RNA tagging),主要依賴線蟲的聚U聚合酶(PUP-2)與感興趣的RBP融合,導致polyU尾巴沉積在RBP相關的RNA上,然後在cDNA文庫生成過程中選擇性富集PolyU標籤。TRIBE和RNA tagging的主要優點是不需要純化RNA-蛋白質複合物,但是它們都涉及將酶與目標RBP融合,這可能會影響RNA結合效率,且無法提供單鹼基解析度水平的結合數據。
圖2. RNA結合蛋白檢測方法
CLIP的測序方法可以提供單個RBP結合到RNA的信息,但無法研究RNA結合蛋白對應的蛋白質組信息。若要發現新的RBP及其在蛋白質組範圍內的特徵,有必要將蛋白質組學應用於RBP分析。由於蛋白通量較低且無法擴增,使得蛋白質組學研究比RNA測序更具有挑戰性,在最近十年,出現了多種用於細胞RBP互補蛋白質組學特徵研究的方法,這些方法都是建立在最初CLIP實驗開發的RNA-蛋白質交聯方法的基礎上。
Hentze和Landthaler實驗室獨立開發了第一種從細胞中分離RBP的技術,稱為「交互作用捕獲」(interactome capture)(圖2a)。在其各自的方法中,首先將RBP通過UV交聯到RNA上,然後通過與oligo-dT珠雜交從細胞中富集polyA RNA-蛋白複合物,在酶消化RNA後,運用質譜的蛋白質組學來鑑定分離的RBP。由於核酸雜交耐受高鹽和離子去汙劑,因此可以在嚴格的變性條件下進行oligo-dT富集,從而從細胞裡游離蛋白中分離出RNA交聯蛋白。互作捕獲法已被廣泛用於研究RBP與mRNA的互作,可用於254nm UV交聯或更長波長的輻射結合4-SU標記的RNA。已知在HeLa和HEK293細胞中鑑定出約800個RBP,其中許多是首次發現的RBP。
非依賴ployA RNA的另一種方法是RICK/ CARIC法,可用於分析與RNA轉錄本相關的RBP,而不論其是否有polyA(圖2b)。這種方法依靠RNA上的5-乙炔基尿苷(5-EU)標記和生物素標記來富集與新生轉錄本(nascent transcripts)交聯的RBP,並為oligo-dT的富集提供結果。研究RBP要有所突破就必須考慮在開發方法上有更大的通用性,不能只局限於分析與polyA化RNA相關的RBP,需要開發能夠更深入了解與RNA結合有關的蛋白質結構域和胺基酸殘基的方法。
Bonasio等人開發了一種名為RBR-ID的方法(圖2c),通過分析交聯的胰蛋白酶肽來鑑定RBP結合區。RBR-ID並不是測量特定的交聯肽-寡核苷酸種類,而是利用了親本(非交聯)胰蛋白酶肽的信號強度隨之降低的優勢。在胚胎幹細胞的核蛋白質組上使用這種檢測方法,可以在肽水平上鑑定出約800個RBP結合區,包括染色質調節劑中幾個以前未知的RNA結合域。此外,RBR-ID法不需要對RNA進行富集,因此可以提供RNA結合蛋白質組的無差別快照信息(unbiased snapshot)。
以上提到的這些分析RBP的方法主要依賴核酸序列或親和試劑的特異性識別來分離交聯的RBP-RNA複合物,也可以直接利用共價蛋白-RNA結合物的理化特性從游離RNA中富集這些游離蛋白(圖2d)。實際上用TriZol提取RNA時,RNA從DNA和蛋白質中的差異化分離是從細胞樣品中分離RNA的常用技術。考慮到共價RNA-蛋白質複合物可能表現出不同於任一單獨組分的雜化相分離特性的基本原理,研究者決定通過交聯物種是否可以通過分離過程中通常被丟棄的相間層來富集。
2019年發表在Nature Communications、Cell、Nature Biotechnology雜誌的三項研究中(Pubmed ID:30824702, 30528433, 30607034),相分離是分離RNA交聯的RBP的有效方法。XRNAX和OOPS這兩種方法(圖2d)使用的是標準的Trizol製劑。此外XRNAX法還結合了在質譜分析之前二氧化矽的交聯肽RNA片段的額外純化方法。第三種方法PTex利用改性的苯酚-甲苯有機層,並在中性和酸性pH下連續萃取(圖2d)。與Oligo-dT的互作捕獲法相比,這三種方法在哺乳動物細胞中能發現更多的RBP,反映出這些方法更具有廣泛的適用性。此外,由於細菌mRNA缺乏polyA,無法通過oligo-dT捕獲獲得細菌RBP,所以OOPS和PTex還能用於研究細菌RBP。另一種叫「矽珠純化」(TRAPP)的方法,可從細胞中富集RNA-RBP複合物且不限於RNA是否攜帶polyA結構(圖2e)。
圖3. 研究依賴RNA修飾的RBP的方法
由於RNA上的修飾水平較低,因此CLIP或RNA互作捕獲等方法不太適用於研究與RNA修飾相關的RBP(或者叫閱讀蛋白reader)。同時,作者也指出現在仍然缺乏在細胞修飾位點附近進行偏向光交聯(bias photocrosslinking)的方法。因此鑑定這些RNA修飾閱讀蛋白很大程度上依賴於合成一段帶有m6A修飾motif序列的oligo寡核苷酸鹼基序列,這段oligo上帶有生物素等標記,方便進行pulldown。該方法已經成功鑑定了多種新型的m6A閱讀蛋白,如陳建軍課題組的黃慧琳博士(現任職於中山大學腫瘤防治中心)發表在2018年的Nature Cell Biology上的利用pulldown技術成功鑑定了IGF2BP家族新型的m6A閱讀蛋白的研究。
由於RBP或閱讀蛋白通常以低親和力與帶修飾的oligo結合,因此可能需要其他步驟才能有效捕獲這些蛋白質。值得注意的是,Vermeulen課題組曾在2017年的Nature Structural & Molecular Biology(Pubmed ID:28869609)發表了,利用包含GG(m6A)CU共有motif的四個串聯重複序列和基於SILAC的定量蛋白質組學的oligo對哺乳動物細胞中與m6A修飾互作的蛋白分析(圖3a)的論文。
作者所在的普林斯頓大學化學系也於2017年在JACS(Pubmed ID: 29140688)發表了開發出一種基於光交聯的化學蛋白質組學方法,該方法依賴於特定的修飾側翼的含二嗪氨酸尿苷殘基(diazirine-containing uridine residue)修飾的合成oligo(圖3b)。為了發現新的閱讀蛋白,該方法將光交聯的優點(如低親和力結合劑相應的穩定性、嚴格的純化條件)與化學合成的多功能性相結合,使得能夠「詢問/檢視(interrogation)」任何可合成的核苷酸。此方法和傳統的affinity pulldown方法都依賴於修飾和未修飾的oligo對蛋白進行富集後的比較,揭示了帶修飾核苷酸對RNA-蛋白質互作親和力的正面和負面影響。
作為用於RNA修飾分析的補充方法,作者在2019年的Biochemistry(Pubmed ID: 31287290)發文稱,已經開發出一種體外的選擇平臺,用於審視轉錄組層面閱讀蛋白的序列結合偏好(圖3c)。這種方法依靠人工化學合成特定鹼基位點帶有修飾的隨機序列RNA library,繼而進行親和力選擇並測序。作者用這種方法來分析某類m6A閱讀蛋白如YTH域蛋白的結合偏好,揭示了m6A修飾的序列motif在生化上的獨特偏好性。
轉錄和轉錄後水平上的新基因調控機制的發現激發了人們對以RNA為中心的相關研究熱情。人們對細胞生物學理解的進一步加深,與高通量測序技術以及基於質譜的蛋白質組學等革命性技術的發展息息相關。利用這些技術,研究人員開發出了可靠的實驗方法來繪製細胞中RNA-蛋白質互作圖譜,從而為全面了解蛋白質組和轉錄組之間的物理聯繫奠定了基礎。
展望未來,以下幾個領域為進一步的研究和開發新方法提供了方向:
綜上所述,隨著轉錄組學和蛋白質組學數據的激增,一個重要的目標是繼續開發強大的實驗工具,以選擇功能上重要性的,並需要深入進行生物學驗證的,高可信度的RNA-蛋白質互作。
譯 者 簡 介
沈勵澤,聯川生物高級產品經理,市場部負責人,在NGS領域有多年從事數據分析和產品開發經驗。目前負責公司高通量測序產品開發與售前技術支持工作,主持開發m6A甲基化測序並撰寫書籍《RNA甲基化修飾m6A研究一本通》。同時參與協助腫瘤外顯子、單細胞測序等產品的相關開發工作。