RNA 豐度是單個細胞狀態的有力指標,但不能直接揭示細胞分化等動態過程。在生物發育過程中,關鍵的分化事件通常發生在數小時到數天的時間尺度上,這相當於 mRNA 典型的半衰期,且單個細胞中將同時存在新合成的 mRNA、成熟的 mRNA 或者完全降解的 mRNA,而新生(未剪接) 和成熟(剪接) mRNA 的相對豐度可以用來估計基因剪接和降解的速率。
所有常見的單細胞 RNA-seq 均通過富集帶有 ployA 尾的 mRNA 分子來進行捕獲測序。研究證明,基於現有的多種測序平臺 (SMART-seq2,STRT / C1,inDrop 和 10x Genomics Chromium) 測得的單細胞轉錄組數據中,均可檢測到包含未剪接的內含子序列的 reads,表明在單細胞轉錄組測序數據中可以檢測到類似的信號,可以揭示整個轉錄組在動態過程中變化的速率和方向。
RNA 速度 (RNA velocity),即細胞中 mRNA 分子豐度隨時間的變化,這種變化代表了細胞狀態的改變,可以通過未剪接和剪接 mRNA 豐度來估計。它是一種局部速度向量,可以在數小時的時間尺度上預測單個細胞的未來狀態。
用來估計 RNA 速度的理論模型,本質上是一個動力學平衡公式,如下圖所示:
在這個轉錄動態模型中,剪接 mRNA 豐度的一階導數 (RNA速度) 由未剪接 mRNA 產生剪接 mRNA 和降解 mRNA 之間的平衡決定。當處於穩態時,剪接 mRNA 隨時間的變化為 0,轉錄速率、降解速率都是恆定的值,顯然有:u=γs。
在動態過程中,轉錄速率的增加或降低都會引起 u 的變化,從而形成新的穩態。例如:轉錄速率 α 增加,會導致未剪接的 mRNA 迅速增加,隨後剪接的 mRNA 也隨之增加,直到達到新的穩定狀態。相反,轉錄速率下降先導致未剪接的 mRNA 迅速下降,隨後剪接的 mRNA 也會減少。
將此模型應用於基因表達中,則為:在誘導基因表達的過程中,未剪接的 mRNA 的存在量會超出基於降解速率 γ 的預期,而在阻抑過程中則相反。因此,未剪接和剪接的 mRNA 豐度的平衡是成熟 mRNA 豐度的未來狀態以及細胞未來狀態的指標。
輸入基因表達矩陣和降維聚類圖,輸出帶方向的聚類圖。
1. 針對每個細胞的每個基因進行剪接和未剪接 reads 的計數;
2. 使用模型,根據以上計數估算降解率 γ;
3. 使用估算的降解率 γ 及未剪接 reads 的數量估算每個細胞下一個時刻剪接 mRNA 的量,認為這是該細胞下一步的狀態;
4. 對每個細胞下一步的狀態與其他細胞進行相關性分析,最終得到該細胞在降維聚類圖上下一步的方向。
實例一:研究已知,在發育過程中,很大一部分嗜鉻細胞(即腎上腺髓質的神經內分泌細胞)源自 Schwann 前體細胞。使用 RNA velocity 對 SMART-seq2 獲得的小鼠嗜鉻細胞的單細胞 RNA-seq 數據進行評估,準確的再現了該數據的轉錄動力學,包括基因的誘導與抑制、細胞的分化方向等,證明 RNA velocity 模型在單細胞測序中揭示轉錄組在動態過程中變化的速率和方向的能力。
a 圖為降維聚類後細胞亞群分布圖;b、c 圖為基因 Serpine2 和 Chga 的表達圖,基因 Serpine2 從左到右逐漸被抑制,基因 Chga 從左到右逐漸被誘導;d 圖為模型推測的分化狀態體現在 PCA 圖上;e 圖為使用譜系追蹤法證實了從 SCP 細胞到 Chromaffin 細胞的轉變;h 圖為 RNA velocity 的推斷結果也可映射於 tSNE 圖上;i 圖為針對大數據量的數據集,可使用最近 k 個細胞作為一個細胞池來進行推斷。實例二:通過對胚胎發育中的人類前腦進行單細胞轉錄組測序,並進行 RNA velocity 分析,發現了穀氨酸神經元譜系從增殖的祖細胞狀態,通過一系列中間成神經細胞階段進行到更成熟的分化的穀氨酸神經元的 RNA 速度模式,證明在人類胚胎中也可檢測到 RNA 速度。
圖片說明:胚胎發育中的穀氨酸能神經元分化的 PCA 圖,顏色代表不同的細胞類型及中間狀態。RNA velocity 分析結果圖
圖片說明:所示為 RNA velocity 的結果映射到 tSNE 降維聚類圖上,圖中的點代表細胞,顏色代表不同的細胞類型,箭頭方向代表算法預測的細胞分化方向。RNA velocity 分析結果在擬時序分析軌跡圖上的展現
圖片說明:將 RNA velocity 的結果映射到擬時序分析的軌跡圖上。
RNA 速度是建立在真實的轉錄動力學基礎上的,這種方法有望為我們理解細胞在基因表達空間的分化動力學提供更堅實的定量基礎。將其靈活運用於細胞發育與分化的研究中,說不定會有意想不到的發現。
猜你想看
#END#