撰文 | 伊凱
責編 | 兮
由高通量技術獲得的全轉錄組基因表達譜是在分子層面定義細胞狀態的根本指標之一。通常,基因表達的測量同時受到空間和時間尺度的限制,前者表現在被測量目標一般為細胞集合而非單個細胞,而後者則表現為以單時間點的瞬時穩態推測系統的全貌。儘管單細胞測序技術的興起在很大程度上突破了基因表達測量的空間限制,但時間尺度上的局限性仍受困於通量低、實驗材料稀缺及實驗步驟繁瑣等因素而難以突破。進一步地,考慮到不同生物過程的時間尺度具有極大的差異,完整而統一地對基因表達的動態特徵進行考察就顯得更為複雜。
不過,對於某些基因表達動態特徵相關的科學假設的驗證,卻並不需要直接觀測某一基因在時間尺度上的完整表達路徑。相反,僅僅依據巧妙的統計規律,對具有共同起始狀態的多個細胞集群在一定時間內動態演化後的終末狀態的分布特徵進行描繪,就能夠很好地推知基因表達遵循的變化邏輯。在這一點上,對基因表達的跨代(細胞分裂)遺傳穩定性的研究就是一個很好的例子。
2020年7月30日,來自賓夕法尼亞大學的Arjun Raj課題組在Cell上發表了題為Memory Sequencing Reveals Heritable Single-Cell Gene Expression Programs Associated with Distinct Cellular Behaviors的文章,揭示了普遍存在於細胞中的具有可穩定遺傳的表達模式的基因,以及這些基因在癌細胞產生化療抗性中的關鍵角色。
在該研究中,作者試圖回答的根本問題是,在不發生顯著狀態轉變(例如分化、癌變、凋亡等)的前提下,一個基因的表達水平能夠在多大程度上保持分裂前後的穩定性。在敏銳地捕捉到這一問題與1943年由Luria和Delbruck完成的經典遺傳學實驗之間的內在聯繫後(在L-D實驗中,研究人員通過統計計算經由均質細菌群體分離而來的單克隆在含有噬菌體的培養基中生長後,產生的抗噬菌體克隆數目所形成的分布符合二項分布還是長尾分布, 來檢驗抗噬菌體突變體的出現是由於在培養時對噬菌體做出反應而產生,還是在培養前就已經發生了基因突變),作者以其策略為範本,設計了MemorySeq實驗來定量化測度基因表達的跨代遺傳穩定性。
在該實驗中,作者從均質的黑色素瘤細胞系中挑取了48個單克隆,獨立擴增至100000個子代細胞後,進行RNA-seq以測量全轉錄組的基因表達水平。這一實驗基於的邏輯是:對於表達模式遺傳穩定性低的基因來說,其激活與關閉的速率較細胞分裂速率快得多,很難將自身表達模式傳遞給子代細胞,因而不會導致上述某一個克隆中富集大量高表達該基因的細胞,最終表現為48個克隆中該基因的表達呈現為相對平均和穩定的分布。相反,如果某個基因的表達遺傳性很強,則很容易導致高表達該基因的細胞的大部分子代細胞均攜帶其表達特徵,而由於一個基因的激活和抑制在48個克隆中是隨機的,最終就會表現為少數克隆中這一基因表達極高,而大部分克隆中其表達則較低。
基於MemorySeq實驗,作者找到了200多個跨克隆表達差異顯著高於背景值的基因,即在該細胞系中具有超越細胞分裂時間尺度的表達模式穩定遺傳的基因。為了進一步驗證這些基因的穩定遺傳性,作者以基因NGFR為例,利用時差顯微鏡觀測了來源於同一單克隆的不同子代細胞中的NGFR蛋白在基因偶然激活後的表達模式的持續性,發現其的確穩定跨越了多次細胞分裂。此外,作者還基於以空間接近程度推測遺傳先後順序的邏輯,設計了在培養皿中稀疏分布細胞單克隆,讓其充分增殖後利用RNA原位雜交技術測量一組基因的空間表達分布的實驗。結果發現,由MemorySeq識別的具有強遺傳性的基因的確具有顯著更好的局限性分布特徵。相反,表達模式不穩定的基因則更傾向於散布於整個空間範圍內。
最後,作者基於前期研究結果及邏輯推理,認為表達模式的穩定遺傳可能代表了細胞群體演化出具有全新狀態的亞群的一種重要途徑,因此具有這一特徵的基因很可能在癌細胞產生耐藥性的過程中扮演關鍵角色。基於此,作者利用MemorySeq篩選了一種乳腺癌細胞系中潛在的穩定遺傳基因,在找到其中一個靶標CA9後,將細胞群體基於該基因的表達水平進行了分選,並驗證了CA9高表達在癌細胞形成抗藥性中的顯著效應。
總之,這一研究基於精妙的實驗設計和豐富的個例驗證,揭示了一項基本而關鍵的生物學過程,即基因表達跨越細胞分裂代際的穩定遺傳性,並且與癌細胞耐藥性的產生這一具體生物學應用場景進行了充分聯繫。儘管該研究已經展現了這一生物現象的普遍科學意義和極高的應用價值,但其產生和維持的分子機制,以及在更廣闊的生物環境中的復現性,還尚不明確,因此也是未來重要的探索方向。
原文連結:
https://doi.org/10.1016/j.cell.2020.07.003