撰文 | Volibear
被Nature Methods雜誌選為2013年年度技術的單細胞測序技術,從誕生之日起就格外引人矚目。與普通測序不同,單細胞測序規避了細胞異質性帶來問題,科學家們可以通過該技術表徵單個細胞的基因組概況(例如基因組、轉錄組、甲基化組、染色質結構等),從而對生物組織中的細胞進行分型。除此之外,更重要的是對每種細胞類型的基因調控網絡、潛在的染色質結構和關鍵轉錄因子(Transcription Factor,TF )的探測,這可理論上以由單細胞RNA-seq聯合單細胞ATAC-seq(Assay for Transposase-Accessible Chromatin with high throughput sequencing)來實現。然而,儘管單細胞RNA-seq技術人們已經獲得了包括人類在內的不同生物的細胞圖譜()【1,2】,但由於單細胞RNA-seq的RNA檢測能力較低,限制了單個細胞中能夠檢測到的基因數量,現有方法幾乎無法提供有關基因-基因相互作用和調控網絡的信息【3】。單細胞ATAC-seq也已廣泛用於細胞分型,科學家創建了果蠅和小鼠等整個生物體的順式調控圖譜【4,5】。但是,單細胞ATAC-seq的檢測能力同樣有限,會導致假陰性結果的出現【6,7】。因此,高精度的單細胞測序技術亟待開發和整合。
近日,來自北京大學生物醫學前沿創新中心的謝曉亮教授、高歌教授、湯富酬教授以及北京大學第三醫院生殖醫學中心喬傑院士強強聯合共同發布了預印本文章Genomic Architecture of Cells in Tissues (GeACT): Study of Human Mid-gestation Fetus,描繪了人類中期妊娠(19-21周)胎兒組織細胞的基因組架構(Genomic Architecture of Cells in Tissues,GeACT)。該項研究中,在兩種新開發的單細胞技術(MALBAC-DT和METATAC)的加持下,研究者分析了人類中期妊娠(19-21周)胎兒消化、免疫、循環、呼吸、生殖和泌尿系統中多個代表器官和組織的轉錄組和染色質可及性。將基因表達譜與潛在的染色質狀態聯繫起來,研究者發現了具有代表性的相關基因模塊 (Corrected Gene Modules,CGMs) 的關鍵轉錄因子,從而加深了我們對於胎兒發育的理解。
文中用到的MALBAC-DT法【3】(見本文method部分)提高了RNA-seq中對RNA的檢測能力,不僅可以檢測到更多的基因,還可以檢測所有表達基因的協方差矩陣,從而產生相關CGM,即共同執行某些生物學功能的相互關聯的基因簇。此外,這項工作中研究者使用了一種名為METATAC(高精度單細胞ATAC-seq)的新方法來生成不同人體組織的染色質可及性圖(見本文method 部分),與以前的方法相比,該方法顯示出可接近的染色質區域的獨特DNA片段增加了約100倍【4】。同時擁有CGM和基因組架構,研究人員就可以描繪出與CGM相關的關鍵TF。
圖1. 單細胞數據生產和分析的工作流程
研究人員收集了胎兒在妊娠後19-21周的17個代表性器官(食道、胃、小腸、大腸、肝臟、胰腺、腎臟、膀胱、支氣管、肺、骨髓、脾臟、胸腺、有動脈的心臟、隔膜、卵巢和睪丸),包含了31個不同採樣位置(例如胃底、胃體和胃竇)。基於非標記的FACS分選後,研究人員採用了高精度單細胞RNA-seq方法(MALBAC-DT)【3】進行文庫製備和cDNA測序,從而產生了轉錄組圖譜。為了探索每個器官的細胞組成,研究人員處理了單細胞數據並獲得了228個細胞簇,每個簇都根據文獻中的著名標記基因進行了注釋,然後將所有細胞聚集在一起以構成全局轉錄組圖譜。該圖譜中包含了大多數器官中常見的6種細胞簇(上皮細胞、內皮細胞、成纖維細胞、神經膠質細胞、免疫細胞和紅細胞)以及性器官特有的幾個細胞簇,例如卵巢中的Granulosa細胞和睪丸中的支持細胞。研究人員對比了這些細胞在組內以及發育過程中的異同,發現了很多有趣的現象。
來自不同器官但具有相似生理特性的細胞類型(例如上皮細胞、內皮細胞和成纖維細胞)往往會被歸類在一起,表明它們在不同器官中的功能和基因表達模式相似,但是生理特性相似的細胞在不同器官中也會表現出不同的特徵。
為了進一步探索細胞類型特異性基因表達譜背後的表觀遺傳機制,研究人員從相應胎兒的14個代表性器官(卵巢,睪丸,支氣管除外)中分離了細胞核。解離後,使用高精度單細胞ATAC-seq方法(METATAC)進行文庫製備,然後進行深度測序。根據該結果對細胞類型進行注釋,研究人員獲得177個細胞簇。這些結果與轉錄組高度一致,證實了利用METATAC來進行細胞分型是可靠的。並且,這些結果也證明了染色質可及性可以真實地反映轉錄因子的活性。基於全面的染色質可及性信息,研究者將非免疫細胞聚類在一起,得到了與轉錄組數據類似的結果,即來自不同器官的類似表觀基因組的細胞傾向於聚類在一起。有趣的是,與RNA表達譜數據不同,來自腎臟、大腸、肺和胃的紅細胞聚類在同一器官的其他細胞類型中,而不是聚類在其他器官的紅細胞中,這表明,臨近細胞存在某些潛在的相互作用。
基於MALBAC-DT和METATAC的數據,研究人員描述了跨細胞類型的CGM。他們選擇分析細胞數量最多的10種細胞類型用於CGM檢測,獲得了227個非冗餘CGM。超過60%的CGM顯示出TF的富集,這反映了TF對共表達基因調控的貢獻。在一半的CGM中觀察到了豐富的蛋白質-蛋白質相互作用(PPI),這表明關聯轉錄是蛋白質活性同步的關鍵過程。儘管蛋白質編碼基因佔CGM的大部分(超過90%),但每個CGM中都有大量非編碼基因。出乎意料的是,對於大多數CGM,基因分散在不同的染色體上,這表明相關基因僅通過基因組鄰近性連接(即順式效應)。相反,具有較高相關性的CGM更可能包含常見的上遊TF調節因子,這表明反式作用是相關基因的主要驅動力。此外,高相關性CGM傾向於包含豐富的PPI,GO生物學過程和KEGG通路,這進一步突顯了基因功能的協同作用。CGM在不同細胞類型中可能顯示出不同的共表達水平。此外,研究人員驗證了如果基因在一種細胞類型中高度共表達,那麼這些基因的調控基因組元件的表觀遺傳狀態應在這種細胞類型中同步變化。這些結果還表明,基因調節區的共可及性是一對基因共表達的必要但不充足的條件。在多種細胞類型中普遍存在的CGM通常參與比較基本的生物過程,例如代謝、蛋白質摺疊和翻譯。
總之,該項研究首次利用兩項新的單細胞技術MALBAC-DT和METATAC,得到了基於橫跨多個胎兒器官的無偏見,高精度組學數據——識別了所有六個主要系統中的200多種不同類型的細胞,並得到了胎兒發育過程中細胞類型內的相關基因模塊(CGM)概況,由此極大地拓展了人們對於胚胎發育過程的認知。在拓寬人類功能基因組的理解上,GeACT還將大有可為。
原文連結:
https://www.biorxiv.org/content/10.1101/2020.04.12.038000v1
製版人:珂
參考文獻
1. Cao, J., et al., The single-cell transcriptional landscape of mammalian organogenesis. 2019. 566(7745): p. 496-502.
2. Han, X., et al., Mapping the mouse cell atlas by microwell-seq. 2018. 172(5): p. 1091-1107. e17.
3. Chapman, A.R., et al., Correlated Gene Modules Uncovered by Single-Cell Transcriptomics with High Detectability and Accuracy. 2020: p. 2019.12. 31.892190.
4. Cusanovich, D.A., et al., A single-cell atlas of in vivo mammalian chromatin accessibility. 2018. 174(5): p. 1309-1324. e18.
5. Cusanovich, D.A., et al., The cis-regulatory dynamics of embryonic development at single-cell resolution. 2018. 555(7697): p. 538-542.
6. Buenrostro, J.D., et al., Integrated single-cell analysis maps the continuous regulatory landscape of human hematopoietic differentiation. 2018. 173(6): p. 1535-1548. e16.
7. Preissl, S., et al., Single-nucleus analysis of accessible chromatin in developing mouse forebrain reveals cell-type-specific transcriptional regulation. 2018. 21(3): p. 432-439.
本文轉載自公眾號「BioArt」(BioGossip)
中國生物物理學會官方訂閱號,為BSC會員及生物物理領域專業人士服務。
投稿及授權請聯繫:bscoffice@bsc.org.cn。
微信號:BSC-1979
原標題:《【科技前沿】謝曉亮/湯富酬/喬傑/高歌等繪製人類中期妊娠胎兒組織細胞的基因組結構圖譜》