責編丨迦漵
單細胞測序是指在單個細胞水平上,對基因組、轉錄組、表觀組等進行高通量測序分析的技術。它能夠在單個細胞層次,揭示細胞間在基因結構、基因表達,表觀遺傳狀態等多方面的異質性,在免疫學、神經科學、腫瘤學、發育生物學、微生物學等領域有著廣泛應用。與單細胞轉錄組測序技術相比,單細胞染色質可及性測序技術無論在實驗方法上,還是數據分析上,均存在巨大挑戰。
近日,中國科學技術大學生命科學與醫學部、合肥微尺度國家科學中心、中科院天然免疫和慢性疾病重點實驗室瞿昆教授課題組,開發了一種新型的單細胞染色質可及性實驗技術ftATAC-seq和數據分析算法APEC。該研究成果以「APEC: an accesson-based method for single-cell chromatin accessibility analysis」為題,於5月13日在線發表在Genome Biology雜誌上。
為了更好的獲取單細胞染色質可及性信息,瞿昆教授課題組開發了ftATAC-seq測序技術。該技術是一種基於流式分選,並利用螢光標記轉座酶插入細胞染色質的單細胞染色質可及性測序方法。相比於現有的同類技術,ftATAC-seq結合了細胞蛋白組信息,可以富集表達特異表面分子的細胞群體,同時利用螢光染料標記轉座酶的插入量,因而可以高效的篩選高質量的單細胞文庫(圖1)。
圖1. ftATAC-seq實驗流程
為了解決單細胞染色質可及性測序數據維度多,拷貝數低,數據矩陣稀疏等問題,課題組還開發了一款新的數據分析算法APEC(圖2),用來精確解析單細胞染色質可及性數據,並深度挖掘數據中隱藏的生物學意義。APEC通過將所有單個細胞之間具有相同信號波動的峰合併為峰組(稱為「訪問子(Accesson)」),將原本非常稀疏的「細胞-峰」矩陣轉換為相對緻密的「細胞-峰組」矩陣,巧妙的解決了單細胞染色質可及性數據過於稀疏的問題。與之前的算法相比,APEC具有分群準確性高,速度快,耗費系統資源少等優勢。為了方便研究者使用,APEC算法已經以Python軟體包的形式發布(https://github.com/QuKunLab/APEC),同時集成了多種配置文件和功能模塊以應對不同的單細胞數據分析需求。利用APEC算法,研究者不僅可以對細胞亞群進行精確分群,還可以描繪細胞的發育路徑,預測基因表達,尋找富集的基序,發現超級增強子等。
圖2. APEC單細胞染色質可及性數據分析原理
結合ftATAC-seq實驗方法和APEC算法,作者首次揭示了小鼠胸腺T細胞發育過程中單個細胞染色質可及性及其動態變化圖譜。作者發現當胸腺T細胞歷經從雙陽性到單陽性發育過程中,存在很強的凋亡壓力。這與絕大部分雙陽性T細胞,經歷了胸腺選擇後,會被克隆清除的現象是吻合的。
據悉,中國科學技術大學生命科學與醫學部瞿昆教授為該論文的通訊作者,課題組的特任副研究員黎斌和博士後李楊為共同第一作者。
原文連結:
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-020-02034-y