伴隨CLC version 21 新主體版本的發布,CLC同時發布了單細胞分析(Single Cell Analysis)模塊。
閱讀本文前,可以先參閱Zhang Kun老師的一篇綜述(WuY, Zhang K. Tools for the analysis of high-dimensional single-cell RNAsequencing data. Nat Rev Nephrol. 2020 Jul;16(7):408-421. doi:10.1038/s41581-020-0262-0. Epub 2020Mar 27. PMID: 32221477),對當前單細胞分析中用到的工具和分析步驟有一個總體概念。
對比Zhang Kun老師文獻中的整體框架圖,除了Trajectory inference步驟,CLC都有相對應的tools。
1. 支持數據類型
當前分析模塊,支持從原始reads進行後續分析,以支持從表達矩陣進行後續分析。且支持當前流行的導出格式。
2. 數據預處理模塊
數據預處理階段,主要是進行數據的Cell barcode和UMI等的拆分及後續的質控步驟,如empty drop,凋亡細胞的去除等。每個步驟主要用到的算法,以綠色進行標記。
3. 細胞類型注釋
自動化細胞類型的注釋,自認為是當前發布的單細胞分析模塊最為特色的一處。通過此tools,能自動化對細胞類型進行注釋,當前主要滿足小鼠和人細胞類型的自動化注釋。對異質程度較高的細胞類型,如腫瘤細胞類型的自動化注釋,亦有相關的輔助工具,支持實驗室自有積累數據的模型訓練及後續的自動化注釋步驟。
4. 聚類可視化呈現
當前支持UMAP及tSNE兩種可視化方法。用戶也可根據需要,添加相關meta信息,對聚類結果進行個性化呈現。
5. 差異基因及可視化
當前差異基因分析,主要依賴Mann-Whitney U tests算法。差異基因呈現,主要以heatmap和dotplot兩種可視化方式。此外,差異分析的結果,亦可無縫隙使用CLC RNAseq分析相關工具,例如火山圖等呈現。
CLC單細胞分析模塊支持圈選方式,對感興趣的不同cluster的進行快速選擇,及後續的差異表達分析。
對差異分析表達結果,可以導入到IPA,基於機制機理的深入解讀。參考這篇文獻 Wilk, A.J., Rustagi, A., Zhao, N.Q. et al. A single-cell atlas of the peripheral immune response in patients with severe COVID-19. Nat Med 26, 1070–1076 (2020). https://doi.org/10.1038/s41591-020-0944-y,了解如何將單細胞分析結果與IPA進行有效結合。
6. Workflow
當前發布的單細胞分析模塊,包含兩個workflow,分別支持從reads和表達矩陣到最終cluster圖等結果的獲得。
7. QC報告
一如既往,CLC對單細胞分析步驟都會有詳細完整的QC報告產出(只截取部分)。
8. 其它
單細胞分析是一個飛速發展的領域。CLC工具不一定能將最新最前沿的研究工具包含在我們的分析包裡。好的一點是,CLC不是一個封閉的分析體系,藉助CLC的External Application接口,我們可以將最新的研究方法納入到我們的分析流程裡。關於External Application接口的介紹,可以參考先前的文章。
PS. Single Cell Analysis分析模塊支持14天免費試用。各位老師可以安裝進行試用。