cytof數據處理難點之細胞亞群繼續分群

2021-02-13 生信技能樹

前面我們已經完成了cytof數據處理的主要步驟,讀入文件,質量控制,降維聚類分群,生物學注釋和細胞亞群比例差異分析。目錄如下:

其實跟純粹的單細胞轉錄組就非常類似了,不過單細胞轉錄組數據分析的細節以及背景我就不贅述了,看我在《單細胞天地》的單細胞基礎10講:

以及各式各樣的個性化匯總教程,差不多就明白了。

基本流程走完了,僅僅是萬裡長徵第一步而已。我們可以開始嘗試分析一些文獻的公共數據集啦,不過在處理那些數據的過程中,我們還需要傳授給大家幾個小技巧。

首先取出亞群

前面的細胞亞群生物學命名的時候,我們就講解過,根據指定抗體信號強度,可以取子集,代碼如下:

rm(list = ls())
suppressPackageStartupMessages(library(flowCore)) 
suppressPackageStartupMessages(library(diffcyt))
suppressPackageStartupMessages(library(HDCytoData))
require(cytofWorkflow)
load(file = 'K20_output_of_cytofWorkflow.Rdata')
 
sce@metadata
p=plotExprHeatmap(sce, features = "type", 
                  by = "cluster_id", k = "meta20", 
                  row_clust = F,
                  bars = TRUE, perc = TRUE)

p
p@matrix 
kp=p@matrix > 0.5
colnames(kp)

k1=which(kp[,"CD45"] &  kp[,"CD3"] &  kp[,"CD4"]   );k1 # CD4
sce 
som=sce@metadata$cluster_codes
table(colData(sce)$cluster_id)
choose_som=som[som$meta20 %in% k1,1]
choose_som

這樣取出來了就是可能的CD4的T細胞啦,有了這個choose_som後面就可以獲取。

不知道大家是否還記得Seurat分析流程裡面的單細胞對象取子集呢?其實本質上都是考驗大家對R裡面的S4對象的理解而已。

然後重新組合成為新的SingleCellExperiment對象

SingleCellExperiment對象的認識非常重要,重點就是:

different quantifications (e.g., counts, CPMs, log-expression) can be stored simultaneously in the assays slot,row and column metadata can be attached using rowData and colData, respectively.

全部的代碼如下;

sce
ct=assay(sce,i = 1)[,colData(sce)$cluster_id %in% choose_som]
ex=assay(sce,i = 2)[,colData(sce)$cluster_id %in% choose_som]
phe=colData(sce)[colData(sce)$cluster_id %in% choose_som,]
geneinfor=rowData(sce) 
sce <- SingleCellExperiment(list(counts=ct,exprs=ex),
                            colData=phe,
                            rowData=geneinfor
)
sce

新組建的SingleCellExperiment對象就可以繼續走聚類分群的步驟啦。而且很容易建議,代碼如下:

p <- plotExprs(sce, color_by = "condition")
p$facet$params$ncol <- 3
p

可以看到,CD4都是有表達量的:

 同樣的聚類分群代

跟之前一樣,示例代碼如下:

sce
pro='Cd4-Tcells_sub'


p <- plotExprs(sce, color_by = "condition")
p$facet$params$ncol <- 3
p
ggsave2(filename = paste0(pro,'_all_markers_density.pdf'),height = 11)

n_cells(sce) 
plotCounts(sce, group_by = "sample_id", color_by = "condition")
ggsave2(filename = paste0(pro,'_plotCounts.pdf'))


# 10 lineage markers and 14 functional markers across all cells measured for each sample in the PBMC dataset
pdf( paste0(pro,'_plotExprHeatmap.pdf'))
plotExprHeatmap(sce, scale = "last",
                hm_pal = rev(hcl.colors(10, "YlGnBu")))
dev.off()


# PCA-based non-redundancy score (NRS) 
plotNRS(sce, features = "type", color_by = "condition")
ggsave2(filename = paste0(pro,'_plotNRS.pdf'))

set.seed(1234)
# 通常建議第一次分群,細一點要好,後面可以人工合併
# We call ConsensusClusterPlus() with maximum number of clusters maxK = 20.
sce <- cluster(sce, features = "type",
               xdim = 10, ydim = 10, maxK = 10, seed = 1234)

pdf(paste0(pro,'_cluster_plotExprHeatmap_row_clust_F.pdf'))
plotExprHeatmap(sce, features = "type", 
                by = "cluster_id", k = "meta10", 
                row_clust = F,
                bars = TRUE, perc = TRUE)
dev.off()

pdf(paste0(pro,'_plotClusterExprs.pdf'))
plotClusterExprs(sce, k = "meta10", features = "type")
dev.off()

pdf(paste0(pro,'_cluster_plotMultiHeatmap.pdf'))
plotMultiHeatmap(sce, 
                 hm1 = "type",   k = "meta10", 
                 row_anno = FALSE, bars = TRUE, perc = TRUE)
dev.off()
# 節約計算資源
# run t-SNE/UMAP on at most 500/1000 cells per sample
set.seed(1234)
sce <- runDR(sce, "TSNE", cells = 1e4, features = "type")
sce <- runDR(sce, "UMAP", cells = 1e4, features = "type")
# plotDR(sce, "UMAP", color_by = "CD4")

library(ggplot2)
p1 <- plotDR(sce, "TSNE", color_by = "meta10") + 
  theme(legend.position = "none")
p2 <- plotDR(sce, "UMAP", color_by = "meta10")
lgd <- get_legend(p2)
p2 <- p2 + theme(legend.position = "none")
plot_grid(p1, p2, lgd, nrow = 1, rel_widths = c(5, 5, 2))
ggsave2(filename = paste0(pro,'_umap_vs_tSNE.pdf'))

# facet by sample
plotDR(sce, "TSNE", color_by = "meta10", facet_by = "sample_id")
ggsave2(filename = paste0(pro,'_TSNE_by_samples.pdf'))
# facet by condition
plotDR(sce, "TSNE", color_by = "meta10", facet_by = "condition")
ggsave2(filename = paste0(pro,'_TSNE_by_condition.pdf'))


# facet by sample
plotDR(sce, "UMAP", color_by = "meta10", facet_by = "sample_id")
ggsave2(filename = paste0(pro,'_umap_by_samples.pdf'))
# facet by condition
plotDR(sce, "UMAP", color_by = "meta10", facet_by = "condition")
ggsave2(filename = paste0(pro,'_umap_by_condition.pdf'))

plotCodes(sce, k = "meta10")

pdf(paste0(pro,'_cluster_som100_plotMultiHeatmap.pdf'))
plotMultiHeatmap(sce, 
                 hm1 = "type",  k = "som100", m = "meta10", 
                 row_anno = FALSE, col_anno = FALSE, bars = TRUE, perc = TRUE)
dev.off()

sce@metadata
plot_grid(labels = c("A", "B"),
          plotDR(sce, "UMAP", color_by = "meta10"),
          plotDR(sce, "UMAP", color_by = "meta8"))

plotAbundances(sce, k = "meta10", by = "sample_id")
ggsave2(filename = paste0(pro,'_plotAbundances_barplot.pdf'))
plotAbundances(sce, k = "meta10", by = "cluster_id", shape_by = "patient_id")
ggsave2(filename = paste0(pro,'_plotAbundances_boxplot.pdf'))

save(sce,file = paste0(pro,'k10_output_of_cytofWorkflow.Rdata'))

可以看到初步分成的10個群,確實都有不一樣的地方,如果生物學背景足夠,就可以給出解釋。

 

相關焦點

  • cytof數據處理難點之合併兩個不同panel的數據集
    前面我們已經完成了cytof數據處理的主要步驟,讀入文件,質量控制,降維聚類分群,生物學注釋和細胞亞群比例差異分析。我們可以開始嘗試分析一些文獻的公共數據集啦,不過在處理那些數據的過程中,我們還需要傳授給大家幾個小技巧。合併兩個不同panel的cytof數據集有一些情況下,你的同一個實驗項目的多個FCS文件,它們的抗體順序並不一致。
  • 陳曉課題組發文發現了全新的再生特異的線粒體相關細胞亞群
    浙江大學基礎醫學院 昨天浙江大學基礎醫學院陳曉教授團隊合作利用單細胞轉錄組測序技術構建了蠑螈肢體再生細胞動態圖譜,並發現了全新的再生特異的線粒體相關細胞亞群。探索蠑螈肢體再生過程中的細胞動態變化,已成為肢體再生研究的重要部分。然而,由於對再生過程中涉及的細胞亞群的特性研究還不充分,人類肢體再生的關鍵驅動因素仍不明確。
  • 騰訊QQ大數據:用戶增長分析——用戶分群分析
    用戶分群方法,能幫助我們對差異較大的群體分別進行深入分析,從而探究指標數字背後的原因,探索實現用戶增長的途徑。一、用戶分群的應用場景 在日常的數據工作中,我們經常接到這樣的需求:想關注符合某些條件的一部分用戶,不僅想知道這些人的整體行為(訪問次數,訪問時長等),還希望知道具體是哪些人符合這些條件。
  • 生化細胞所蘇州研究院細胞表型檢測
    一、服務簡介細胞間相互識別的物質基礎是細胞膜分子,包括細胞表面的多種抗原、受體或其他分子,細胞生長發育過程中,處於不同階段的細胞或不同亞型的細胞,其表面有不同的標記,根據這些不同的標記,使用相應的抗體將細胞進行分析檢測,稱之為細胞表型檢測。
  • 公衛·科普 | 淋巴細胞亞群檢測的臨床意義
    淋巴細胞亞群的方法原理是:基於流式細胞技術手段,外周血中淋巴細胞表面抗原經過抗體孵育後形成抗原抗體複合物,抗體偶聯的螢光素標記在雷射激發下發出特定螢光,不同抗體發射的螢光在通過過濾片後通過光電倍增管收集並轉化為電子信號傳導到電腦,並以模擬信號的形式予以呈現。
  • 由同一個祖細胞發育而來的兩個CD8+記憶T細胞亞群具有不同的細胞命運
    由同一個祖細胞發育而來的兩個CD8+記憶T細胞亞群具有不同的細胞命運 作者:小柯機器人 發布時間:2020/10/13 16:29:37 義大利IRCCS-基金會Enrico Lugli及其研究團隊發現,在人體中兩個幹細胞樣CD8
  • 北京大學發現胚胎幹細胞中的新稀有細胞亞群
    責編 | 十一月幹細胞的異質性是指同一種幹細胞存在不同狀態細胞亞群的現象近年來採用單細胞測序及報告基因示蹤等技術研究發現,這是基因表達調控的內生隨機性、細胞生長微環境的差異性等內外因素共同作用引起的各種幹細胞的普遍特性。
  • 研究鑑定出多發性硬化症中的單核細胞致病亞群
    研究鑑定出多發性硬化症中的單核細胞致病亞群 作者:小柯機器人 發布時間:2020/4/22 12:27:22 2020年4月20日,《自然—免疫學》雜誌在線發表了德國馬克斯·德爾布呂克分子醫學中心Alexander Mildner
  • 發現新型效應性Treg細胞亞群
    已有報導表明,Treg細胞要經歷類似CD4 T細胞一樣的活化過程,最終分化為效應性Treg細胞,可分泌抑制性細胞因子,行使免疫抑制功能。TGF-β、IL-10是被普遍研究的免疫抑制因子。近年來研究發現,Treg細胞會分泌一種新型抑制性細胞因子IL-35,該因子已被證實在體內和體外都具有很強的免疫抑制能力,能夠在感染性疾病和腫瘤中引起傳染性免疫耐受。
  • 微生物所發現新型效應性Treg細胞亞群
    微生物所發現新型效應性Treg細胞亞群 2017-11-17 微生物研究所 【字體:大 中 小】 通過報告基因的標記,課題組發現在小鼠體內存在的IL-35分泌細胞主要來源於胸腺來源的tTreg細胞。進一步通過表面分子和轉錄譜分析發現,分泌IL-35的IL-35-Treg和分泌IL-10的IL-10-Treg是兩群完全獨立的效應性Treg亞群,它們具有不同的表面標記、組織分布和轉錄因子的依賴性。
  • 蘭州中醫白癜風醫院T淋巴細胞亞群檢測新技術發布
    T淋巴細胞亞群檢測儀,用於檢測細胞免疫和體液免疫功能,對分析白癜風疾病發病機理、指導臨床用藥、監控病程發展、觀察療效及監測愈後等有著重要指導意義。【什麼是T淋巴細胞亞群檢測】T淋巴細胞亞群的測定是檢測機體細胞免疫功能的重要指,通過檢測可以了解患者機體的免疫功能是否處於平衡狀態。
  • Genome Biology丨瞿昆組開發單細胞染色質可及性實驗和分析新技術
    該技術是一種基於流式分選,並利用螢光標記轉座酶插入細胞染色質的單細胞染色質可及性測序方法。相比於現有的同類技術,ftATAC-seq結合了細胞蛋白組信息,可以富集表達特異表面分子的細胞群體,同時利用螢光染料標記轉座酶的插入量,因而可以高效的篩選高質量的單細胞文庫(圖1)。
  • COVID-19急性患者的免疫反應相關特徵|covid-19|亞群|細胞|t細胞...
    2020年12月22日,蒙特婁大學在medRxiv上上傳了一項研究,對COVID-19急性住院患者、其他非COVID-19的急性疾病患者和健康人的外周血進行分析,發現免疫細胞亞群的一些失調
  • 兒童淋巴細胞分類參考值建立
    >近日,重慶醫科大學附屬兒童醫院、重慶市兒童感染免疫重點實驗室趙曉東教授團隊等完成的中國兒童外周血淋巴細胞分類正常參考範圍的最新研究成果論文,在過敏和臨床免疫全球排名第一的雜誌《過敏與臨床免疫》上發表。
  • 特殊的自然殺傷細胞亞群或能增加個體患...
    2017年7月7日 訊 /生物谷BIOON/ --超過一半的德國人群都是肥胖者,肥胖的一個效應就是會慢性地激活機體免疫系統,使其處於持續性的壓力之中,近日來自科隆大學醫院和普朗克研究所的研究人員通過研究在肥胖小鼠和人類機體中發現了一類特殊的免疫細胞亞群,這類細胞能夠參與糖尿病的發生,如果在人類機體中特異性地剔除這類免疫細胞亞群,過重人群患糖尿病的風險就會下降,相關研究刊登於國際雜誌
  • JCI Insight:特殊的免疫B細胞亞群或能有效減緩1型糖尿病的發生
    2018年12月19日 訊 /生物谷BIOON/ --近日,一項刊登在國際雜誌JCI Insight上的研究報告中,來自美國貝勒醫學院和密西根大學醫學院的科學家們通過研究發現,CD19+IgM+ B細胞(一類免疫B細胞亞群)或能減緩小鼠模型1型糖尿病的發作,相關研究結果或能幫助研究人員開發治療1型糖尿病的新型療法。
  • B細胞8個亞群及其表型區別
    以B細胞為例,外周血B細胞可通過免疫球蛋白M(IgM)、IgD、CD10、CD19、CD24、CD27和CD38的表達量不同區分為8個連續分化的亞群,依次為Immature B、T1 Transitional B、T2 Transitional B、T3 Transitional B、Naive B、Unswitched
  • 科學家發現可促進中樞神經系統再生的新型中性粒細胞亞群
    科學家發現可促進中樞神經系統再生的新型中性粒細胞亞群 作者:小柯機器人 發布時間:2020/10/27 15:04:30 美國俄亥俄州立大學Benjamin M.
  • 脂肪調節細胞:抑制成脂分化的脂肪幹細胞特殊亞群
    近期發表於Nature的一項研究中,發現在我們所熟知的脂肪幹細胞中,存在著一個具有抑制成脂分化能力的脂肪幹細胞亞群——脂肪調節細胞。首先,作者利用單細胞測序技術,根據基因表達的不同,把脂肪幹細胞分成三個細胞亞群——P1,P2和P3。
  • 一個新鑑定出的Th17細胞亞群或是抵抗慢性炎症性疾病的關鍵
    在一項新的研究中,來自美國聖猶大兒童研究醫院的研究人員鑑定出輔助性T細胞的一個亞群,這可能有助於人們重新認識和治療慢性的衰弱性炎症性疾病。如今,在這項新的研究中,這些研究人員鑑定出Th17細胞中的一個新的亞群,它在功能和代謝上不同於與慢性炎症相關的Th17細胞。他們報導這兩個Th17細胞亞群表達獨特的調節不同基因活性的轉錄因子。他們證實基因表達和細胞功能部分上是由代謝調節的。代謝活性調節基因表達這項新的研究建立在Chi及其同事們之前的研究結果之上。