單細胞數據高級分析——解碼細胞通信網絡

2021-01-10 網易

  前言

  多細胞生物是由不同類型的細胞組成開放社會,這個社會中的單個細胞間必須協調它們的行為,為此,細胞建立通訊聯絡是必需的。細胞通訊是指一個細胞發出的信息通過介質傳遞到另一個細胞產生相應的反應,通過化學信號分子進行細胞間通訊是動物和植物最普遍採用的通訊方式。配體-受體複合物介導的細胞-細胞通訊對協調發育、分化和炎症等多種生物學過程具有至關重要的作用。

  複雜的細胞外反應始於配體與其同源受體的結合和特定細胞信號通路的激活,定位這些配體-受體相互作用是理解細胞行為和對鄰近細胞反應的基礎。隨著單細胞RNA測序的日益流行,RNA測序數據量的指數增長,使得測量多種細胞類型中配體和受體的表達,並系統地解碼細胞間通信網絡,最終解釋組織在穩態中的功能及其在疾病中的變化成為可能。

  CellPhoneDB 簡介

  
為了研究不同細胞類型間的細胞通訊網絡如何使生理過程得以進行的,英國 Sanger 研究所的 Teichmann 實驗室和 Vento-Tormo實驗室聯合開發了 CellPhoneDB[1],一個配體、受體及其相互作用的資料庫,用於細胞通訊網絡的系統分析。該資料庫利用了來自 UniProt、Ensembl、PDB、IUPHAR等資料庫的信息,共存儲了978種蛋白質:501種為分泌蛋白,585種為膜蛋白。這些蛋白質參與1396種相互作用,其中,有474種相互作用涉及分泌蛋白,490種相互作用僅涉及膜蛋白(圖1)。

  與其他資料庫相比,CellPhoneDB的一個主要優點是它考慮了配體和受體的結構組成,準確地描述了異聚複合物。這一點對於許多細胞因子等蛋白質家族來說尤其重要,因為配體-受體相互作用通常涉及多個亞單位,其中受體共享結構亞單位,配體的親和力由受體亞單位的特定組合決定。在儲存在CellPhoneDB中的所有蛋白質中,466種是異聚體。

  

  圖1 CellPhoneDB 資料庫概述

  CellPhoneDB 進行細胞通訊分析原理

  CellPhoneDB 集成了一種計算方法,用於從 scRNA-seq 數據中識別與生物學相關的配體-受體相互作用。CellPhoneDB的輸入scRNA-seq數據中應包含有counts定量數據和細胞類型注釋信息,具有相同細胞類型注釋的細胞以細胞狀態聚合在一起(圖a)。

  

  CellPhoneDB 根據一種細胞類型中受體的表達和另一種細胞類型中配體的表達,預測兩種細胞狀態之間豐富的配體-受體相互作用。首先,對於細胞群中的每個基因,計算表達該基因的細胞百分比和基因表達平均值。只有表達受體和配體基因的細胞佔比超過指定的閾值時(默認為10%),該配體-受體對才會被納入分析。對於聚合體而言,則選擇表達平均值較小的亞基的表達值代表該受體的表達用於後續的統計分析(圖b)。

  

  然後在數據集中的所有細胞類型之間執行成對比較。首先,隨機排列所有細胞的細胞類型標記,形成新的細胞群(默認隨機排列1000次),計算隨機排列後細胞群中配體的平均表達水平和與其相互作用的細胞類型中受體的平均表達水平的平均值。通過這種方式,在兩種細胞類型之間的每對配對比較中為每個配體-受體對生成一個零分布(圖c)。

  

  生成零分布之後,按照原細胞分群計算兩種細胞類型間配體-受體對的實際平均值,根據計算平均值等於或高於實際平均值的比例推測該受體-配體對在這兩種細胞類型中可能的顯著性P值(圖d)。

  

  之後,根據兩種細胞類型中富集到的顯著的配體-受體對的數量,對細胞類型之間高度特異的相互作用進行排序,以便手動篩選出生物學相關的相互作用關係。這樣,通過特異性的蛋白複合物,預測了細胞群之間可能的分子相互作用,產生了細胞群間潛在的通訊網絡,這些網絡可以通過直觀的表格和圖表進行可視化(圖e)。

  

  細胞通訊分析應用

  CellPhoneDB 分析細胞通訊網絡可以推廣到任何包含潛在相互作用細胞群單細胞轉錄組數據中,並且已在多個單細胞圖譜中得以應用。例如:

  

Braga 等使用 CellPhoneDB分析識別了健康氣道和哮喘氣道中細胞間相互作用的變化,確定了健康氣道中以間充質-上皮相互作用為主的細胞通訊網絡在哮喘氣道中轉向以Th2細胞為主[2];Stewart 等在腎臟的背景下,使用細胞間相互作用分析方法有助於揭示上皮免疫系統的串擾,從而協調抗菌巨噬細胞和嗜中性粒細胞向腎臟最易感染區域的富集[3];在2019年的一個單細胞圖譜分析中,Popescu 等通過涉及與造血相關的重要的分子如VCAM1、ITGB1和ITGA4分子等的相互作用,確定了紅細胞和EI巨噬細胞之間的相互作用[4]。此外,CellPhoneDB 資料庫是使用人類特有的配體-受體相互作用創建的,但是通過將人類基因映射到同源的小鼠基因上,也可以應用於小鼠數據集。Davidson 等在18年通過細胞通訊框架證明了在小鼠黑色素瘤模型的腫瘤微環境中,不同細胞之間複雜的相互作用[5]。

  歐易細胞通訊分析結果展示

  

  圖片說明:所示左圖為點圖,展示了ligand-receptor對在不同細胞類型中的表達強度和特異性;所示右圖為熱圖,展示了不同細胞類型中相關作用的數量。

  左圖中,行表示具有細胞間通訊關係的ligand-receptor對,列表示發生細胞通訊的細胞類型,圓圈大小表示顯著性水平,圓圈越大表示越顯著,圓圈顏色越紅表示細胞間通訊關係越強;右圖中,行和列都表示為細胞,每格表示細胞間的相關作用的數量,顏色越紅表示細胞間的相互作用數目越多,即細胞間通訊關係越強。

  

  圖片說明:所示為細胞通訊網絡圖,顯示不同的細胞類型之間檢測到配體-受體相互作用的數量。

  圖中分別標記了正向(從信號細胞到目標細胞)和反向信號,同時測量了每個細胞類型內的自分泌信號。網絡圖的節點按照細胞類型進行顏色編號,邊緣按信號和目標細胞之間的相互作用的數量進行標記和縮放。

  

  圖片說明:所示為細胞通訊circos圖,顯示了每種相互作用的方向。其中最外圈表示每個相互作用的配體-受體基因對的詳細信息,基因表達由低到高由顏色由黃到紅表示;第二圈表示細胞類型,不同的細胞類型用不同的顏色表示;最內圈表示配體-受體基因對的作用關係,實線表示信號強度顯著,虛線表示不顯著。用戶可以選擇要在circos圖中顯示的細胞類型、基因類別和相互作用的數量。

  總結

  細胞通訊分析以細胞亞群的基因表達量數據為研究對象,獲取細胞中的配體及受體信息,獲得細胞間的信號通訊網絡,在闡明生物學過程中細胞間通訊的複雜性、多樣性和動態性方面有重要意義。

  參考文獻

  [1] Efremova, M., Vento-Tormo, M., Teichmann, S.A. et al. CellPhoneDB: inferring cell–cell communication from combined expression of multi-subunit ligand–receptor complexes. Nat Protoc (2020).
[2] Braga, F. A. V. et al. A cellular census of human lungs identifies novel cell states in health and in asthma.Nat. Med. 25, 1153–1163 (2019).[3] Stewart, B. J. et al. Spatiotemporal immune zonation of the human kidney. Science 365, 1461–1466 (2019).[4] Popescu, D.-M. et al. Decoding the development of the blood and immune systems during human fetal liver haematopoiesis. Nature 574, 365–371 (2019).[5] Davidson, S. et al. Single-cell RNA sequencing reveals a dynamic stromal niche within the evolving tumour microenvironment. Preprint at bioRxiv: https://doi.org/10.1101/467225 (2018).

  猜你想看

  

  END

  本文系歐易生物原創

  轉載請註明本文轉自歐易生物

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺「網易號」用戶上傳並發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關焦點

  • 「靈長類細胞解碼計劃」探尋生命真相
    近日,以「靈長類細胞解碼」為主題的香山科學會議第S51次學術討論會在上海召開,中科院院士季維智表示,通過對包括人類以及非人靈長類動物的細胞解碼計劃,可以使得生命科學離生命真相更近一步。「利用新的單細胞多組學技術、開展靈長類細胞多組學的多學科交叉研究,有利於我們深入了解人類本身,為解決相關疾病問題提供理論基礎和靶點。」中科院院士陳潤生如是說。
  • 單細胞轉錄組高級分析四:scRNA數據推斷CNV
    ,然而那些分析只是揭開了組織異質性的面紗,還有更多的生命奧秘隱藏在數據中等待我們發掘。本專題將介紹一些單細胞轉錄組的高級分析內容:多樣本批次校正、轉錄因子分析、細胞通訊分析、基因集變異分析和更全面的基因集富集分析。不足之處請大家批評指正,歡迎添加Kinesin微信交流探討!inferCNV是大名鼎鼎的broad研究所開發的,可以使用單細胞轉錄組數據分析腫瘤細胞CNV。
  • 單細胞數據分析神器——Seurat
    在2015年至2017年,甚至對某細胞群體或組織進行單細胞測序,解析其細胞成分就能發一篇CNS級別的文章。近兩三年,單細胞技術從最開始的基因組,轉錄組測序,發展成現在的單細胞DNA甲基化,單細胞ATAC-seq等等。測序手段也從早期的10X Genomics、 Drop-seq等,發展為現在的多種多樣個性化的方法。研究內容更不僅僅局限於解析細胞群體的成分,而是向研究細胞功能和生物學特性發展。
  • ...學院張強鋒課題組利用深度學習人工智慧算法分析單細胞ATAC-seq...
    生命學院張強鋒課題組利用深度學習人工智慧算法分析單細胞ATAC-seq數據清華新聞網10月12日電 10月8日,清華大學生命學院的張強鋒課題組在《自然·通訊》(Nature Communications)上發表題為「SCALE方法基於隱特徵提取進行單細胞ATAC-seq數據分析」(SCALE method for
  • 10x單細胞免疫組庫VDJ數據分析就看它
    2015年,10x Genomics發布了基於微流控和油滴包裹技術的Chromium單細胞系統平臺,可實現高通量的單細胞轉錄組和單細胞V(D)J測序。不但可以將TCR/BCR雙鏈完美匹配,而且可以細化到單細胞水平,同時獲得表達譜信息。目前該技術也是研究單細胞免疫組庫應用最廣泛的技術,那麼10x 單細胞免疫數據該如何分析?分析結果又有哪些呢?今天小編帶大家來聊聊單細胞免疫組庫測序數據分析那些事。
  • 科學家揭示整合單細胞和群體細胞轉錄組數據推斷細胞分化時間的作用
    近日,中國科學院上海生命科學研究院(人口健康領域)馬普計算生物學夥伴研究所韓敬東研究組,中科院生物化學與細胞生物學研究所景乃禾研究組該研究通過開發計算工具包(iCpSc)用於整合單細胞和群體細胞轉錄組數據,來預測細胞分化過程中單細胞的分化時間和路徑,並通過基因調控網絡分析尋找重要調控因子和信號通路。單細胞轉錄組測序技術作為強大的方法應用於分析發育和重編程過程的細胞異質性。分析細胞間異質性的關鍵目標就是尋找未知的細胞狀態或重構細胞譜系的發育軌跡。
  • 精於數據處理:自動化單細胞分析軟體——CeleScope
    你是否還在為單細胞數據分析而發愁?是否還在為重新學習各種分析軟體而苦惱?今天給大家介紹一個單細胞數據分析軟體——CeleScope™,簡單易上手,結果準確可靠,讓你的研究更進一步!CeleScope™是一系列用於分析新格元GEXSCOPE®單細胞測序數據的生物信息流程。可從二代測序下機的原始fastq數據開始處理,包含數據拆分、比對、定量、生成表達矩陣、分群等功能。
  • 邀您體驗CLC單細胞數據分析模塊
    單細胞測序技術作為一種高解析度的技術,可以在單細胞水平快速構建組織或器官的分子圖譜,了解基因調控機制,從而探索早期胚胎發育、組織及器官形成、免疫機制和腫瘤發生等分子機理。當然,對於高噪音、高維度的單細胞測序數據,同樣需要特定的分析流程進行處理。
  • Illumina與Bio-Rad聯合發布單細胞基因組測序解決方案,使複雜疾病...
    該綜合解決方案是單細胞分析的第一個新一代測序(NGS)工作流程,使研究人員能夠在組織功能、病情進展和治療反應方面深入探查個體細胞的協同作用。與以往任務艱巨且昂貴費時的流程不同,該解決方案能夠對數以千計的個體細胞進行高通量測序。單細胞測序廣泛用於人類發展與疾病研究中,能在該解決方案發布以後獲益良多。
  • 單細胞學習之細胞周期分析
    develop in preparation for cell division,為分裂做準備M(mitosis):'Old' cell partitions the two copies of the genetic material into the two daughter cells.And the cell cycle can begin again.3、scRNA-seq與cell cycle在分析單細胞數據時
  • ItClust:單細胞RNA測序分析的聚類和細胞類型分類算法
    儘管scRNA-seq有著光明的前景,但是單細胞測序技術過程中產生的數據噪音和scRNA-seq數據本身的高維度(測序得到的基因數量往往遠高於細胞的數量)使得scRNA-seq的分析變得十分具有挑戰性RNA測序分析的聚類和細胞類型分類的機器學習算法。
  • 相同DNA的人體細胞為何命運職責皆不同?專家這樣說
    近日,以「靈長類細胞解碼」為主題的香山科學會議第S51次學術討論會在上海召開,中科院院士季維智表示,通過對包括人類以及非人靈長類動物的細胞解碼計劃,可以使得生命科學離生命真相更近一步。「利用新的單細胞多組學技術、開展靈長類細胞多組學的多學科交叉研究,有利於我們深入了解人類本身,為解決相關疾病問題提供理論基礎和靶點。」中科院院士陳潤生如是說。
  • 單細胞分析技術在幹細胞異質性研究中的應用
    幹細胞按種類可以分為全能幹細胞、多能幹細胞和單能幹細胞。單細胞分析技術:能通過相應技術分離與提取單個靶細胞,利用基因組擴增、測序等技術對靶細胞內的基因組信息、蛋白信息進行分析,能準確地提供細胞內物質及生化反應的準確信息,能夠反映細胞的功能與化學組分的特定關係與某些細胞在生命體內的特殊作用。
  • Science:利用單細胞RNA測序分析黑色素瘤
    2016年4月8日/生物谷BIOON/--單細胞分析是一種開創性方法,如今在整個生物領域中正被用來研究一個共同的問題:如何研究異質細胞群體中的細胞多樣性。這種多樣性能夠對細胞存活和增殖、對藥物療法和幹預作出的反應以及很多其他的生物過程產生深刻影響。
  • |可解釋膠囊網絡深度學習框架從單細胞RNA測序...
    最近,scRNA-seq數據的快速積累使得可以為每個單個細胞分配一個標記,該標記可以記錄細胞的類型同一性,發育階段,空間位置或該細胞的另一個生物學特徵。為了滿足細胞類型標記的要求,已經開發了幾種用於單細胞轉錄組分析的生物信息學算法。雖然,現有的基於基因表達的有監督或無監督學習方法上實現了一個穩健的、定量的細胞類別定義。但是,它們都需要進行特徵選擇以揭示分類器如何為某個細胞分類類別標籤。
  • 單細胞測序揭開「作物遺傳分析和產量基因挖掘」新篇章
    為突破這一瓶頸,來自美國冷泉港實驗室的David Jackson 課題組及多個合作團隊的研究者們利用玉米這一糧食農作物作為研究對象,聚焦花序器官早期發育這一決定性階段,運用時下先進的單細胞轉錄組測序 (scRNA-seq) 技術, 構建單細胞水平基因共表達網絡並準確預測基因冗餘,進而整合特異性細胞群體染色質開放數據,鑑定關鍵轉錄因子調控位點,最終結合全基因組關聯分析挖掘產量性狀相關基因。
  • ...開發出將多種單細胞數據集結合在一起的新工具,有助確定細胞類型
    2019年6月17日訊/生物谷BIOON/---單細胞研究揭示了可能在其他分析中被忽略的細胞細節。生物學家當前使用一系列方法來收集不同組織和物種的單細胞數據。一些科學家可能使用基於組織的原位方法來研究小鼠神經元中的DNA甲基化,而另一些科學家可能使用液滴方法來探究人神經元中的RNA表達。
  • Cell:開發出將多種單細胞數據集結合在一起的新工具,有助確定細胞...
    2019年6月17日訊/生物谷BIOON/---單細胞研究揭示了可能在其他分析中被忽略的細胞細節。生物學家當前使用一系列方法來收集不同組織和物種的單細胞數據。一些科學家可能使用基於組織的原位方法來研究小鼠神經元中的DNA甲基化,而另一些科學家可能使用液滴方法來探究人神經元中的RNA表達。
  • 單細胞數據科學的十一個重大挑戰
    這是單細胞數據分析的大框架,要說難點都難,今天我們就來談談目前單細胞數據解讀(挖掘)的一些挑戰。主要參考文章:Eleven grand challenges in single-celldata science ,Lähnemann et al.
  • 細胞分化高級玩法——RNA velocity 分析,你 get 了嗎?
    研究證明,基於現有的多種測序平臺 (SMART-seq2,STRT / C1,inDrop 和 10x Genomics Chromium) 測得的單細胞轉錄組數據中,均可檢測到包含未剪接的內含子序列的 reads,表明在單細胞轉錄組測序數據中可以檢測到類似的信號,可以揭示整個轉錄組在動態過程中變化的速率和方向。