研究揭示整合單細胞數據集Harmony

2021-01-12 科學網

研究揭示整合單細胞數據集Harmony

作者:

小柯機器人

發布時間:2019/11/19 12:23:39

美國布萊根婦女醫院和哈佛醫學院Soumya Raychaudhuri研究組揭示了快速、靈敏、準確地整合單細胞數據:Harmony。相關論文11月18日在線發表在《自然—方法學》上。

研究人員提供了Harmony(https://github.com/immunogenomics/harmony),一種按細胞類型而不是特定數據集進行分組的算法,其將不同細胞數據整合到一個數據集。Harmony解決了多個實驗和生物學因素。在六項分析中,研究人員證明Harmony優於以前發布的算法,同時所需的計算資源更少。利用Harmony可以在個人計算機上集成約106個單元。研究人員利用Harmony整合了具有較大實驗差異數據的外周血單核細胞聚集,這些數據集包括胰腺胰島細胞的五項研究、小鼠胚胎發生數據集以及scRNA-seq與空間轉錄組學數據集。

據介紹,多樣的單細胞RNA-seq數據集可以在多種生物學和臨床條件下對細胞的轉錄進行完整的表徵。但因為存在著生物學和技術上的差異,特別是在使用不同技術分析數據集時將它們一起分析仍是一個挑戰。

附:英文原文

Title: Fast, sensitive and accurate integration of single-cell data with Harmony

Author: Ilya Korsunsky, Nghia Millard, Jean Fan, Kamil Slowikowski, Fan Zhang, Kevin Wei, Yuriy Baglaenko, Michael Brenner, Po-ru Loh, Soumya Raychaudhuri

Issue&Volume: 2019-11-18

Abstract: The emerging diversity of single-cell RNA-seq datasets allows for the full transcriptional characterization of cell types across a wide variety of biological and clinical conditions. However, it is challenging to analyze them together, particularly when datasets are assayed with different technologies, because biological and technical differences are interspersed. We present Harmony (https://github.com/immunogenomics/harmony), an algorithm that projects cells into a shared embedding in which cells group by cell type rather than dataset-specific conditions. Harmony simultaneously accounts for multiple experimental and biological factors. In six analyses, we demonstrate the superior performance of Harmony to previously published algorithms while requiring fewer computational resources. Harmony enables the integration of ~106 cells on a personal computer. We apply Harmony to peripheral blood mononuclear cells from datasets with large experimental differences, five studies of pancreatic islet cells, mouse embryogenesis datasets and the integration of scRNA-seq with spatial transcriptomics data.

DOI: 10.1038/s41592-019-0619-0

Source: https://www.nature.com/articles/s41592-019-0619-0

相關焦點

  • 科學家揭示整合單細胞和群體細胞轉錄組數據推斷細胞分化時間的作用
    該研究通過開發計算工具包(iCpSc)用於整合單細胞和群體細胞轉錄組數據,來預測細胞分化過程中單細胞的分化時間和路徑,並通過基因調控網絡分析尋找重要調控因子和信號通路。單細胞轉錄組測序技術作為強大的方法應用於分析發育和重編程過程的細胞異質性。分析細胞間異質性的關鍵目標就是尋找未知的細胞狀態或重構細胞譜系的發育軌跡。
  • 【突破】500,000+單細胞的RNA序列揭示所有主要人體器官的細胞類型圖
    在周三發表在《自然》雜誌上的一項新研究中,中國研究人員根據來自中國漢族捐贈者的500,000多個單細胞的RNA序列,描述了所有主要人體器官的細胞類型組成。這項研究為人類生物學提供了寶貴的資源。
  • ...開發出將多種單細胞數據集結合在一起的新工具,有助確定細胞類型
    2019年6月17日訊/生物谷BIOON/---單細胞研究揭示了可能在其他分析中被忽略的細胞細節。生物學家當前使用一系列方法來收集不同組織和物種的單細胞數據。一些科學家可能使用基於組織的原位方法來研究小鼠神經元中的DNA甲基化,而另一些科學家可能使用液滴方法來探究人神經元中的RNA表達。
  • Cell:開發出將多種單細胞數據集結合在一起的新工具,有助確定細胞...
    2019年6月17日訊/生物谷BIOON/---單細胞研究揭示了可能在其他分析中被忽略的細胞細節。生物學家當前使用一系列方法來收集不同組織和物種的單細胞數據。一些科學家可能使用基於組織的原位方法來研究小鼠神經元中的DNA甲基化,而另一些科學家可能使用液滴方法來探究人神經元中的RNA表達。
  • 重磅 | 百奧智匯推出單細胞RNA大數據可視化平臺OmniBrowser:收錄癌症等多個領域近1500個數據集,為藥物研發賦能
    2020年1月4日,百奧智匯正式推出單細胞RNA測序大數據可視化平臺——OmniBrowser,為研究者們挖掘利用海量單細胞數據提供有力工具,為藥靶發現、藥物研發、科研探索賦能。為了能夠對上述大量單細胞數據進行高效處理,該平臺內置數十種百奧智匯獨立研發的大數據可視化處理、儲存和傳輸算法,可支持十萬量級單細胞的秒級加載和流暢交互。
  • 單細胞轉錄組整合分析——seurat包
    Seurat 學習筆記該包於去年新推出了整合功能。重點是找到不同數據集中的錨點anchors,這些「錨點」然後用於協調數據集,或將信息從一個數據集傳輸到另一個數據集。步驟如下:數據預處理作者把單細胞數據放在了SeuratData等一系列包中,如果你的網速不行,可以直接到網頁下載數據
  • 【綜述】盤點單細胞測序研究——續篇
    2018.11.30 研究人員使用優化的單細胞多組學測序來更好地了解結腸癌腫瘤的異質性 與中國多個機構有聯繫的一組研究人員發現,使用優化的單細胞多組學測序可以更好地揭示結腸癌腫瘤的異質性。
  • 單細胞數據分析神器——Seurat
    在2015年至2017年,甚至對某細胞群體或組織進行單細胞測序,解析其細胞成分就能發一篇CNS級別的文章。近兩三年,單細胞技術從最開始的基因組,轉錄組測序,發展成現在的單細胞DNA甲基化,單細胞ATAC-seq等等。測序手段也從早期的10X Genomics、 Drop-seq等,發展為現在的多種多樣個性化的方法。研究內容更不僅僅局限於解析細胞群體的成分,而是向研究細胞功能和生物學特性發展。
  • 單細胞RNA測序揭示癌細胞對化學療法的多種反應機制
    單細胞RNA測序揭示癌細胞對化學療法的多種反應機制 2020-08-27 15:57 來源:澎湃新聞·澎湃號·湃客
  • 單細胞數據科學的十一個重大挑戰
    一個主要的挑戰將是將這與從其他測量中獲得的單細胞的空間位置相結合。這將有助於確定來自同一亞克隆的細胞是否位於同一位置,轉移是否經常由同一亞克隆發生,單個轉移是由單個亞克隆發生還是由多個亞克隆發生。利用來自同一腫瘤和遠處轉移的多個區域樣本的研究已經為研究這些問題鋪平了道路。然而,只有單細胞空間解析度才能在特定位置識別特定的個體基因型,並得出精確的結論。
  • BIOPIC張澤民課題組在Nature Communications發表單細胞轉錄組數據...
    單細胞轉錄組測序能夠揭示單個細胞的基因表達狀態,反映細胞間的異質性,並為鑑定各種細胞的功能提供了重要途徑。隨著測序技術的發展,測得單個細胞轉錄組的價格不斷下降,數據集的大小呈指數函數增長趨勢;與此同時,其應用場景也逐漸從孤立的局部領域拓寬到系統性的物種單細胞圖譜上。
  • 單細胞RNA測序技術的研究進展
    單細胞RNA測序已成為解剖細胞異質性並將組織分解成細胞類型和/或細胞狀態的必不可少的工具,這為從頭發現提供了巨大的潛力。單細胞轉錄組圖譜提供了前所未有的解析度,可揭示複雜的細胞事件並加深我們對生物系統的了解。在本綜述中,簡要簡紹了單細胞RNA測序技術及相關應用。我們預計單細胞RNA測序在生物學中的作用將日益增強,在提供空間信息和與細胞形態的方面將進一步提高。將來,能夠更好地應用於科研領域。
  • 研究揭示胰腺癌腫瘤-微環境高度異質性細胞特徵
    為解決生命與健康領域重大醫學科學前沿問題,2018年,中國科學院—北京協和醫院健康科學研究中心成立。由中科院院士趙玉沛、周琪擔任科學顧問,中科院北京基因組研究所楊運桂團隊、韓大力團隊與北京協和醫院吳文銘團隊在健康科學研究中心支持下,為探究PDAC發生發展的分子機制以及腫瘤微環境的調控作用,通過合作研究,利用單細胞轉錄組測序技術,系統鑑定並分析了PDAC病人和對照胰腺樣本細胞類型,闡明了胰腺癌腫瘤-微環境高度異質性特徵,揭示了腫瘤亞群細胞與浸潤免疫細胞間相互關係,提出了新的潛在治療靶點
  • 大事件、新技術引領單細胞進入新時代
    無偏性轉錄組數據分析匹配每個細胞的物理位置和軌跡歷史,記錄發育胚胎中每個單細胞在全基因水平完整的基因表達歷史。 通過基因網絡和功能分析鑑別出一個β細胞功能異質性相關的基因集,這個基因集可以用來預測電生理學。 研究人員同時報導了2型糖尿病患者的轉錄機制,並將該方法延伸到1型糖尿病患者的凍存細胞,為了解健康和疾病人群中胰島細胞異質性提供了有價值的資源。
  • 如何讓單細胞測序變得如此簡單?
    2017年7月20日 訊 /生物谷BIOON/ --單細胞生物學研究一直是當今的熱門話題,而且最前沿的領域就是單細胞RNA測序了(scRNA-seq)。這個過程是非常複雜的,但對於大量的RNA-seq而言,研究人員可以利用算法對每一個步驟進行處理,而且他們也非常清楚每個過程的運行狀況。如今網上有很多在線資源和工具能夠簡化scRNA-seq數據分析的過程,其中名為GitHub的平臺(Awesome Single Cell)就整合了70多種工具和資源,而且相關的工具和資源能夠覆蓋分析過程的每一步。
  • 10x單細胞免疫組庫VDJ數據分析就看它
    2015年,10x Genomics發布了基於微流控和油滴包裹技術的Chromium單細胞系統平臺,可實現高通量的單細胞轉錄組和單細胞V(D)J測序。不但可以將TCR/BCR雙鏈完美匹配,而且可以細化到單細胞水平,同時獲得表達譜信息。目前該技術也是研究單細胞免疫組庫應用最廣泛的技術,那麼10x 單細胞免疫數據該如何分析?分析結果又有哪些呢?今天小編帶大家來聊聊單細胞免疫組庫測序數據分析那些事。
  • 單細胞測序揭示平滑肌細胞在動脈粥樣硬化過程中的轉化及治療靶點
    為了揭示動脈粥樣硬化過程中SMC轉分化的軌跡,並確定相關的治療分子靶標,研究人員將小鼠和人動脈粥樣硬化斑塊的SMC命運圖譜與單細胞RNA測序聯合起來。此外,研究人員還在體外SMC衍生細胞中進行了細胞生物學實驗,整合了人類基因組學研究,並進行了藥理研究。
  • 13種單細胞測序方法的比較研究
    13種單細胞測序方法的比較研究 作者:小柯機器人 發布時間:2020/4/9 19:19:50 近日,西班牙巴塞隆納科技學院Holger Heyn等研究人員對用於細胞圖譜計劃的單細胞RNA測序實驗方案進行基準測試。
  • 單細胞免疫組庫數據分析||Seurat整合單細胞轉錄組與VDJ數據
    在做10X單細胞免疫組庫分析的是往往是做一部分BCR、TCR做一部分5『轉錄組,那麼怎樣才能把兩者結合到一起呢?今天我們嘗試用我們的趁手工具做一下整合分析。首先是下載數據,我們從10X官方的dataset中下載數據:https://support.10xgenomics.com/single-cell-vdj/datasets/3.1.0/vdj_v1_hs_pbmc3在下載頁面有關於這個樣本的基本介紹,如這個數據集根據單細胞V(D)J試劑試劑盒使用指南和細胞表面蛋白特徵條形碼技術(CG000186),從標記的細胞中擴增出cDNA
  • 如何同時對單細胞進行多組學研究
    同樣,精心優化質譜檢測可以提供相同細胞的蛋白組學和代謝組學數據。要從單個細胞獲得高品質的集成文件,進一步提高檢測的效率將是必不可少的。組分分離不同種類的生物分子可以在從相同的細胞裂解液提取、分離、和獨立分析。例如,最近的一項研究用生物素標記的寡聚dT接頭沉澱總RNA,進行 RNA測序文庫製備,而游離的DNA可擴增後進行DNA測序。