超能餅乾|SnapATAC分析單細胞ATAC-seq數據(一)

2021-02-20 科研貓
SnapATAC簡介

SnapATAC (Single Nucleus Analysis Pipeline for ATAC-seq) 是一個能夠快速、準確和全面分析單細胞ATAC-seq數據的R包,它可以對單細胞ATAC-seq數據進行常規的數據降維、聚類和批次校正分析,鑑定遠端調控元件並預測其調控的靶基因,調用chromVAR軟體進行motif分析,同時還可以將scRNA-seq和scATAC-seq數據進行整合分析等。

SnapATAC軟體安裝RequirementsPre-print

Rongxin Fang, Sebastian Preissl, Xiaomeng Hou, Jacinta Lucero, Xinxin Wang, Amir Motamedi, Andrew K. Shiau, Eran A. Mukamel, Yanxiao Zhang, M. Margarita Behrens, Joseph Ecker, Bing Ren. Fast and Accurate Clustering of Single Cell Epigenomes Reveals Cis-Regulatory Elements in Rare Cell Types. bioRxiv 615179; doi: https://doi.org/10.1101/615179

Installation

SnapATAC軟體主要由以下兩個組件組成:Snaptools和SnapATAC.

# Install snaptools from PyPI. 
# NOTE: Please use python 2.7 if possible.
# 使用pip安裝snaptools模塊
pip install snaptools

# Install SnapATAC R pakcage (development version).
# 安裝一些依賴R包
install.packages(c('raster','bigmemory','doSNOW','plot3D'))

# 使用devtools安裝SnapATAC包
library(devtools)
install_github("r3fang/SnapATAC")

SnapATAC常見問題匯總1)What is a snap file?

snap (Single-Nucleus Accessibility Profiles)格式文件是一個層級結構的hdf5文件,它可以用來存儲single nucleus ATAC-seq數據集。該文件(version 4)主要由以下幾個部分組成:header (HD), cell-by-bin accessibility matrix (AM), cell-by-peak matrix (PM), cell-by-gene matrix (GM), barcode (BD) and fragment (FM).

HD session: 包含snap文件的版本、創建日期、比對信息和參考基因組信息。

BD session: 包含所有unique細胞的barcodes和相應的meta data信息。

AM session: 包含不同解析度(bin size)下的cell-by-bin數據矩陣。

PM session: 包含cell-by-peak的計數矩陣和cell-by-gene的計數矩陣。

FM session: 包含每個細胞中可用的所有frangments片段信息。

2)How to create a snap file from fastq file?Step 1. Barcode demultiplexing.

首先,我們將barcode信息以"@" + "barcode" + ":" + "read_name"的格式添加到每條read的開頭,用以拆分FASTQ文件。
下面是一個用於拆分fastq文件的示例,我們可以通過awk或python腳本輕鬆實現。

# 下載示例數據
wget http://renlab.sdsc.edu/r3fang/share/Fang_2019/MOs_snATAC/fastq/CEMBA180306_2B.demultiplexed.R1.fastq.gz
wget http://renlab.sdsc.edu/r3fang/share/Fang_2019/MOs_snATAC/fastq/CEMBA180306_2B.demultiplexed.R2.fastq.gz
wget http://renlab.sdsc.edu/r3fang/share/Fang_2019/MOs_snATAC/peaks/all_peak.bed
wget http://renlab.sdsc.edu/r3fang/share/Fang_2019/MOs_snATAC/mm10.blacklist.bed.gz
wget http://renlab.sdsc.edu/r3fang/share/Fang_2019/MOs_snATAC/genes/gencode.vM16.gene.bed
wget http://hgdownload.cse.ucsc.edu/goldenPath/mm10/bigZips/mm10.chrom.sizes
wget http://renlab.sdsc.edu/r3fang/share/Fang_2019/MOs_snATAC/genome/mm10.fa

# 查看fastq文件
zcat CEMBA180306_2B.demultiplexed.R1.fastq.gz | head 
@AGACGGAGACGAATCTAGGCTGGTTGCCTTAC:7001113:920:HJ55CBCX2:1:1108:1121:1892 1:N:0:0
ATCCTGGCATGAAAGGATTTTTTTTTTAGAAAATGAAATATATTTTAAAG
+
DDDDDIIIIHIIGHHHIIIHIIIIIIHHIIIIIIIIIIIIIIIIIIIIII

Step 2. Index reference genome (snaptools).

接下來,我們將對參考基因組構建索引用於後續的比對分析,這裡我們展示了如何使用BWA來構建參考基因組的索引。用戶可以通過—-aligner參數指定要使用的比對軟體,目前snaptools可以支持bwa, bowtie2和minimap2比對軟體。同時,我們還需要指定比對軟體所在文件夾的路徑,例如,如果bwa安裝在/opt/biotools/bwa/bin/bwa下,我們需要指定--path-to-aligner=/opt/biotools/bwa/bin/

# 查看bwa軟體所在的路徑
which bwa
/opt/biotools/bwa/bin/bwa 

# 使用snaptools構建參考基因組索引
snaptools index-genome  \
    --input-fasta=mm10.fa  \
    --output-prefix=mm10  \
    --aligner=bwa  \
    --path-to-aligner=/opt/biotools/bwa/bin/  \
    --num-threads=5

Step 3. Alignment (snaptools).

構建好參考基因組索引後,我們使用snaptools將拆分後的FASTQ reads序列比對到相應的參考基因組上。比對後,將比對好的bam文件按reads名稱進行排序。我們還可以通過設置--num-threads參數指定多個CPU加快比對的速度。

snaptools align-paired-end  \
    --input-reference=mm10.fa  \
    --input-fastq1=CEMBA180306_2B.demultiplexed.R1.fastq.gz  \
    --input-fastq2=CEMBA180306_2B.demultiplexed.R2.fastq.gz  \
    --output-bam=CEMBA180306_2B.bam  \
    --aligner=bwa  \
    --path-to-aligner=/opt/biotools/bwa/bin/  \
    --read-fastq-command=zcat  \
    --min-cov=0  \
    --num-threads=5  \
    --if-sort=True  \
    --tmp-folder=./  \
    --overwrite=TRUE  

Step 4. Pre-processing (snaptools).

比對完之後,我們將比對好的雙端reads轉換為fragments片段,並查看每個 fragment片段的以下屬性:
1)比對質量評分MAPQ;
2)比對上的reads兩端是否按比對的flag值正確配對;
3)fragments片段的長度:
我們根據以下條件進行過濾篩選,只保留滿足條件的fragments片段;
1)兩端正確配對的fragments片段;
2)MAPQ值大於30的fragments片段(-min-mapq);
3)長度小於1000bp的fragments片段 (-max-flen)。

# 提取參考基因染色體長度信息
fetchChromSizes mm10.fa > mm10.chrom.sizes

# 使用snaptools進行數據預處理,生成snap格式文件
snaptools snap-pre  \
    --input-file=CEMBA180306_2B.bam  \
    --output-snap=CEMBA180306_2B.snap  \
    --genome-name=mm10  \
    --genome-size=mm10.chrom.sizes  \
    --min-mapq=30  \
    --min-flen=0  \
    --max-flen=1000  \
    --keep-chrm=TRUE  \
    --keep-single=FALSE  \
    --keep-secondary=FALSE  \
    --overwrite=True  \
    --min-cov=100  \
    --verbose=True

Step 5. Cell-by-bin matrix (snaptools).

最後,我們使用snap文件創建不同解析度下的cell-by-bin矩陣文件。在下面的示例中,我們分別創建了1,000、5,000和10,000 bin size下的三個cell-by-bin矩陣,並將所有的矩陣都存儲在cemba180306_2B.snap文件中。

# 使用snaptools創建cell-by-bin矩陣
snaptools snap-add-bmat    \
    --snap-file=CEMBA180306_2B.snap \
    --bin-size-list 1000 5000 10000 \
    --verbose=True

3)How to create snap file from 10X dataset?

Case 1

1)首先,運行cellranger-atac mkfastq生成拆庫後的fastq文件;
2)接下來,對於每個測序文庫,識別相應的測序文件,其中R1和R3是測序的reads,I1是16bp i5 (10x Barcode), R2是i7 (sample index)。
3)最後,使用snaptools提供的dex-fastq子程序,將10X barcode信息添加到reads的名稱中。

snaptools dex-fastq \
    --input-fastq=Library1_1_L001_R1_001.fastq.gz \
    --output-fastq=Library1_1_L001_R1_001.dex.fastq.gz \ 
    --index-fastq-list Library1_1_L001_R2_001.fastq.gz

snaptools dex-fastq \
    --input-fastq=Library1_1_L001_R3_001.fastq.gz \
    --output-fastq=Library1_1_L001_R3_001.dex.fastq.gz \ 
    --index-fastq-list Library1_1_L001_R2_001.fastq.gz

snaptools dex-fastq \
    --input-fastq=Library1_2_L001_R1_001.fastq.gz \
    --output-fastq=Library1_2_L001_R1_001.dex.fastq.gz \ 
    --index-fastq-list Library1_2_L001_R2_001.fastq.gz

snaptools dex-fastq \
    --input-fastq=Library1_2_L001_R3_001.fastq.gz \
    --output-fastq=Library1_2_L001_R3_001.dex.fastq.gz \ 
    --index-fastq-list Library1_2_L001_R2_001.fastq.gz

# combine these two library
cat Library1_1_L001_R1_001.fastq.gz Library1_2_L001_R1_001.fastq.gz > Library1_L001_R1_001.fastq.gz

cat Library1_1_L001_R3_001.fastq.gz Library1_2_L001_R3_001.fastq.gz > Library1_L001_R3_001.fastq.gz

Case 2 


在本示例中,我們有兩個10x的測序文庫(每個文庫都通過單獨的Chromium chip channel進行處理)。請注意,在運行完cellranger-atac mkfastq拆分數據之後,我們對每個文庫進行單獨的cellranger-atac count處理。

snaptools dex-fastq \
    --input-fastq=Library1_S1_L001_R1_001.fastq.gz \
    --output-fastq=Library1_S1_L001_R1_001.dex.fastq.gz \ 
    --index-fastq-list Library1_S1_L001_R2_001.fastq.gz

snaptools dex-fastq \
    --input-fastq=Library1_S1_L001_R3_001.fastq.gz \
    --output-fastq=Library1_S1_L001_R3_001.dex.fastq.gz \ 
    --index-fastq-list Library1_S1_L001_R2_001.fastq.gz

4)Can I run SnapATAC with CellRanger outcome?

Yes. There are two entry points

(1)use the position sorted bam file (recommanded).

# 查看比對的bam文件信息
samtools view atac_v1_adult_brain_fresh_5k_possorted_bam.bam
A00519:218:HJYFLDSXX:2:1216:26458:34976    99  chr1    3000138 60  50M =   3000474 385 TGATGACTGCCTCTATTTCTTTAGGGGAAATGGGACTTTTAGTCCATGAA  FFFFFFFFFFFFFFFF,FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF  NM:i:0  MD:Z:50 MC:Z:49M    AS:i:50 XS:i:37 CR:Z:GGTTGCGAGCCGCAAA   CY:Z:FFFFFFFFFFFFFFFF   CB:Z:GGTTGCGAGCCGCAAA-1 BC:Z:AACGGTCA   QT:Z:FFFFFFFFGP:i:3000137   MP:i:3000522    MQ:i:40 RG:Z:atac_v1_adult_brain_fresh_5k:MissingLibrary:1:HJYFLDSXX:2

在比對的read名稱前添加barcode信息
The cell barcode is embedded in the tag CB:Z:GGTTGCGAGCCGCAAA-1, you can modify the bam file by add the cell barcode GGTTGCGAGCCGCAAA-1 to the beginning of read

# extract the header file
samtools view atac_v1_adult_brain_fresh_5k_possorted_bam.bam -H > atac_v1_adult_brain_fresh_5k_possorted.header.sam

# create a bam file with the barcode embedded into the read name
cat <( cat atac_v1_adult_brain_fresh_5k_possorted.header.sam ) \
<( samtools view atac_v1_adult_brain_fresh_5k_possorted_bam.bam | awk '{for (i=12; i<=NF; ++i) { if ($i ~ "^CB:Z:"){ td[substr($i,1,2)] = substr($i,6,length($i)-5); } }; printf "%s:%s\n", td["CB"], $0 }' ) \
| samtools view -bS - > atac_v1_adult_brain_fresh_5k_possorted.snap.bam

# 查看添加好barcode信息的bam文件
samtools view atac_v1_adult_brain_fresh_5k_possorted.snap.bam | cut -f 1 | head 
GGTTGCGAGCCGCAAA-1:A00519:218:HJYFLDSXX:2:1216:26458:34976
GGTTGCGAGCCGCAAA-1:A00519:218:HJYFLDSXX:2:2256:23194:13823
GGTTGCGAGCCGCAAA-1:A00519:218:HJYFLDSXX:2:2546:5258:31955
CTCAGCTAGTGTCACT-1:A00519:218:HJYFLDSXX:1:2428:8648:18349
CTCAGCTAGTGTCACT-1:A00519:218:HJYFLDSXX:1:2428:8648:18349
GAAGTCTGTAACACTC-1:A00519:218:HJYFLDSXX:3:2546:14968:2331
GAAGTCTGTAACACTC-1:A00519:218:HJYFLDSXX:3:2546:14705:2628
GGTTGCGAGCCGCAAA-1:A00519:218:HJYFLDSXX:2:1216:26458:34976
GGTTGCGAGCCGCAAA-1:A00519:218:HJYFLDSXX:2:2256:23194:13823
GGTTGCGAGCCGCAAA-1:A00519:218:HJYFLDSXX:2:2546:5258:31955

對bam文件按read的名稱進行排序
Then sort the bam file by read name:

samtools sort -n -@ 10 -m 1G atac_v1_adult_brain_fresh_5k_possorted.snap.bam -o atac_v1_adult_brain_fresh_5k.snap.nsrt.bam

使用snaptools進行數據預處理生成snap文件
Then generate the snap file

snaptools snap-pre  \
    --input-file=atac_v1_adult_brain_fresh_5k.snap.nsrt.bam  \
    --output-snap=atac_v1_adult_brain_fresh_5k.snap  \
    --genome-name=mm10  \
    --genome-size=mm10.chrom.sizes  \
    --min-mapq=30  \
    --min-flen=50  \
    --max-flen=1000  \
    --keep-chrm=TRUE  \
    --keep-single=FALSE  \
    --keep-secondary=False  \
    --overwrite=True  \
    --max-num=20000  \
    --min-cov=500  \
    --verbose=True

刪除中間文件
remove temporary files

rm atac_v1_adult_brain_fresh_5k.snap.snap.bam 
rm atac_v1_adult_brain_fresh_5k_possorted.header.sam

(2)use the fragment tsv file. Fragment file is already filtered, this will disable snaptools to generate quality control metrics.

# decompress the gz file
gunzip atac_v1_adult_brain_fresh_5k_fragments.tsv.gz

# sort the tsv file using the 4th column (barcode column)
sort -k4,4 atac_v1_adult_brain_fresh_5k_fragments.tsv > atac_v1_adult_brain_fresh_5k_fragments.bed

# compress the bed file 
gzip atac_v1_adult_brain_fresh_5k_fragments.bed

# run snap files using the bed file
snaptools snap-pre  \
    --input-file=atac_v1_adult_brain_fresh_5k_fragments.bed.gz  \
    --output-snap=atac_v1_adult_brain_fresh_5k.snap  \
    --genome-name=mm10  \
    --genome-size=mm10.chrom.sizes  \
    --min-mapq=30  \
    --min-flen=50  \
    --max-flen=1000  \
    --keep-chrm=TRUE  \
    --keep-single=FALSE  \
    --keep-secondary=False  \
    --overwrite=True  \
    --max-num=20000  \
    --min-cov=500  \
    --verbose=True

5)How to create a snap file from bam or bed file?

在很多情況下,我們可以直接使用snaptools pre子程序將比對好的、按read名稱進行排序的bam或bed文件作為輸入,生成snap格式文件。強烈建議使用未經過濾的比對文件作為輸入。
(1)對於bam文件,我們需要在read的名稱前添加細胞的barcode信息,如下所示:

samtools view demo.bam|head

AAACTACCAGAAAGACGCAGTT:7001113:968:HMYT2BCX2:1:1215:20520:88475    77  *   0   0   *   *   0   0CTATGAGCACCGTCTCCGCCTCAGATGTGTATAAGAGACAGCAGAGTAAC @DDBAI??E?1/<DCGECEHEHHGG1@GEHIIIHGGDGE@HIHEEIIHH1  AS:i:0  XS:i:0
AAACTACCAGAAAGACGCAGTT:7001113:968:HMYT2BCX2:1:1215:20520:88475    141 *   0   0   *   *   0   0GGCTTGTACAGAGCAAGTGCTGAAGTCCCTTTCTGATGACGTTCAACAGC 0<000/<<1<D1CC111<<1<1<111<111<<CDCF1<1<DHH<<<<C11  AS:i:0  XS:i:0
AAACTACCAGAAAGACGCAGTT:7001113:968:HMYT2BCX2:1:2201:20009:41468    77  *   0   0   *   *   0   0CGGTGCCCCTGTCCTGTTCGTGCCCACCGTCTCCGCCTCAGATGTGTATA DDD@D/D<DHIHEHCCF1<<CCCGH?GHI1C1DHIII0<1D1<111<1<1  AS:i:0  XS:i:0
AAACTACCAGAAAGACGCAGTT:7001113:968:HMYT2BCX2:1:2201:20009:41468    141 *   0   0   *   *   0   0GAGCGAGGGCGGCAGAGGCAGGGGGAGGAGACCCGGTGGCCCGGCAGGCT 0<00</<//<//<//111000/<</</<0<1<1<//<<0<DCC/<///<D  AS:i:0  XS:i:0

# 使用snaptools將bam文件轉換為snap格式文件
snaptools snap-pre  \
    --input-file=demo.bam  \
    --output-snap=demo.snap  \
    --genome-name=mm10  \
    --genome-size=mm10.chrom.sizes  \
    --min-mapq=30  \
    --min-flen=0  \
    --max-flen=1000  \
    --keep-chrm=TRUE  \
    --keep-single=TRUE  \
    --keep-secondary=False  \
    --overwrite=True  \
    --min-cov=100  \
    --verbose=True

(2)對於bed格式的文件,應將barcode信息添加到第四列中,如下所示:

zcat demo.bed.gz | head

chr2    74358918    74358981    AACGAGAGCTAAAGACGCAGTT
chr6    134212048   134212100   AACGAGAGCTAAAGACGCAGTT
chr10    93276785    93276892    AACGAGAGCTAAAGACGCAGTT
chr2    128601366   128601634   AACGAGAGCTAAAGCGCATGCT
chr16    62129428    62129661    AACGAGAGCTAACAACCTTCTG
chr8    84946184    84946369    AACGAGAGCTAACAACCTTCTG

# 使用snaptools將bed文件轉換為snap格式文件
snaptools snap-pre  \
    --input-file=demo.bed.gz  \
    --output-snap=demo.snap  \
    --genome-name=mm10  \
    --genome-size=mm10.chrom.sizes  \
    --min-mapq=30  \
    --min-flen=0  \
    --max-flen=1000  \
    --keep-chrm=TRUE  \
    --keep-single=TRUE  \
    --keep-secondary=False  \
    --overwrite=True  \
    --min-cov=100  \
    --verbose=True

6)How to group reads?

(1)Group reads from one cell ATACAGCCTCGC in snap file sample1.snap.

library(SnapATAC);
snap_files = "sample1.snap";
barcode_sel = "ATACAGCCTCGC";
reads.gr = extractReads(barcode_sel, snap_files);

(2)Group reads from multiple barcodes in one snap file.

library(SnapATAC);
barcode_sel = c("ATACAGCCTCGC", "ATACAGCCTCGG")
snap_files = rep("sample1.snap", 2);
reads.gr = extractReads(barcode_sel, snap_files);

(3)Group reads from multiple barcodes and multiple snap files.

library(SnapATAC);
barcode_sel = rep("ATACAGCCTCGC", 2);
snap_files = c("sample1.snap", "sample2.snap");
reads.gr = extractReads(barcode_sel, snap_files);

7)How to analyze multiple samples together?

因為SnapATAC軟體使用cell-by-bin矩陣對細胞進行聚類分群,這使他很容易將多個樣本進行結合併執行比較分析。它需要將所有的樣本創建相同bin size大小的cell-by-bin矩陣。在這裡,我們以PBMC_5K和PBMC_10K數據為例進行分析。

$ R
# 加載SnapATAC包
> library(SnapATAC);

# 下載示例數據
> system("wget http://renlab.sdsc.edu/r3fang/share/Fang_2019/published_scATAC/atac_v1_pbmc_10k_fastqs/atac_v1_pbmc_10k.snap");
> system("wget http://renlab.sdsc.edu/r3fang/share/Fang_2019/published_scATAC/atac_v1_pbmc_5k_fastqs/atac_v1_pbmc_5k.snap");
> file.list = c("atac_v1_pbmc_5k.snap", "atac_v1_pbmc_10k.snap");
> sample.list = c("pbmc.5k", "pbmc.10k");

# 使用createSnap函數將兩個數據結合在一起
> x.sp = createSnap(file=file.list, sample=sample.list);

createSnap函數將創建一個snap對象,該對象中包含了每個snap文件的名稱和相應的barcodes信息。

8)How to choose bin size?

SnapATAC軟體是基於cell-by-bin矩陣對細胞進行聚類分群的,因此選擇不同的bin size可能對細胞的聚類分群產生較大的影響。如何選擇最優的bin size,這個問題沒有絕對的答案。

一方面,我們發現在5kb-50kb範圍內的bin size大小的改變,並沒有明顯地改變細胞聚類分群的結果(如下圖所示)。而另一方面,我們確實注意到了一個大的bin size通常會生成相對較少的cluster。這種聚類的差異,可以使用解析度較小的Louvain聚類算法進行彌補。

使用較大bin size的好處是可以節省一些內存,這對於一些大型數據集尤為有用。這裡提供了一個bin size大小選擇的主觀建議。

參考來源:https://github.com/r3fang/SnapATAC/wiki/FAQs#what-is-a-snap-file

為了使更多的科研工作者快速做出高端大氣的科研圖表,並能夠加入到hiplot開發小組和成長計劃中。經團隊商量決定:從今日起,hiplot網站開放免費註冊,不再需要邀請碼,小夥伴們還在等什麼,快點註冊吧!

註冊網址:

https://hiplot.com.cn/signup

掃描下方二維碼快速註冊

科研繪圖神器—hiplot,是2020年7月19日openbiox聯合科研貓鄭重推出的全網首個開源繪圖平臺,目前提供基於R語言的60餘種基礎可視化和50餘種進階繪圖的功能,同時還部署了多個 openbiox社區項目(如bget下載文獻附錄、UCSCXenaShiny 等)。

截止目前,網站的總訪問量大約13萬餘次,在免註冊使用大部分可視化插件,以及僅開放教育用戶和邀請註冊的情況下,已有正式註冊用戶千餘人,日均訪問量千餘次。

https://hiplot.com.cn

點擊圖片進入Hiplot平臺介紹

相關焦點

  • 超能餅乾|SnapATAC分析單細胞ATAC-seq數據(三)
    簡介在本教程中,我們將對PBMC的兩個scATAC-seq數據集(5K和10K)和一個scRNA-seq數據集進行整合分析。這三個數據集均來自10X genomics測序平臺產生的數據,可以直接在10x官網下載使用。
  • ...學院張強鋒課題組利用深度學習人工智慧算法分析單細胞ATAC-seq...
    生命學院張強鋒課題組利用深度學習人工智慧算法分析單細胞ATAC-seq數據清華新聞網10月12日電 10月8日,清華大學生命學院的張強鋒課題組在《自然·通訊》(Nature Communications)上發表題為「SCALE方法基於隱特徵提取進行單細胞ATAC-seq數據分析」(SCALE method for
  • 缺什麼來什麼,單細胞ATAC的數據有救了!
    這本書很長,洲更每周五會更新一章,一直到把他更新完成。這樣,我們的單細胞專欄也正式開啟了。以下洲更開始表演:使用ArchR分析單細胞ATAC-seq數據(第1章)第1章: ArchR基礎入門這一章將會介紹如何導入數據,如何構建Arrow文件,這是後續ArchR分析的基礎。
  • 從數據分析到結論產生,談談scATAC-seq
    開放染色質區域的全基因組圖譜可以通過它們與特徵相關序列變異型的聯繫來促進順式和反式調節元件的功能分析。目前,高通量測序分析轉座酶可及染色質(ATAC-seq)被認為是全基因組可及染色質的最易獲得和最具成本效益的策略。還開發了單細胞ATAC-seq(scATAC-seq)技術來研究包含異質細胞群體的組織樣本中細胞特異性染色質的可及性。
  • 【中文在線網絡研討會】單細胞ATAC-Seq入門:高解析度表觀基因組學研究
    中文在線網絡研討會單細胞ATAC-Seq
  • 解讀單細胞RNA-seq技術
    多年來,跟蹤一個單細胞的轉錄組,超出了我們的能力。但是現在,時代已經變了,新的單細胞RNA-seq方法,可以分析大量的細胞及它們的命運。我們都參加過大型生日派對:在擁擠的房間裡,與許多人聊天、吃飯和慶祝。但是,試想你並不知道壽星是誰,只是像一個局外者看待這個派對。
  • 一文讀懂表觀遺傳學研究利器——ATAC-seq技術及應用丨深度長文
    但是,成功FAIRE-seq對於甲醛的固定效率具有很高的依賴性。FAIRE-seq相比於其他染色質可及性分析手段最主要的問題是信噪比過低,過高的背景信號對數據的分析解讀產生非常大的幹擾[5]。UCSC瀏覽器展示ATAC-seq數據標籤;B. UCSC瀏覽器展示具有代表性的ATAC-seq數據和熱圖展示其附近的基因表達[10] 2018年,來自史丹福大學的表觀遺傳學者張元豪等將TCR編碼基因的測序與染色質可及性分析(ATAC-seq)在單細胞水平相結合,分析測定來自同一個體的T細胞的TCR特異性和表觀基因組狀態的信息[11]。
  • 綜述科普|染色質調控區域的研究:對CHIP-seq和ATAC-seq發展的深入思考
    2015年,開發了用於轉座酶開放染色質測序的單細胞組合測定法(sci-ATAC-seq),可同時對大量單個細胞進行測序。在這種方法中,對細胞進行標記,並在單細胞水平上對染色質開放性進行測序。首先用特定編碼標記的Tn5轉座酶對96孔板中的所有核進行編碼後,然後將核合併並重新分配到新的一組孔中。因此,可以通過PCR擴增添加第二個編碼信息(圖4a)。
  • Direct-seq:單細胞水平分析CRISPR基因編輯篩選實驗
    然而在目前的研究策略中,基因的RNA表達譜(gene expression profile)這一重要中間層面的信息是完全缺失的。第二,細胞異質性是近年來生物學研究的重點與熱點問題。在對篩選終點的細胞群進行分析時,儘管它們呈現出類似的表型,然而它們在分子水平上的異質性是不明確的。
  • mtscATAC-seq:單細胞線粒體DNA基因分型與染色質分析新方法
    線粒體DNA與細胞狀態可以被同時測量和描述,但是目前為止還沒有能夠對複雜人體組織進行大規模並行處理的單細胞測序方法。為了解決這一問題,哈佛醫學院Vijay G. Sankaran研究組、Broad研究所Aviv Regev研究組、Caleb A. Lareau以及Leif S.
  • ATAC-Seq Motif 富集分析
    Motif 一般有 2 種模式,一是迴文序列,比如 CACGTG 其反向互補序列也是 CACGTG. 二是 2 段保守序列被一段非保守序列分隔,這往往是因為結合的轉錄因子是二聚體,分別識別 2 段保守序列。    Motif 的分析是容易受假陽性困擾的,這稱為無效定理(Futility Theorem)。
  • Direct-seq:單細胞水平分析CRISPR基因編輯篩選實驗 | Genome...
    論文標題:Direct-seq: programmed gRNA scaffold for streamlined scRNA-seq in CRISPR screen 期刊:Genome Biology 作者:Qingkai Song, Ke Ni et.al 發表時間:2020/06/08 數字識別碼:10.1186/s13059-0
  • Nature||單細胞轉錄組測序和ATAC-Seq聯合解碼人類大腦海馬體體發育與形成機制
    :10X Genomics 平臺細胞數量:共30416個細胞分析思路:研究者通過對人腦不同發育時期的海馬體進行單細胞轉錄組和表觀遺傳組測序及系統分析,解析出人腦海馬體發育過程中的不同細胞類型及關鍵的分子特徵與調控網絡。
  • scRNA-seq數據差異基因表達分析的有效方法有哪些?
    scRNA-seq數據差異基因表達分析的有效方法有哪些?我們知道RNA-seq即轉錄組測序,是某個物種或者特定細胞類型產生的所有轉錄本的集合,而單細胞RNA測序(single-cell RNA-seq,簡稱scRNA-seq)則是以單個細胞為特定研究對象,提取其mRNA進行逆轉錄並進行高通量測序分析,可體現出個體細胞內表達水平的具體變化,目前已廣泛應用在生物學、醫藥研發、臨床醫學等各個領域。
  • 單細胞數據分析神器——Seurat
    在2015年至2017年,甚至對某細胞群體或組織進行單細胞測序,解析其細胞成分就能發一篇CNS級別的文章。近兩三年,單細胞技術從最開始的基因組,轉錄組測序,發展成現在的單細胞DNA甲基化,單細胞ATAC-seq等等。測序手段也從早期的10X Genomics、 Drop-seq等,發展為現在的多種多樣個性化的方法。研究內容更不僅僅局限於解析細胞群體的成分,而是向研究細胞功能和生物學特性發展。
  • 何愛彬研究組開發高通量單細胞ChIP-seq技術——CoBATCH並解析多...
    這一單細胞技術不僅適用於研究各種組蛋白修飾,同時也能捕獲DNA結合蛋白在基因組上的結合信息。利用這一單細胞技術,研究者首次解析了小鼠胚胎10個器官(心臟、肝臟、肺、左腦、右腦、後腦、腎臟、皮膚、肌肉和小腸)的內皮細胞譜系發育、分化和功能的異質性。
  • 學徒跟著B站ATAC-seq視頻5天完成流程
    來源自簡書第1篇:ATAC-seq的背景介紹以及與ChIP-Seq的異同優勢 實驗設計 實戰流程 注意一些黑名單(微衛星序列,重複序列),去除掉不要當做peaks1.數據下載 通過SRP055881 下載原始數據,獲得sraruntable與accession list,找到樣本對應的信息(例如樣本名,分組等)
  • 吳昊團隊開發檢測單細胞mRNA動態變化新技術scNT-seq
    為了應對這一挑戰,賓夕法尼亞大學吳昊實驗室開發了一種高通量檢測單細胞mRNA動態變化的新方法, scNT-seq(全稱single-cell metabolically labeled new RNA tagging sequencing)。
  • 10x單細胞免疫組庫VDJ數據分析就看它
    2015年,10x Genomics發布了基於微流控和油滴包裹技術的Chromium單細胞系統平臺,可實現高通量的單細胞轉錄組和單細胞V(D)J測序。不但可以將TCR/BCR雙鏈完美匹配,而且可以細化到單細胞水平,同時獲得表達譜信息。目前該技術也是研究單細胞免疫組庫應用最廣泛的技術,那麼10x 單細胞免疫數據該如何分析?分析結果又有哪些呢?今天小編帶大家來聊聊單細胞免疫組庫測序數據分析那些事。
  • 我國科學家實現單細胞表觀組學新突破:兩種革新單細胞ChIP-seq技術...
    ChIP-seq技術-CoBATCH實驗設計思路 圖2 單細胞ChIP-seq技術-sc-itChIP實驗設計思路 在國家重點研發計劃幹細胞及轉化研究重點專項(批准號:2017YFA0103402)等資助下,北京大學分子醫學研究所、北大-清華生命科學聯合中心何愛彬課題組近期突破單細胞表觀遺傳研究的瓶頸,開發了兩種具有普適性、操作簡單