MPB:深大李猛組-基於PacBio SMRT三代測序的紅樹林沉積物真菌群落的研究

2021-02-15 宏基因組

為進一步提高《微生物組實驗手冊》稿件質量,本項目新增大眾評審環節。文章在通過同行評審後,採用公眾號推送方式分享全文,任何人均可在線提交修改意見。公眾號格式顯示略有問題,建議電腦端點擊文末閱讀原文下載PDF審稿。在線文檔(https://kdocs.cn/l/cL8RRqHIL)大眾評審頁面登記姓名、單位和行號索引的修改建議。修改意見的徵集截止時間為推文發布後的72小時,文章將會結合有建設性的修改意見進一步修改後獲得DOI在線發表,同時根據貢獻程度列為審稿人或致謝。感謝廣大同行提出寶貴意見。

基於PacBio SMRT三代測序的紅樹林沉積物真菌群落的研究

Analysis of Fungal Community in Mangrove Sediments Based on PacBio SMRT Sequencing

張志鋒1,李猛1 *

1高等研究院,深圳大學,深圳,廣東

*通訊作者郵箱:limeng848@szu.edu.cn

摘要:雖然二代測序可以在短時間內產生大量高質量的數據,但由於讀長原因,測序結果並不能準確的鑑定到種水平,因而在環境微生物群落的鑑定上仍存在一定的局限性。以circular consensus sequencing (CCS) 技術為基礎的PacBio SMRT的三代測序技術,可以產生長度可達十至數十kb的高質量DNA數據,能夠完整的覆蓋細菌16S rDNA,真菌18S/28S rDNA和ITS區域,甚至18S rDNA+ITS+28S rDNA區域全長,可以有效的解決注釋精度的問題。在本研究中,通過紅樹林沉積物樣品採集,DNA提取,PCR擴增,PacBio SMRT測序和數據分析,最終獲得高注釋精度的真菌群落OTU table。以此為基礎,通過後續的生態學分析,對紅樹林真菌群落的多樣性、組成、分布規律、影響因素、群落組裝過程、物種相互作用關係等方面有深刻認識。分析方法部分同樣適用於其他環境微生物群落PacBio SMRT三代擴增子測序數據的分析。

關鍵詞:PacBio SMRT,真菌群落,擴增子測序

材料與試劑

1.DNeasy PowerSoil Kit (Qiagen, 12888-50/12888-100) 或 FastDNA Spin Kit for soil (MP Biomedicals, 116560)

2.PrimeSTAR GXL DNA Polymerase (Takara, R050) 或 Phusion High-Fidelity DNA Polymerase (Thermo Scientific, F537L)

3.無菌超純水

儀器設備

1.沉積物採樣器

2.渦旋振蕩器 (帶適配器) /組織研磨儀 (MP Biomedicals, MP Fastprep-24 5G)

3.NanoDrop ND-2000c UV-Vis spectrophotometer (NanoDrop Technologies)

4.ProFlex™ PCR儀 (ThermoFisher)

軟體和資料庫【可選】

1.軟體

pbccs (v4.02, https://github.com/PacificBiosciences/ccs)

BAM2fastx (https://github.com/pacificbiosciences/bam2fastx/)

lima (v1.11.0, https://github.com/pacificbiosciences/barcoding/)

flexbar (v3.0, https://github.com/seqan/flexbar)

mothur (v1.44.2, https://github.com/mothur/mothur/releases/tag/v1.44.2)

vsearch (v2.15.0, https://github.com/torognes/vsearch/releases/)

ITSx (v1.0.11, https://microbiology.se/software/itsx/)

usearch (v10.0.240, https://drive5.com/usearch/)

BLAST+ (v2.10.1, https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/)

RAxML (v8.2.12, https://github.com/stamatak/standard-RAxML)

IQTree (v2.1.1, http://www.iqtree.org)

FastTree (v2.1.11, http://www.microbesonline.org/fasttree/)

2.資料庫

UNITE (v8.2, https://doi.org/10.15156/BIO/786372) for ITS

silva (release 138, https://www.arb-silva.de/documentation/) for 16S/18S rDNA

UCHIME reference dataset (v7.2, https://unite.ut.ee/repository.php)

實驗步驟

1.樣品採集與處理

1.1樣品採集

根據實驗目的設計合理的實驗方案,選擇要採集的紅樹林,確定採樣位置。紅樹林樣品的採集使用特製的沉積物樣品採樣器,沉積物樣品的採集使用三點或五點取樣法。對每個樣點的3-5個重複樣品進行等量混合以減少採樣偏差。根據實驗需要可對樣品按深度分層,使用無菌自封袋保存。樣品需使用冰袋或乾冰冷藏運輸,實驗室內存放於-40/-80 °C冰箱。

1.2DNA提取

參考所使用試劑盒說明書進行。若使用DNeasy PowerSoil Kit,可在機械破碎後增加60 °C水浴30 min,可提高DNA產量。使用NanoDrop確定DNA質量和濃度,並1%瓊脂糖凝膠電泳檢測。質量不好的DNA應重提或使用DNA純化試劑盒進行純化。

2.PCR擴增與PacBio SMRT測序

2.1Primers選擇

選擇合適的Primer是研究微生物群落的最重要步驟。對於真菌群落的研究通常選用ITS區域。對於ITS全長的擴增,建議優先選用對真菌群落具有極高覆蓋度的引物ITS9Munngs/ITS4ngs (Tedersoo and Lindahl, 2016; Nilsson, et al., 2019) 。若上述引物擴增效果較差,可根據情況選用ITS1Fngs/ITS4ngs (White et al., 1990; Tedersoo et al., 2015 ) 或ITS1F/ITS4 (White et al., 1990; Gardes and Bruns, 1993) 。根據後續測序過程中的混樣方案,在正反向引物上下遊添加特異barcode信息,barcode長度不小於6 bp,以保證測序後數據的正確拆分。

2.2PCR擴增

PCR擴增中嵌合體的形成與循環數,聚合酶的選擇和初始模板質量有很大關係,特別是長片段擴增中更容易出現嵌合體。建議選擇高活性高保真度的DNA聚合酶,延長延伸時間 (Tedersoo et al., 2015) 。雖然循環數的增加容易導致嵌合體產生,但擴增效率也會隨著片段長度的增加而下降,因而循環數的選擇一定要慎重。ITS片段擴增的循環數可以設置為30-32個,不超過35個,當片段長度增加時可以適當增加循環數 (Tedersoo et al., 2015; Nilsson et al., 2019) 。PCR擴增前將DNA模板稀釋到5-10 ng/μl,以保證擴增過程中模板的一致性。由於三代測序所需DNA量較大,PCR擴增體系可選擇30 μl,其中包含1.5U polymerase,3 μl buffer,150 μM dNTPs,正反向引物各0.12 μM,2-10 ng DNA模板。PCR擴增程序為,94 °C 5 min, 94 °C 30 s, 57 °C 30 s, 72 °C 1 min 20 s, 72 °C 10 min,其中2-4步為32循環。PCR產物使用NanoDrop和1%瓊脂糖凝膠電泳檢測。每個樣品至少設置3個重複,並將其等量混合,在以減少PCR偏差。同時每批次PCR都應設置空白對照。

2.3PacBio SMRT測序

此步驟主要由測序公司完成,簡單步驟如下:將加有barcode的PCR產物按照預先設計的混樣方案等量混合,然後將發卡測序接頭連接到PCR文庫並完成環化。使用Enzyme Clean Up Kit對測序文庫進行純化。將測序引物退火結合至PCR產物文庫,並將DNA 聚合酶結合測序模板。測序使用PacBio Sequal平臺進行。

3.數據分析

3.1CCS (circular consensus sequencing) reads

PacBio SMRT 通過對環化連接的插入測序片段循環進行多次測序後比對校正糾錯,獲得高精度的保守序列 (CCS reads) 。當循環測序數達到5次時,CCS reads的質量理論上可以達到QC40,也就是錯誤率0.01%。PacBio平臺產生數據格式為.bam,使用pbccs軟體進行環化校正得到CCS reads,命令為ccs cell01.subreads.bam cell01.ccsreads.bam --minPasses 5 --reportFile ccs_report.txt。原始文件為cell01.subreads.bam,輸出文件為cell01.ccsreads.bam,--minPasses為循環數,--reportFile為統計結果文件。

3.2數據拆分 (demultiplex)

準備barcode文件 (Barcode.fasta) ,根據barcode信息,使用lima軟體進行樣品拆分:lima --ccs cell01.ccsreads.bam Barcodes.fasta split.bam --same --split-bam --split-bam-named -j 100。其中split.bam文件為輸出文件,輸出文件將以split.xxx.bam命名,--same表示雙端引物相同,--split-bam表示按照barcode pairs拆分bam文件,--split-bam-named表示按照barcode名稱對拆分後輸出的bam文件命名,-j線程數。另外可先進行步驟3.3 bam轉fastq,將cell01.ccsreads.bam文件轉換為fastq文件後,根據barcode序列,使用flexbar軟體 (Dodt et al., 2012) 進行拆分,命令為flexbar -b Barcodes.fasta -r cell01.ccsreads.fastq -t cell01.ccsreads -bt ANY -be 0.1,-b為barcode序列文件,-r為需要拆分的fastq文件,-t為輸出文件前綴,-bt為--barcode-trim-end,ANY表示刪除barcode兩端序列,-be為--barcode-error-rate。

3.3bam轉fastq

使用BAM2fastx軟體進行。bam2fastq -o sample1 sample1.ccsreads.bam -u。-o為輸出文件前綴,sample1.ccsreads.bam為輸入bam文件,-u表示輸出文件不壓縮。

3.4質控過濾

使用mothur ( Schloss et al., 2009) 進行質控過濾,首先將fastq拆分為序列文件及其對應的質量分數文件fastq.info(fastq=sample1.fastq),隨後進行質控trim.seqs(fasta=sample1.fasta,minlength=100,maxambig=0,maxhomop=12,qfile=sample1.qual,qwindowsize=50,qwindowaverage=20)。

3.5文件及序列重命名

批量修改文件名以後使用usearch (Edgar., 2010) 對序列按照文件名進行重命名,usearch11 -fastx_relabel sample1.fasta -prefix sample1- -fastaout sample1_relabel.fasta -keep_annots。-prefix為重命名序列前綴,-fastaout為輸出文件名。

3.6提取ITS序列

使用ITSx (Bengtsson-Palme et al., 2013) 進行提取。命令為ITSx -i sample1_relabel.fasta -o sample1_out --cpu 4 --save_regions all --preserve T -E 1e-2。-i輸入文件名,-o輸出文件名,--cpu核心數,--save_region要保留的片段,all表示保留所有片段,包括18S,28S,ITS全長,ITS1,5.8S和ITS2,--preserve序列名為原始序列名,-E,e-value。此步驟產生的sample1_out.full.fasta文件為ITS全長序列,用於後續分析。

3.7嵌合體檢測與刪除

使用vsearch (Rognes et al.,2016) 進行重頭嵌合體檢測uchime_denovo (Edgar et al., 2011) 和基於資料庫的嵌合體檢測uchime_ref。uchime_denovo命令:vsearch --uchime_denovo sample1_out.full.fasta --chimeras sample1_out.full_chimeras.fasta --nonchimeras sample1_out.full_nonchimeras.fasta --relabel_keep;uchime_ref命令:vsearch --uchime_ref sample1_out.full_nonchimeras.fasta --chimeras sample1_out.ful_chimeras2.fasta --nonchimeras sample1_out.full_nonchimeras2.fasta --db uchime_reference_dataset_28.06.2017.fasta --relabel_keep --threads 25。重命名文件sample1_out.full_nonchimeras2.fasta為sample1.fasta用於後續分析。

3.8長度篩選

絕大部分真菌ITS片段的長300-900 bp,極少數擔子菌可達到1,100 bp ( Schoch et al., 2014; Nilsson et al., 2019) 。為避免過長或過短序列幹擾,使用vsearch進行片段長度篩選。vsearch --fastx_filter sample1.fasta --fastaout sample1.remian.fasta --fastaout_discarded sample1.discarded.fasta --fastq_maxlen 900 --fastq_minlen 300。

3.9OTU生成與代表序列挑選

主要使用usearch,但由於免費版32位usearch限制,在處理大數據量時結合vsearch共同使用。此步驟可以分為以下步驟:

1)計數與去重

usearch -fastx_uniques sample1.remian.fasta -fastaout uniques.sample1.fasta -sizeout

2)去除單條序列

usearch -sortbysize uniques.sample1.fasta -fastaout desingl.uniques.sample1.fasta -minsize 2。-minsize表示保留序列的最小條數。

註:以上兩步可以在vsearch中合併為一步,vsearch --derep_fulllength sample1.fasta --sizein --fasta_width 0 --sizeout --output desingl.unique.sample1.fasta --minuniquesize 2 --threads 8。

3)OTU聚類

usearch10 -cluster_otus desingl.uniques.sample1.fasta -otus sample1.otu.fasta -uparseout sample1.otu.txt -relabel OTU -minsize 2。-otus sample1.otu.fasta輸出即為OTU代表序列,usearch10默認選擇豐度最高的序列為代表序列。usearch10默認使用UPARSE算法 (Edgar., 2013) 進行OTU聚類,序列相似度閾值為97%,不能更改。若想更改相似度閾值,可選擇usearch10以前的早期版本,通過-id 0.97參數進行修改。常用的OTU聚類方法還有CD-HIT等方法 (Fu et al., 2012) ,此處不再贅述。

4)OTU table生成

vsearch --usearch_global sample1.fasta --db sample1.otu.fasta --id 0.97 --otutabout sample1.otutable.txt --threads 50。以步驟3.9.3產生的OTU代表序列的資料庫 (-db) 對樣品數據以97%相似度 (-id) 為閾值進行聚類生成OTU table。

3.10 代表序列注釋

使用軟體為BLAST+,真菌ITS使用UNITE資料庫。有研究表明早期的UNITE資料庫中有許多序列都是錯誤鑑定的,將一些非真菌生物鑑定為真菌,主要為Rozellomycota和一些未知真菌。最新版的UNITE資料庫分為真菌和真核兩種,真菌資料庫主要為真菌序列,真核資料庫主要為真核序列,真核資料庫相比於真菌資料庫更加全面準確,因而建議使用真核資料庫。構建資料庫:makeblastdb -in UNITE_eukaryotes_all_04.02.2020.fasta -dbtype nucl -out unite_eukaryotes。-dbtype nucl表示資料庫類型為核酸序列。注釋:blastn -max_target_seqs 10 -db unite_eukaryotes -out otu.rep.seq.euk.blast -query sample1.otu.fasta -num_threads 10 -outfmt "6 qseqid qlen qstart qend salltitles sseqid slen sstart send qcovs bitscore evalue pident"。-max_target_seqs輸出比對結果數量,-out輸出比對結果文建,-query輸入代表序列文件,-num_threads核心數,-outfmt輸出文件格式,6表示表格格式,後面內容為比對結果信息。為使注釋結果更加可靠,採用Tedersoo等人 (2015, 2018) 使用的注釋策略,對於注釋在真菌界中的OTU,以90%、85%、80%和75%的序列相似度分別作為屬、科、目和綱的區分標準。

3.11系統發育注釋 (可選)

相比於二代測序而言,三代測序獲得的更長的微生物maker基因序列可以獲得更為精確的注釋結果。但是由於人們目前對自然界微生物認識有限,現有資料庫中許多微生物並未精確注釋,如UNITE真核生物資料庫中有許多序列被注釋為「Eukaryota_kgd_Incertae_sedis」,同時有許多序列僅通過數十至上百bp的的alignment進行了注釋,結果不夠準確,而且有許多未知微生物的序列並未被包括在資料庫中。因而我們提出了基於blastn注釋結果的「基於系統發育分析的微生物鑑定」,以更準確的對未知真菌進行注釋。簡單來說就是使用3.93中獲得OTU代表序列 (或去除其它真核序列的真菌OTU代表序列) 構建系統發育樹。常用構建系統發育樹的方法有Neighbor Joining (NJ) ,Maximum Parsimony (MP) ,Maximum Likelihood (ML) 和Bayesian inference (BI) ,幾種方法各有優勢。此處推薦使用ML方法構建系統發育樹,推薦軟體有FastTree (號稱速度最快的ML樹構建軟體,一般來簡單觀察系統發育關係,數據量特別大時使用) (Nguyen et al. 2015),IQTree (一種精確快速的ML系統發育分析工具,bootstrap計算速度是RAxML的10-40倍,大數據量時強烈推薦) (Price et al. 2010),和RAxML (最常用的系統發育樹構建軟體之一,支持多線程和向量指令運行,運行速度較快,數據量不是特別大時推薦使用) (Stamatakis 2014),請根據情況酌情選用。序列比對使用MUSCLE (Edgar 2004) :muscle -in input.ITS.fas -out aligned.input.ITS.muscle.fas;其中-in為輸如fasta序列;-out為輸出alignment文件。序列修剪使用trimAl (Capella-Gutierrez et al. 2009) :trimal -in aligned.input.ITS.muscle.fas -out aligned.input.ITS.muscle.trim.phy -gt 0.1;-in為輸如fasta序列;-out為輸出alignment文件;-gt序列中允許出現gap的部分。IQTree構建系統發育樹:iqtree -s aligned.input.ITS.muscle.trim.phy -m TESTONLY -nt 60 -bb 1000 -alrt 1000;-s為輸入alignment文件;-nt為核心數,也可設為AUTO系統自動分配;-bb (ultrafast bootstrap approximation)重複抽樣次數,默認1000,大數據建議-bb,小數據可用-b;-alrt 是否啟用SH-aLRT檢驗,可刪除;-m,model,不提供時iq-tree自動選擇;-o可指定外群序列。FastTree構建系統發育樹:FastTree aligned.input.ITS.muscle.trim.phy > aligned.input.ITS.muscle.trim.tree;數據量特別大時使用。RAxML構建系統發育樹:raxmlHPC-PTHREADS-SSE3 -T 40 -f a -x 12345 -# 1000 -m GTRGAMMA -s ./BAE61387_aligned_sequences.fas.phy -n tre;若CPU支持也可選用raxmlHPC-PTHREADS-AVX或raxmlHPC-PTHREADS-AVX2,可以極大提高運行速度;-T 線程數;-f 選擇RAxML算法,a為快速bootstrap分析;-x隨機數;-# bootstrap;-m,model,DNA序列常用為GTRGAMMA;-s 輸入文件名;-n 輸出文件後綴。構建完成系統發育樹後,根據OTU所在的系統發育分枝對OTU進行相應的初步注釋。

4.數據統計與分析

基於步驟3所獲得的代表性序列和OTU table對真菌群落的α多樣性、β多樣性、生物地理學特徵、分布與群落結構的影響因素,群落結構的組裝過程、共現性關係等內容進行分析與可視化展示,此部分內容繁多,本文中不再贅述。

致謝

本工作由科技部基礎資源調查專項 (2019FY100700) 、國家自然科學基金 (91851105、31970105) 及中國博士後科學基金 (2020M672779) 資助。本文分析方法已應用於待發表文章「Pacific Biosciences single-molecule real-time (SMRT) sequencing reveals high diversity of basal fungal lineages and stochastic processes controlled fungal community assembly in mangrove sediments」。

參考文獻

1.Bengtssonpalme, J., Ryberg, M., Hartmann, M., Branco, S., Wang, Z., Godhe, A., ... and Nilsson, R. H. (2013) Improved software detection and extraction of ITS1 and ITS2 from ribosomal ITS sequences of fungi and other eukaryotes for analysis of environmental sequencing data. Methods Ecol Evol 4: 914–919.

2.Capella-Gutierrez, S., Silla-Martinez, J.M., Gabaldon, T., trimAl: a tool for automated alignment trimming in large-scale phylogenetic analyses. Bioinformatics 2009; 25:1972-1973.

3.Dodt M, Roehr J, Ahmed R. Dieterich C. (2012) FLEXBAR—Flexible barcode and adapter processing for next-generation sequencing platforms. Biology 1: 895–905.

4.Edgar, R.C., MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res 2004; 32:1792-1797.

5.Edgar, R.C. (2010), Search and clustering orders of magnitude faster than BLAST. Bioinformatics 26: 2460-2461.

6.Edgar, R. C., Haas, B. J., Clemente, J. C., Quince, C., Knight, R. (2011) UCHIME improves sensitivity and speed of chimera detection. Bioinformatics 27: 2194–2200.

7.Edgar, R.C. (2013) UPARSE: highly accurate OTU sequences from microbial amplicon reads. Nat Methods 10: 996–998.

8.Fu, L., Niu, B., Zhu, Z., Wu, S. and Li, W. (2012) CD-HIT: accelerated for clustering the next-generation sequencing data. Bioinformatics 23: 3150–3152.

9.Gardes, M., Bruns, T. D. (1993) ITS primers with enhanced specificity for basidiomycetes, application to the identification of mycorrihiza and rusts. Mol Ecol 2: 113–8.

10.Nguyen L, Schmidt HA, von Haeseler A, Minh BQ. IQ-TREE: A Fast and Effective Stochastic Algorithm for Estimating Maximum-Likelihood Phylogenies. Mol Biol Evol 2015; 32:268-274.

11.Nilsson, R. H., Anslan, S., Bahram, M., Wurzbacher, C., Baldrian, P. and Tedersoo, L. (2019). Mycobiome diversity: high-throughput sequencing and identification of fungi. Nat Rev Microbiol 17: 95-109.

12.Price, M.N., Dehal, P.S., and Arkin, A.P. (2010) FastTree 2 -- Approximately Maximum-Likelihood Trees for Large Alignments. PLoS ONE, 5(3):e9490. doi:10.1371/journal.pone.0009490.

13.Rognes, T., Flouri, T., Nichols, B., Quince, C., Mahé, F. (2016) VSEARCH: a versatile open source tool for metagenomics. PeerJ 4:e2584.

14.Schloss, P. D., Westcott, S. L., Ryabin, T., Hall, J. R., Hartmann, M., Hollister, E. B., ... and Weber, C. F. (2009) Introducing mothur: Open-source, platform-independent, community-supported software for describing and comparing microbial communities. Appl Environ Microbiol 75: 7537–7541.

15.Schoch, C. L., Robbertse, B., Robert, V., Vu, D., Cardinali, G., Irinyi, L., ... and Kirk, P. M. (2014). Finding needles in haystacks: linking scientific names, reference specimens and molecular data for Fungi. Database 2014: 1-21.

16.Stamatakis, A., (2014) RAxML version 8: a tool for phylogenetic analysis and post-analysis of large phylogenies. Bioinformatics 30:1312–1313.

17.Tedersoo, L., Anslan, S., Bahram, M., Põlme, S., Riit, T., Liiv, I., ... and Bork, P. (2015). Shotgun metagenomes and multiple primer pair-barcode combinations of amplicons reveal biases in metabarcoding analyses of fungi. MycoKeys 10: 1-43.

18.Tedersoo, L. and Lindahl, B. (2016). Fungal identification biases in microbiome projects. Env Microbiol Rep 8: 774-779.

19.Tedersoo, L., Tooming-Klunderud, A., Anslan, S. (2018) PacBio metabarcoding of Fungi and other eukaryotes: errors, biases and perspectives. New Phytol 217: 1370–1385.

20.White, T. J., Bruns, T. D., Lee, S. B. and Taylor, J. W. (1990) Amplification and direct sequencing of fungal ribosomal RNA genes for phylogenetics. In: Innis MA, Gelfand DH, Sninsky JJWT, editors. PCR protocols: a guide to methods and applications. New York: Academic Press, p. 315–22.

猜你喜歡

10000+:菌群分析 寶寶與貓狗 梅毒狂想曲 提DNA發Nature Cell專刊 腸道指揮大腦

系列教程:微生物組入門 Biostar 微生物組  宏基因組

專業技能:學術圖表 高分文章 生信寶典 不可或缺的人

一文讀懂:宏基因組 寄生蟲益處 進化樹

必備技能:提問 搜索  Endnote

文獻閱讀 熱心腸 SemanticScholar Geenmedical

擴增子分析:圖表解讀 分析流程 統計繪圖

16S功能預測   PICRUSt  FAPROTAX  Bugbase Tax4Fun

在線工具:16S預測培養基 生信繪圖

科研經驗:雲筆記  雲協作 公眾號

編程模板: Shell  R Perl

生物科普:  腸道細菌 人體上的生命 生命大躍進  細胞暗戰 人體奧秘  

寫在後面

為鼓勵讀者交流、快速解決科研困難,我們建立了「宏基因組」專業討論群,目前己有國內外5000+ 一線科研人員加入。參與討論,獲得專業解答,歡迎分享此文至朋友圈,並掃碼加主編好友帶你入群,務必備註「姓名-單位-研究方向-職稱/年級」。PI請明示身份,另有海內外微生物相關PI群供大佬合作交流。技術問題尋求幫助,首先閱讀《如何優雅的提問》學習解決問題思路,仍未解決群內討論,問題不私聊,幫助同行。

學習16S擴增子、宏基因組科研思路和分析實戰,關注「宏基因組」

點擊閱讀原文下載PDF審稿,或瀏覽器直接訪問下載連結:http://210.75.224.110/github/MicrobiomeProtocol/04Review/210111/2003701ZhifengZhang939585/Protocol2003701final.pdf

相關焦點

  • 三代測序數據簡單分析
    簡單介紹:三代測序技術讀長較長,針對比較小的基因組像只有16kbp的人類線粒體
  • 【技術專題】之 Pacbio 三代測序及其在醫學研究中的應用
    而測序在研究靶點的選擇中經常起到關鍵的第一步。Pacbio三代測序技術介紹:Pacbio三代測序的長讀長可以輕鬆地跨越基因組的複雜區域,獲得單鹼基解析度的SV斷點結果,並且由於其無GC偏好性,對基因組的覆蓋更加均一,相比於二代測序能夠獲得更高的結構變異檢出率。
  • pH驅動鹼性沉積物細菌群落空間變異
    記者近日從中科院南京土壤研究所獲悉,該所褚海燕團隊和中科院青藏高原研究所的研究人員合作,深入研究了青藏高原鹼性湖底沉積物細菌群落的空間分布及其驅動機制
  • From 16S rDNA測序 To 宏基因組學研究—技術發展及異同點
    狹義宏基因組:則以生態環境中全部細菌和真菌基因組DNA作為研究對象,它不是採用傳統的培養微生物的基因組,包含了可培養和不可培養的微生物的基因,通過克隆、異源表達來篩選有用基因及其產物,研究其功能和彼此之間的關係和相互作用,揭示其規律。
  • 測序原理-------一代測序、二代測序、三代測序
    第一代測序平臺也是基於Sanger法發展起來的,不過更加智能,功能更加多樣化。下圖為第一代測序儀ABI 3730,基於雙脫氧核苷酸終止法),雖然相比二代測序,一代測序通量較低,但是其準確度是非常高的,許多文獻將Sanger測序結果當做黃金標準。
  • 基於「三+二」宏基因組測序的抗性基因和可移動元件的精確研究
    今天美格基因的佳作推薦基於「三+二」宏基因組測序策略提出了一套高效組裝宏基因組數據的分析流程,為抗性基因和可移動元件的精確研究提供了可靠方法。3、人工構建GIS20腸道微生物群落及其測序:將20種已知的細菌菌株的DNA混合在一起,菌株DNA的豐度為0.1%到30%,再進行三代測序。比較不同工具對該數據的組裝效果。4、分析可移動元件和抗性基因,對巨噬菌體進行注釋和進化分析。
  • 叢枝菌根真菌研究取得進展
    中科院南京土壤研究所林先貴研究員課題組在叢枝菌根真菌的最新研究中發現,磷肥的施用有利於我國北方潮土地力的提升。
  • 16S/18S/ITS 擴增子測序
    與16S rRNA類似,真核微生物18S rRNA基因長度1500-2000 bp,常用於研究環境樣本中真核微生物群落結構多樣性,其中,真菌rRNA基因的非轉錄區還包含一段隱秘的內轉錄間隔區(Internal Transcribed Spacer,ITS),長度為400-900bp,由於種內保守,種間差異明顯,也非常適於種類鑑定和群落分析。
  • 【三代測序傳】——動植物研究中的捕獲測序
    為了鑑定特定表型的基因,必須對包含特定信息的SNP進行精細定位-通常用靶向測序來進行。這些區域一般比較大,可能有幾K,可能包含難以用現有技術進行識別的結構變化。單分子實時測序為靶向感興趣的區域提供了靈活的解決方案,大小可靈活調整,為相關基因提供最全面的檢測。它還能提供精細定位所需的讀取長度和準確性,並簡化LargeRegion的組裝。
  • 微生物 18S rRNA區域和引物的選擇對研究真菌多樣性的影響
    核糖體RNA基因(rDNA)擴增子的高通量測序技術的發展,成為大規模的研究微生物群落多樣性和結構很有利的方法。
  • 美格基因引入Nanopore平臺助力宏基因組三代測序!
    1、更真實反映菌群實際組成美格基因三代宏基因組採用「三+二」測序策略,三代宏基因組測序策略解決了二代讀長短的限制,能輕鬆覆蓋基因間區或基因特異性區域,長讀長Reads能夠更為精準地鑑定水體、土壤、腸道等生境中微生物的種類,有效提高微生物群落鑑定的解析度,更加真實的反映菌群的實際組成。
  • 作物根系轉錄組與根中的真菌群落結構有什麼樣的特點呢?
    對擬南芥、水稻和玉米的研究表明,根際區域的微生物群落結構受土壤類型的影響,而且與土壤質地和有機質含量有關。改變土壤營養狀況、pH、溫度、水分和通氣等會影響土壤理化性質的措施也會對植物根際區域微生物群落結構產生影響。劉俊傑等(2008)研究表明,施磷會顯著影響大豆根際細菌和真菌群落結構。
  • 城市環境所微生物群落環境響應研究獲進展
    中國科學院城市環境研究所研究員姚槐應研究組通過土壤DNA與RNA的提取,在基因和轉錄水平上對細菌和真菌的rRNA基因片段進行高通量測序分析,比較水稻土在淹水過程中當前所有(the total/present community)與潛在活性狀態的微生物群落(the potentially active community)變化的差異,並分析微生物在土壤迅速淹水後的群落演變軌跡。
  • 微生物群落多樣性測序與功能分析
    微生物群落測序是指對微生物群體進行高通量測序,通過分析測序序列的構成分析特定環境中微生物群體的構成情況或基因的組成以及功能。藉助不同環境下微生物群落的構成差異分析我們可以分析微生物與環境因素或宿主之間的關係,尋找標誌性菌群或特定功能的基因。
  • 基於擴增子與GeoChip 5.0 聯合分析的噬菌體與原核微生物群落研究
    對採集的樣品進行物理化學檢測,包括Fe、Cu、Cr、SO42-、Cl-、NH4+-N和pH及過程性能指標TS、VS和COD;提取DNA,基於MiSeq平臺進行16S rDNA V4區測序,並用包涵455種噬菌體探針的Geochip 5.0探測噬菌體基因。然後對獲得的序列信息進行一系列的分析。
  • 植物所在亞熱帶森林群落生物多樣性維持機制研究中取得進展
    然而,由於對亞熱帶森林群落多樣性維持機制缺乏足夠的認識,如何保育和修復我國各類退化亞熱帶森林生態系統面臨著核心理論「瓶頸」。  中國科學院植物研究所馬克平研究團隊近20年來一直致力於亞熱帶森林生物多樣性研究。
  • 中科院城市環境所在微型浮遊生物群落研究方面取得進展
    水庫微型真核浮遊生物(0.2-200 μm)包括原生動物、藻類、低等真菌和小型後生動物等,具有個體微小、種類多樣、分布廣泛等特點。長期以來,微型真核浮遊生物群落生態研究主要依賴顯微技術進行觀測,面臨的問題是很難辨別、準確鑑定形態相似的種類和個體極其微小的物種。為了避免這一問題,研究者近年來利用18S rDNA高通量測序技術獲得了更加豐富而多樣的真核浮遊生物信息,但該方法無法直接區分生物個體大小。
  • 三代重測序助力阿爾茲海默症研究
    簡單一句話介紹就是,作者採用二代和三代Nanopore重測序數據找到了DPP6上的4M大小的倒位,並採用二代測序數據大隊列研究DPP6基因的變異對阿爾茲海默症的影響。本研究中,作者採用二代測序和三代長read全基因組測序來研究常染色體顯性遺傳史的痴呆家族顯著關聯的7q36。他們識別並驗證了4Mb的倒位在疾病單倍型中分離,並擾亂了DPP6基因的編碼序列。在早發性阿爾茲海默症和額顳葉痴呆中,利用DPP6基因的重測序技術識別了更多罕見的非同義突變,移碼突變和無義突變。
  • 科研 | Environ Microbiol:大型植物落葉分解中細菌和真菌之間的相互作用(國人作品)
    此外,真菌可通過快速的定殖和生長速度競爭生態系統中的其他物種。研究表明凋落物分解初期細菌數量增加,隨溼度條件變化細菌群落組成沒有變化。放線菌門細菌在分解後期有助於胞外降解酶的產生,且細菌可以在厭氧或高溫的微生物群落中佔主導地位。細菌與真菌經常共存並相互作用,但對細菌與真菌在植物分解過程中的相互作用所知甚少。
  • COM:根系微生物組研究中的合成群落還原法
    總結了合成菌群體系在植物根系微生物組功能研究中的應用。主要包括:一、分離培養根系微生物組菌種資源;二、比較主流植物無菌種植研究體系的優缺點;三、合成菌群體系在根系微生物組研究中應用的經典案例(重現自然土壤的實驗結果,研究根系微生物組的功能,研究微生物與微生物之間的關係)。文章也指出當前研究方法的不足,展望了未來需要解決的問題。