為進一步提高《微生物組實驗手冊》稿件質量,本項目新增大眾評審環節。文章在通過同行評審後,採用公眾號推送方式分享全文,任何人均可在線提交修改意見。公眾號格式顯示略有問題,建議電腦端點擊文末閱讀原文下載PDF審稿。在線文檔(https://kdocs.cn/l/cL8RRqHIL)大眾評審頁面登記姓名、單位和行號索引的修改建議。修改意見的徵集截止時間為推文發布後的72小時,文章將會結合有建設性的修改意見進一步修改後獲得DOI在線發表,同時根據貢獻程度列為審稿人或致謝。感謝廣大同行提出寶貴意見。
土壤宏轉錄組學樣本前處理與數據分析
Sample Pretreatment And Data Analysis Of Soil Metatranscriptome
張麗燕1, 2,連鄭漢3,褚海燕1, 2, *
1中國科學院南京土壤研究所,土壤與農業可持續發展國家重點實驗室,江蘇,南京,210008
2中國科學院大學,北京,100049
3廣東美格基因科技有限公司, 廣州,510000
*通訊作者郵箱:hychu@issas.ac.cn
摘要:土壤宏轉錄組學是通過製備土壤RNA樣本、RNA測序、以及利用一系列生物信息學方法和平臺搭建來完成土壤微生物組的轉錄過程分析,提供關於基因表達和土壤微生物組功能活性,從而獲得微生物組關鍵代謝差異表徵等信息的一門學科。關鍵點是針對土壤RNA樣本,表徵特定條件下執行各個代謝過程的微生物活性特徵,極大地規避了因高通量DNA測序帶來無法準確反映土壤微生物代謝活性的缺陷。目的:本實驗以兩種類型(酸性和鹼性)溼地土壤樣本為例,詳述了利用市售RNA提取試劑盒進行的土壤宏轉錄組樣本製備流程,為準確評價土壤RNA樣本製備提供參考,同時給出了宏轉錄組數據分析流程,為從RNA水平分析土壤微生物表達活性提供思路。
關鍵詞:土壤,宏轉錄組學,RNA,土壤微生物代謝活性
材料與試劑
1.50 ml離心管(Thermo Fisher Scientific, USA)
2.酚氯仿異戊醇(配比25:24:1, pH=8)
3.瓊脂糖
4.電泳緩衝液(TAE)
5.RNA提取試劑盒RNA Mini Kit(Qiagen, Hilden, Germany)
儀器設備
1.超微量紫外分光光度計NanoDrop One(Thermo Fisher Scientific, MA, USA)
2.臺式高速冷凍離心機(Techcomp(Holdings), model: CT15RT)
3.渦旋儀(Qiangen, catalog number: 13000-V1-15)
4.水浴鍋
5.移液槍
6.電泳儀
數據分析軟體及平臺
1.CD-HIT(http://weizhongli-lab.org/cd-hit/)
2.fastp(https://github.com/OpenGene/fastp)
3.SortMeRNA(https://github.com/biocore/sortmerna)
4.idba_tran(https://github.com/loneknightpy/idba)
5.prodigal(https://github.com/hyattpd/Prodigal)
6.CD-HIT(http://weizhongli-lab.org/cd-hit/)
7.RSEM(https://github.com/deweylab/RSEM)
8.bowtie2(http://bowtie-bio.sourceforge.net/bowtie2/index.shtml)
9.diamond軟體(http://www.diamondsearch.org)
10. 上述軟體均在Linux作業系統下進行
土壤總RNA提取步驟
1.取樣過程
採集 0-20 cm 溼地土壤樣品5克於 50 ml 的無菌離心管中,加入RNA 酶抑制劑約10 ml使其浸沒土壤樣品並封存。低溫運輸並儘快於-80 °C保存。
2.注意事項
確保實驗工作區無RNase汙染並且整個操作過程戴橡膠手套。
3.RNA製備
1). 加2 g土壤到15 ml磁珠管中(試劑盒提供)。
2). 依次向離心管內加入2.5 ml Bead solution溶液,0.25 ml SR1溶液和0.8 ml的IRS溶液並漩渦混勻。
發生的反應:Bead Solution是一種緩衝液可用來打散細胞和土壤顆粒;SR1能幫助細胞裂解,可以破壞脂肪酸和幾種微生物細胞膜相關的脂類;IRS可以幫助去除腐殖質、細胞碎片和蛋白質等雜質。
3). 向磁珠管加入3.5 ml酚氯仿異戊醇溶液(pH=8),漩渦混勻直到分層消失。
4). 最大轉速渦旋混勻15 min。
發生反應:從1到4步的化學試劑和漩渦使細胞裂解,酚/氯仿/異戊醇使其最大程度裂解,溶解的細胞和試劑混合在一起,蛋白質降解只剩下核酸在溶液中。
5). 2,500 × g 離心10 min。
發生反應:離心導致混合樣品相分離。離心後能觀察到三相,底下的有機相包括蛋白質和細胞碎片,中間相包括腐殖質和其他有機及無機物質,上層相包括所有的核酸。
6). 小心轉移上層水相於一新15 ml離心管中(試劑盒提供)。
註:用槍頭小心吸取上層水相,誤觸碰界面。
7). 加1.5 ml SR3到水相中,漩渦混合。4 °C孵育10 min, 2,500 × g 離心10 min。
8). 將上清液轉移到一新15 ml離心管中(不要碰到下面的沉澱物),加入5 ml SR4混勻,室溫放置30 min。
註:分層明顯的界面處小心吸取上清,勿刺破(觸碰)界面。
9). 2,500 × g 離心30 min。
10). 倒出上清液,將離心管倒置在紙巾上5 min。
註:依據土壤類型的不同,沉澱可能較大或顏色較深(Mettel, et al., 2010)。
11). 搖晃SR5溶液使其混合,加1 ml SR5溶液到離心管中,使沉澱再完全懸浮。
註:沉澱可能由於土壤樣品的不同不易懸浮,可能需要將離心管放到45 °C的水浴池中10 min再懸浮,再漩渦混合,重複這樣直到沉澱重懸浮。
12). 為每個RNA樣品準備一個捕集柱。
12.1). 將捕集柱懸掛到離心管上。
12.2). 加2 ml SR5溶液到捕集柱上,使其重力流。允許SR5溶液完全流過捕集柱。
註:在加RNA樣品前不要讓捕集柱流幹。
13). 將11步的RNA分離樣加到捕集柱中,使其流過捕集柱。
14). 用1 ml SR5溶液洗滌捕集柱,流出液收集在15 ml離心管中。
反應:樣品加到捕集柱上,核酸結合到柱基質上。捕集柱用SR5溶液洗滌確保未結合的汙染物被去除掉。
15). 將捕集柱轉移到一新15 ml離心管中,搖晃SR6,然後加1 ml SR6溶液到捕集柱中使其流過捕集柱,洗提RNA。
發生反應:SR6溶液RNA洗提緩衝液是專有的鹽溶液,它能使RNA流出而DNA、剩下的細胞碎片和抑制劑依然留在捕集柱上。
16). 將洗提的RNA轉移到2.2 ml離心管中,並加1 ml SR4,至少倒置混合一次,-20 °C靜置10 min。
17). 13,000 × g離心15 min。
18). 移去上清液,將RNA離心管倒置在紙巾上10 min,風乾顆粒物。
19). 加100 μl SR7溶液使RNA顆粒再懸浮。
注意事項
為防止DNA交叉汙染,DNA汙染物的去除很重要,純化的RNA應該直接用PCR檢測。 瓊脂糖電泳缺乏檢測複製片段表明缺乏檢測到的交叉汙染DNA。 如果檢測到DNA,需要進一步使用DNase I分離RNA。
土壤RNA樣本提取效果評價
實驗藉助市售土壤RNA提取試劑盒(RNA Mini Kit, Qiagen, Germany)比較兩種不同類型(酸性、鹼性)的溼地土壤樣本總RNA提取效果,純度和濃度測試結果如表1所示。OD260代表核酸的吸光度,OD280代表蛋白質的吸光度,OD230代表其他雜質(多糖等)的吸光度。OD是光密度值。一般來說,OD260/OD280介於1.9~2.0 說明RNA提取純度高,汙染小。OD260/OD280 << span=""> 1.7時表明有蛋白質或酚汙染;OD260/OD280 > 2.0時表明可能有異硫氰酸殘存。原核生物的核糖體rRNA主要由23S、16S和5S rRNA組成。實驗室主要通過觀察核糖體的23S rRNA和16S rRNA條帶的亮度和片段形狀來判定RNA的提取效果(Peano et al., 2013),本實驗中根據OD260/OD280介於1.9~2.0之間,16S rRNA 及 23S rRNA兩條標誌性條帶清晰,說明該方法提取RNA得到了比較純的RNA樣品,經公司評價,滿足建庫要求。將裝有RNA樣品的EP管用乾冰密封好,送至美格基因進行宏轉錄組測序(測序平臺為Illumina Hiseq Xten)。
表1. 部分樣本RNA提取濃度和純度, 1-4代表酸性溼地四個土壤RNA樣本,5-8代表鹼性溼地四個土壤RNA樣本
SampleID
Concentration(ng/μl)
OD260/OD280
OD260/OD230
OD260
OD230
OD280
1
184.75
1.93
1.73
4.62
2.68
2.39
2
173.45
1.93
1.71
4.34
2.54
2.25
3
128.83
1.95
1.72
3.22
1.87
1.65
4
223.20
1.98
1.79
5.58
3.12
2.82
5
193.83
1.97
1.80
4.85
2.70
2.46
6
98.76
1.94
1.67
2.47
1.47
1.28
7
86.87
1.97
1.65
2.17
1.31
1.11
8
143.05
1.95
1.75
3.58
2.05
1.83
圖1. 兩種類型溼地土壤樣品試劑盒提取的總RNA瓊脂糖凝膠電泳圖。1-4分別代表酸性溼地土壤RNA,5-8分別代表鹼性溼地土壤RNA,M代表片段大小不同的核酸標記物。
宏轉錄組下機數據分析流程
1.測序得到的原始數據(raw data)中包含接頭序列及低質量鹼基(Q<30< span="">),首先經過fastp(https://github.com/OpenGene/fastp)去接頭(adapter)及過濾鹼基質量後得到高質量序列(clean data)以便用於後續分析:
$ fastp -I $Sample_R1.fq.gz -I $Sample_R2.fq.gz -o $Sample_clean_R1.fq -O $Sample_clean_R2.fq -l 50 -q 30 -t 10
2.高質量序列中仍包含大量的核糖體RNA(rRNA),通過SortMeRNA(https://github.com/biocore/sortmerna)過濾clean data中的rRNA序列:
$ sortmerna --ref $refdir/rRNA_databases/silva-arc-16s-id95.fasta, $refdir /index/silva-arc-16s-id95: \
$refdir/rRNA_db/silva-arc-23s-id98.fasta, $refdir/index/silva-arc-23s-id98: \
$refdir/rRNA_db/silva-bac-16s-id90.fasta, $refdir/index/silva-bac-16s-id90: \
$refdir/rRNA_db/silva-bac-23s-id98.fasta, $refdir/index/silva-bac-23s-id98: \
$refdir/rRNA_db/silva-euk-18s-id95.fasta, $refdir/index/silva-euk-18s-id95: \
$refdir/rRNA_db/silva-euk-28s-id98.fasta, $refdir/index/silva-euk-28s-id98: \
$refdir/rRNA_db/rfam-5s-database-id98.fasta, $refdir/index/rfam-5s-database-id98: \
$refdir/rRNA_db/rfam-5.8s-database-id98.fasta, $refdir/index/rfam-5.8s-database-id98 \
--reads $Sample_clean_R1.fq --reads $Sample_clean_R2.fq --fastx --other $Sample_rmRNA --aligned $Sample_aligned -a 30 -paired-out
$ unmerge-paired-reads.sh $Sample_rmRNA.fq $Sample_rmRNA_R1.fq $Sample_rmRNA_R2.fq
3.通過idba_tran(https://github.com/loneknightpy/idba)對轉錄組數據進行組裝得到每個樣本的轉錄組序列$Sample_assembly/contig.fa:
$ $IDBA/bin/fq2fa –merge $Sample_rmRNA_R1.fq $Sample_rmRNA_R2.fq $Sample_merge.fa
$ $IDBA/bin/idba_tran -r $Sample_merge.fa -o $Sample_assembly --pre_correction --mink 20 --maxk 60 --step 10 --num_threads 20
4.組裝得到的Contig中包含非mRNA信息,使用prodigal(https://github.com/hyattpd/Prodigal)對蛋白質編碼區進行預測:
$ prodigal -d $Sample_nul.fa -I $Sample_assembly/contig.fa -m -p meta
5.預測到每個個體樣品的基因序列後,利用CD-HIT(http://weizhongli-lab.org/cd-hit/)對所有樣品的基因進行聚類構建非冗餘基因集(gene catalogue.fa):
$ cat $Sample*_nul.fa > all_gene.fa
$ cd-hit-est -I all_gene.fa -c 0.95 -aS 0.9 -M 0 -o all_gene_nr -T 40
$ awk 'BEGIN{a=1}{if($0~/>/){print ">Unigene_"a;a+=1}else{print $0}}' all_gene_nr.fa >gene catalogue.fa
6.樣本中基因的表達量通過將reads比對到基因集(gene catalogue.fa)獲得,通過將測序reads比對到基因序列上得到樣品中基因表達量(sample_fpkm.txt)。即使用RSEM(https://github.com/deweylab/RSEM)對 bowtie2(http://bowtie-bio.sourceforge.net/bowtie2/index.shtml)的比對結果進行統計,獲得每個樣本中每個基因的 reads counts,同時計算FPKM。FPKM(全稱 expected number of Fragments Per Kilobase of transcript sequence per Millions base pairs sequenced)是每百萬 fragments 中來自某一基因每千鹼基長度的fragments 數目,其同時考慮了測序深度和基因長度對fragments計數的影響,是對read counts進行標準化處理的目前最為常用的基因表達水平估算方法(Trapnell et al., 2010)。
$ rsem-calculate-expression -p 70 --bowtie2 --paired-end \
$Sample_rmRNA_R1.fq $Sample_rmRNA_R2.fq rsem.ref $Sample
$ for i in `$Sample*.genes.results`; \
do cut -f 1,7 $i >${i/gene.results/FPKM.txt}; \
done
$ python merge_metaphlan_tables.py $Sample*.FPKM.txt > all_sample_fpkm.txt (腳本下載連結:https://github.com/biobakery/MetaPhlAn/blob/master/metaphlan/utils/merge_metaphlan_tables.py)
7.使用diamond軟體將非冗餘的Unigenes 序列與 NCBI-NR 資料庫進行比對(設定閾值為e-value≤1e-5),採取最近公共祖先LCA(Lowest Common Ancestor)算法獲得基因序列的物種注釋信息:
$ diamond blastp –threads 20 -q Unigenes_pro.fa -d nr_*version.dmnd -o Unigenes_vs_nr_blt.txt --max-target-seqs 10 –evalue 1e-5 --outfmt 6 qseqid qlen sseqid stitle slen pident length mismatch gapopen qstart qend sstart send evalue bitscore
$ blast2lca -input Unigenes_vs_nr_blt.txt -o Unigenes_vs_nr_blt.tax -ms 50 -me 0.000001 -g2t gi_taxid-March2015X.bin
8.通過將基因序列和特定資料庫(如KEGG)進行比對,完成基因功能注釋。序列比對使用diamond(https://github.com/bbuchfink/diamond)軟體進行。
KEGG資料庫(https://pan.baidu.com/s/1jnulGNSQ3qDfoB3b76a0Dg,提取碼:jzal)
$ diamond makedb –in meta.pep -d meta.dmnd
$ diamond blastp -d meta.dmnd -q Unigenes_pro.fa -k 1 -p 50 -f 6 -o Unigenes_vs_kegg_blt.txt
結果分析
通過和KEGG 資料庫中的KO資料庫進行比對,得到不同層次的基因功能分類(圖2)。以一種酸性土壤樣本為例,從KO level 1層次來看,土壤微生物的大部分活性基因與新陳代謝(Metabolism)相關,佔總體基因表達量的45.7%,其次為遺傳信息加工(Genetic information processing,8.5%),環境信息加工(Environmental information processing,9.6%)和細胞過程(Cellular processes, 8.2%)。KO level 2 層次上的基因功能分類如圖2。 從圖中可以看出,微生物新陳代謝相關的活動主要表現為能量代謝、碳水化合物代謝和胺基酸代謝;遺傳信息加工主要表現在蛋白翻譯;環境信息加工主要包括信號轉導和膜轉運;而細胞過程相關的基因主要參與了cellular community-eukaryotes和細胞遷移(cell motility)。
圖2.以酸性土樣本為例的土壤微生物活性基因在KEGG level2水平上的功能分類
土壤宏轉錄組研究的優點
1). 當與室內培養控制實驗和高通量測序結合使用時,可以估算群落中特定微生物正在進行的積極的轉錄過程。
2). 排除了死亡微生物細胞殘體,休眠體的影響。
3). 能夠捕捉土壤特定類群內部動態變化。
4). 直接評估土壤微生物活性,包括對於幹擾或者暴露等情況的響應。
致謝
本實驗得到國家自然科學基金項目(91951109)的資助。
參考文獻
1.Mettel, C., Kim, Y., Shrestha, P.M. and Liesack, W. (2010). Extraction of mRNA from soil. Appl Environ Microbiol 76: 5995-6000.
2.Peano, C., Pietrelli, A., Consolandi, C., Rossi, E., Tagliabue, L., De Bellis, G.D. and Landini, P. (2013). An efficient rRNA removal method for RNA sequencing in GCrich bacteria. Microb Inform Exp 3:1.
3.Torre, A., Metivier, A., Chu, F., Laurens, L.M., Beck, D.A., Pienkos, P.T., Lidstrom, M.E., and Kalyuzhnaya, M.G. (2015). Genome-scale metabolic reconstructions and theoretical investigation of methane conversion in Methylomicrobium buryatense strain 5G(B1). Microb Cell Factories 14: 188.
4.Trapnell, C., Williams, B.A., Pertea, G., Mortazavi, A.,Kwan, G., van Baren, M.J., Salzberg, S.L., Wold, B.J., and Pachter,L. (2010).Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. Nat Biotechnol 28: 5.
猜你喜歡10000+:菌群分析 寶寶與貓狗 梅毒狂想曲 提DNA發Nature Cell專刊 腸道指揮大腦
系列教程:微生物組入門 Biostar 微生物組 宏基因組
專業技能:學術圖表 高分文章 生信寶典 不可或缺的人
一文讀懂:宏基因組 寄生蟲益處 進化樹
必備技能:提問 搜索 Endnote
文獻閱讀 熱心腸 SemanticScholar Geenmedical
擴增子分析:圖表解讀 分析流程 統計繪圖
16S功能預測 PICRUSt FAPROTAX Bugbase Tax4Fun
在線工具:16S預測培養基 生信繪圖
科研經驗:雲筆記 雲協作 公眾號
編程模板: Shell R Perl
生物科普: 腸道細菌 人體上的生命 生命大躍進 細胞暗戰 人體奧秘
寫在後面為鼓勵讀者交流、快速解決科研困難,我們建立了「宏基因組」專業討論群,目前己有國內外5000+ 一線科研人員加入。參與討論,獲得專業解答,歡迎分享此文至朋友圈,並掃碼加主編好友帶你入群,務必備註「姓名-單位-研究方向-職稱/年級」。PI請明示身份,另有海內外微生物相關PI群供大佬合作交流。技術問題尋求幫助,首先閱讀《如何優雅的提問》學習解決問題思路,仍未解決群內討論,問題不私聊,幫助同行。
學習16S擴增子、宏基因組科研思路和分析實戰,關注「宏基因組」
點擊閱讀原文下載PDF審稿,或瀏覽器直接訪問下載連結:http://210.75.224.110/github/MicrobiomeProtocol/04Review/201222/2003543HaiyanChu928814/Protocol2003543final.pdf