MPB:南土所褚海燕組-土壤宏轉錄組學樣本前處理與數據分析

2021-03-01 宏基因組

為進一步提高《微生物組實驗手冊》稿件質量,本項目新增大眾評審環節。文章在通過同行評審後,採用公眾號推送方式分享全文,任何人均可在線提交修改意見。公眾號格式顯示略有問題,建議電腦端點擊文末閱讀原文下載PDF審稿。在線文檔(https://kdocs.cn/l/cL8RRqHIL)大眾評審頁面登記姓名、單位和行號索引的修改建議。修改意見的徵集截止時間為推文發布後的72小時,文章將會結合有建設性的修改意見進一步修改後獲得DOI在線發表,同時根據貢獻程度列為審稿人或致謝。感謝廣大同行提出寶貴意見。

土壤宏轉錄組學樣本前處理與數據分析

Sample Pretreatment And Data Analysis Of Soil Metatranscriptome

張麗燕1, 2,連鄭漢3,褚海燕1, 2, *

1中國科學院南京土壤研究所,土壤與農業可持續發展國家重點實驗室,江蘇,南京,210008

2中國科學院大學,北京,100049

3廣東美格基因科技有限公司, 廣州,510000

*通訊作者郵箱:hychu@issas.ac.cn

摘要:土壤宏轉錄組學是通過製備土壤RNA樣本、RNA測序、以及利用一系列生物信息學方法和平臺搭建來完成土壤微生物組的轉錄過程分析,提供關於基因表達和土壤微生物組功能活性,從而獲得微生物組關鍵代謝差異表徵等信息的一門學科。關鍵點是針對土壤RNA樣本,表徵特定條件下執行各個代謝過程的微生物活性特徵,極大地規避了因高通量DNA測序帶來無法準確反映土壤微生物代謝活性的缺陷。目的:本實驗以兩種類型(酸性和鹼性)溼地土壤樣本為例,詳述了利用市售RNA提取試劑盒進行的土壤宏轉錄組樣本製備流程,為準確評價土壤RNA樣本製備提供參考,同時給出了宏轉錄組數據分析流程,為從RNA水平分析土壤微生物表達活性提供思路。

關鍵詞:土壤,宏轉錄組學,RNA,土壤微生物代謝活性

材料與試劑

1.50 ml離心管(Thermo Fisher Scientific, USA)

2.酚氯仿異戊醇(配比25:24:1, pH=8)

3.瓊脂糖

4.電泳緩衝液(TAE)

5.RNA提取試劑盒RNA Mini Kit(Qiagen, Hilden, Germany)

儀器設備

1.超微量紫外分光光度計NanoDrop One(Thermo Fisher Scientific, MA, USA)

2.臺式高速冷凍離心機(Techcomp(Holdings), model: CT15RT)

3.渦旋儀(Qiangen, catalog number: 13000-V1-15)

4.水浴鍋

5.移液槍

6.電泳儀

數據分析軟體及平臺

1.CD-HIT(http://weizhongli-lab.org/cd-hit/)

2.fastp(https://github.com/OpenGene/fastp)

3.SortMeRNA(https://github.com/biocore/sortmerna)

4.idba_tran(https://github.com/loneknightpy/idba)

5.prodigal(https://github.com/hyattpd/Prodigal)

6.CD-HIT(http://weizhongli-lab.org/cd-hit/)

7.RSEM(https://github.com/deweylab/RSEM)

8.bowtie2(http://bowtie-bio.sourceforge.net/bowtie2/index.shtml)

9.diamond軟體(http://www.diamondsearch.org)

10. 上述軟體均在Linux作業系統下進行

土壤總RNA提取步驟

1.取樣過程

採集 0-20 cm 溼地土壤樣品5克於 50 ml 的無菌離心管中,加入RNA 酶抑制劑約10 ml使其浸沒土壤樣品並封存。低溫運輸並儘快於-80 °C保存。

2.注意事項

確保實驗工作區無RNase汙染並且整個操作過程戴橡膠手套。

3.RNA製備

1). 加2 g土壤到15 ml磁珠管中(試劑盒提供)。

2). 依次向離心管內加入2.5 ml Bead solution溶液,0.25 ml SR1溶液和0.8 ml的IRS溶液並漩渦混勻。

發生的反應:Bead Solution是一種緩衝液可用來打散細胞和土壤顆粒;SR1能幫助細胞裂解,可以破壞脂肪酸和幾種微生物細胞膜相關的脂類;IRS可以幫助去除腐殖質、細胞碎片和蛋白質等雜質。

3). 向磁珠管加入3.5 ml酚氯仿異戊醇溶液(pH=8),漩渦混勻直到分層消失。

4). 最大轉速渦旋混勻15 min。

發生反應:從1到4步的化學試劑和漩渦使細胞裂解,酚/氯仿/異戊醇使其最大程度裂解,溶解的細胞和試劑混合在一起,蛋白質降解只剩下核酸在溶液中。

5). 2,500 × g 離心10 min。

發生反應:離心導致混合樣品相分離。離心後能觀察到三相,底下的有機相包括蛋白質和細胞碎片,中間相包括腐殖質和其他有機及無機物質,上層相包括所有的核酸。

6). 小心轉移上層水相於一新15 ml離心管中(試劑盒提供)。

   註:用槍頭小心吸取上層水相,誤觸碰界面。

7). 加1.5 ml SR3到水相中,漩渦混合。4 °C孵育10 min, 2,500 × g 離心10 min。

8). 將上清液轉移到一新15 ml離心管中(不要碰到下面的沉澱物),加入5 ml SR4混勻,室溫放置30 min。

註:分層明顯的界面處小心吸取上清,勿刺破(觸碰)界面。

9). 2,500 × g 離心30 min。

10). 倒出上清液,將離心管倒置在紙巾上5 min。

註:依據土壤類型的不同,沉澱可能較大或顏色較深(Mettel, et al., 2010)。

11). 搖晃SR5溶液使其混合,加1 ml SR5溶液到離心管中,使沉澱再完全懸浮。

註:沉澱可能由於土壤樣品的不同不易懸浮,可能需要將離心管放到45 °C的水浴池中10 min再懸浮,再漩渦混合,重複這樣直到沉澱重懸浮。

12). 為每個RNA樣品準備一個捕集柱。

12.1). 將捕集柱懸掛到離心管上。

12.2). 加2 ml SR5溶液到捕集柱上,使其重力流。允許SR5溶液完全流過捕集柱。

註:在加RNA樣品前不要讓捕集柱流幹。

13). 將11步的RNA分離樣加到捕集柱中,使其流過捕集柱。

14). 用1 ml SR5溶液洗滌捕集柱,流出液收集在15 ml離心管中。

反應:樣品加到捕集柱上,核酸結合到柱基質上。捕集柱用SR5溶液洗滌確保未結合的汙染物被去除掉。

15). 將捕集柱轉移到一新15 ml離心管中,搖晃SR6,然後加1 ml SR6溶液到捕集柱中使其流過捕集柱,洗提RNA。

發生反應:SR6溶液RNA洗提緩衝液是專有的鹽溶液,它能使RNA流出而DNA、剩下的細胞碎片和抑制劑依然留在捕集柱上。

16). 將洗提的RNA轉移到2.2 ml離心管中,並加1 ml SR4,至少倒置混合一次,-20 °C靜置10 min。

17). 13,000 × g離心15 min。

18). 移去上清液,將RNA離心管倒置在紙巾上10 min,風乾顆粒物。

19). 加100 μl SR7溶液使RNA顆粒再懸浮。

注意事項

為防止DNA交叉汙染,DNA汙染物的去除很重要,純化的RNA應該直接用PCR檢測。 瓊脂糖電泳缺乏檢測複製片段表明缺乏檢測到的交叉汙染DNA。 如果檢測到DNA,需要進一步使用DNase I分離RNA。

土壤RNA樣本提取效果評價

實驗藉助市售土壤RNA提取試劑盒(RNA Mini Kit, Qiagen, Germany)比較兩種不同類型(酸性、鹼性)的溼地土壤樣本總RNA提取效果,純度和濃度測試結果如表1所示。OD260代表核酸的吸光度,OD280代表蛋白質的吸光度,OD230代表其他雜質(多糖等)的吸光度。OD是光密度值。一般來說,OD260/OD280介於1.9~2.0 說明RNA提取純度高,汙染小。OD260/OD280 << span=""> 1.7時表明有蛋白質或酚汙染;OD260/OD280 > 2.0時表明可能有異硫氰酸殘存。原核生物的核糖體rRNA主要由23S、16S和5S rRNA組成。實驗室主要通過觀察核糖體的23S rRNA和16S rRNA條帶的亮度和片段形狀來判定RNA的提取效果(Peano et al., 2013),本實驗中根據OD260/OD280介於1.9~2.0之間,16S rRNA 及 23S rRNA兩條標誌性條帶清晰,說明該方法提取RNA得到了比較純的RNA樣品,經公司評價,滿足建庫要求。將裝有RNA樣品的EP管用乾冰密封好,送至美格基因進行宏轉錄組測序(測序平臺為Illumina Hiseq Xten)。

表1. 部分樣本RNA提取濃度和純度, 1-4代表酸性溼地四個土壤RNA樣本,5-8代表鹼性溼地四個土壤RNA樣本

SampleID

Concentration(ng/μl)

OD260/OD280

OD260/OD230

OD260

OD230

OD280

1

184.75

1.93

1.73

4.62

2.68

2.39

2

173.45

1.93

1.71

4.34

2.54

2.25

3

128.83

1.95

1.72

3.22

1.87

1.65

4

223.20

1.98

1.79

5.58

3.12

2.82

5

193.83

1.97

1.80

4.85

2.70

2.46

6

98.76

1.94

1.67

2.47

1.47

1.28

7

86.87

1.97

1.65

2.17

1.31

1.11

8

143.05

1.95

1.75

3.58

2.05

1.83

圖1. 兩種類型溼地土壤樣品試劑盒提取的總RNA瓊脂糖凝膠電泳圖。1-4分別代表酸性溼地土壤RNA,5-8分別代表鹼性溼地土壤RNA,M代表片段大小不同的核酸標記物。

宏轉錄組下機數據分析流程

1.測序得到的原始數據(raw data)中包含接頭序列及低質量鹼基(Q<30< span="">),首先經過fastp(https://github.com/OpenGene/fastp)去接頭(adapter)及過濾鹼基質量後得到高質量序列(clean data)以便用於後續分析:

$ fastp -I $Sample_R1.fq.gz -I $Sample_R2.fq.gz -o $Sample_clean_R1.fq -O $Sample_clean_R2.fq -l 50 -q 30 -t 10

2.高質量序列中仍包含大量的核糖體RNA(rRNA),通過SortMeRNA(https://github.com/biocore/sortmerna)過濾clean data中的rRNA序列:

$ sortmerna --ref $refdir/rRNA_databases/silva-arc-16s-id95.fasta, $refdir /index/silva-arc-16s-id95: \

$refdir/rRNA_db/silva-arc-23s-id98.fasta, $refdir/index/silva-arc-23s-id98: \

$refdir/rRNA_db/silva-bac-16s-id90.fasta, $refdir/index/silva-bac-16s-id90: \

$refdir/rRNA_db/silva-bac-23s-id98.fasta, $refdir/index/silva-bac-23s-id98: \

$refdir/rRNA_db/silva-euk-18s-id95.fasta, $refdir/index/silva-euk-18s-id95: \

$refdir/rRNA_db/silva-euk-28s-id98.fasta, $refdir/index/silva-euk-28s-id98: \

$refdir/rRNA_db/rfam-5s-database-id98.fasta, $refdir/index/rfam-5s-database-id98: \

$refdir/rRNA_db/rfam-5.8s-database-id98.fasta, $refdir/index/rfam-5.8s-database-id98 \

--reads $Sample_clean_R1.fq --reads $Sample_clean_R2.fq --fastx --other $Sample_rmRNA --aligned $Sample_aligned -a 30 -paired-out

$ unmerge-paired-reads.sh $Sample_rmRNA.fq $Sample_rmRNA_R1.fq $Sample_rmRNA_R2.fq

3.通過idba_tran(https://github.com/loneknightpy/idba)對轉錄組數據進行組裝得到每個樣本的轉錄組序列$Sample_assembly/contig.fa:

$ $IDBA/bin/fq2fa –merge $Sample_rmRNA_R1.fq $Sample_rmRNA_R2.fq $Sample_merge.fa

$ $IDBA/bin/idba_tran -r $Sample_merge.fa -o $Sample_assembly --pre_correction --mink 20 --maxk 60 --step 10 --num_threads 20

4.組裝得到的Contig中包含非mRNA信息,使用prodigal(https://github.com/hyattpd/Prodigal)對蛋白質編碼區進行預測:

$ prodigal -d $Sample_nul.fa -I $Sample_assembly/contig.fa -m -p meta

5.預測到每個個體樣品的基因序列後,利用CD-HIT(http://weizhongli-lab.org/cd-hit/)對所有樣品的基因進行聚類構建非冗餘基因集(gene catalogue.fa):

$ cat $Sample*_nul.fa > all_gene.fa

$ cd-hit-est -I all_gene.fa  -c 0.95 -aS 0.9 -M 0 -o all_gene_nr -T 40

$ awk 'BEGIN{a=1}{if($0~/>/){print ">Unigene_"a;a+=1}else{print $0}}' all_gene_nr.fa >gene catalogue.fa

6.樣本中基因的表達量通過將reads比對到基因集(gene catalogue.fa)獲得,通過將測序reads比對到基因序列上得到樣品中基因表達量(sample_fpkm.txt)。即使用RSEM(https://github.com/deweylab/RSEM)對 bowtie2(http://bowtie-bio.sourceforge.net/bowtie2/index.shtml)的比對結果進行統計,獲得每個樣本中每個基因的 reads counts,同時計算FPKM。FPKM(全稱 expected number of Fragments Per Kilobase of transcript sequence per Millions base pairs sequenced)是每百萬 fragments 中來自某一基因每千鹼基長度的fragments 數目,其同時考慮了測序深度和基因長度對fragments計數的影響,是對read counts進行標準化處理的目前最為常用的基因表達水平估算方法(Trapnell et al., 2010)。

$ rsem-calculate-expression -p 70 --bowtie2 --paired-end \

$Sample_rmRNA_R1.fq $Sample_rmRNA_R2.fq rsem.ref $Sample

$ for i in `$Sample*.genes.results`; \

do cut -f 1,7 $i >${i/gene.results/FPKM.txt}; \

done

$ python merge_metaphlan_tables.py $Sample*.FPKM.txt > all_sample_fpkm.txt (腳本下載連結:https://github.com/biobakery/MetaPhlAn/blob/master/metaphlan/utils/merge_metaphlan_tables.py)

7.使用diamond軟體將非冗餘的Unigenes 序列與 NCBI-NR 資料庫進行比對(設定閾值為e-value≤1e-5),採取最近公共祖先LCA(Lowest Common Ancestor)算法獲得基因序列的物種注釋信息:

$ diamond blastp –threads 20 -q Unigenes_pro.fa -d nr_*version.dmnd -o Unigenes_vs_nr_blt.txt --max-target-seqs 10 –evalue 1e-5 --outfmt 6 qseqid qlen sseqid stitle slen pident length mismatch gapopen qstart qend sstart send evalue bitscore

$ blast2lca -input Unigenes_vs_nr_blt.txt -o Unigenes_vs_nr_blt.tax -ms 50 -me 0.000001 -g2t gi_taxid-March2015X.bin

8.通過將基因序列和特定資料庫(如KEGG)進行比對,完成基因功能注釋。序列比對使用diamond(https://github.com/bbuchfink/diamond)軟體進行。

KEGG資料庫(https://pan.baidu.com/s/1jnulGNSQ3qDfoB3b76a0Dg,提取碼:jzal)

$ diamond makedb –in meta.pep -d meta.dmnd

$ diamond blastp -d meta.dmnd -q Unigenes_pro.fa -k 1 -p 50 -f 6 -o Unigenes_vs_kegg_blt.txt

結果分析

   通過和KEGG 資料庫中的KO資料庫進行比對,得到不同層次的基因功能分類(圖2)。以一種酸性土壤樣本為例,從KO level 1層次來看,土壤微生物的大部分活性基因與新陳代謝(Metabolism)相關,佔總體基因表達量的45.7%,其次為遺傳信息加工(Genetic information processing,8.5%),環境信息加工(Environmental information processing,9.6%)和細胞過程(Cellular processes, 8.2%)。KO level 2 層次上的基因功能分類如圖2。 從圖中可以看出,微生物新陳代謝相關的活動主要表現為能量代謝、碳水化合物代謝和胺基酸代謝;遺傳信息加工主要表現在蛋白翻譯;環境信息加工主要包括信號轉導和膜轉運;而細胞過程相關的基因主要參與了cellular community-eukaryotes和細胞遷移(cell motility)。

圖2.以酸性土樣本為例的土壤微生物活性基因在KEGG level2水平上的功能分類

土壤宏轉錄組研究的優點

1). 當與室內培養控制實驗和高通量測序結合使用時,可以估算群落中特定微生物正在進行的積極的轉錄過程。

2). 排除了死亡微生物細胞殘體,休眠體的影響。

3). 能夠捕捉土壤特定類群內部動態變化。

4). 直接評估土壤微生物活性,包括對於幹擾或者暴露等情況的響應。

致謝

本實驗得到國家自然科學基金項目(91951109)的資助。

參考文獻

1.Mettel, C., Kim, Y., Shrestha, P.M. and Liesack, W. (2010). Extraction of mRNA from soil. Appl Environ Microbiol 76: 5995-6000.

2.Peano, C., Pietrelli, A., Consolandi, C., Rossi, E., Tagliabue, L., De Bellis, G.D. and Landini, P. (2013). An efficient rRNA removal method for RNA sequencing in GC­rich bacteria. Microb Inform Exp 3:1.

3.Torre, A., Metivier, A., Chu, F., Laurens, L.M., Beck, D.A., Pienkos, P.T., Lidstrom, M.E., and Kalyuzhnaya, M.G. (2015). Genome-scale metabolic reconstructions and theoretical investigation of methane conversion in Methylomicrobium buryatense strain 5G(B1). Microb Cell Factories 14: 188.

4.Trapnell, C., Williams, B.A., Pertea, G., Mortazavi, A.,Kwan, G., van Baren, M.J., Salzberg, S.L., Wold, B.J., and Pachter,L. (2010).Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. Nat Biotechnol 28: 5.

猜你喜歡

10000+:菌群分析 寶寶與貓狗 梅毒狂想曲 提DNA發Nature Cell專刊 腸道指揮大腦

系列教程:微生物組入門 Biostar 微生物組  宏基因組

專業技能:學術圖表 高分文章 生信寶典 不可或缺的人

一文讀懂:宏基因組 寄生蟲益處 進化樹

必備技能:提問 搜索  Endnote

文獻閱讀 熱心腸 SemanticScholar Geenmedical

擴增子分析:圖表解讀 分析流程 統計繪圖

16S功能預測   PICRUSt  FAPROTAX  Bugbase Tax4Fun

在線工具:16S預測培養基 生信繪圖

科研經驗:雲筆記  雲協作 公眾號

編程模板: Shell  R Perl

生物科普:  腸道細菌 人體上的生命 生命大躍進  細胞暗戰 人體奧秘  

寫在後面

為鼓勵讀者交流、快速解決科研困難,我們建立了「宏基因組」專業討論群,目前己有國內外5000+ 一線科研人員加入。參與討論,獲得專業解答,歡迎分享此文至朋友圈,並掃碼加主編好友帶你入群,務必備註「姓名-單位-研究方向-職稱/年級」。PI請明示身份,另有海內外微生物相關PI群供大佬合作交流。技術問題尋求幫助,首先閱讀《如何優雅的提問》學習解決問題思路,仍未解決群內討論,問題不私聊,幫助同行。

學習16S擴增子、宏基因組科研思路和分析實戰,關注「宏基因組」

點擊閱讀原文下載PDF審稿,或瀏覽器直接訪問下載連結:http://210.75.224.110/github/MicrobiomeProtocol/04Review/201222/2003543HaiyanChu928814/Protocol2003543final.pdf

相關焦點

  • 宏基因組bining+宏轉錄組強強聯合
    採用宏基因組genome bining以及宏轉錄組的方法,發現並驗證新物種和新功能。通過功能宏基因組學的方法,研究者從酸性泥炭地中恢復了7株新的酸桿菌基因組草圖,這些酸桿菌都具有潛在的異化亞硫酸鹽(dsrAB, dsrC, dsrD, dsrN, dsrT, dsrMKJOP)或硫酸鹽呼吸(sat, aprBA, qmoABC和dsr)相關功能基因。令人驚訝的是,這些基因組也編碼了DsrL蛋白,迄今為止該基因只在硫氧化微生物中發現。
  • 什麼是組學?
    這些物質可以是核酸(DNA),脫氧核糖核酸(RNA),蛋白質(Protein)和化學分子(Chemical Molecular);根據物質的不同,這些組學分別稱為為宏基因組(Metagenome),宏轉錄組(Metatranscriptome),宏蛋白組(Metproteome)和代謝組(Metabolome)。
  • 一作解讀Microbiome:多維宏組學揭示複雜細菌群落間的相互關係
    香港大學張彤教授團隊與北京大學餘珂博士研究團隊,以生物降解菌群為研究模型,運用多維宏組學方法(宏基因組、宏轉錄組及目標性代謝組學聯合)解析混合微生物群落內細菌間協同代謝關係。研究證明,多維宏組學分析比單一宏組學數據更能對微生物群落有更深入和透徹的理解,可準確預測群落內微生物的共生或競爭等關係。本文建立了一個綜合的多維宏組學的分析體系,成功解譯BPA降解群落中微生物的代謝能力和相互作用。該論文所構建的多維宏組學分析流程不僅適用於環境工程體系中微生物相互關係的預測,同樣對其他自然環境或腸道微生物菌間相互關係的研究有啟示性作用。
  • 項目文章 | 轉錄組學+iTRAQ蛋白質組學揭示乾旱條件下木薯的轉錄後調控機理
    本研究作為木薯轉錄組學和蛋白質組學分析的首次研究,為乾旱脅迫下木薯的轉錄後調控提供了新的方向。與轉錄組分析的結果相似,在葉和根樣本中變化相同的差異蛋白極少(圖1B),說明乾旱脅迫對葉和根中的不同功能途徑起作用。這些結果在蛋白質組水平上提供了乾旱脅迫對木薯功能途徑影響解析。
  • (偽)從零開始學轉錄組(7):差異基因表達分析
    基本任務是得到差異分析結果,進階任務是比較多個差異分析結果的異同點。目錄原先三個樣本的HTSeq-count計數的數據可以在我的GitHub中找到,但是前面已經說過Jimmy失誤讓我們分析的人類就只有3個樣本, 另外一個樣本需要從另一批數據獲取(請注意batch effect),所以不能保證每一組都有兩個重複。
  • 想要「魔法消除」轉錄組不同批次樣本的差異?你要這麼辦...
    在進行轉錄組數據分析的過程中經常會遇到如下情況,單次實驗測序數據量不足,需要對多次實驗獲得的數據整合分析,或者利用公共資料庫中已有的數據,不同批次樣本間有差異怎麼辦?這個問題就涉及到了我們今天要介紹的批次效應。批次效應指樣品在不同的批次處理和測量時引入的生物狀態不相關的系統性的技術偏差。
  • 【NRM綜述】利用轉錄組學探究海洋原生生物的進化、生態和生理機制
    Caron【作者單位】美國南加州大學生物科學系亮點1、原生生物培養物種的轉錄組學研究結合自然群落的宏組學分析,增加了真核生物系統進化樹上原生生物的遺傳信息;2、原生生物轉錄組學研究提供了對原生生物與其他微生物和大型生物之間的適應和相互作用的有效了解途徑
  • 網課《腦神經的空間轉錄組分析》回放
    翻成中文,就是《人類背外側前額葉皮層轉錄組規模的空間基因表達》 在這張圖裡,左半邊是空間轉錄組的分析結果,右半邊是全轉錄組的分析結果,全轉錄組也就是傳統的RNA-seq。明顯可以看到,左半邊圖格子中的紅顏色要比右半邊圖格子的顏色深得多,也就是說,空間轉錄組相比於全轉錄組是更加敏感的分析手段。空間轉錄組的差異的顯著性要高許多。 那麼這個分析得到的一個結果,遺傳性的精神分裂症在第2層中有富集。
  • 基於RNA-seq的銀線草轉錄組分析
    本研究利用RNA-seq進行銀線草轉錄組測序分析,以期揭示其轉錄組信息特徵,為該藥用植物功能基因挖掘、次生代謝途徑解析及調控研究提供基礎數據。測序原始圖像數據經鹼基識別(base calling)轉化為序列數據原始序列(raw reads),經數據評估、過濾除雜和冗餘處理等質控得到高質量序列(clean reads),再利用Trinity做轉錄組de novo組裝。Trinity首先將具有一定長度重疊(overlap)的reads連成更長的片段,即得到的不含N的組裝片段作為unigene。
  • 希望組正式推出納米孔單細胞全長轉錄組測序分析服務
    作為國內三代測序服務的引領者,希望組在三代測序技術領域深耕多年,將長讀長與單細胞測序技術結合,開發出了完整的納米孔單細胞全長轉錄組實驗分析流程,打破用三代測序單細胞全長轉錄組建庫起始量高的技術壁壘,並於近日正式推出納米孔單細胞全長轉錄組測序分析服務。
  • 搞定轉錄組入門分析?必備技能看這裡
    隨著高通量測序技術的迅猛發展,轉錄組分析逐漸發展成為一項基礎的研究方法在生物學個領域得到廣泛的應用。在轉錄組分析入門的過程中,您是否遇到這樣的問題:看了一篇篇的入門乾貨,依然無從下手;因缺少數據分析的環境,空有一肚子的理論無法實踐;按照教程一步步實踐,可就是無法產生相同的結果;面對種類繁多的數據挖掘工具,應該怎麼選擇?
  • Nature綜述:Rob Knight帶你分析微生物組數據(2020版)
    隨著這些方法的進一步發展,和宏基因組學、宏轉錄組學、宏蛋白質組學以及代謝組學數據相結合,實驗設計和適當樣本量的選擇也都得到了合理的改進。對於具體的實驗設計,建議多閱讀同行高水平文章中有類似樣本類型和預期結果的相關研究。下面我們對微生物組實驗設計的一些重要問題進行了擴展。
  • 分析混合微生物群落內細菌協同代謝關係,「代謝組+」聯合助力!
    宏基因組學(metagenomics)恢復菌群中主要微生物的功能潛能以預測其參與的生理過程;2). 宏轉錄組學(metatranscriptomics)分析特定時期主要細菌的表達譜並推測其在不同階段激活的代謝通路;3).
  • 轉錄組學+iTRAQ蛋白質組學揭示乾旱條件下木薯的轉錄後調控機理
    通過轉錄組測序技術和iTRAQ標記定量蛋白質組學聯合研究,在木薯葉片和根中分別鑑定出1242/715個差異表達基因(DEGs)和237/307個差異表達蛋白(DEPs)。本研究作為木薯轉錄組學和蛋白質組學分析的首次研究,為乾旱脅迫下木薯的轉錄後調控提供了新的方向。棕色箭頭和藍色箭頭分別代表上調和下調的DEGs/DEPs。
  • ...小紅/秦偉捷團隊合作報導,大規模尿液樣本的糖基化組學分析新策略
    運用該集成數據處理策略,作者共在36個健康的人類尿液樣本中鑑定出1300個完整的O-糖肽,缺失數據量減少了30%-40%。這是目前尿O-糖蛋白組學的最大數據集,證明了這種新策略在大規模臨床研究中的應用潛力。相關研究成果發表在專業學術期刊Analytical Chemistry上。
  • 2019微生物組—宏基因組分析專題培訓開課啦!
    背景:國際微生物組、中國微生物組計劃研究對象:人、動物、植物、環境研究方法:培養組學、擴增子、宏基因組、宏轉錄組、宏蛋白組、宏代謝組、宏基因組關聯分析、宏表觀組……宏基因組學的研究熱點:培養組、腸菌與疾病、宏基因組關聯分析(MWAS)、多組學聯合分析……測序發展史與原理樣品製備、實驗重複和測序數據量的選擇宏
  • Nature Protocols:整合宏基因組、代謝組和表型分析的的計算框架
    、解讀困難;分析的核心思想是降維:代謝組和微生物組物種通過數據驅動的聚類或分箱法降維;微生物組功能組成基於知識驅動如KEGG層級分類法降維;再篩選與表型顯著相關的數據特徵關聯分析;研究人員可以整理多組學和表型數據,獲得出版級關聯分析結果圖表,快速建立宿主和微生物組與疾病嚴重程度和治療結果間的潛在聯繫;本計算框架由R腳本編寫,可在個人電腦上1小時完成分析。
  • Nature子刊:整合宏基因組、代謝組和表型分析的的計算框架
    、解讀困難;分析的核心思想是降維:代謝組和微生物組物種通過數據驅動的聚類或分箱法降維;微生物組功能組成基於知識驅動如KEGG層級分類法降維;再篩選與表型顯著相關的數據特徵關聯分析;研究人員可以整理多組學和表型數據,獲得出版級關聯分析結果圖表,快速建立宿主和微生物組與疾病嚴重程度和治療結果間的潛在聯繫;本計算框架由R腳本編寫,可在個人電腦上1小時完成分析。
  • 基於宏轉錄組技術的水禽和岸禽病毒宿主特異性和關聯性研究
    了解病毒才能更好地預防病毒的入侵,本次推薦一篇基於宏轉錄組技術的水禽和岸禽病毒宿主特異性和關聯性研究。該研究深入了解病毒群落特點,證明禽類病毒群落的多樣性和複雜性,為以後進一步探索禽類病毒、監控野生禽類病毒情況提供了參考。
  • 如何用好公開資料庫多種組學數據?
    >雜誌上的一篇文章"Multi-omics analysis based on integrated genomics, epigenomics and transcriptomics in pancreatic cancer".在文章中作者分析了161例胰腺癌樣本的CNV、MET、RNA-Seq(mRNA)表達水平以及相應的臨床信息。