【生信篇】基因功能預測之PICRUSt

2021-01-19 ASBIOS
 PICRUSt全稱為PhylogeneticInvestigation of Communities by Reconstruction of Unobserved States,由Langille等人於2013年開發,文章發表在Nature Biotechnology上(Langille et al. 2013)。它是最早被開發的基於16S rRNA基因序列預測微生物群落功能的工具,包括在線版(http://huttenhower.sph.harvard.edu/galaxy/root?tool_id=PICRUSt_normalize)和基於MacOS X或Linux系統的下載安裝版(http://picrust.github.io/picrust/install.html#install)。conda install -c bioconda picrustdownload_picrust_files.py# 手動安裝準備環境pip installnumpy==1.5.1sudo apt-get install libhdf5-devsudo apt-get install python-h5py##如果運行腳本遇到numpy相關的問題,更新幾個相關的庫pip install --upgrade numpy scipy pandaswgethttps://github.com/picrust/picrust/releases/download/1.1.0/picrust-1.1.0.tar.gztar -xzf picrust-1.1.0.tar.gz#下載好的 **16S拷貝數** 及ko文件放在picrust/data文件夾wgethttp://kronos.pharmacology.dal.ca/public_files/picrust/picrust_precalculated_v1.1.3/13_5/16S_13_5_precalculated.tab.gzwget http://kronos.pharmacology.dal.ca/public_files/picrust/picrust_precalculated_v1.1.3/13_5/ko_13_5_precalculated.tab.gzwget http://kronos.pharmacology.dal.ca/public_files/picrust/picrust_precalculated_v1.1.3/13_5/cog_13_5_precalculated.tab.gzsudo python setup.py installwgetftp://greengenes.microbio.me/greengenes_release/gg_13_5/gg_13_5_otus.tar.gztar xvzfgg_13_5_otus.tar.gz./usearch10-usearch_. /seqs_usearch.fa -db gg_13_5_otus/rep_set/97_otus.fasta -otutaboutresult/gg135_otu_table.txt -biomout result/gg135_table.biom -strand plus -id0.97 -threads 10biom convert -iresult/gg135_otu_table.txt -o result/gg135_otu_table.biom--table-type="OTU table" --to-jsonnormalize_by_copy_number.py-i result/gg135_table.biom -o normalized_otus.biom # 用usearch的biom結果會報錯normalize_by_copy_number.py-i result/gg135_otu_table.biom -o result/normalized_otus.biom -cpicrust/picrust/data/16S_13_5_precalculated.tab.gzpredict_metagenomes.py-i result/normalized_otus.biom -o result/metagenome_predictions.biom -cpicrust/picrust/data/ko_13_5_precalculated.tab.gzbiom convert -iresult/metagenome_predictions.biom -o result/metagenome_predictions.txt--table-type="OTU table" --to-tsvsed -i '/#Const/d;s/#OTU //g' result/metagenome_predictions.txt# 預覽KO表,和OTU表類似,只是OTU變為了KOlessresult/metagenome_predictions.txtwc -lresult/metagenome_predictions.txt# -c指輸出類型,有KEGG_Pathways,COG_Category(2級),RFAM三種,-l是級別categorize_by_function.py-i result/metagenome_predictions.biom -c KEGG_Pathways -l 1 -oresult/metagenome_predictions.L3.biomcategorize_by_function.py-i result/metagenome_predictions.biom -c KEGG_Pathways -l 2 -oresult/metagenome_predictions.L3.biomcategorize_by_function.py-i result/metagenome_predictions.biom -c KEGG_Pathways -l 3 -oresult/metagenome_predictions.L3.biomCOGcategorize_by_function.py -iresult/metagenome_predictions.biom -c COG_Pathways -l 1 -oresult/metagenome_predictions.L3.biomcategorize_by_function.py-i result/metagenome_predictions.biom -c COG_Pathways -l 2 -oresult/metagenome_predictions.L3.biombiom convert -iresult/metagenome_predictions.L3.biom -o result/metagenome_predictions.L3.txt--table-type="OTU table" --to-tsvsed -i '/#Const/d;s/#OTU //g' result/metagenome_predictions.L3.txt# 查找指定通路的豐度情況(可選,用於具體查看某個KO)metagenome_contributions.py-i result/normalized_otus.biom -l K00001,K00002,K00004 -oresult/ko_metagenome_contributions.tab

「 往期回顧 」

【Nature Communication】16S rRNA基因全長測序分析微生物菌群

【生信篇】Qiim2使用(二)

【市場活動】安山生物擴增子(16S/18S/ITS)測序分析服務

【生信篇】Qiime2使用(一)

【ISME】多組學結合探索海洋微生物及其功能

【軟體推薦】GraphPad Prism 7.0繪圖軟體應用

【Nature】腸道菌群基因結構變異關聯宿主健康

【客戶文章】安山生物協助客戶發文Environment International

【Science】宏基因組研究發現奶牛瘤胃生物質降解基因和基因組

       安山(天津)生物科技有限公司位於天津市濱海新區中關村科技園,這裡風景優美,具有良好的生態環境。安山生物專注於新一代基因組學技術在生命科學研究和人類醫學健康領域的產業化應用。為生命科學科研工作者提供系統化解決方案,同時努力發展臨床醫學及健康相關領域精準基因檢測、輔助診療業務。安山生物立足於先進的基因組學技術,提供新一代測序技術服務,已與高校院所和研發機構開展科研合作,旨在發展基因銀行,建立集科研服務,基因儲備檢測及個性化用藥指導為一體的綜合平臺。歡迎有志之士參與支持,共謀發展。

相關焦點

  • PICRUSt功能預測又被爆出新的問題啦!
    預測的基因同宏基因組數據進行分析發現除了人類數據重合度很高之外,其他都只有一部分可以重合基於不同功能的基因在功能預測和宏基因之間相關性不同歡迎加入微生信生物討論群,掃描下方二維碼添加小編微信,小編帶你入夥啦,大牛如雲,讓交流變得簡單。
  • PICRUSt2 使用指南
    ,從而進一步探究其功能變化。目前,PICRUSt 已經升級到 PICRUSt2,對比第一版,PICRUSt2 用於預測的參考基因組資料庫擴大了 10 倍以上,兼容序列去噪方法輸出的結果(如 DADA2 ),除了分析 16s 序列外還可對真菌 ITS 和 18S rRNA 基因序列進行功能預測。同時整合了部分 HUMAnN2 的方法,可以輸出 MetaCyc 功能預測結果。
  • PICRUSt 2——更加強大的菌群功能預測工具
    常見的功能研究方法可分為三類:1.基於物種進行功能預測2.功能基因擴增分析3.宏基因組、宏轉錄組等全基因組擴增手段。基於物種進行功能預測的原理(圖2),簡單說來就是將測序、歸類後得到的OTU信息輸入到預測軟體中,預測軟體將OTU序列信息與已測序的微生物基因組資料庫中物種進行比對,將OTU注釋為對應物種,並根據OTU的豐度輸出功能類型以及對應功能豐度。
  • PICRUSt 2——更加強大的菌群功能預測工具
    這種功能分析方法成本低,只要有16s的測序數據就可以開展,不需要額外的數據進行補充。基於物種進行功能預測的原理(圖2),簡單說來就是將測序、歸類後得到的OTU信息輸入到預測軟體中,預測軟體將OTU序列信息與已測序的微生物基因組資料庫中物種進行比對,將OTU注釋為對應物種,並根據OTU的豐度輸出功能類型以及對應功能豐度。
  • PICRUSt功能預測和GeoChip檢測結果的比較
    前段時間,一篇關於PICRUSt功能預測和GeoChip檢測結果的比較性文章被發表在F1000Research上。這雜誌看起來有點特別啊,小編這裡就先簡單介紹一下這篇雜誌。F1000Research是一個涵蓋所有生命科學領域的全球開放獲取期刊。在獲得編輯部基本的科學性以及完整性審核後,未經審稿人審稿的論文會立即被刊發在網站上。
  • 微生物多樣性PICRUSt2功能預測雲分析來了
    微生物多樣性測序數據主要基於物種層面進行微生物群落分析,而功能預測軟體,可以幫我們預測微生物的潛在功能,近年來,由於PICRUSt等預測軟體的加持,為我們文章增加了不少亮點,在高分文章中屢見不鮮。相較早期版本即PICRUSt1,PICRUSt2做了全面的優化和改進,功能預測精度大幅提升:1)將待預測的OTU代表序列置於軟體中已有的系統發育樹中,而不是直接對OTU序列進行分類學注釋;2)不再基於GreenGene 16S資料庫進行功能預測,其用於預測的參考基因組資料庫相比先前也已擴大了10倍以上,除了能對細菌或古菌16S
  • 功能基因組學的預測網絡模型識別炎症性腸病的調節因子
    題目英文:A functional genomics predictive network model identifies regulators of inflammatory bowel disease題目中文:功能基因組學的預測網絡模型識別炎症性腸病的調節因子
  • miRNA靶基因預測軟體__miRWalk 3.0
    是一款集靶基因預測、miRNA與基因互作、靶基因富集的綜合性分析工具,當前被文獻引用超過96篇,網址:http://mirwalk.umm.uni-heidelberg.de
  • 突變對蛋白功能影響預測
    基因突變對於基因功能的影響是多種多樣的。有的突變會改變蛋白的功能,這類改變蛋白功能的突變對於整個基因而言則更加重要一些。我們在腫瘤治療當中,有的藥物是基因蛋白功能起作用的。如果因為蛋白功能的改變其藥物可能就發揮不出原有的作用了。
  • 動物所建立靈長類特異新基因資料庫並系統預測新基因功能
    靈長類特異乃至人特異新基因起源是推動人類表型演化的重要推動力,但只有少量新基因功能已知。近年來基因編輯技術和類器官技術的發展使得系統揭示新基因在人之所以為人這一演化過程中的貢獻成為可能。然而,由於基因年齡推斷方法的差別以及較低的新基因注釋質量(很難區分新蛋白編碼基因和假基因),文獻中已經發表的靈長類特異新基因(PSG)數據集相互之間差別極大。
  • MagicHand雲平臺|物種與功能網絡與模型預測分析
    今天給大家介紹雲平臺宏基因組個性化分析之一:物種與功能網絡與模型預測分析。物種與功能網絡與模型預測分析物種與功能網絡與模型預測分析是針對特定的研究對象和目的,對特定的樣品及其數據集進行關聯與模型預測分析,進一步挖掘數據中的有效信息。
  • 靶基因預測分析已上線
    為此我們特地推出在線靶基因預測雲分析,幫老師排憂解難!(雲平臺地址:https://www.omicstudio.cn/analysis/target_gene/create?analysis_id=4)該工具選用認知度較高的動物靶標預測軟體(Targetscan和Miranda)及植物靶標預測軟體(PsRobot),提供我司靶標預測庫供老師選擇,僅需上傳需預測的miRNA序列(15-26nt)即可一鍵分析,方便快捷。當然,它還不止有這些功能,接下來由我簡單介紹下該工具。
  • 細菌基因組信息分析與解讀專題系列(二)——細菌基因組注釋Ⅰ(基因預測和ncRNA)
    要解讀隱藏在這些字符和排列中的生命含義,就需要經過一個根據已有知識進行預測的注釋過程。 基因組注釋(Genome annotation)是利用生物信息學方法和工具,對基因組所有基因的生物學功能進行高通量注釋,是當前功能基因組學研究的一個熱點。基因組注釋的研究內容包括基因識別、基因組功能注釋,而基因組功能注釋包括基因預測、ncRNA、重複序列、CRISPR預測、分泌蛋白預測等。
  • 微生物群落基於KEGG預測功能的豐度分布圖繪製
    功能預測在基於16S rRNA擴增子的研究中,因為了解微生物群落功能的需要,我們經常會使用一些軟體工具對16S rRNA擴增子數據進行功能預測,比如PICRUSt2。這些功能預測的結果大多是基於KEGG資料庫,KEGG是一個整合了基因組、化學和系統功能信息的資料庫。把從已經完整測序的基因組中得到的基因與更高級別的細胞、物種和生態系統水平的系統功能關聯起來是KEGG資料庫的特色之一。
  • 非瘟疫苗研發之困:過半基因功能未知,已知基因功能研究不足
    「國外研究機構先後嘗試了滅活疫苗、亞單位疫苗、核酸疫苗、病毒活載體疫苗、減毒活疫苗和基因缺失疫苗等各種類型疫苗的研發,但最終的效果差強人意。」中國農業科學院哈爾濱獸醫研究所獸醫生物技術國家重點實驗室研究員仇華吉說。由於沒有安全有效的商品化疫苗及治療手段,非洲豬瘟的防控主要依靠提高生物安全措施及早期檢測和嚴格的撲殺等措施。
  • 團花樹 NcIRX9 基因在木聚糖生物合成中的功能保守性
    本期推薦論文研究擬證明團花樹 NcIRX9 基因具有和擬南芥 AtIRX9 基因相似的生物學功能,都參與到木聚糖在木本植物團花樹 中,NcIRX9 基因是否存在功能分化。本研究探索我國南方速生樹種團花樹 NcIRX9 基因及其在木聚糖合成中的功能。
  • Current Opinion in Structural Biology:從蛋白質序列到功能的預測
    2015年5月8日訊/生物谷BIOON/ --隨著測序技術的飛速發展,大量的基因被揭示,大量的蛋白質序列也得到了解析。例如,只有不到1%的蛋白質序列有已知的功能。如果我們能夠利用計算生物學的方法,大量註解這些序列信息,就能夠積累很多對於蛋白質結構的認識,最終達到從量變到質變的飛躍。來自美國紐約霍華德醫學中心的科學家們討論了基於蛋白質功能注釋結構的新方法。在以前,已有的預測方法都是基於序列的同源性,進化關係和在基因組的位置來預測序列對應的模板及其功能。
  • GeneMark-ES:真核生物編碼基因預測軟體
    GeneMark-ES軟體用於預測真核生物中的蛋白編碼基因,和其他預測基因結構的軟體不同,它採用的是非監督算法,可以不依賴訓練集進行預測。基本用法如下gmes_petap.pl --ES  --cores 10--sequence genome.fagmes_petap.pl本身整合了geneMark-ES和geneMark-ET兩個功能,genemark-ES用於基因組數據的預測,geneMark-ET用於轉錄組數據的預測
  • 用於評估產生功能喪失等位基因sgRNA的評分系統
    用於評估產生功能喪失等位基因sgRNA的評分系統 作者:小柯機器人 發布時間:2020/6/9 18:21:00 奧地利維也納生物中心Ulrich Elling和Johannes Zuber研究小組合作取得一項新成果。
  • PICRUSt不靈啦?別慌,它一直都不咋靈~
    PICRUSt作為利用16S進行功能預測的方法,使用非常廣泛。但是其利用Greengene作為參考資料庫,由於Greengene更新緩慢,在如今測序技術發展一日千裡、成本不斷下降、新序列的出現日新月異的條件下,其準確性一直都受到質疑(沒有文獻參考,起碼受到我的質疑0.0)。