R語言將微生物OTU表標準化為百分比形式

2021-12-09 土壤微生物組

收錄於話題 #數據分析和可視化 93個內容

####R語言將微生物OTU表標準化為百分比形式

otu<-read.csv("D://test/test_otu.csv",row.names = 1)

#連結:https://pan.baidu.com/s/1KpV3jhlcEf8DakZFKjsxmg 提取碼:qxxd

#統計樣品序列數總和,序列並不一致,因此需要標準化。

colSums(otu)

#36717 55257 34664 45064 45774 26558 36491

#抽平由於只能局限於整數的計算,會導致數據的丟失,尤其是樣品的序列數相差幾倍甚至10倍以上的時候。

#通過標準化為百分比和百萬分比(CPM:counts per million)可以數據的0丟失

Len<-as.numeric(length(rownames(otu)))

Row<-as.numeric(length(colnames(otu)))

id<-rep(colSums(otu),Len)

#生成OTU序列和的矩陣

bb<-matrix(id, nrow = Row, ncol = Len)

bb<-as.data.frame(t(bb))

#計算百分比相對豐度

rarefy_otu<-otu/bb*100

colSums(rarefy_otu)

#經過標準化後,每個樣品的序列之和都轉化為了100 100 100 100 100 100 100 100。

write.csv(rarefy_otu,file="D://taxonomy_rarefy.csv")

相關焦點

  • #R語言繪製高顏值三元圖(差異OTU展示)
    #R語言繪製高顏值三元圖(差異OTU展示)#三元圖分析可展示微生物群落差異OTU的豐度(點大小表示
  • 用R語言畫柱狀圖
    詳細的流程如下:數據準備,形如下圖:sewd("C:/Rwork")#設置工作目錄mycol<-c(119,132,147,454,89,404,123,529,463,104,552,28,54,84,256,100,558,43,652,31,610,477,588,99,81,503,562,76,96,495) #定義顏色,mycol
  • R語言 | randomForest包的隨機森林回歸模型以及對重要變量的選擇
    首先來看一篇與植物根系微生物組有關研究,將文中涉及到隨機森林回歸的部分內容節選出來以幫助大家理解。Edwards等(2018)分析了來自兩個地區(加利福尼亞州、阿肯色州)以及三個連續種植季(2014、2015、2016)的水稻根系微生物組,意在闡述水稻根系微生物群落的時間動態特徵,並解釋驅動微生物群落組建的成因。
  • 機器學習:R語言實現隨機森林
    最後將各決策樹的分類結果匯總,所有預測類別中的眾數類別即為隨機森林所預測的該對象的類別,分類準確率提升。本篇使用微生物群落研究中的16S擴增子測序數據,展示R包randomForest中的隨機森林方法。註:randomForest包根據經典決策樹生成隨機森林;如果期望根據條件推斷樹生成隨機森林,可使用party包。當預測變量間高度相關時,基於條件推斷樹的隨機森林可能效果更好。
  • ​R語言計算群落多樣性分析中常見Alpha多樣性指數
    本篇以某16S高通量測序所得細菌群落數據為例,簡介使用R計算幾種在微生物群落分析中常用的Alpha多樣性指數。 本篇示例文件、R腳本等,已上傳至百度盤,提取碼xim2。https://pan.baidu.com/s/1fUiG1WMK6T8cpAQg4trXDg 網盤文件「otu_table.txt」為某16S擴增子測序所得OTU豐度表格,可以理解為物種豐度表。表中每一列為一個樣本,每一行為一種OTU,交叉區域為每種OTU在各樣本中的豐度。
  • 一文學會網絡分析——Co-occurrence網絡圖在R中的實現
    第二種數據格式是鄰接矩陣,物種間相關性計算得到的通常為此種形式。第三種為邊列表(edgelist),共兩列數據,分別代表網絡內的節點名稱,每一行代表這兩個節點間存在著聯繫。="fdr",alpha=.05)occor.r = occor$r # 取相關性矩陣R值occor.p = occor$p # 取相關性矩陣p值# 確定物種間存在相互作用關係的閾值,將相關性R矩陣內不符合的數據轉換為0occor.r[occor.p>0.05|abs(occor.r)<0.6] = 0 # 構建igraph對象
  • 根據OTU表繪製韋恩圖
    之前有觀眾老爺問怎麼根據OTU表來繪製venn圖,覺得做微生物分析其它朋友應該也有此需求,今天就通過一篇文檔來詳細介紹一下,後臺回復2021-6-14獲取本文數據及代碼,喜歡的小夥伴歡迎掃描文末二維碼加入我的交流群,更多精彩內容為您而準備加載R包library(tidyverse)
  • R語言教程:使用Phyloseq包進行微生物群落多樣性分析
    在本教程中,我們將學習如何導入OTU表和samplemetadata(實驗設計等)導入到R Phyloseq包(更多詳細也可閱讀本公眾號之前的文章「如何將QIIME2輸出的數據導入R中使用Physoseq進行後續分析」)。我們將執行一些基本的探索性分析,包括檢查我們的樣品的分類組成情況並將使用不同的排序方法可視化樣品之間的差異。最後,我們還將估計樣本的α多樣性(豐富度和均勻度)。
  • Nature子刊經典網絡圖在R中的繪製,網絡模塊性可視化
    ,通過構建微生物網絡的功能模塊,表明了微生物互作網絡複雜性的提高能夠促進生態系統功能。")source("CorrDF.R")source("cor.mtest.R")## 進行相關分析aa <- rcorr(t(otu[1:500,6:14]), type=c("spearman"))## Create data frame of co-occurring OTUsnet <- CorrDF
  • 微生物門類堆疊柱狀圖-衝擊圖-在R4.0更新版本
    寫在前面2020年12月 在R4.0 更新後,我之前的barMainplot函數中衝擊圖部分不能很好地運行,是由於dplyr版本更新後產生的問題,我將這部分做了更新
  • R語言微生物群落數據分析:從原始數據到結果(No2)
    == "Lactobacillales")plot_abundance(psOrd, Facet = "genus", Color = NULL)qplot(sample_data(ps0)$age, geom = "histogram") + xlab("age")qplot(log10(rowSums(otu_table
  • R語言中獲取矩陣中元素的幾種形式
    在上一篇文章中,小編介紹了R語言中創建矩陣的幾種形式。今天,我們再來探討一下如何訪問矩陣中的元素。在R語言中獲取矩陣中的元素主要有以下幾種形式:獲取矩陣中所有的元素值只要使用矩陣名就可以獲取整個矩陣中的所有元素。
  • R語言|採用三元圖展示三種處理的共有OTU/菌群
    土壤中的微生物群落提供了廣泛的生態系統服務。在小範圍內,由動物或植物活動形成的土壤中富含營養的熱點是微生物群落組成及其功能模式的重要驅動因素。然而,在底土中,具有不同生活方式的微生物的空間異質性迄今很少被考慮。
  • R語言從入門到精通:Day10-R語言統計入門代碼大全
    我們一波了  到目前為止,R語言的數據操作和基礎繪圖部分已經講解完畢,換句話說,大家應該已經能將數據導入R中,並運用各種函數處理數據使其成為可用的格式,然後將數據用各種基礎圖形展示。完成前面這些步驟之後,我們接下來要探索數據中變量的分布以及各組變量之間的關係。
  • r語言work_r語言work函數 - CSDN
    R的源起R是S語言的一種實現。S語言是由 AT&T貝爾實驗室開發的一種用來進行數據探索、統計分析、作圖的解釋型語言。最初S語言的實現版本主要是S-PLUS。S-PLUS是一個商業 軟體,它基於S語言,並由MathSoft公司的統計科學部進一步完善。
  • R語言:用R計算各種統計值
    BioNews,專注於報導生命科學領域相關新聞,長按下方二維碼即可關注"BioNews"(id : iBioNews)目錄:求極差(range)做頻數分布表和頻數分布圖(coefficient of variance)正態分布(normal distribution)標準正態分布(standard normal distribution)使用R語言的內建實例數據框:faithfulhead(faithful)## eruptions waiting## 1 3.600
  • r語言有什麼優劣勢及R語言的未來發展趨勢_R語言在現實中的應用
    「我之所以喜愛R語言,是因為它易於從計算機科學角度出發實現編程,」Peng表示。而R語言隨時間推移正呈現出愈發迅猛的發展態勢,並成為能夠將不同數據集、工具乃至軟體包結合在一起的膠水型語言,Peng解釋道。 「R語言是創建可重複性及高質量分析的最佳途徑。