普氏分析結果可視化--物種與環境、物種與物種、物種與功能關聯分析

2021-02-24 Glioma

在微生物群落研究的過程中,我們經常需要評估微生物群落結構與環境因子整體之間是否具有顯著的相關性,此時,通常使用的方式是Mantel test和普氏分析

當然除了分析群落結構與環境因子的相關性之外,這兩個分析還可以用於分析同一樣品不同類型微生物群落之間的相關性,比如同一樣品的稀有和豐富物種或者同一樣品細菌和真菌群落結構的相關性。

不同微生物群落之間,該分析更多的還是用於分析微生物群落組成結構與其它功能基因組之間的關係,比如細菌組成結構與抗生素抗性組的相關性。

最後還有一種不太常用的用法,就是分析配對的兩種不同類型樣品微生物群落的相關性,比如河流或海洋同一位置水體和沉積物細菌群落組成結構的相關性,從而分析這兩種關聯樣品類型中微生物群落的轉移。

這兩種方法的具體原理我這裡就不講了,網上有很多,感興趣的朋友可以自行搜索一下,本推文主要介紹分析的實現方法以及對結果可視化的美化。

輸入數據

既然是評估兩組數據的相關性,那麼輸入數據就是兩個數據表,分別對應要分析的兩組數據,本推文已一套樣本的細菌群落豐度數據及其對應的環境因子數據為例。

⚠️無論分析何種數據,兩個數據表格的樣品均要一一對應

數據的格式如下,就是普通的寬格式的表格,第一行和第一列分別對應樣本和物種/環境因子,文件為制表符分割的txt格式。

注意行為樣本還是列為樣本並不重要,最終分析的時候是行為樣本,至少輸入數據後注意是否進行轉置即可。

Mantel test和普氏分析

這裡需要使用「vegan」包,首先載入該分析包,並將待分析數據導入。

在進行Mantel test和普氏分析之前,需要先對輸入的數據計算其樣本間的距離,一般物種組成數據使用bray-curtis距離,而環境因子數據使用歐式距離,具體代碼如下:

library(vegan)

data <- read.csv("class.txt", head=TRUE,sep="\t",row.names = 1)
data <- data[which(rowSums(data) > 0),]
data <- t(data)
s.dist <- vegdist(data,method = "bray")

data <- read.csv("environment.txt", head=TRUE,sep="\t",row.names = 1)
r.dist <- vegdist(data)

隨後進行Mantel test

mantel(s.dist,r.dist)

這裡注意記錄結果,主要是Mantel statistic r和Significance兩個數值

默認是使用pearson相關性,也可以根據情況使用spearman相關性。

mantel(s.dist,r.dist,method = "spearman")

在進行普氏分析之前,需要先對兩個數據進行降為分析,這裡使用的是NMDS,也可以使用PCoA。

mds.s <- monoMDS(s.dist)
mds.r <- monoMDS(r.dist)

隨後進行普氏分析,並計算結果顯著性。

pro.s.r <- procrustes(mds.s,mds.r)
protest(mds.s,mds.r)

注意記錄結果,主要是Procrustes Sum of Squares (m12 squared)和Significance兩個數值

結果可視化

接下來使用「ggplot2」包進行結果的可視化,首先載入繪圖包並建立繪圖數據。

library(ggplot2)
Y <- cbind(data.frame(pro.s.r$Yrot), data.frame(pro.s.r$X))
X <- data.frame(pro.s.r$rotation)
Y$ID <- rownames(Y)

之後開始繪圖。

p <- ggplot(Y) +
geom_segment(aes(x = X1, y = X2, xend = (X1 + MDS1)/2, yend = (X2 + MDS2)/2),
arrow = arrow(length = unit(0, 'cm')),
color = "#B2182B", size = 1) +
geom_segment(aes(x = (X1 + MDS1)/2, y = (X2 + MDS2)/2, xend = MDS1, yend = MDS2),
arrow = arrow(length = unit(0, 'cm')),
color = "#56B4E9", size = 1) +
geom_point(aes(X1, X2), fill = "#B2182B", size = 4, shape = 21) +
geom_point(aes(MDS1, MDS2), fill = "#56B4E9", size = 4, shape = 21) +
theme(panel.grid = element_blank(),
panel.background = element_rect(color = 'black', fill = 'transparent'),
legend.key = element_rect(fill = 'transparent'),
axis.ticks.length = unit(0.4,"lines"), axis.ticks = element_line(color='black'),
axis.line = element_line(colour = "black"),
axis.title.x=element_text(colour='black', size=14),
axis.title.y=element_text(colour='black', size=14),
axis.text=element_text(colour='black',size=12)) +
labs(x = 'Dimension 1', y = 'Dimension 2', color = '') +
labs(title="Correlation between community and environment") +
geom_vline(xintercept = 0, color = 'gray', linetype = 2, size = 0.3) +
geom_hline(yintercept = 0, color = 'gray', linetype = 2, size = 0.3) +
geom_abline(intercept = 0, slope = X[1,2]/X[1,1], size = 0.3) +
geom_abline(intercept = 0, slope = X[2,2]/X[2,1], size = 0.3) +
annotate('text', label = 'Procrustes analysis:\n M2 = 0.8358, p-value = 0.035\nMantel test:\n r = 0.1703, p-value = 0.04',
x = -1.5, y = 1.2, size = 4,hjust = 0) +
theme(plot.title = element_text(size=16,colour = "black",hjust = 0,face = "bold"))

然後保存圖片。

png("proc.png",width = 3600,height = 3200,res = 600)
p
dev.off()

pdf(file = "prco.pdf",width = 6,height = 5.4)
p
dev.off()

⚠️因為我懶得做一個公式連結自動標註統計學檢驗結果,所以是手動記錄結果只手自己輸入的,因此更換數據之後,在annotate那個代碼裡,你們要自己修改內容以及文本插入的坐標軸位置。

關注公眾號「紅皇后學術」,後臺回復「普氏分析」獲取示例數據和繪圖代碼!

另感謝杰哥提供了一個基本的繪圖代碼🙏!!

擴展閱讀

相關焦點

  • MagicHand雲平臺|物種與功能網絡與模型預測分析
    今天給大家介紹雲平臺宏基因組個性化分析之一:物種與功能網絡與模型預測分析。物種與功能網絡與模型預測分析物種與功能網絡與模型預測分析是針對特定的研究對象和目的,對特定的樣品及其數據集進行關聯與模型預測分析,進一步挖掘數據中的有效信息。
  • 美格基因|擴增子物種群落分析
    一、物種群落結構分析1、共有及特有OTU統計分析1)OTU 數目統計基於 OTU_table 統計 No. of OTUs,將 OTU 序列數大於 0 的全部記為 1,並對每列數求和,即為每個樣本的OTU 總數。
  • 物種網絡構建與關鍵物種篩選
    |撰文:阿拉雷在過往的微生物群落研究中,闡明群落中物種與物種間存在的關聯並非一件簡單的事情,難點在於群落中的屬水平物種數量通常能達到幾百甚至上千,如此龐大數量的群落再加上微生物間錯綜複雜的聯繫,使得找出目標微生物間的關聯變得很困難。
  • 物種起源——達爾文的偉大發現
    當來到加拉帕戈斯群島,達爾文發現每個孤立的島嶼上都有一些不同的物種,這是一件奇怪的事情。他將在加拉帕戈斯群島發現的物種進行了詳細的記錄,並帶回一些標本,回到英國後,通過分析達爾文帶回來的物種記錄和標本,人們發現加拉帕戈斯群島上90%以上的爬行動物、50%的陸禽和45%的高等植物,都是地球上其他地方所沒有的。
  • 外來入侵物種是指 外來入侵物種什麼意思
    目前,外來物種入侵已成為全球性的環境問題,比如很多新病蟲害造成農業損失,因為改變生態系統所引發的一系列水土、氣候問題,那麼你知道外來入侵物種是指什麼嗎?外來入侵物種入侵途徑有哪些?趕緊了解一下吧!
  • 《物種起源》-達爾文的物種演化理論力作
    選擇方向非常明確,因此千百年來就馴化出了寥寥幾種牛,而且不同地區的牛即便是在歷史上從未雜交過,馴化出的結果也都差不多,日本的和牛與澳大利亞的肉牛在外形上差別並不大。而養狗的目的則是多種多樣,打獵、看家、牧羊、拉雪橇,乃至作戰等等,每一種功能都對狗有著不同的要求,或強壯、或耐久、或嗅覺靈敏、或頭腦聰明,人們會出於不同的目的來篩選狗的後代,於是狗就比牛更加多種多樣。
  • 雲南再次發現新物種,為何自然界頻繁出現新物種?環境正在變好?
    近段時間根據云南自然保護區報告來看,雲南地區發現了兩個全新的植物種類,它們一個名字叫紫花黃藥,另一個則叫大葉可愛花,我們只聽它們的名字,會認為它們長相一定特別美麗可愛,實際上這已經不是第1次在雲南發現新物種出現,要知道今年極端惡劣的環境下,能夠出現新物種是一件極為不容易的事情,這時候大家猜測
  • 科學網—國際自然保護聯盟稱珍稀物種非洲西部黑犀牛滅絕
    同時,IUCN補充道,南部白犀牛和普氏野馬幸運地因為得力的保護項目而從滅絕的邊緣被拉了回來。 「人類是地球的總幹事,我們有責任保護物種,並和其他動物一起分享自然環境。」IUCN物種保護委員會主席Simon Stuart說道。
  • 滅絕滋生滅絕: 一個物種的滅絕會導致更多物種滅絕
    包括鳥類、樹木、蕨類、真菌、魚類、昆蟲以及哺乳動物在內的物種數量是地球這45億年歷史中最多的時候,但也是大量物種消失的時候。這項新研究分析了29400種生活在陸地上的脊椎動物,包括老鼠、鷹、河馬、蛇等。 這些來自世界各地的物種已被國際自然保護聯盟列入目錄。在這些物種中,有515種(佔研究物種的1.7%)瀕臨滅絕。 這些物種包括小頭鼠海豚,鷦鷯和蘇門答臘犀牛等。
  • 物種是什麼?研究物種有什麼用?來看看生物學上關於物種的故事
    物種分布生物的歸類跟Pokemon遊戲類似,激發我們收集和辨認事物的本能。我們擁有分類系統,這對科研人員極其有用,我是說,它能展示每種已知生物是如何與其他物種相互關聯的。我們已將生活中所有生物繪成一張巨大圖譜,想到這一點,你會感到十分驚奇。
  • 美科學家發現生物物種數量豐富與絕跡無關
    科學家認識生物絕種的基本原則是,數量多的生物物種比數量少的生物物種生存期要長。然而,美國喬治亞大學的科學家8日卻表示,他們新完成的研究結果顯示出更加複雜的關係。通過分析從52個不同地方發掘出的4.6萬個生物化石,科學家發現大數量的確幫助了腕足類生物(與現代的蛤類似)在奧陶紀滅絕期中得以倖存,然而令人感到意外的是,數量巨大的腕足類生物並沒有能在滅絕期後繼續生存下來。有研究表明,在奧陶紀滅絕期,地球上大約50%的生命遭到毀滅。
  • 每日科學:人類壽命越長 物種滅絕越快
    據美國每日科學網站10月9日報導,研究人員分析了15種社會和生態變量的組合,從旅遊業與人均國內生產總值,到用水緊張與政治穩定。然後,研究人員分析了這些因素與鳥類和哺乳動物被入侵和瀕臨滅絕之間的關聯,環境保護主義者奧爾多·萊奧波爾多將鳥類和哺乳動物稱為衡量「土地病態程度」的兩個指標。該研究結果刊登在9月一期的《生態與社會》雜誌上。
  • 外來生物入侵加劇物種取代
    我國確認外來入侵生物超500種 外來生物入侵是指生物由原產地通過自然或人為的途徑遷移到新的地區,並在當地的自然或人工生態環境中定居、自行繁殖和擴散,最終破壞該地區生態平衡,引發生態災難的現象。據統計,目前我國確認的外來入侵生物超過500種,其中大面積發生、危害嚴重的達100多種。
  • 為什麼赤道的物種比兩極的多?
    芝加哥大學的David Jablonski教授是研究物種滅絕和生物多樣性方面的著名學者,他說這一定律幾乎適用於所有種類的生命,也適用於所有環境,但背後的原因卻仍是大家激烈爭論的焦點:「這是一個可以追溯到達爾文之前的基本問題。」 Jablonski的目標是了解生物多樣性,這是一個具有重大利害關係的課題,比如它關係到物種將如何適應氣候變化這類問題。
  • 一百多年前,外國人為了得到中國一稀有物種,害得此物種幾近滅絕
    今天我們故事的主角是「普氏野馬」,那麼,這種野馬為什么姓普呢?其實,來自中國的「普氏野馬」並非是以中國人普氏命名,而是以俄羅斯人普爾熱瓦爾斯基命名,那麼,這又是怎麼回事呢?其實,這其中還有一段不為人知的屈辱往事,讓我為大家慢慢道來。
  • 兩個全新物種被發現,為何自然界不斷有新物種出現?
    當然,從發現到確認,還需要很長的時間,因為很多物種之間差別是非常細微的,需要通過大量的實物和標本等來進行分析鑑定,才可以最終確認它到底屬不屬於一個新物種。同樣,大葉可愛花也發現了多年的時間,最終經過詳細的對比和分析後,確認了它是一個全新的物種。看到這裡,大家可能會好奇,人類已經在地球上存在200萬年的時間了,特別是伴隨著人類的發展,人類也是一直不斷在自然界中去尋找未知的事物,那麼,為何一直到今天,地球上仍然不斷有新物種被發現呢?
  • 福建省發現新物種
    發現一個新物種有多難?首先它必須是未被發現記錄過的物種,其次你需要捕獲一雄一雌作為標本,再寫論文並在國際上獲得認可。7月初,國際最權威動物分類學期刊《Zootaxa》就認可了一種發現於福建深山,發現者為福建人,並且以這位福建人命名的新物種天牛!!
  • 微生物群落多樣性測序與功能分析
    微生物群落測序是指對微生物群體進行高通量測序,通過分析測序序列的構成分析特定環境中微生物群體的構成情況或基因的組成以及功能。藉助不同環境下微生物群落的構成差異分析我們可以分析微生物與環境因素或宿主之間的關係,尋找標誌性菌群或特定功能的基因。
  • 物種壽命由何決定?端粒縮短速度是決定因素
    研究還表明,上述聯繫可以用數學公式來表示,並可用於準確預測物種的壽命。那麼,火烈鳥平均能活40年,老鼠只能活兩年,大象壽命在60歲左右,人類則越來越多地能活過80歲……不同物種的壽命有差距的原因為何?西班牙國家癌症研究中心的專家對9種哺乳動物和鳥類進行分析後給出了答案。
  • 組圖:從滅絕邊緣拉回來的八種生物-滅絕,物種,生物,地球 ——快...
    人類活動一次又一次的將其它物種推向滅絕邊緣,而當人類醒悟之後又擅作主張的對它們施加保護,試圖彌補自己以往的過失。下面將要呈現的便是騰訊科學編譯歸納的8種曾經瀕臨滅絕但最終「起死回生」的地球生物。黑足雪貂1979年黑足雪貂被宣布滅絕,幸運的是,科學家發現還有少量黑足雪貂生活在美國懷俄明州,之後科學家對它們進行圈養繁殖,起初僅有18隻,到目前野生環境中的黑足雪貂數量已超過1200隻。