【R語言】相關性分析、相關係數的顯著性檢驗及可視化

2021-01-14 生態數據筆記

本篇文章介紹基於R語言的相關性分析、相關係數的顯著性檢驗及可視化,該教程為個人筆記,大家也可參考學習,不足之處也歡迎大家批評指正!

相關性分析用於評估兩個或多個變量之間的關聯,能通過定量指標描述變量之間的強弱、直接或間接聯繫。相關係數是對變量之間的相關程度的定量描述,相關係數值介於-1~1之間,越接近0相關性越低,越接近-1或1相關性越高;正負號表明相關方向,正號為正相關、負號為負相關。當數據呈正態分布時,才可以使用相關性分析。可以使用Shapiro-Wilk test進行檢查數據是否滿足正態分布。

該案例中示例數據包含多樣性(diversity)、生物量(biomass)、產量(yield)和種植密度(density)四個指標(單位請自動忽略,數據僅作為示例使用)。

1、Pearson相關係數:Pearson相關係數是用於表示相關性大小的最常用指標,適用於兩個正態分布的連續變量。

2、Spearman等級相關係數:又稱為秩相關係數,利用兩變量的秩次大小來進行分析,屬於非參數統計方法。適用於不滿足Pearson相關係數正態分布要求的連續變量,也可以用於有序分類變量的之間的相關性測量。

3、Kendall's Tau相關係數:Kendall's Tau相關係數是一種非參數檢驗。適用於兩個有序分類變量。

4、偏相關:當要進行相關性分析的兩個變量其取值受到其他變量影響時,可以利用偏相關分析對其他變量進行控制,在控制其他變量基礎之上進行這兩個變量之間相關性分析。適用於考慮第三方影響的兩個變量之間的相關性分析。

1、Pearson、Kendall、Spearman相關

#df<-read.csv("D:\\Users\\ASUS\\Desktop\\Correlation\\correlation.csv",header = T)#df

shapiro.test(df$diversity)shapiro.test(df$biomass)shapiro.test(df$yield)shapiro.test(df$density)

結果符合正態分布

cor(df, method = "pearson")cor(df, method = "kendall")cor(df, method = "spearman")

2、偏相關

偏相關是指在控制一個或多個定量變量時,另外兩個定量變量之間的相互關係。

#library(ggm)##pcor(c(1,2,3), cov(df))

3、相關係數的顯著性檢驗

####cor.test(df[,1],df[,2], method = "pearson")

#library("psych")cor<-corr.test(df, method = "pearson")#cor$r#cor$p

4、可視化

4.1 corrplot包

#library(corrplot)#corrplot(cor$r, p.mat = cor$p, insig = 'label_sig', sig.level = c(.001, .01, .05), pch.cex = 1.5)

*** p<0.001; ** p<0.01; * p<0.05, the same below.

corrplot(cor$r, p.mat = cor$p,tl.col = "black",method = "circle",type = "upper",tl.pos = "d",order="AOE",         insig = 'label_sig', sig.level = c(.001, .01, .05))corrplot(cor$r,add=TRUE, type="lower", method="number",order="AOE",diag=FALSE,tl.pos="n", cl.pos="n")

color<-colorRampPalette(c("#053061", "#2166AC", "#4393C3","#92C5DE","#D1E5F0",                          "#FFFFFF","#FDDBC7","#F4A582","#D6604D","#B2182B","#67001F"))

corrplot(cor$r, p.mat = cor$p,tl.col = "black",method = "circle",order="AOE",type = "upper",tl.pos = "d",col = color(500),         insig = 'label_sig', sig.level = c(.001, .01, .05), pch.cex = 1.5)corrplot(cor$r,add=TRUE, type="lower", method="number",order="AOE",diag=FALSE,tl.pos="n", cl.pos="n", col = color(500))


4.2 PerformanceAnalytice包
library(PerformanceAnalytics)chart.Correlation(cor$r)


對角線上顯示的是分布圖,左下部顯示的是具有擬合線的雙變量散點圖,右上部顯示的是相關係數以及顯著性水平。

兩個包做出來的圖顯著性不一致,額... 有點懵;後續還需進一步研究,但是一般情況下多用corrplot包作圖。

相關焦點

  • 【方法】相關係數的計算與顯著性檢驗
    這些信息可供讀者進行後續分析。樣本相關係數可以用來對論文中建立的統計模型進行驗證,也可以用來進行元分析。相關係數的計算和顯著性檢驗是一個很輕鬆的工作——通常情況下,研究者會使用SPSS計算SPSS中各變量的相關,SPSS也直接提供了對相關係數的顯著性檢驗,研究者需要做的就是點點滑鼠,然後將結果抄寫在論文中。
  • 檢驗回歸係數的顯著性excel_excel相關係數顯著性檢驗 - CSDN
    通過數據間相關性分析的研究,進一步建立自變量(i=1,2,3,…)與因變量Y之間的回歸函數關係,即回歸分析模型,從而預測數據的發展趨勢。首先我們用數據分析—相關係數分析計算一下自變量和因變量之間的相關係數為0.95157,為強相關。
  • r語言卡方檢驗和似然比檢驗_r語言似然比檢驗代碼 - CSDN
    本章中將學習如何對多種統計檢驗進行功效分析,包括比例檢驗、t檢驗、卡方檢驗、平衡的單因素ANOVA、相關性分析,以及線性模型分析。由於功效分析針對的是假設檢驗,我們將首先簡單回顧零假設顯著性檢驗(NHST)過程,然後學習如何用R進行功效分析,主要關注於pwr包。
  • 回歸係數顯著性t檢驗 - CSDN
    回歸方程的顯著性檢驗  t 檢驗(回歸係數的檢驗)  F 檢驗(回歸方程的檢驗)  相關係數的顯著性檢驗  樣本決定係數  三種檢驗的關係  3.相關係數的顯著性檢驗  因為一元線性回歸方程討論的是變量 x 與變量 y 之間的線性關係,所以變量 x 與 y 之間的相關係數來檢驗回歸方程的顯著性。用相關係數來反應 x 與 y 的線性關係的密切程度。
  • 【R】ggcor相關性可視化
    上周,我們寫了一個 ggcor 對相關性可視化的帖子 (【ggcor】相關性圖的另外一種展示)。裡面用到的例子是厚老師的示例數據。這次,我自己構建數據集,探索如何使用 ggcor 進行展示。P值,相關性方法為「pearson」cor = corAndPvalue(env, spec, method = 'pearson')# 提取相關係數並改成長數據格式c = cor[["cor"]] %>%        as.data.frame()c$cat = rownames(c)c = melt(c, id.vars = ncol
  • 數據分析基礎相關性分析,SPSS實操
    樣本相關係數r:在說明變量之間線性相關程度時,根據經驗可將相關程度分為以下幾種情況: 若r≥0.8 時,視為高度相關; 若0.5≤r<0.8 時,視為中度相關; 當0.3≤r<0.5 時,視為低度相關;
  • R語言從入門到精通:Day10-R語言統計入門代碼大全
    4、連續型變量的相關性檢驗  連續型變量中的相關性可以用相關係數來描述,相關係數的符號(±)表明關係的方向(正相 關或負相關),其值的大小表示關係的強弱程度(完全不相關時為0,完全相關時為1)。(示例數據來自於R基礎安裝中的state.x77數據集)。
  • 相關性顯著水平_r語言 兩個相關係數在0.05顯著性水平上顯著不同於...
    為加強對進口高氟煤炭的管理,評價進口煤炭中...進口加拿大煤中氟含量與灰分、全硫含量相關性不顯著,與磷含量的相關性係數為0.763,顯著性水平為0.01
  • 回歸方程的顯著性檢驗 - CSDN
    回歸方程的顯著性檢驗  t 檢驗(回歸係數的檢驗)  F 檢驗(回歸方程的檢驗)  相關係數的顯著性檢驗  樣本決定係數  三種檢驗的關係  3.相關係數的顯著性檢驗  因為一元線性回歸方程討論的是變量 x 與變量 y 之間的線性關係,所以變量 x 與 y 之間的相關係數來檢驗回歸方程的顯著性。用相關係數來反應 x 與 y 的線性關係的密切程度。
  • r語言檢驗序列相關 - CSDN
    ,則進行模式識別畫自相關圖和非自相關圖,根據兩圖的結尾性和拖尾性進行AR、MA、ARMA的模式識別對識別後模式中的位置參數進行參數估計arima()模型檢驗分為:①殘差的白噪聲檢驗;②過度擬合檢驗pt()模型檢驗通過則進行模型優化,否則重新進行模式識別模型優化中得到AIC和BIC值,進行模型的優化然後進行預測與控制2.
  • r語言檢驗 是否相關 - CSDN
    #兩樣本問題t檢驗、方差齊次性檢驗、分布檢驗#相關與回歸分析#例一某種元件的壽命X(小時),服從正態分布,N(mu,sigma2),其中mu,sigma2均未知,16隻元件的壽命如下:問是否有理由認為元件的平均壽命大於225小時。
  • 【Matlab】柵格數據相關分析及顯著性檢驗
    相關分析就是對總體中確實具有聯繫的標誌進行分析,其主體是對總體中具有因果關係標誌的分析。
  • 相關分析:從概念到步驟
    顯然,相關係數矩陣是對稱矩陣,而且對角線上的相關係數全為1(即變量自身的相關係數為1)。從上表中可知,腰圍和體重的相關係數r=0.853,存在強相關;脂肪比重和體重的相關係數r=0.697,存在中度相關。
  • r語言的p值檢驗 - CSDN
    醫學統計與R語言:KS曲線,KS plot,lift plot醫學統計與R語言:身體酸痛,醒來學個卡方檢驗醫學統計與R語言:利用午睡幾分鐘,學習下Population Pyramid醫學統計與R語言:有序Logistic回歸平行線檢驗(Test proportional odds assumption )醫學統計與R語言:你的基金標書裡還少這幅圖
  • 三大相關係數簡介及其在R中的相關函數
    概率統計學習中最常見的是Pearson相關係數,其取值範圍是[-1,1],當取值為0時表示不(線性)相關,取值為[-1,0)表示負相關,取值為(0,1]表示正相關。相關係數絕對值越接近於1,兩個變量間(線性)相關性越強。
  • 相關係數之Pearson
    定義說到相關係數需要了解的 3 個概念:相關分析、數據期望、協方差。先分別說明這些概念。
  • r語言多元線性回歸相關性_多元線性回歸調整相關性 - CSDN
    RSS(殘差平方和)與R2  (相關係數的平方)選擇法:遍歷所有可能的組合,選出使RSS最小,R2  最大的模型。:在該數據集中的EXAMINATION變量與模型的相關性中沒有一個*,從而表示,該變量與該模型沒有相關性,可以去除。
  • 一元線性回歸顯著性檢驗專題及常見問題 - CSDN
    回歸方程的顯著性檢驗  t 檢驗(回歸係數的檢驗)  F 檢驗(回歸方程的檢驗)  相關係數的顯著性檢驗  樣本決定係數  三種檢驗的關係  3.相關係數的顯著性檢驗  因為一元線性回歸方程討論的是變量 x 與變量 y 之間的線性關係,所以變量 x 與 y 之間的相關係數來檢驗回歸方程的顯著性。用相關係數來反應 x 與 y 的線性關係的密切程度。
  • 相關係數種類
    前幾篇文章,介紹了如何做簡單相關分析,重點介紹了兩個數值型變量的相關分析,採用的是Pearson相關係數。比如,度量身高與體重、工齡與收入、價格與銷量等等之間的關係,就可以使用Pearson簡單相關係數。
  • SPSS之簡單相關係數
    簡單相關分析是對兩個變量之間的相關程度進行分析。單相關分析所用的指標稱為 單相關係數,又稱為 Pearson(皮爾森)相關係數或相關係數。通常用 ρ 表示總體的相 關係數,以 r 表示樣本的相關係數。 我們已經給出總體相關係數的定義式為