三大相關係數簡介及其在R中的相關函數

2021-03-02 機會的數學

    相關係數是反映隨機變量之間關係的度量指標,是研究變量關係的重要工具。概率統計學習中最常見的是Pearson相關係數,其取值範圍是[-1,1],當取值為0時表示不(線性)相關,取值為[-1,0)表示負相關,取值為(0,1]表示正相關。相關係數絕對值越接近於1,兩個變量間(線性)相關性越強。

    

    Pearson相關係數用來度量連續取值變量的相關性,在醫學、經濟學和社會學等領域還經常需要研究其他類型變量如定序變量等之間的關係,此時可以用Spearman秩相關係數和Kendall τ相關係數。下面簡單介紹一下這三種相關係數的定義及計算公式。

    關於樣本Pearson相關係數的統計性質及檢驗統計量,可參考:Pearson相關係數:熟悉的陌生人。

4. 在R中計算並展示相關係數

    

    在R中可使用cor( )函數來計算三種相關係數值,用cor.test( )檢驗相關係數顯著性,還可以用corrplot包中的corrplot( )函數或者corrgram包中的corrgram( )函數進行圖示化。以著名的鳶尾花數據為例。

cor(x, y = NULL, use = "everything",method = c("pearson", "kendall", "spearman"))

分別計算三種相關係數:

iris.corp<-cor(iris[,-5],method='pearson')iris.cors<-cor(iris[,-5],method='spearman')iris.cork<-cor(iris[,-5],method='kendall')iris.corp#輸出的Pearson相關係數結果             Sepal.Length Sepal.Width Petal.Length Petal.WidthSepal.Length    1.0000000  -0.1175698    0.8717538   0.8179411Sepal.Width    -0.1175698   1.0000000   -0.4284401  -0.3661259Petal.Length    0.8717538  -0.4284401    1.0000000   0.9628654Petal.Width     0.8179411  -0.3661259    0.9628654   1.0000000

以iris數據集前兩個變量為例檢驗相關係數的顯著性:

cor.test(iris[,1],iris[,2],method='pearson')#輸出結果        Pearson's product-moment correlationdata:  iris[, 1] and iris[, 2]t = -1.4403, df = 148, p-value = 0.1519alternative hypothesis: true correlation is not equal to 095 percent confidence interval: -0.27269325  0.04351158sample estimates:       cor -0.1175698

利用corrplot包中的corrplot( )函數圖示化相關係數:

#install.packages("corrplot")library(corrplot)corrplot(corr=iris.corp, method = "ellipse") #具體參數的設置和使用可參考幫助文檔

圖形如下:

利用corrgram包中的corrgram( )函數圖示化相關係數:

#install.packages("corrgram")library(corrgram)corrgram(iris.corp, type="cor", lower.panel=panel.shade, upper.panel=panel.pie, text.panel=panel.txt, main="Correlogram of iris intercorrelations (1)")corrgram(iris.corp, type="cor",order=F, lower.panel=panel.conf, upper.panel=panel.pie, text.panel=panel.txt, main="Correlogram of iris intercorrelations (2)")corrgram(iris[,-5], order=F, lower.panel=panel.ellipse, upper.panel=panel.pts, text.panel=panel.txt, main="Correlogram of iris intercorrelations (3)")#上面顯示了三種不同的相關性展示方法,可以通過設置相應的參數實現。

三種圖形分別如下:

用符號展示相關性程度:

symnum(iris.corp)#輸出結果             S.L S.W P.L P.WSepal.Length 1              Sepal.Width      1          Petal.Length +   .   1      Petal.Width  +   .   B   1  attr(,"legend")[1] 0 『 』 0.3 『.』 0.6 『,』 0.8 『+』 0.9 『*』 0.95 『B』 1

計算三種相關係數之間的相關程度:

i <- lower.tri(iris.corp)cor(cbind(P = iris.corp[i], S = iris.cors[i], K = iris.cork[i]))#輸出結果          P         S         KP 1.0000000 0.9965806 0.9960445S 0.9965806 1.0000000 0.9987646K 0.9960445 0.9987646 1.0000000

相關焦點

  • 相關係數簡介及R計算
    變量間Pearson、Spearman、Kendall、Polychoric、Tetrachoric、Polyserial、Biserial相關係數簡介及R計算對於給定數據集中,變量之間的關聯程度以及關係的方向,常通過相關係數衡量。
  • R語言 | Pearson、Spearman、Kendall、Polychoric、Polyserial相關係數簡介及R計算
    變量間Pearson、Spearman、Kendall、Polychoric、Tetrachoric、Polyserial、Biserial相關係數簡介及R計算對於給定數據集中,變量之間的關聯程度以及關係的方向,常通過相關係數衡量。
  • Pearson、Spearman、Kendall、Polychoric、Polyserial相關係數簡介及R計算
    變量間Pearson、Spearman、Kendall、Polychoric、Tetrachoric、Polyserial、Biserial相關係數簡介及R計算對於給定數據集中,變量之間的關聯程度以及關係的方向,常通過相關係數衡量。
  • 五大相關係數簡介及R計算:Pearson、Spearman、Kendall、Polychoric、Polyserial
    變量間Pearson、Spearman、Kendall、Polychoric、Tetrachoric、Polyserial、Biserial相關係數簡介及R計算對於給定數據集中,變量之間的關聯程度以及關係的方向,常通過相關係數衡量。
  • 三大相關係數法
    在這三大相關係數中,spearman和kendall屬於等級相關係數亦稱為「秩相關係數」,是反映等級相關程度的統計分析指標。最終選擇哪種相關係數法,對比結果誰更符合預期效果。Pearson相關係數:按照大學的線性數學水平來理解, 它比較複雜一點,可以看做是兩組數據的向量夾角的餘弦。
  • 模型研究4-相關係數問題(皮爾遜相關係數法)
    本期:相關係數問題研究如果有兩個變量:X、Y,最終計算出的相關係數的含義可以有如下理解:當相關係數為
  • R平臺相關係數教程
    本教程介紹相關係數的知識,包括三方面的內容:首先,R平臺相關係數計算其次,R平臺相關矩陣可視化最後,R平臺相關係數的類型和如何影響後續分析工作
  • R_相關分析_Correlation
    利用兩個變量之間的均值和標準差計算的相關係數或線性相關係數,一般用字母r表示,可以用來描述變量相關聯的方向(±:正相關或負相關)和強度(完全不相關時為0,完全相關時為1)Pearson相關係數被廣泛使用,除此之外還有Spearman秩相關係數和Kendall秩相關係數。Pearson相關係數計算公式如下:其中為均值。在這裡主要介紹Pearson相關係數在R語言中的實現。
  • 回歸分析的基礎概念之2:相關性與相關關係,相關係數與判定係數
    2、函數關係、相關關係與因果關係。3、相關係數及其計算方法。4、相關關係強弱的評定標準。5、判定係數及其計算方法。6、相關係數與判定係數在回歸分析中的作用。3、不相關,顧名思義,就是指兩個變量之間沒有關係,即一個變量的變化對另一變量沒有明顯影響。二、函數關係、相關關係與因果關係。客觀事物之間的關係,一般來說可以歸納為兩大類,函數關係和相關關係(不相關也是相關關係的一種)。
  • 【實戰】如何優雅的在文章中使用皮爾森相關係數
    在項目中經常會用到皮爾森相關係數,比如表達相關性,比如樣本重複性等等,如何更好的展示你的數據呢,今天就來分享幾個皮爾森相關係數的展現方式和計算方法
  • Excel相關性分析(一)- 計算相關係數
    本公眾號文章字數500左右,花3分鐘就能學會,點擊上方公眾號名稱關注下吧    相關係數,通常用r表示,是對樣本中變量x和變量
  • 如何用Excel計算相關係數矩陣?
    一般來講,兩個變量之間的關係是以下三種之一:正相關、負相關、無相關。相關係數被用來衡量兩個變量之間相關性的強弱程度,數值變動範圍在+1和-1之間。但要注意,相關係數隻反映兩個變量之間的相互關係及其相關方向,但無法確切地表明兩個變量之間相關的程度。
  • 自相關和互相關函數計算方法總結及心得體會
    [轉版友hustyoung]自相關函數是描述隨機信號X(t)在任意兩個不同時刻t1,t2的取值之間的相關程度;互相關函數給出了在頻域內兩個信號是否相關的一個判斷指標,把兩測點之間信號的互譜與各自的自譜聯繫了起來。它能用來確定輸出信號有多大程度來自輸入信號,對修正測量中接入噪聲源而產生的誤差非常有效。
  • 用Excel做數據間的相關係數
    按照慣例,我會先講講什麼是相關係數(CorrelationCoefficient)。相關係數是研究變量之間線性相關程度的量。相關係數的計算公式如下 那麼下面演示一下怎麼利用Excel計算兩組數據的相關係數吧。先介紹個函數Excel的隨機函數,RANDBETWEEN(a,b),它表示可以隨機產生一個在a與b之間並且包括a和b的數。 1.隨機生成一個A列,就這麼叫吧,不知道啥意思,一共99行數據。
  • R 語言中常用的文件操作及字符串相關函數
    至少,沒有 file  move類 函數,也沒有類似於 tree 命令效果的函數。特別是關於軟連結和硬連結問題還沒有深入涉及。目前,談到 「R語言文件及路徑操作」,國內能夠搜索到的內容,基本上都是千篇一律,要麼是水文,搬運函數名和對應的功能,簡單羅列;要麼就異常豐富,直接把基礎函數裡所有相關的函數名全部羅列了出來。在這裡面,能夠追溯到較早的文章,在 2015 年左右,甚至更早。
  • DCC-GARCH:動態條件相關係數模型
    在介紹多元 GARCH 中的 DCC (Dynamic Conditional Correlational) 模型之前,我們先來介紹基礎的 GARCH 模型。在對金融時間序列進行建模時,我們常常會碰到誤差項的方差會隨著時間的變化而變化的現象,直觀的看,方差存在明顯的波動聚集性。我們需要估計出很多個參數,才能儘可能的描述出這個隨時間變化而改變的異方差函數的生成過程,但這是很難做到的。
  • 【每天學點應用軟體】用Excel進行數據分析:計算相關係數
  • 可決係數R與相關係數R是一回事嗎
    可決係數R與相關係數R是一回事嗎 【提問】難道可決係數R與相關係數R是一回事嗎?方差R2=0.924推出可決係數R=0.961.相關係數R=可決係數R?【回答】您好!您的問題答覆如下:可決係數R2中的R與相關係數R是一回事的,方差R2=0.924推出可決係數R=0.961.
  • 【方法】相關係數的計算與顯著性檢驗
    樣本相關係數可以用來對論文中建立的統計模型進行驗證,也可以用來進行元分析。相關係數的計算和顯著性檢驗是一個很輕鬆的工作——通常情況下,研究者會使用SPSS計算SPSS中各變量的相關,SPSS也直接提供了對相關係數的顯著性檢驗,研究者需要做的就是點點滑鼠,然後將結果抄寫在論文中。
  • 如何選用Pearson、Spearman、Kendall三大相關係數
    說到相關分析,很多人會馬上拿出皮爾遜Pearson相關係數,從不論數據是不是符合適用條件,甚至完全不了解Pearson相關係數還有假設條件這回事。常見的相關係數有三種,它們分別是Pearson、Spearman、Kendall係數,世人兼知pearson係數,冷淡了另外兩個。