R相關性圖如何按比例顯示相關係數

2021-02-19 生信交流平臺

    今天偶然從一篇paper裡看到了一張R繪製的相關性圖,跟以往看到的有些不一樣。這張圖裡面不僅展示了相關係數,並且相關係數顯示的大小跟相關係數是成比例的。這樣做的好處是,讓那些最顯著相關的一目了然,而那些不怎麼相關的就不那麼顯眼。這個引起了小編的興趣,想自己也畫一張這樣的相關性圖。

說幹就幹,就拿mtcars這套數據來練練手。先來個簡單的,由簡入繁

library(corrplot)M <- cor(mtcars)corrplot(M, method = "circle",         number.cex = 1,         addCoef.col="black")

接下來嘗試一下根據相關係數的大小來調節顯示的字體大小

corrplot(M, method = "circle",         number.cex = abs(M),         addCoef.col="black"         )

沒想到這麼容易就實現了,太沒有挑戰了。

不過文章中的相關性圖是三角形的,接下來我們也來畫一個三角形的圖,勝利在望。

#設置type = "upper"就可以畫出上三角#設置成lower就可以畫下三角corrplot(M, method = "circle",         type = "upper",         number.cex = abs(M),         addCoef.col="black")

高興太早,翻車了!只畫一半的時候,不能用完整的相關係數矩陣M來作為字體的大小,這樣設置不對。

推測如果圖像只畫一半,相關係數應該也只用一半。那麼這個相關係數的順序如何確定呢?下面來做個測試

size=rep(0.1,66)size[1]=1size[2]=0.5size[3]=1corrplot(M, method = "circle",         type = "upper",         number.cex = size,         addCoef.col="black")

被我發現了,是按列來排布的!如箭頭所示的方向和順序

接下來就是最終章了

size=c()for(i in 1:ncol(M)){  size=c(size,M[1:i,i])}size=as.numeric(size)
corrplot(M, method = "circle", type = "upper", number.cex = abs(size), addCoef.col="black")

大功告成了!!!

相關焦點

  • 相關係數之Pearson
    相關分析相關分析是用來說明兩個變量之間的關係。這個關係包含:兩個變量的方向和強度。按相關的程度不同分:完全相關、統計相關、完全無關。《如何通俗地理解協方差與相關係數?》相關係數Pearson 相關係數:一般用來計算兩個連續型變量的相關係數。也是最常用的相關係數。公式這裡就不寫了,一些統計學的教程都有說明。當兩個變量的標準差都不為零時,相關係數才有定義,皮爾遜相關係數適用於:兩個變量的觀測值是成對的,每對觀測值之間相互獨立。
  • 【R語言】相關性分析、相關係數的顯著性檢驗及可視化
    本篇文章介紹基於R語言的相關性分析、相關係數的顯著性檢驗及可視化,該教程為個人筆記,大家也可參考學習,不足之處也歡迎大家批評指正!相關性分析用於評估兩個或多個變量之間的關聯,能通過定量指標描述變量之間的強弱、直接或間接聯繫。
  • 簡單相關分析中,相關係數r的取值的特點有( )。
    簡單相關分析中,相關係數r的取值的特點有( )。A.r的值越大,意味著變量之間的相關程度越高B.若兩變量相關,且變化的方向一致,則r值為負;反之,則r值為正C.r=0,意味著變量之間完全不相關D.r=l,意味著變量之間完全正相關E.r=﹣1,意味著變量之間完全負相關查看答案解析【正確答案】ACDE
  • 相關係數第二彈:斯皮爾曼相關
    n為等級個數d為二列成對變量的等級差數簡單點說,斯皮爾曼相關就是無論兩個變量的數據如何變化,符合什麼樣的分布,我們只關心每個數值在變量內的排列順序。利用斯皮爾曼等級相關計算A、D基因表達量的相關性,結果是:r=1,p-value = 4.96e-05這裡斯皮爾曼等級相關的顯著性顯然高於皮爾森相關。這是因為雖然兩個基因的表達量是非線性關係,但兩個基因表達量在所有樣本中的排列順序是完全相同的,因為具有極顯著的斯皮爾曼等級相關性。相關係數r的取值範圍是-1≤r ≤ 1,一般取小數點後兩位。
  • 相關係數種類
    前幾篇文章,介紹了如何做簡單相關分析,重點介紹了兩個數值型變量的相關分析,採用的是Pearson相關係數。比如,度量身高與體重、工齡與收入、價格與銷量等等之間的關係,就可以使用Pearson簡單相關係數。
  • 相關係數,為何相關,如何相關?
    在現實生活中,變量之間的常見關係有三種:一是確定性函數關係,變量之間的關係可以用函數表示;二是非確定性相關關係,變量之間有一定的關係,但不能完全用函數表達,變量問只存在統計規律;三是毫無關係的兩個變量,譬如上述的日期與氣溫。對於兩個變量,我們如何確定不相關,或者相關,相關性的強弱,如何解決?當然我們可以求出回歸方程,然後再利用相關指數判斷,但似乎有點後知後覺的感覺!
  • SPSS之簡單相關係數
    簡單相關分析是對兩個變量之間的相關程度進行分析。單相關分析所用的指標稱為 單相關係數,又稱為 Pearson(皮爾森)相關係數或相關係數。通常用 ρ 表示總體的相 關係數,以 r 表示樣本的相關係數。 我們已經給出總體相關係數的定義式為
  • 模型研究4-相關係數問題(皮爾遜相關係數法)
    本期:相關係數問題研究如果有兩個變量:X、Y,最終計算出的相關係數的含義可以有如下理解:當相關係數為
  • 三大相關係數簡介及其在R中的相關函數
    概率統計學習中最常見的是Pearson相關係數,其取值範圍是[-1,1],當取值為0時表示不(線性)相關,取值為[-1,0)表示負相關,取值為(0,1]表示正相關。相關係數絕對值越接近於1,兩個變量間(線性)相關性越強。
  • 協方差(covariance)與相關係數(2)
    以上涉及的是直線相關,相關係數的取值為【-1,1】:散點完全在同一條直線上,預測的準確性最高,相關係數的正負號表示相關性的正負。若x與y是同向變化,相關係數等於1,為完全正相關;若x與y是反向變化,相關係數等於-1,為完全負相關。
  • 皮爾森相關係數的計算
    在《變量關係大揭秘(一)》,我們提到了皮爾森相關係數r,它可是相關係數大家庭中的「1號人物」。
  • K-S檢驗,皮爾遜相關係數,spearman相關係數總結
    2 pearson correlation coeffcient 和 sperman秩相關係數2.1pearson相關係數(注意:描述的是兩個樣本的線性相關性,服從正態分布的連續變量#計算pearson相關係數data = pd.DataFrame({'value1':data1.values,                     'value2':data2.values
  • 【方法】相關係數的計算與顯著性檢驗
    樣本相關係數可以用來對論文中建立的統計模型進行驗證,也可以用來進行元分析。相關係數的計算和顯著性檢驗是一個很輕鬆的工作——通常情況下,研究者會使用SPSS計算SPSS中各變量的相關,SPSS也直接提供了對相關係數的顯著性檢驗,研究者需要做的就是點點滑鼠,然後將結果抄寫在論文中。
  • 下列關於相關係數R的說法錯誤的是( )
    下列關於相關係數R的說法錯誤的是( ) 2014-08-28 14:15  來源:  字體:大小  列印 原  題: 下列關於相關係數R的說法錯誤的是( ) 選  項: A.當R=1時,變量x和y沒有線性關係
  • 第九章 直線相關與回歸--第一節 直線相關
    第一節 直線相關   一、相關係數的意義   相關分析是用相關係數(r)來表示兩個變量間相互的直線關係,並判斷其密切程度的統計方法。相關係數r沒有單位。在-1~+1範圍內變動,其絕對值愈接近1,兩個變量間的直線相關愈密切,愈接近0,相關愈不密切。
  • 線性相關
    當然,有關聯並不代表就一定是線性相關,也可能是曲線、性線性相關等。本節主要討論線性相關,因為線性相關較其他相關簡單,也是多重線性回歸的基礎。           線性相關                兩隨機變量X、Y之間呈線性趨勢的關係。一般地,若兩變量X、Y 同時增大或減少,稱為正相關;若兩變量X、Y 呈反向變化,稱為負相關。
  • SPSS分析技術:組內相關係數(ICC)的原理及運用
    ,以及如何使用統計軟體對它們進行計算,大家可以點擊下方文章連結進行回顧:今天草堂君給大家介紹的相關係數類型是在問卷分析中經常會用到的一種可靠性指標,特別是在跨層的問卷分析研究中會用到,它就是組內相關係數ICC(Intraclass Correlation Coefficients)。
  • 機器學習之計算相關度
    PPMCC或PCCs, 文章中常用 r 或 Pearson's r表示,用於度量兩個變量X和Y之間的相關(線性相關),其值介於-1與1之間。在自然科學領域中,該係數廣泛用於度量兩個變量之間的相關程度。它是由卡爾·皮爾遜從弗朗西斯·高爾頓在19世紀80年代提出的一個相似卻又稍有不同的想法演變而來。這個相關係數也稱作「皮爾森相關係數r」。上圖是幾組(x, y)的點集,以及各個點集中x和y之間的相關係數。
  • 數學建模筆記——相關係數
    相關係數,其實就是衡量兩個變量之間相關性的大小的指標,常用的相關係數有兩種,一種是pearson相關係數,也就是《概率論與數理統計》這本書裡提到的,平時最為常用的相關係數。另一種稱之為spearman相關係數,我也是在清風老師的課中第一次聽說,它衡量的是兩個變量的依賴性,唔,也可以理解為單調性啦。
  • 皮爾森和斯皮爾曼相關係數
    >之前我們介紹了如何使用相關係數來衡量變量之間的相關性大小,但其實統計學中有三大相關係數,它們的計算方式不盡相同,適用於不同的場景。之前介紹的相關係數其實是皮爾森簡單相關係數,用協方差除以標準差的方式來計算,它計算簡單,應用廣泛,適用于衡量變量之間的線性關係。