用Excel做數據間的相關係數

2021-02-13 科學知識

今天給大家講一下用Excel做數據間的相關係數。

按照慣例,我會先講講什麼是相關係數(CorrelationCoefficient)。相關係數是研究變量之間線性相關程度的量。

相關係數的計算公式如下

其中,cov(X,Y)=E[(X-EX)(Y-EY)]為隨機變量X與Y的協方差,E為數學期望或均值,D為方差,D開根號為標準差σ

 

那麼下面演示一下怎麼利用Excel計算兩組數據的相關係數吧。

先介紹個函數

Excel的隨機函數,RANDBETWEEN(a,b),它表示可以隨機產生一個在a與b之間並且包括a和b的數。

 

1.隨機生成一個A列,就這麼叫吧,不知道啥意思,一共99行數據。

2.隨機生成一個B列,範圍在10到35之間,同樣是99行數據。

3.隨機生成C列,範圍是0至8,同樣是99行數據。

D、E、F、G列同理可得出隨機的數據,或者粘過來前面列的數據。

這個數據不重要,只作為演示用。

4.有可能有的小夥伴的Excel沒有(不顯示)數據分析這個模塊,不要緊,按照下列操作進行調試出來。

依次點擊文件

→點擊左下角的選項

→加載項→分析工具庫→轉到

選擇分析工具庫,點擊確定。

然後後面的照著圖做。

點擊數據→點擊數據分析

點擊相關係數→確定

這裡選擇輸入區域即為進行相關係數分析的數據區域,輸出的區域可以選擇本工作頁碼或者建立新的工作表都行的,沒有影響。

最後出這麼一個結果。

這個結果可以大致的說明一下。

列1和列1的相關性肯定是1了,數都一樣,完全相關。

列1和列2的相關係數是0.009338,這種相關性太小了。

等等

以此類推,就這意思。

這裡出現負值了,意思是說這兩組數是負相關的。就好比說一般情況下,某種商品銷量和單價的關係,單價越低銷量越高,這就是負相關(不知道舉的例子能不能說明問題)。

一般來說,相關係數的數值範圍在-1到+1之間的,正值(大於零)說明是正相關,負值(小於零)說明是負相關。

Excel中計算的是皮爾遜相關係數(英語:Pearsonproduct-moment correlation coefficient,又稱作PPMCC或PCCs,用r表示)。

兩個變量之間的皮爾遜相關係數定義為兩個變量之間的協方差和標準差的商。

這從Excel的幫助文件可看出             

         

通常情況下通過以下相關係數取值範圍判斷變量的相關強度:

取絕對值後,

0.0-0.2:極弱相關或無相關,

0.2-0.4:弱相關,

0.4-0.6:中等程度相關,

0.6-0.8:強相關,

0.8-1.0:極強相關。

 

當兩個變量的標準差都不為零時,相關係數才有定義,皮爾遜相關係數適用於:

兩個變量之間是線性關係,都是連續數據。

兩個變量的總體是正態分布,或接近正態的單峰分布。

兩個變量的觀測值是成對的,每對觀測值之間相互獨立。

 

 

看結果,本文隨機產生的這組數據具有很微弱的相關性啊,基本不相關啊。

 

不管怎麼說,你會了方法就是啦!

 

歡迎討論學習。

相關焦點

  • 【每天學點應用軟體】用Excel進行數據分析:計算相關係數
    或稱線性相關係數、皮氏積矩相關係數(Pearsonproduct-moment correlation coefficient, PPCC)等,是衡量兩個隨機變量之間線性相關程度的指標。它由卡爾·皮爾森(Karl Pearson)在1880年代提出,現已廣泛地應用於科學的各個領域。相關係數的計算公式相關係數的值介於–1與+1之間,即–1≤r≤+1。
  • 如何用Excel計算相關係數矩陣?
    在以前的博文中,曾經介紹過如何計算兩個變量之間的相關係數,方法是用Excel的correl函數,在Excel幫助中關於correl函數功能的介紹部分舉了一個例子,有A、B兩組數據,分別位於Excel的A3至A7和B3至B7單元格區域。
  • 【每天學點應用軟體】用Excel做數據分析之相關係數與協方差
    某次實驗在兩個不同的反應器中進行同一條件下實驗得到兩組溫度和壓力相關數據,試分析他們和溫度的關聯關係,並對在不同反應器內進行同一條件下反應的可靠性給出依據。  相關係數是描述兩個測量值變量之間的離散程度的指標。
  • Excel相關性分析(一)- 計算相關係數
    本公眾號文章字數500左右,花3分鐘就能學會,點擊上方公眾號名稱關注下吧    相關係數,通常用r表示,是對樣本中變量x和變量
  • 像Excel一樣使用R進行數據分析(3)
    Excel是數據分析中最常用的工具,本篇文章通過R與excel的功能對比介紹如何使用R通過函數式編程完成excel中的數據處理及分析工作。
  • 數據分析系列(3) | 如何用R語言進行相關係數與多變量的meta分析
    本文主體部分來自《全哥的學習生涯》,如需轉載請聯繫公眾號後臺。
  • Excel做兩個相關係數比較的U檢驗!
    我們常需要考察某變量和其他很多變量之間的線性相關性,比如,考察A和B、A和C的相關性,然後,我們想知道A和B更相關,還是A和C更相關?
  • 三大相關係數法
    在這三大相關係數中,spearman和kendall屬於等級相關係數亦稱為「秩相關係數」,是反映等級相關程度的統計分析指標。最終選擇哪種相關係數法,對比結果誰更符合預期效果。Pearson相關係數:按照大學的線性數學水平來理解, 它比較複雜一點,可以看做是兩組數據的向量夾角的餘弦。
  • Excel裡的這個工具,做財務分析一定要學會
    可以用二元一次方程的方式去求解,但那樣用到的數據太少,會影響到預測的準確性。在excel裡,提供了一個非常好的工具,可以基於一組數據來進行求解。只要有準備好的數據,用工具自動計算a和b的值,比手工計算的準確度要好,也更簡單。 1、準備工作。
  • 【實戰】如何優雅的在文章中使用皮爾森相關係數
    在項目中經常會用到皮爾森相關係數,比如表達相關性,比如樣本重複性等等,如何更好的展示你的數據呢,今天就來分享幾個皮爾森相關係數的展現方式和計算方法
  • Matlab教程 | 利用NC文件進行相關係數場的計算及繪製
    希望能幫助到你這個程序是做相關場的。這個的相關場是年數據的,也就是經過計算有N年的夏季數據和N年的nino某一季節的數據!注意這裡的NC文件層數是只有一層的,如果涉及多層要在NC文件讀取那裡改,一般NC文件都是從[ 經度  緯度 層數 時間 ] 這種順序擺放的。
  • 如何使用excel做比對試驗結果的回歸分析
    >excel是我們最常用的數據處理軟體之一,幾乎所有的電腦上面都會裝有excel。在早期學習的時候我們都是通過手工計算,使用最小二乘法來計算x的係數,求出一元回歸方程。一元回歸分析可以說是最基礎的分析了,下面和大家一起看看如何使用excel來做線性分析。工具/原料·        excel或者wps表格·        電腦方法/步驟1.
  • 協方差(covariance)與相關係數(2)|統計學專題
    將配對的數據用藍色的小圓點表示,並使用直線展示gene x與gene y表達水平之間的相關趨勢。基於該趨勢,可以用gene x預測gene y的可能取值範圍,也可用gene y預測gene x的可能取值範圍。
  • 相關係數計算(Spearman,Pearson,Kendall)
    Spearman相關係數又稱秩相關係數,是利用兩變量的秩次大小作線性相關分析,對原始變量的分布不作要求,屬於非參數統計方法,適用範圍要廣些。斯皮爾曼等級相關是根據等級資料研究兩個變量間相關關係的方法。它是依據兩列成對等級的各對等級數之差來進行計算的,所以又稱為「等級差數法」斯皮爾曼等級相關對數據條件的要求沒有積差相關係數嚴格,只要兩個變量的觀測值是成對的等級評定資料,或者是由連續變量觀測資料轉化得到的等級資料,不論兩個變量的總體分布形態、樣本容量的大小如何,都可以用斯皮爾曼等級相關來進行研究
  • 別人都在用數據分析軟體,你還在用excel做數據分析?
    之前聽朋友吐槽過,他們是上千人的企業,但做數據分析居然還是靠手動上傳數據,而且還是用的excel做的。但其實excel並不是企業做數據分析的好工具。數據分析是指用適當的統計分析方法對收集來的大量數據進行分析,提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。
  • 相關係數簡介及R計算
    變量間Pearson、Spearman、Kendall、Polychoric、Tetrachoric、Polyserial、Biserial相關係數簡介及R計算對於給定數據集中,變量之間的關聯程度以及關係的方向,常通過相關係數衡量。
  • SPSS:相關係數在遊戲分析中的應用
    下圖是對相關係數的一個解讀。  憑藉著科技的力量進入了大數據時代,收集數據的能力也大大提高,分析師每天與這些「大」數據打交道。在遊戲行業,我們擁有成熟的AARRR模型,從獲客、活躍、流失和留存、收入到用戶傳播建立一個完美的閉環。除了常規指標,在分析過程中我們還會建立很多臨時指標來輔助分析。
  • Pearson(皮爾遜)相關係數
    相關係數:考察兩個事物(在數據裡我們稱之為變量)之間的相關程度。如果有兩個變量:X、Y,最終計算出的相關係數的含義可以有如下理解:(1)、當相關係數為0時,X和Y兩變量無關係。(2)、當X的值增大(減小),Y值增大(減小),兩個變量為正相關,相關係數在0.00與1.00之間。
  • 別人都在用數據分析軟體了,不要再用excel做數據分析了
    之前聽朋友吐槽過,他們是上千人的企業,但做數據分析居然還是靠手動上傳數據,而且還是用的excel做的。但其實excel並不是企業做數據分析的好工具。 數據分析是指用適當的統計分析方法對收集來的大量數據進行分析,提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。
  • 如何用excel做數據核對?
    不知大家工作中是否遇到過以下場景:兩列數據需要找出相同項和不同項,然後能在excel表格中區分出來。比如做庫存檔點、員工工資核對、中獎人是否已派發獎品等等。下面給大家總結了excel中數據核對的幾種方法,快來看看吧!