協方差與相關係數

2021-02-13 小宇治水

協方差

協方差這個玩意兒,好多同學仍舊是一頭霧水,而後面再加上相關係數更是讓人一臉懵逼,今天我們就來認認真真研究下。

在此之前呢,我們來看一下方差。方差總該知道是啥吧?

假設有這麼兩個集合:

[0,8,12,20]和[8,9,11,12]

兩個集合呢,均值都是10,但顯然兩者的差別還是蠻大的,我們通過計算方差即可得出二者的差異:

第一個集合表現的比較動蕩(不是放蕩),第二個集合表現比較平穩,方差就是衡量這個的。

好啦,既然有了方差,問題又來了。假設你統計了兩組樣本:

第一組數據是身高X,第二組數據是體重Y。那麼我現在想知道:

身高和體重是否存在某種聯繫?

一般來說,身高和體重可能是有某種聯繫的,身高較高的人體重一般較大,二者呈正相關性。

我們將其繪製到圖像上,可以驗證我們的直覺是正確的:

那麼,我們如何來量化這件事呢?也就是如何來說明:

身高X和體重Y之間存在正(或負)相關性呢?

這就是引出了協方差的概念:

為啥分母是n-1而不是n呢?這個問題我們之前討論過,這裡不再贅述。

我們將身高和體重的關係計算如下:

最後得到的協方差值是209.4,那麼這個值代表什麼含義呢?

其實這個值大小沒啥含義,我們只需關心其正負性就好:

1)當協方差Cov(X,Y)>0時,X與Y正相關

2)當協方差Cov(X,Y)<0時,X與Y負相關

3)當協方差Cov(X,Y)=0時,X與Y不相關

209.4>0,因此我們就說身高和體重兩個隨機變量之間呈正相關性。

這裡我們還要注意兩個概念,就是相關性和獨立:

獨立一定不相關,但是不相關不一定獨立。

相關焦點

  • 協方差(covariance)與相關係數(2)
    相關係數的計算公式:從上面的公式中可以看出:相關係數的計算公式中包括x與y的協方差、x的方差和y的方差。故計算x與y的協方差是計算相關係數的基礎。分母的作用是將協方差的結果調整至[-1,1],故相關係數不受數據scale的影響。
  • 協方差和相關係數的主要計算方法
    協方差和相關係數的主要計算方法 http://kaoyan.eol.cn  中國教育在線考研頻道    2006-11-10  大 中 小
  • 方差-協方差法VaR計量模型選擇
    因此,方差—協方差方法中,資產組合的協方差矩陣是計算VaR的關鍵環節。     在VaR的計算中,波動性模型和估值模型是其核心和難點。不同的波動性模型和估值模型構成了VaR計算的不同方法。實際金融數據具有一些基本特徵,如尖峰厚尾性、波動集聚及爆發性、自相關及序列相關性等,模型的提出或改進都是基於這些基本特徵的。
  • 期望、方差與協方差
    方差用于衡量隨機變量或一組數據的離散程度,方差在在統計描述和概率分布中有不同的定義和計算公式。①概率論中方差用來度量隨機變量和其數學期望(即均值)之間的偏離程度;②統計中的方差(樣本方差)是每個樣本值與全體樣本均值之差的平方值的平均數,代表每個變量與總體均值間的離散程度。
  • 從協方差分析看回歸與方差分析的聯繫
    因此,在這種情況下,「收入」這個變量就被稱為「協變量」,可以記為「Z」。納入協變量的方差分析,即稱協方差分析。一般而言,進行協方差分析的協變量為「定量變量」,比如本例中的「人均月收入」,它一般不是研究者重點研究的變量(本例中重點研究的是教育程度和性別),但因為它會對分析結果造成幹擾,因此在分析過程中必須要將其納入。
  • 相關係數之Pearson
    定義說到相關係數需要了解的 3 個概念:相關分析、數據期望、協方差。先分別說明這些概念。
  • 皮爾森相關係數的計算
    在《變量關係大揭秘(一)》,我們提到了皮爾森相關係數r,它可是相關係數大家庭中的「1號人物」。
  • ML基礎:協方差矩陣!
    在翻譯sklearn文檔 2.無監督學習部分過程中,發現協方差矩陣幾乎貫穿整個章節,但sklearn指導手冊把協方差部分放在了這一章節偏後的部分,作為機器學習一個基礎概念,在這篇文章中,想把協方差矩陣的相關知識以及主要應用。統計學中常用平均值,方差,標準差等描述數據。
  • 協方差矩陣是什麼_協方差矩陣計算公式_如何計算協方差矩陣
    打開APP 協方差矩陣是什麼_協方差矩陣計算公式_如何計算協方差矩陣 發表於 2017-12-05 15:58:43
  • spss協方差分析
    什麼是協方差分析?協方差分析又稱「共變量分析」,是方差分析的引申和擴大。基本原理是將線性回歸與方差分析結合起來,調整各組平均數和 F 檢驗的實驗誤差項,檢驗兩個或多個調整平均數有無顯著差異,以便控制在實驗中影響實驗效應(因變量)而無法人為控制的協變量(與因變量有密切回歸關係的變量)在方差分析中的影響。好吧,聽不懂。簡單舉個例子來說:有一項研究,想知道男生和女生在跑步後的心率是否有差異。
  • Pearson(皮爾遜)相關係數
    相關係數:考察兩個事物(在數據裡我們稱之為變量)之間的相關程度。如果有兩個變量:X、Y,最終計算出的相關係數的含義可以有如下理解:(1)、當相關係數為0時,X和Y兩變量無關係。(2)、當X的值增大(減小),Y值增大(減小),兩個變量為正相關,相關係數在0.00與1.00之間。
  • 快速處理數據分析之協方差分析
    如果方差分析時需要考慮幹擾項,此時就稱之為協方差分析,而幹擾項也稱著「協變量」。前提條件(1) 協方差分析中,X是定類數據,Y是定量數據;協變量通常為定量數據;如果協變量是定類數據,可考慮將其納入X即自變量中,或者將協變量做虛擬變量處理。
  • CG03-投資項目的風險及風險的衡量方法:預期值、標準差、方差、變異係數
    風險:是預期結果的不確定性,    即包括負面效應的不確定,也包括正面效應的不確定性財管中所說的風險,是與收益相關的風險
  • 基於FPGA的複數浮點協方差矩陣實現
    O 引言 協方差矩陣的計算是信號處理領域的典型運算,是實現多級嵌套維納濾波器、空間譜估計、相干源個數估計以及仿射不變量模式識別的關鍵部分,廣泛應用於雷達、聲吶、數字圖像處理等領域。
  • 2011年質量專業資格輔導:協方差分析
    (一)協方差分析基本思想  通過上述的分析可以看到,不論是單因素方差分析還是多因素方差分析,控制因素都是可控的,其各個水平可以通過人為的努力得到控制和確定。但在許多實際問題中,有些控制因素很難人為控制,但它們的不同水平確實對觀測變量產生了較為顯著的影響。
  • 相關係數種類
    首先,Pearson相關係數的前提條件是要兩個變量滿足近似正態分布。這要求在計算相關係數前,要作正態性檢驗。而且,多數情況下變量不一定滿足正態分布的,這就無法使用Pearson相關係數。其次,Pearson相關係數是在方差和協方差的基礎上得到的,對離群值比較敏感。
  • 教程| 從特徵分解到協方差矩陣:詳細剖析和實現PCA算法
    PCA 本質上是將方差最大的方向作為主要特徵,並且在各個正交方向上將數據「去相關」,也就是讓它們在不同正交方向上沒有相關性。通常我們認為信息具有較大的方差,而噪聲有較小的方差,信噪比就是信號與噪聲的方差比,所以我們希望投影后的數據方差越大越好。因此我們認為,最好的 k 維特徵是將 n 維樣本點轉換為 k 維後,每一維上的樣本方差都很大。
  • R語言統計篇: 單因素協方差分析
    方差分析(One-way ANCOVA)可以研究一個分類變量對一個連續變量的影響,同時校正其他變量的作用,這些變量也稱為協變量(Covariate)。也是單因素方差分析(One-way ANOVA,R語言統計篇:單因素方差分析)的一個延伸。比方說,我們現在想要研究不同BMI(偏輕,正常與超重)與空腹血糖的關係,同時校正血壓水平。在此研究中,BMI分組是一個分類變量(自變量),血糖是一個連續變量(因變量),血壓則是一個協變量(covariate)。c.
  • 第270期|皮爾森相關係數簡述
    相關係數:考察兩個事物(在數據裡我們稱之為變量)之間的相關程度。      如果有兩個變量:X、Y,最終計算出的相關係數的含義可以有如下理解:(1)、當相關係數為0時,X和Y兩變量無關係。(2)、當X的值增大(減小),Y值增大(減小),兩個變量為正相關,相關係數在0.00與1.00之間。
  • 數學建模筆記——相關係數
    相關係數,其實就是衡量兩個變量之間相關性的大小的指標,常用的相關係數有兩種,一種是pearson相關係數,也就是《概率論與數理統計》這本書裡提到的,平時最為常用的相關係數。另一種稱之為spearman相關係數,我也是在清風老師的課中第一次聽說,它衡量的是兩個變量的依賴性,唔,也可以理解為單調性啦。