Spearman相關係數又稱秩相關係數,是利用兩變量的秩次大小作線性相關分析,對原始變量的分布不作要求,屬於非參數統計方法,適用範圍要廣些。斯皮爾曼等級相關是根據等級資料研究兩個變量間相關關係的方法。它是依據兩列成對等級的各對等級數之差來進行計算的,所以又稱為「等級差數法」
斯皮爾曼等級相關對數據條件的要求沒有積差相關係數嚴格,只要兩個變量的觀測值是成對的等級評定資料,或者是由連續變量觀測資料轉化得到的等級資料,不論兩個變量的總體分布形態、樣本容量的大小如何,都可以用斯皮爾曼等級相關來進行研究
對於服從Pearson相關係數的數據亦可計算Spearman相關係數,但統計效能要低一些。Pearson相關係數的計算公式可以完全套用 Spearman相關係數計算公式,但公式中的x和y用相應的秩次代替即可。
Kendall's tau-b等級相關係數:用於反映分類變量相關性的指標,適用於兩個分類變量均為有序分類的情況。對相關的有序變量進行非參數相關檢驗;取值範圍在-1-1之間,此檢驗適合於正方形表格;肯德爾(Kendall)W係數又稱和諧係數,是表示多列等級變量相關程度的一種方法。適用這種方法的數據資料一般是採用等級評定的方法收集的,即讓K個評委(被試)評定N件事物,或1個評委(被試)先後K次評定N件事物。等級評定法每個評價者對N件事物排出一個等級順序,最小的等級序數為1 ,最大的為N,若並列等級時,則平分共同應該佔據的等級,如,平時所說的兩個並列第一名,他們應該佔據1,2名,所以它們的等級應是1.5,又如一個第一名,兩個並列第二名,三個並列第三名,則它們對應的等級應該是1,2.5,2.5,5,5,5,這裡2.5是2,3的平均,5是4,5,6的平均。
肯德爾(Kendall)U係數又稱一致性係數,是表示多列等級變量相關程度的一種方法。該方法同樣適用於讓K個評委(被試)評定N件事物,或1個評委(被試)先後K次評定N件事物所得的數據資料,只不過評定時採用對偶評定的方法,即每一次評定都要將N個事物兩兩比較,評定結果如下表所示,表格中空白位(陰影部分可以不管)填入的數據為:若i比j好記1,若i比j差記0,兩者相同則記0.5。一共將得到K張這樣的表格,將這K張表格重疊起來,對應位置的數據累加起來作為最後進行計算的數據,這些數據記為γij。
我們用python 下的pandas 包來進行計算:
pandas相關係數-DataFrame.corr()參數詳解
DataFrame.corr(method='pearson', min_periods=1)
參數說明:
method:可選值為{『pearson』, 『kendall』, 『spearman』}
pearson:Pearson相關係數來衡量兩個數據集合是否在一條線上面,即針對線性數據的相關係數計算,針對非線性數據便會有誤差。
kendall:用於反映分類變量相關性的指標,即針對無序序列的相關係數,非正太分布的數據
spearman:非線性的,非正太分析的數據的相關係數
min_periods:樣本最少的數據量
返回值:各類型之間的相關係數DataFrame表格。
簡要示例代碼如下:
這個在股票市場中計算,各個股票間的相關係數比較有用。