相關係數計算(Spearman,Pearson,Kendall)

2021-01-09 路角石

Spearman相關係數又稱秩相關係數,是利用兩變量的秩次大小作線性相關分析,對原始變量的分布不作要求,屬於非參數統計方法,適用範圍要廣些。斯皮爾曼等級相關是根據等級資料研究兩個變量間相關關係的方法。它是依據兩列成對等級的各對等級數之差來進行計算的,所以又稱為「等級差數法」

斯皮爾曼等級相關對數據條件的要求沒有積差相關係數嚴格,只要兩個變量的觀測值是成對的等級評定資料,或者是由連續變量觀測資料轉化得到的等級資料,不論兩個變量的總體分布形態、樣本容量的大小如何,都可以用斯皮爾曼等級相關來進行研究

對於服從Pearson相關係數的數據亦可計算Spearman相關係數,但統計效能要低一些。Pearson相關係數的計算公式可以完全套用 Spearman相關係數計算公式,但公式中的x和y用相應的秩次代替即可。

Kendall's tau-b等級相關係數:用於反映分類變量相關性的指標,適用於兩個分類變量均為有序分類的情況。對相關的有序變量進行非參數相關檢驗;取值範圍在-1-1之間,此檢驗適合於正方形表格;肯德爾(Kendall)W係數又稱和諧係數,是表示多列等級變量相關程度的一種方法。適用這種方法的數據資料一般是採用等級評定的方法收集的,即讓K個評委(被試)評定N件事物,或1個評委(被試)先後K次評定N件事物。等級評定法每個評價者對N件事物排出一個等級順序,最小的等級序數為1 ,最大的為N,若並列等級時,則平分共同應該佔據的等級,如,平時所說的兩個並列第一名,他們應該佔據1,2名,所以它們的等級應是1.5,又如一個第一名,兩個並列第二名,三個並列第三名,則它們對應的等級應該是1,2.5,2.5,5,5,5,這裡2.5是2,3的平均,5是4,5,6的平均。

肯德爾(Kendall)U係數又稱一致性係數,是表示多列等級變量相關程度的一種方法。該方法同樣適用於讓K個評委(被試)評定N件事物,或1個評委(被試)先後K次評定N件事物所得的數據資料,只不過評定時採用對偶評定的方法,即每一次評定都要將N個事物兩兩比較,評定結果如下表所示,表格中空白位(陰影部分可以不管)填入的數據為:若i比j好記1,若i比j差記0,兩者相同則記0.5。一共將得到K張這樣的表格,將這K張表格重疊起來,對應位置的數據累加起來作為最後進行計算的數據,這些數據記為γij。

我們用python 下的pandas 包來進行計算:

pandas相關係數-DataFrame.corr()參數詳解

DataFrame.corr(method='pearson', min_periods=1)

參數說明:

method:可選值為{『pearson』, 『kendall』, 『spearman』}

pearson:Pearson相關係數來衡量兩個數據集合是否在一條線上面,即針對線性數據的相關係數計算,針對非線性數據便會有誤差。

kendall:用於反映分類變量相關性的指標,即針對無序序列的相關係數,非正太分布的數據

spearman:非線性的,非正太分析的數據的相關係數

min_periods:樣本最少的數據量

返回值:各類型之間的相關係數DataFrame表格。

簡要示例代碼如下:

這個在股票市場中計算,各個股票間的相關係數比較有用。

相關焦點

  • Pearson和Spearman相關性檢驗
    看過許多統計教程,這篇是我最推薦的介 紹Pearson相關用於檢驗兩個數值變量的相關性,應用條件為兩變量均符合正態分布,否則需要採用Spearman相關。除此之外,Spearman相關還可以用於檢驗兩個等級變量的相關性。
  • 回歸分析的基礎概念之2:相關性與相關關係,相關係數與判定係數
    2、函數關係、相關關係與因果關係。3、相關係數及其計算方法。4、相關關係強弱的評定標準。5、判定係數及其計算方法。6、相關係數與判定係數在回歸分析中的作用。回歸分析,主要分析的是相關關係。三、相關係數及其計算方法。相關係數,是衡量兩個變量之間相關方向和相關程度的相對指標。相關方向,是指兩者之間是正相關還是負相關。相關程度,是指兩者之間相關的緊密度。
  • 《只狼:影逝二度》難度係數計算分享
    《只狼:影逝二度》的出名,主要來源於遊戲的難度,以及宮崎英高前幾代作品口碑的積累,但是這遊戲越到後面會越難,且多周目之後更加難打,那麼關於只狼遊戲的難度係數是怎麼計算的呢?《只狼:影逝二度》難度係數計算分享難度係數 (算法大致是:難度係數= BOSS血量/我方從戰鬥記憶獲取的攻擊力,之後以二周目難度為基礎進行標準化)關於難度係數計算方法的說明圖例其實已經說明了,難度係數就是敵人的血量/己方的攻擊力,同時把二周目各階段難度設置為1(關於階段的含義以及為什麼以二周目為基準請參考下文)。
  • 根據區間判斷計算績效係數,用VLOOKUP函數代替IF函數,更簡單
    一說到計算提成、績效獎金等,大家都覺得是個很燒腦的問題。但如果用對公式了,其實就很簡單了。今天,我們就舉個簡單且實用的例子「計算績效係數」,看看各位都是怎麼來完成。如下表格,為一家公司的績效考核規則。達到不同的完成率,拿到的績效係數是不一樣。
  • 肯豆kendall身材360度無死角,學她穿歐美風搭配,高級感說有就有
    大多數歐美女明星的身材都特別的豐滿,而且身材高挑,具有著得天獨厚的身材優勢,肯豆kendall作為一名比較時尚的女人,在穿衣方面都很有自己的見解,給我們提供了很多借鑑意義,而且每一次的出街都會引起大家的關注,今天我們可以來看一看關於肯豆kendall的穿搭。
  • 複利終值和現值互為逆運算,複利的終值係數與現值係數互為倒數
    複利計算方法分為一次性複利現值和終值計算和年金的計算。那麼,複利一次性終值和現值的計算是已知現值、利率、計息期,求終值,或已知終值、利率、計息期,求現值。其計算公式應為:這裡F表示為終值,P表示為現值,i表示為利率、n表示為計息期。被稱為複利終值係數,用符號表示為(F/P.i.n),即F=Px(F/P.i.n)這裡我們為了便於計算,就會使用到複利終值係數表。
  • 建築電氣設計相關計算公式大全,收藏備用(附工程設計應用舉例)
    提示:按設備組計算,配電幹線逐項計算累加後,來計算變電所低壓母線和變壓器的容量。變電所低壓母線一般按計算電流的1.35—1.5倍的係數考慮。3、推薦的配電幹線、配變綜合需要係數簡明方法綜合係數(K綜)表:註明:建築電氣計算中變電所的綜合同期係數,可作為估算時使用,即:住宅建築綜合係數K∑綜一般取0.45~0.55;
  • 清單土方工程量如何計算?
    3、A1.1-3——放坡係數表(1)放坡起點是在挖溝槽、基坑、一般土方工程中,當挖到一定深度時,為了防止側壁坍塌,確保安全施工及必要的工作面,需要進行放坡,這個「一定深度」就是放坡起點了(2)放坡係數1)邊坡坡度=1: m=h:b,m為放坡係數,h為基高,b為底寬m=b/h 即土壁邊坡坡度的底寬b
  • 玻璃溫室大棚受壓和壓彎構件的約束係數
    ⑤ 有綴板的單軸對稱開口戒面軸心受壓構件彎扭屈曲的換算長細比λw可按公式(1-13)計算,約束係數α、β可按表1-46採用,但扭轉屈曲的計算長度lw=β*α,α為綴板中心線的最大間距。構件兩支承點間至少應設置2塊綴板(不包括構件支撐點處的綴板或封頭板在內)。
  • 福建物構所提出晶體電光係數的多晶粉末測試方法
    中國科學院福建物質結構研究所中科院光電材料化學與物理重點實驗室研究員葉寧課題組受到高效的粉末倍頻測試方法之於非線性光學晶體探索的啟發,提出晶體電光係數的粉末測試方法,實現晶體電光性能的初步表徵。不同於純粹的理論計算或測試,該方法通過粉末狀態下晶體樣品的粉末倍頻測試、紅外反射譜和拉曼光譜的測試及分析來預測晶體的電光係數。
  • 步進電機選型及計算公式分享
    #步進電機#在面臨步進電機選型時候我們需要對相關數據進行計算,儘管在網頁和書本上有大量的相關方法,但是大多數都比較難懂、深奧、僅停留在書本上,沒有實際的現場應用經驗,我們機械工程師、電氣設計、結構設計工程師等崗位在查找這方面資料時候,還是比較困難,所以我們技術工程師們專門在培訓時候整理了一下,以供大家使用,歡迎大家收藏、關注。
  • 暖通設計師必備的,超高層建築空調負荷計算方法,北京院這樣計算
    陳亮研究了不同氣候區超高層建築空調負荷高度修改係數,認為高層風速和溫降綜合作用減小的冷負荷可考慮作為空調冷負荷的安全餘量,在計算中不予考慮,冬季熱負荷採用穩態算法,受高層風速和溫降的影響較大,分別給出了不同氣候區外牆、屋頂和天窗的高度修正係數。其他超高層建築空調設計文獻很少涉及負荷計算,也沒有對計算參數或計算結果做一定的修正。
  • 電氣負荷計算和負荷電流怎麼計算?這裡有詳細講解,小白趕緊收藏
    三、負荷計算方法目前普遍採用需要係數法和二項式係數法確定用電設備的負荷,其中需要係數法是國際上普遍採用的確定計算負荷的方法,最為簡便;而二項式係數法在確定設備臺數較少且各臺設備容量差別大的分支幹線計算負荷時比較合理;
  • JCIM|結合自由能計算能否預測藥物選擇性?
    由於每個目標的模擬計算是分開的,如果我們假設兩個目標的系統誤差均按照雙變量正態分布進行分布,其中相關係數ρ量化了相關程度(其中ρ=0表示不相關,ρ=1表示完全相關,ρ=-1表示完全反相關)和兩個目標(σstat,ij,target)的統計誤差是完全獨立的,我們可以將預測ΔSij的誤差建模為σ選擇性。
  • Midas 橋梁設計建模計算,全過程圖文解析!
    4.6.15圖 4.6.15路徑:【分析】/【移動荷載分析控制數據】選擇相關項見圖 4.6.16圖 4.6.16路徑:【分析】/【施工階段分析控制數據】選擇相關項見圖 4.6.17圖 4.6.17(11)運行按 F5 鍵執行計算七、汽車荷載橫向分布係數不同計算方法的比較(1
  • 如何計算玻璃的K值?
    我國絕大多數採暖地區房屋圍護結構的保溫隔熱功能,都比氣候相近的發達國家差了許多,其中傳熱係數,建築外牆相差3.5至4.5倍、外窗相差為2至3倍、屋面為3至6倍,門窗的空氣滲透相差為3至6倍。在建築整體舒適度低於世界各發達國家的情況下,我國單位建築面積能耗是發達國家能耗的2至3倍以上;建築能耗已經佔到當年全社會終端能源消耗的30%以上。
  • 評價得分計算:確立權重的方法
    常用方法:層次分析法AHP、權值因子判斷表法、德爾菲法、模糊分析法、二項係數法、環比評分法、最小平方法、序關係分析法等客觀賦權法:依據歷史數據研究指標之間的相關關係或指標與評估結果的影響關係來綜合評價。這是定量研究,無須考慮決策者主觀意願和業務經驗,計算方法較為複雜。