今天我們來講講分析方法的相關係數
定義
相關分析方法的定義就是利用指標衡量兩種數據間的相關程度。
1)數值大小表示兩種數據的相關程度:
相關係數的絕對值越大,說明兩種數據的相關程度越高。
弱相關:0~0.3
高度相關:0.6~1
2)數值正負反映兩種數據的相關方向:
-:反方向變化,負相關,一種數據增大,另一種數據隨之減小
+:同方向變化,正相關,一種數據增大,另一種數據隨之增大
0:不是線性相關
應用場景
比如說一個APP的日活量下降,經過假設檢驗分析,我們了解到日活量下降的原因有三個:
1.獲取用戶的渠道B出現了問題
2.產品出現了閃退等問題
3.競品對手開始了大額補貼
這三個問題都很棘手,都急需解決。但是因為公司的資源有限,只能優先解決一個問題,那麼哪個問題是最優先的呢?
這裡就要用到相關係數分析,我們分析後發現問題2.產品出現了閃退和日活量下降相關係數最高,所以我們知道了解決閃退問題是最優先的了。
注意事項
相關關係我們很容易和因果關係相混淆。
因果關係往往是A事件導致了B事件
而相關關係是A事件發生的同時,B事件也發生了,但是我們不能說A事件的發生導致了B事件的發生。
實際上,相關關係的發生要麼是有個C事件的發生導致的,要麼是純屬巧合。
那麼,怎樣判斷是因果關係還是相關關係呢?
單一控制變量法即可,對,就是初中學的那個!~!
舉個慄子:每天早上,公雞都會打鳴,太陽都會升起。那麼這兩者之間是啥關係呢?
我們把公雞燉了,太陽依然會照常升起。
所以這不是因果關係,屬於相關關係。
CTR技術建立在相關關係分析的基礎上的,大部分時候我們往往無法找到直接的因果關係,當必須找到原因時:先找到相關關係,再通過實驗找到因果關係。
最後打個小廣告,我的微信公眾號:顧先生的數據挖掘
喜歡的小夥伴可以關注下,你的關注是我最大的動力!