數據分析在網際網路公司的重要性不言而喻,隨著社會對數據分析人才需求量的增大,越來越多的人在朝數據分析的方向發展。但很多人談到數據分析時首先想到的是數據分析工具,如Python、SQL等,卻忽略了數據分析思維的培養。
數據分析思維決定了從哪些方面分析,而數據分析工具主要是服務於數據分析思維。簡單地說,數據分析思維決定了分析方向,而數據分析工具只是幫你達到目的地。
一個連分析的方向都搞不清楚的人,即使通過數據分析給出了一些結論,這些結論也很難讓人信服,因為這些一般都是片面的,當然更談不上對業務的指導。
本文我就通過一個案例來教大家掌握五個關鍵的數據分析思維。
案例:某電商公司最近一個月的GMV環比增長10%,但本月用於銷售的成本支出卻環比增長50%,分析GMV環比增長率低於銷售成本增長率的原因。
一、因素分解法
因素分解法,顧名思義,就是分解影響目標的因素。
案例中,影響GMV的因素可以從多個維度拆分:
渠道維度:總體GMV=渠道1 GMV+渠道2 GMV+…+渠道n GMV
城市(子公司)維度:總體GMV=城市1 GMV+城市2 GMV+…+城市n GMV
GMV=訂單量*客單價
訂單量=活躍用戶數*下單率
活躍用戶數=新增活躍用戶數+活躍的老用戶數
顯然,訂單量、活躍用戶數、新增活躍用戶數、活躍的老用戶數等每一個因素都可以再分解到渠道和城市維度,而每個城市也可以再分解到渠道維度。這就是交叉因素分析法。
每一個因素的變化如何分析呢?這就需要用到對比法。
二、對比法
對比法主要有環比上期、同比去年同期兩個比較基準,當然也可以根據業務情況,確定其他比較基準。
對比法可以發現數據變化的規律,並且增長率可以定量反映數據變化情況。不同時期的同比增長率可以對比,環比增長率也可以再對比。
如案例中,若同比去年,發現去年11月GMV的同比增長率為20%,而今年的同比增長率只有5%,顯然今年11月份的增長率同比去年11月份變低了。
提到對比,不得不提到值得注意的一點:趨勢固然重要,但不要只看大致趨勢,要分析具體的變化比率。數據分析不是告訴別人差不多,而是要告訴別人差多少。
三、分類法
在分解了影響目標的因素,並分析了各因素指標的增長率以後,我們可以發現有一些城市、業務單元或者其他對象(如用戶)多個關鍵指標都表現比較好,或者其中一個關鍵指標表現好,但其他指標表現差。對這些對象我們需要進一步分類,區分出高價值對象、重點發展對象、重要挽留對象和一般維持對象。
如案例中,我們進一步分析發現:部分用戶下單頻率很高,客單價也很高;部分用戶下單頻率比較低,但客單價很高;部分用戶下單頻率很高,但客單價低;還有部分用戶下單頻率和客單價都很低。
四、二八分布法則
有一個玩笑說:如果一種數據的分布不服從常見的正態分布、泊松分布、二項分布的話,那它就接近服從二八分布了。
這個玩笑雖然不一定百分之百能概括所有的數據分布類型,但在我們常見的與錢相關的數據分布中,很多都服從二八分布。如:世界上20%的人掌握了80%的財富,一個公司20%的客戶貢獻了80%的收入,一個公司20%的員工為企業發展貢獻了80%的力量……
二八分布法則對數據分析師的啟示是:重點研究貢獻80%的收入的20%用戶,找出這些用戶的特徵,再把其他潛在用戶培養成這20%的用戶,企業就可以越做越大了。所以,作為一名數據分析師,先集中精力把這20%的重要用戶研究清楚,再研究其他用戶吧。
通過以上四種思維方法,你已經把案例中下過訂單、貢獻收入的用戶基本分析清楚了。
但除了下過訂單的用戶,還有一部分用戶是沒有下過訂單的,這部分用戶為什麼沒有下過訂單呢?
我們需要通過漏鬥法來分析用戶從登錄平臺到最後下單的轉化率。
五、漏鬥法
漏鬥法主要目的是查看目標事件整個過程中每一步的轉化率以及整個事件最終的轉化率,發現用戶流失最嚴重的環節,以優化程序和提高整體轉化率。如:產品使用過程中每一步的轉化率,可以幫助分析產品設計環節的優劣;運營活動每一步的轉化率,可以分析運營活動各個環節設計的優劣。
漏鬥法在網際網路公司的數據分析中經常被用到,並且經常通過埋點數據分析頁面曝光和點擊的PV、UV。
在案例中,電商漏鬥可用如下圖表示,註冊、登錄一般是新用戶才有的環節,對老用戶而言則是啟動、瀏覽商品直至最後支付成功的環節。
電商用戶登錄-支付成功漏鬥圖
當然,漏鬥中每一步的轉化率指標同樣需要結合前面提到的對比法進行分析,如分析同一時期轉化率的變化情況,對比分析不同城市或用戶群體每一步的轉化率等。
最後,每一種數據分析思維不是孤立存在的,需要結合交叉使用,以發現問題和解決問題為最終目的。
大數據分析關鍵的5個思維.中琛魔方大數據分析平臺(www.zcmorefun.com)表示大數據有五大特點,即大量(Volume)、高速(Velocity)、多樣(Variety)、低價值密度(Value)、真實性(Veracity)。它並沒有統計學的抽樣方法,只是觀察和追蹤發生的事情。大數據的用法傾向於預測分析、用戶行為分析或某些其他高級數據分析方法的使用。