在數據分析中,單個欄位的對比在特殊場景下並不嚴謹,還有可能產生錯誤的分析與判斷。而引入比率概念後,我們則可以更加準確地識別數據,做數據分析。
在上篇文章中,和大家一起分析了常見的「數據對比」,也通過「老王女裝店中靜默銷售額」的案例提出單個欄位的數據對比,具有迷惑性,存在陷阱。
由此可見,單個欄位的對比在一些特殊的場景下是不夠嚴謹的,容易產生錯誤的判斷。
這個時候我們可以引入「比率」的概念,通過「比率」來破解這一數據對比陷阱,可以讓論證結果更加嚴謹,更加科學。
下面讓我們一起來討論「比率」在數據對比中的意義。
一、什麼是比率
「比率」在百度百科中的解釋是,樣本(或總體)中各不同類別數據之間的比值,由於比率不只是部分與整體之間的對比關係,因此比值可能大於1。
從「比率」的定義中可以發現,比率的值是多個欄位經過了對比得到的值,這也是為什麼它能更加嚴謹和科學的原因,通過計算比率過程中的對比,對不同的數據進行了一次標準化的過程。
例如下面這個例子,通過「客單價」這個比率對客服的銷售能力進行了一個標準化的衡量,發現對於單個顧客的成交價格金額,客服甲的能力優於客服乙:
老王女裝店的2個客服,客服甲和客服乙的今日銷售情況 :
今日客服甲銷售額3000元,成交人數為30人,客單價100元今日客服乙銷售額5000元,成交人數為60人,客單價83.33元(保留兩位小數)那麼哪些欄位算的上「比率」呢?常見的「比率」有3種,佔比、轉化率、平均值。
1. 佔比
佔比,是指一個總體中各個部分數量佔總體數量的比重,反映總體的構成或者結構。
下面我們通過老王的店鋪來看一下,在沒有引入「佔比」前,我們通過「團隊銷售額」和「全店銷售額」兩個欄位,能得出兩個欄位的今日數據都比昨日有明顯降低:
今日客服團隊銷售額10000元,全店銷售額15000元昨日客服團隊銷售額12000元,全店銷售額20000元通過對「團隊銷售額」和「全店銷售額」兩個欄位的分析,發現「團隊銷售額」屬於「全店銷售額」的一部分(通常店鋪銷售額=團隊銷售額+靜默銷售額),符合「佔比=佔比數例值/總數值「。
通過計算「團隊銷售額」佔全店的佔比,就能夠直觀的發現客服團隊對全店銷售額的貢獻度,發現今日「團隊銷售額」是降低了,但是對於店鋪的整體貢獻度更大,較為客觀的衡量了店鋪每天的銷售情況,也便於店鋪主根據這一數據調整對「客服團隊」和「自然靜默銷售」的策略。
今日客服團隊銷售佔比:66.67%昨日客服團隊銷售佔比:60%通過案例可以推斷出的「轉化率」的通用公式:
公示:C欄位=A欄位/B欄位
數據格式:
A欄位:總體中某個個體或部分的數據B欄位:總體數據A欄位是B欄位的子集,或者說B欄位包含A欄位單位:百分率(%)佔比,直觀反映了個體佔總體的比重,常被用於觀察總體的構成情況(每個個體的佔比起情況),監控個體在總體的變化(個體隨著時間維度在總體的佔比變動)。
2. 轉化率
轉化率,指一個周期或一個業務流程內,某一行為針對另一行為的轉化百分率。
例如在電商客服中的一個接待周期,接待客戶–>詢單客戶–>下單客戶–>購買;在app中一個商品推廣的業務流程,落地頁–>購買頁–>訂單頁–>購買。
在前一個行為進行到下一個行為的過程中,都會產生流失,轉化率為我們分析不同行為之間的轉化,以及一整個業務流程或周期內每個步驟的轉化情況提供了數據支持和指導意義,同樣來看下老王店鋪的案例
最近,老王的店鋪想要評估下整個客服團隊在「接待」上的能力,老王收集了1月份客服團隊「進店人數」,「詢單人數」,「下單人數」,「付款人數」的數據。
單純依靠這些數據,我們只能獲得孤立的結論,比如通過「進店人數」,對老王店鋪1月份的進店客戶數的了解,能讓我們對店鋪規模有一個大致的概念,但是沒有辦法進一步評估客服團隊的「接待」能力。
而通過4個欄位的分析,4個行為的人數是逐級減少的,這也符合了一個接待周期的規律,但是仍然無法分析出「接待」能力。
老王店鋪客服團隊1月份接待客戶的數據如下:
進店人數:10000人 詢單人數:8342人下單人數:2350人付款人數:2139人其實我們分析上述的4個欄位,不難發現,其分別對應了「接待」客戶中客戶不同的4種行為——進店、詢單、下單、付款。
4個行為屬於一個周期內先後的4種客戶表現:進店–>詢單–>下單–>付款(每個行為非必須,比如客戶進店後沒有向客服詢單直接下單付款),我們可以在每個環節引入轉化率。就可以非常直觀的了解客服團隊在「接待」客戶的每一個環節的流失情況,可以針對性採取一些措施:
進店–>詢單轉化率:83.42%詢單–>下單轉化率:28.17%下單–>付款轉化率:91.02%通過案例可以推斷出的「轉化率」的通用公式
公示:C欄位=A欄位/B欄位
數據格式:
A欄位:行為1的數據或數據之和B欄位:行為2的數據或數據之和行為1和行為2同屬一個周期,傳遞關係為行為2–>行為1單位:百分率(%)轉化率是一個周期或者一個業務流程中,用戶行為的直觀和真實反映。能幫助我們對每一個行為進行監控和分析,也能幫助我們及時發現其中存在的問題,並採取對應的策略。常常被應用在業務流程中「核心和關鍵場景」分析,例如註冊流程,電商的交易流程等
3. 平均值
平均值是數據分析中常用的比率之一,是數據之和除以數據個數後得到的值,反映的是數據的集中趨勢,常常用來度量數據的一般水平。我們還是通過老王店鋪的案例來理解平均值吧
老王的店鋪又到了考核「客服績效」的時候,其中有一項對客服銷售能力的考核,我們僅從銷售額和成交人數看,都無法很好比較出客服甲和客服乙誰的銷售能力更強,因為兩者的銷售人數不同。
老王女裝店有2個客服,分別是客服甲,客服乙 :
今日客服甲銷售額3000元,成交人數為30人今日客服乙銷售額5000元,成交人數為60人分析「銷售額」和「成交人數」的關係我們發現,銷售額是每個成交人數的成交金額之和,符合平均值的定義,可以引入平均值=銷售額/成交人數,常常定義為「客單價」,通過「客單價」把不同度量單位的「銷售額」和「成交人數」用「單位人的金額」統一了,直觀的展示了兩個客服的銷售能力,發現客服甲的銷售額能力強於客服乙:
客服甲的今日客單價100元客服乙的今日客單價83.33元(保留兩位小數)通過案例可以推斷出的「平均值」的通用公式:
公示:C欄位=A欄位/B欄位
數據格式:
A欄位:總量,一組數據的數據之和B欄位:數量,一組數據的數據個數單位:C欄位單位同A欄位單位平均值能較好的反映了一組數據的集中趨勢,直觀、簡單的反映了一組數據的一般情況。
平均值與平均值的對比,也解決了不同數組之間單位不一致無法比較的情況。
平均值往往被應用於,描述和對比不同個體之間的優劣和效果,例如常見的客單價、件均價等。
二、總結
通過「比率」在數據分析和數據產品中,是一種常見的方法,能更科學和嚴謹的評估對比現象,得出的論證結果也較為全面,避開了單欄位對比容易產生的陷進問題。
但是「比率」也存在一定的問題,例如下面的例子,運營同學單純的從商品A的銷售佔比出發,確實可以發現商品A銷售佔比相較於活動前一天有很大的提高,得出了年貨節的活動是成功的。
但是老王通過對當天銷售額的查看,發現商品A的實際銷售額是下降的,那麼這次活動真的成功了嗎?
年貨節當天總銷售額10w,商品A銷售額8w,商品A銷售佔比80%活動前一天總銷售額20w,商品A銷售額12w,商品A銷售佔比60%從這個案例中我們可以發現比率也是具有一定迷惑性的,「銷售佔比」只能評估當天該商品的一個銷售佔比和權重,跨天比較就會存在誤導性,所以在使用比率中,我們需要明確對比的對象。
本文由 @晌午 原創發布於人人都是產品經理,未經作者許可,禁止轉載。
題圖來自Unsplash,基於CC0協議。