△藍字可關注並標星
現在,各大招聘網站上,幾乎所有的高薪崗位都需要具備數據分析能力,都要求能用數據分析解決業務問題,比如改進活動效果、挖掘用戶需求、提升付費轉化率等等。這說明,各大公司已經越來越意識到數據在公司運營中的重要地位。
但是依然有很多人想知道如何下手對手裡的數據進行處理,從什麼維度進行分析。今天DataHunter數獵哥就來給大家分享一下,拿到數據以後,我們該用哪些方法來分析數據,獲得進一步工作指導。
一、數據分析方法
在說數據分析方法之前,我們先來明確兩個概念:數據分析方法與數據分析方法論。
分析方法論是一次數據分析工作遵循的宏觀框架;分析方法,是針對不同目標、不同數據源選用的細節工具,一次分析工作中會藉助很多種不同的分析工具。
如圖所示,定下框架在前,使用細節工具在後。
常見的數據分析方法論有以下幾種:營銷方面的理論模型有4P、用戶使用行為、STP理論、SWOT等,而管理方面的理論模型有PEST、5W2H、時間管理、生命周期、邏輯樹、金字塔、SMART原則等,這些都是經典的營銷、管理方面的理論。
而數據分析方法則是指具體的分析方法,基本的分析方法有:對比分析、分組分析法、交叉分析法、結構分析法、漏鬥圖分析法、綜合評價分析法、因素分析法、矩陣關聯分析法等;高級的分析方法有:相關分析法、回歸分析法、聚類分析法、判斷分析法、成分分析法、因子分析法、對應分析法、時間序列等。
如圖所示,在之前的文章中我們已經為大家分享過:①基於流程:漏鬥分析、留存分析;②基於精細化運營:用戶分層與分群;③基於實驗的分析方法:A/B測試。想了解的朋友可以查看:
如何用漏鬥模型做數據分析
如何利用數據分析提高用戶留存
如何利用用戶分層來提高運營效率
Facebook、Google、今日頭條、抖音都在用的A/B測試到底是什麼
今天主要的講的是基礎分析方法:指標分析法、對比分析法、結構分析法。
二、指標分析法
如圖所示是一些統計學中的概念,當我們拿到數據後,可以將分析目的和這些概念本身的含義分別結合,進行有針對性的數據分析。
1.平均數
運用計算平均數的方法來反映總體在一定時間、地點條件下某一數量特徵的一般水平的分析方法叫平均分析法。
平均數的相關指標可用於對比同類現象在不同地區、不同行業、不同單位等之間的差異程度,比用總量指標對比更具說服力;利用平均指標對比某些現象在不同歷史時期的變化,更能說明其發現趨勢和規律。
平均分析法常用指標有算術平均數、調和平均數、幾何平均數、眾數和中位數等,其中最為常見的是算術平均數,也就是日常所說的平均數或平均值。
如下圖顯示,居民可支配收入每個居民都是不一樣的,那麼如何反應不同年份居民可支配收入的增長情況呢?這個時候就可以使用平均數來綜合考量居民可支配收入,通過不同年份人均可支配收入變化來反應當年的居民可支配收入水平。類似的,男女的身高對比、體重對比,崗位的薪資對比等,都可以使用平均數指標。
2.眾數
在(1,2,2,2,2,3,3,4,5,5)這組十個數據組成的樣本中,2是出現次數最多的數據,有4次。假設這是10家公司的滿意度調查結果,2代表「較為滿意」,就說明在10家公司中,有較多人對你產品的整體滿意度一般。從眾數角度講,你需要進一步找到產品可迭代之處。
眾數是指在數據中發生頻率最高的數據值,這組樣本的眾數就是:2,較為滿意。
眾數也可能不存在,如(1,3,4,5)這組數中,所有數出現的次數均為1次,因此這組數可以認為沒有眾數。
在統計學中,眾數反映了一組數據的集中程度,日常生活中諸如「最佳」,「最受歡迎」,「最滿意」等,都與眾數有關係,它反映了一種最普遍的傾向。
3.中位數
中位數是另外一種反映數據的中心位置的指標。
顧名思義,其確定方法是將所有數據以由小到大的順序排列,位於中央的數據值就是中位數。
因為中位數是通過排序得到的,所以它不受最大、最小兩個極端數值的影響,而且部分數據的變動對中位數也沒有影響。
因其可以很好地避免樣本中個別數據的跳脫,用它來描述這個樣本的集中趨勢就是最好不過的了。
Tips:想描述一個樣本的集中趨勢,如果各個數據之間的差異程度較小,用平均值;如果數據之間的差異程度較大,或者有個別的極端值,中位數或眾數會有較好的代表性。
4.最大(小)數
最值,也就是一組數據中最大(小)的那個數。在日常工作中作為典型代表與異常值進行分析,如銷售冠軍,爆款商品等。如下圖,你可以將銷售額最大的幾款商品提取出來,作為典型商品進行分析,找到爆款原因,看是否可以複製到其他商品。
5.比率
比率的作用主要是消除樣本數量不同帶來的可比性差異,例如,如河南大學生數量為103萬,北京大學生數量為51萬,能夠說明河南的受教育程度比北京高嗎?
再如,數獵哥寫了兩篇文章,其中一篇的閱讀量為980,點讚數為44,另一篇的閱讀量為1024,點讚數為33,哪篇文章的質量更高?(所以,請各位同學看過文章點個「好看」,避免數獵哥懷疑人生)
6.絕對值
絕對值是對於觀測對象的度量,通常用於如銷售額、應付帳款等方面,所做動作就是累加。如圖所示,毛利額就是一個絕對值,指標沒有進行加工,只是做了一下匯總。
7.計數
計數就比較簡單了,可理解為重複加1的行為,通常用於算出對象有多少個,如訂單數、訪客數。如圖所示,訂單數就是一個計數的案例,可以理解為一個訂單編號就是一個訂單,訂單編號的數量就是訂單的數量,因此求訂單數的時候,可以對訂單編號進行計數。
三、對比分析法
對比分析法是指將兩個或兩個以上的數據進行比較,分析它們的差異,從而揭示這些數據所代表的事物發展變化情況和規律性。它可以非常直觀地看出事物某方面的變化或差距,並且可以準確、量化地表示出這種變化或差距是多少?對比分析法可分為靜態比較和動態比較兩類。
靜態比較:在同一時間條件下對不同總體指標的比較,如不同部門、不同地區、不同國家的比較、也叫橫向比較,簡稱橫比;
動態比較:在同一總體條件下對不同時期指標數值的比較,也叫縱向比較,簡稱縱比。這兩種方法既可單獨使用,也可結合使用。
進行對比分析時,可以單獨使用總量指標、相對指標或平均指標,也可將它們結合起來進行對比。比較的結果可用相對數表示,如百分數、倍數等指標。
在使用對比分析法時,需要先注意以下幾個方面:①指標的口徑範圍、計算方法、計量單位必須一致,即要用同一種單位或標準去衡量;②對比的對象要有可比性;③對比的指標類型必須一致。無論絕對數指標、相對數指標、平均數指標,還是其他不同類型的指標,在進行對比時,雙方必須統一。
1.時間維度對比
同一指標在不同時間維度下的對比,如同比、環比、定基比等。同比就是與去年的同一個時間段進行對比分析,可以是季、月、周、天;環比就是和上一個時間段來對比(也有和下一個時間段對比的,也叫後比),例如本月和上月,本周和上周對比;定基比是和某個指定的時期進行對比分析,比如2013年每個月都和2013年1月的銷售額進行對比取值。
如圖為各月銷售額對比,時間範圍一致(均為月匯總)、指標一致、指標含義一致、其表現的為整個企業信息,總體性質可比。
2.空間對比
就是不同空間數據的對比,比如華北區和華南區對比,北京和上海,上海古北店和成都春熙路店進行對比。相似空間的對比對象必須是形態上比較接近,先進空間則是和同一種形態中的優秀空間進行對比,與擴大空間的對比,比如北京和全國的數據對比,北京王府井店和全北京的數據對比,和競爭對手的對比也在此列。
如圖為2018年全年各銷售小組銷售額對比,其對比的時間範圍一致、指標一致、指標含義一致、維度為各個銷售小組,具有相同性質。
3.計劃對比
和計劃標準的對比是銷售追蹤中非常重要的一環,所有的績效考核都是計劃標準,例如銷售實際達成金額與銷售計劃達成金額對比,看銷售是否完成當初指定的計劃,如果沒有完成,原因在哪裡。
4.與經驗值或理論值對比
其中的經驗標準是在大量的實踐過程中總結出來的值,而理論標準則是根據理論推斷出來的值,平均值則是某一空間或時間的平均值。如,一單一品率:所有銷售小票中只有一個商品的小票數量佔比。參考值為小於40%,如果數據超過了40%,則需要考慮如何調整策略,幫助客戶做關聯購買。而參考值小於40%,就是一個理論值。
四、結構分析法
結構分析法是指被分析總體內的各部分與總體之間進行對比的分析方法,即總體內各部分佔總體的比例,屬於相對指標。一般某部分的比例越大,說明其重要程度越高,對總體影響越大。
市場佔有率是分析企業在行業中競爭狀況的重要指標,也是衡量企業運營狀況的綜合經濟指標。市場佔有率高,表明企業運營狀況好,競爭能力強,在市場上佔據有利地位;反之,則表明企業運營狀態差,競爭能力弱,在市場上處於不利地位。
五、小結
1.數據分析方法論是一次數據分析工作遵循的宏觀框架;分析方法,是針對不同目標、不同數據源選用的細節工具。
2.統計學中的概念會幫助我們做有針對性的數據分析。
3.數據分析要結合目標,真正落實到優化未來業務上去。
PS:以上圖表都是使用Data Analytics製作,Data Analytics是一個輕量級業務數據可視化平臺,可一鍵快速接入企業本地和雲端內外部Execl/CSV等數據文件,無需編程僅需簡單的拖拽即可製作酷炫的數據可視化看板,用直觀的數據幫你做好的決策。