很多人都說會數據分析的人比別人聰明,實際上他們「聰明」在擁有分析思維,今天我們就來說說常見的數據分析思維。
以下10種數據分析思維可能不會瞬間升級你的思維模式,但說不定會為你以後的工作帶來「靈光一閃」的感覺,請耐心讀完,靈光一閃的時候別忘了我,你們的數據獵人DataHunter。
日常工作中,客戶分群、產品歸類、市場分級……許多事情都需要有分類的思維。關鍵在於,分類後的事物,需要在核心關鍵指標上能拉開距離!也就是說,分類後的結果必須是顯著的。
如圖,橫軸和縱軸往往是你運營當中關注的核心指標(當然不限於二維),而分類後的對象,你能看到他們的分布不是隨機的,而是有顯著的集群的傾向。
打個比方,經典的RFM模型依託收費的3個核心指標構建用戶分群體系:最近一次消費時間(Recency)、消費頻率(Frequency)、消費金額(Monetary)。
在R/M/F三個指標上,我們通過經驗將實際的用戶劃分為以下8個區(如上圖),我們需要做的就是促進不同的用戶向更有價值的區域轉移。也就是將每個付費用戶根據消費行為數據,匹配到不同的用戶價值群體中,然後根據不同付費用戶群體的價值採用不同的策略(如下表)
分類思維的發展之一是矩陣思維,矩陣思維不再局限於用量化指標來進行分類。許多時候,我們沒有數據做為支持,只能通過經驗做主觀的推斷時,是可以把某些重要因素組合成矩陣,大致定義出好壞的方向,然後進行分析。大家可以百度經典的管理分析方法「波士頓矩陣」模型。
這種思維方式已經比較普及了,漏鬥分析分為長漏鬥和短漏鬥。長漏鬥的特徵是涉及環節較多,時間周期較長,常用的長漏鬥有渠道歸因模型,AARRR模型,用戶生命周期模型等等;短漏鬥是有明確的目的,時間短,如訂單轉化漏鬥和註冊漏鬥。
但是,看上去越是普適越是容易理解的模型,它的應用越得謹慎和小心。在漏鬥思維當中,我們尤其要注意漏鬥的長度。
漏鬥從哪裡開始到哪裡結束?漏鬥的環節不該超過5個,漏鬥中各環節的百分比數值,量級不要超過100倍(漏鬥第一環節100%開始,到最後一個環節的轉化率數值不要低於1%)。若超過了我說的這兩個數值標準,建議分為多個漏鬥進行觀察。
理由是什麼呢?超過5個環節,往往會出現多個重點環節,那麼在一個漏鬥模型中分析多個重要問題容易產生混亂。數值量級差距過大,數值間波動相互關係很難被察覺,容易遺漏信息。
我們觀察指標,不僅要看單個指標的變化,還需要觀察指標間的相互關係。有正相關關係(圖中紅色實線)和負相關關係(藍色虛線)。最好能時常計算指標間的相關係數,定期觀察變化。
相關思維的應用太廣了,往往是被大家忽略的。現在的很多企業管理層,面對的問題並不是沒有數據,而是數據太多,卻太少有有用的數據。相關思維的其中一個應用,就是能夠幫助我們找到最重要的數據,排除掉過多雜亂數據的幹擾。
如何執行呢?你可以計算能收集到的多個指標間的相互關係,挑出與其他指標相關係數都相對較高的數據指標,分析它的產生邏輯,對應的問題,若都滿足標準,這個指標就能定位為核心指標。
建議大家養成一個習慣,經常計算指標間的相關係數,仔細思考相關係數背後的邏輯,有的是顯而易見的常識,比如訂單數和購買人數,有的或許就能給你帶來驚喜!另外,「沒有相關關係」,這往往也會成為驚喜的來源。
一般說明邏輯樹的分叉時,都會提到「分解」和「匯總」的概念。我這裡把它變一變,使其更貼近數據分析,稱為「下鑽」和「上卷」。
下鑽,就是在分析指標的變化時,按一定的維度不斷的分解;而上卷是反方向的匯總。
下鑽和上卷並不是局限於一個維度的,往往是多維組合的節點,進行分叉。邏輯樹引申到算法領域就是決策樹。有個關鍵便是何時做出決策(判斷)。當進行分叉時,我們往往會選擇差別最大的一個維度進行拆分,若差別不夠大,則這個枝椏就不在細分。能夠產生顯著差別的節點會被保留,並繼續細分,直到分不出差別為止。經過這個過程,我們就能找出影響指標變化的因素。
很多問題,我們是找不到橫向對比的方法和對象的,那麼,和歷史上的狀況比就將變得非常重要。其實很多時候用時間維度的對比來分析問題,便於排除掉一些外在的幹擾,尤其適合創新型的分析對象,比如一個新行業的公司,或者一款全新的產品。
時間序列的思維有三個關鍵點:
一是距今越近的時間點,越要重視(圖中的深淺度,越近期發生的事,越有可能再次發生);
二是要做同比(圖中的連線指示,指標往往存在某些周期性,需要在周期中的同一階段進行對比,才有意義);
三是異常值出現時,需要重視(比如出現了歷史最低值或歷史最高值,建議在時間序列作圖時,添加平均值線和平均值加減一倍或兩倍標準差線,便於觀察異常值)。
時間序列思維有一個子概念不得不提一下,就是「生命周期」的概念。產品生命周期理論(PLC模型)是由美國經濟學家Raymond Vernon提出的,即一種新產品從開始進入市場到被市場淘汰的整個過程。用戶、產品、人、事都存在生命周期。
隨著計算機運算能力的提高,隊列分析(cohort analysis)這一方式逐漸展露頭腳。從經驗上看,隊列分析就是按一定的規則,在時間顆粒度上將觀察對象切片,組成一個觀察樣本,然後觀察這個樣本的某些指標隨著時間的演進而產生的變化。目前使用得最多的場景就是留存分析。
隊列分析中,指標其實就是時間序列,不同的是衡量樣本。隊列分析中的衡量樣本是在時間顆粒上變化的,而時間序列的樣本則相對固定。
循環/閉環的概念可以引申到很多場景中,比如業務流程的閉環、用戶生命周期閉環、產品功能使用閉環、市場推廣策略閉環等等。
業務流程的閉環是管理者比較容易定義出來的,列出公司所有業務環節,梳理出業務流程,然後定義各個環節之間相互影響的指標,跟蹤這些指標的變化,能從全局上把握公司的運行狀況,如脈脈的業務流程(如下圖)。有了循環思維的好處是,你能比較快的建立有邏輯關係的指標體系。
邏輯思維即明白價值鏈、明白各項數據中的關係,也就是因果關係。
該方法的關鍵在於明白其中的關係要求你對這項工作要了解、熟悉,要細緻和慎密,要清楚充分性和必要性的關係。 實際上也就是指:你需要哪些數據?如何獲得這些數據?數據之間的關係如何?這裡最常見的手段就是A/B test啦。
那麼如何細化一下這個概念?一是在條件允許的情況下,決策前儘量做對比測試;二是測試時,一定要注意參照組的選擇,建議任何實驗中,都要留有不進行任何變化的一組樣本,作為最基本的參照。現在數據獲取越來越方便,在保證數據質量的前提下,希望大家多做實驗,多去發現規律,可以按如下表格來做實驗。
指數化思維是今天分享的10個思維當中最重要的。許多管理者面臨的問題是「數據太多,可用的太少」,這就需要「降維」了,即要把多個指標壓縮為單個指標。指數化思維就是將衡量一個問題的多個因素分別量化後,組合成一個綜合指數(降維),來持續追蹤的方式。
指數化的好處非常明顯:一是減少了指標,使得管理者精力更為集中;二是指數化的指標往往都提高了數據的可靠程度;三是指數能長期使用且便於理解。
指數的設計是門大學問,這裡簡單提三個關鍵點:一是要遵循獨立和窮盡的原則;二是要注意各指標的單位,儘量做標準化來消除單位的影響;三是權重和需要等於1。
PS:獨立窮盡原則,即你所定位的問題,在搜集衡量該問題的多個指標時,各個指標間儘量相互獨立,同時能衡量該問題的指標儘量窮盡(收集全)。例如當運營人員考慮是否需要將自己的內容分發到其他平臺時,他可以採用指數化思維來整體評分。
10種數據分析的思維方式我們分享完了,當然在我們的工作中不只這10種,我們將會在以後的內容中分享給大家,除此之外如果大家有額外的好的數據分析思維方式,可以分享給我噢!
如果想知道如何結合業務深入去分析,那麼這門課很適合你
分析案例思維課程
這門課的特點:案例講解,由BAT數據分析專家帶你領略數據分析思維的樂趣,目前好評如潮,記住有了思維和方法論再去入門,這樣你定位更加清晰,後期也可作為自己思維的提升,多看幾遍
上線二月已近1700人加入學習