數據分析的四個層次

2020-12-04 人人都是產品經理

編輯導讀:單純的數字是沒有靈魂的,但是數據分析卻可以洞察出數據背後業務的規律。因此,數據分析是商業活動中重要的一項工作。本文將圍繞數據分析的四個層次展開介紹,希望對你有幫助。

一、引言

我通常把數據理解為業務的另一個他,單純的數字是沒有靈魂的,而背後的業務卻是鮮活的。商業數據分析的核心是洞察數據背後業務的規律,本質是數據賦能。我相信從事商業分析的小夥伴們都聽說過,數據分析的三個層次:描述性分析、診斷性分析和預測性分析。

著名的諮詢公司Gartner在2013年總結、提煉出了一套數據分析的框架,如上圖所示,他們把數據分析分成了四個層次,除了剛才說到的三個之外,還有一個處方性分析。診斷出業務的問題之後,還需要結合實際情況,給出運營策略去改善它。我更傾向把處方性分析合到診斷性分析裡,因為分析和運營是需要結合在一起的。當然,這些小細節影響並不大。如今在公司0-1的參與項目,先前很多的方法論正好有機會都經歷一遍,所以想結合這些框架梳理一下自己的想法,歡迎大家留言或者進群交流。

本篇文章先跟大家介紹一下數據分析的四個層次:描述性分析、診斷性分析、預測性分析、處方性分析。

二、描述性分析:發生了什麼?

通過一些核心指標的數據和前後對比,告訴業務方(或者老闆)目前業務的現狀是怎樣的。比如常見的流量、轉化率、收入、成本等等這些指標。往往這些指標是比較宏觀和概括性的,對比完就能對整體的情況有個認知。在公司裡,大家經常會用Tableau做日報/周報,其實主要承擔的就是描述性的匯報。

關於描述性分析,需要思考幾個問題,才能讓整個日/周報概括而又具體:

1. 關注哪些業務

首先要思考在日/周報中展示哪些業務,可以提供幾個維度去參考:

老闆關心哪些業務?想了解什麼信息?部門負責哪些業務,重點是在推哪些?可以沿著這個方向去確定要展示的業務。

2. 用哪些指標,如何衡量變好/變壞

善用對比(環比/同比)、趨勢等比較方式,不能只展示指標的數據,還要能直觀的反映出目前狀態是好還是壞。

3. 沉澱分析框架

當然,描述性匯報也需要沉澱診斷性分析的框架。比如說,在周報中展示轉化率指標,不論漲跌,大家肯定會在意是怎麼回事。而要分析這事兒,就可以按渠道進行拆解,分成APP端、PC端、小程序端的轉化率等等,分別關注一下。

所以對於該指標的框架性拆解分析,就可以沉澱在描述性匯報中,這樣指標的漲跌就立馬能定位到哪個環節的問題。定位出問題環節後,再細一步的原因就需要去找對應的業務方諮詢了。

三、診斷性分析:為什麼會發生?

業務變好/變壞了,除了知道這個結果外,我們還需要通過數據進一步了解為什麼會這樣。

在診斷性分析中,就需要去分析業務結果和很多因素的相關性。當然,怎麼能較快速地定位到分析哪些因素和結果的關係,要基於對業務的理解。可以大家一起頭腦風暴分析業務數據,也可以去調研,或者深度訪談一些業務關鍵角色,讓他們給一些輸入,我們才可能知道從哪些維度去分析數據更合理。

1. 定性分析

若分析的僅是一個特徵與結果的相關性,則可以通過畫二者的二維散點圖進行分析,通過圖形描述,可以初步且直觀判斷二者的存在何種相關關係:正相關、負相關、無關;如果相關的話,是線性相關還是非線性相關(拋物線、指數等)。

2. 定量分析

我們通過散點圖可以定性的判斷兩者是否具有相關性。定量上,我們可以通過回歸對他們對關係做出精確的描述。

若結果為連續值,則應用的模型為回歸模型,包括:

1)一元線性回歸

若僅有一個特徵與結果相關,並且其是呈線性關係的,則可以進行一元線性回歸,即建立回歸模型y=a+bx計算出截距a和斜率b,x為特徵(自變量),y為結果(因變量)。

2)多元線性回歸

在實際業務中,僅單個特徵與結果相關的情況是不多見的,大多數都是多特徵共同作用導致的結果。若多個特徵無多重共線性,且與結果呈線性關係,則可以進行多元線性回歸分析,建立回歸模型y=a+b1x1+b2x2+…+bnxn。

3)非線性回歸

如果回歸模型的因變量是自變量的一次以上函數形式,回歸規律在圖形上表現為形態各異的各種曲線,稱為非線性回歸。常見的非線性回歸模型包括:雙曲線模型、冪函數模型、指數函數模型、對數函數模型、多項式模型等。

四、預測性分析:後續可能會發生什麼?

預測性分析就是提前評估後續可能會發生什麼?在工作中的場景,經常就是利用現有數據進行測算,評估業務接下來的發展。

比如提前需要測算業務年度成本、年度目標、未來收益的大小等等。

五、處方性分析:該怎麼做?

這步的分析通常是接著診斷性分析的,在我們找到了業務變化背後的原因後,我們就需要去想一些策略去改善它。

首先是要定位出業務原因。在診斷性分析這一步,我們在數據上找到了影響結果的因素,這時候就需要去在業務層面上思考原因。

比如說,為了促進用戶轉化,我們發放了優惠券,但是後續發現券的使用很少,單量也沒有上升,這是數據維度的原因。

那業務層面的呢?為什麼用戶都不用優惠券呢:

這時候有些猜測的原因可以通過數據來論證,而有些原因就需要去調研用戶;如果是優惠券的位置不明顯,我們就需要在產品上調整;如果是優惠券的額度太小,我們就需要去適當調整優惠力度。只有準確找到了業務原因,我們才能用策略根本性地解決它。

我發現很多時候,業務原因的定位是缺失的,往往我們在發現數據原因後,我們就開始思考運營策略了,指向性也非常強,激勵(抓手)+數據維度的改變,這種做法是比較粗糙的。可能短期內有效果,但是一旦你激勵停止,業務還是會回到原來的狀態。

核心還是要找到業務改變的關鍵動作以及可以運營的業務場景,不能盲目的抓結果!

#專欄作家#

人人都是產品經理專欄作家,《數據產品經理修煉手冊》作者。

本文原創發布於人人都是產品經理。未經許可,禁止轉載

題圖來自Unsplash,基於CC0協議

相關焦點

  • 商業數據分析的四個層次
    01 引言 我通常把數據理解為業務的另一個他,單純的數字是沒有靈魂的,而背後的業務卻是鮮活的。商業數據分析的核心是洞察數據背後業務的規律,本質是數據賦能。
  • 數據分析四個步驟是什麼?
    我將回答有關數據分析四個步驟的問題。數據分析過程的主要活動包括識別信息需求,收集數據,分析數據,評估和提高數據分析的有效性。下面,我將為大家詳細介紹這四個步驟。一,識別需求信息需求是確保數據分析過程有效性的主要條件,並且可以為數據收集和分析提供明確的目標。識別信息需求是管理者的責任。管理人員應根據決策和過程控制的需求提出信息需求。
  • 有效溝通的四個層次
    在對這種互動的提問和觀察當中,我觀察到有效的溝通,清晰地分為四個層次。其中一位同事分享的是《共情力》,是杏仁核分泌的皮質醇影響了一個人共情能力的強弱,而不僅僅是我們認為的情商,如果我們只是講從情商的角度提高情商,恐怕並沒有真正的效果。
  • XBRL層次結構與財務信息數據挖掘
    這一層次結構中,只有XML層、RDF層、Ontology層、Logic層是為語言解釋而設計的,這四個層次本身還可以進一步劃分。實例文檔封裝了具體的商業事實(fact),根據信息的匯集程度分為條目(item)、元組(tuple)、組(groups)三個不同層次。其中,條目通常與一個數字型的事實對應;元組是事實的聯合體,等同於關係資料庫裡的一條記錄,組是實例文檔的根結點,由相關聯的數據項的集合構成。在不知道分類標準的情況下,實例文檔沒有任何意義。
  • 四個維度助你分析會議活動的數據
    會議復盤對於分析會議活動來說非常重要,可以幫助我們了解會議的得與失,從而有針對性地對會議模式進行改進。分析—場會議的活動數據可以從四個維度來入手,參與度、預期收益、傳播量和投入產出比。比如:通過這個分析出我們人員參與度是20%,和以往的數據進行對比,這個參與度的高了還是低了?問題出在哪裡?是咱們宣傳有問題還是會議引導沒到位,或是其他什麼原因?下圖是鯨會務的用戶管理截圖,可以清楚的展示用戶的數量、報名人數、籤到人數等,幫助辦會者了解用戶的參與度,對會議情況進行分析總結。
  • 國際關係理論的層次分析方法
    >1.體系層次分析:行為體之間的互動/行為體與體系之間的互動2.國家層次分析:戰略決策、經濟權力、軍事權力、國內其他因素3.個人層次分析:人性——認知、意象、知識背景、心理等二、羅斯諾(Rosenau)的六個層次概念    個人:決策者個人及其個性角色:決策者扮演的角色
  • 5個層次分析:產品設計中的「借鑑」思想如何運用?
    戰略層、範圍層、結構層、框架層、表現層這五個層次出現在產品的不同流程中,但排列組合又組成了一個有機的網際網路產品。那麼本文基於5個層面分析,「借鑑」競品應該如何去做?
  • 競爭對手的數據分析方法
    確定了你的競爭對手並收集到足夠數據後,我們就要對他們進行深度分析了。競爭對手分析路徑競爭對手分析共分為10個步驟,如圖1是分析路線圖。這個分析路線圖側重於企業前端即營運端的分析。
  • 認知四層次模型
    《思辨與立場》的作者理察保羅,曾經提出過人的認知四層次理論,他將人們的認知劃分出了四個等級,分別為:一、不知不知即不知道自己不知道,處在這個層次的人最為可怕,因為自以為是,所以做事盲目自信,會把過錯推脫給環境,經常半途而廢,他的進步非常緩慢,經常不懂裝懂,感覺什麼事都很簡單,還總幻想著上天的眷顧,幻想著自己總有一天能幹出一番大事業。
  • 這裡有10G的生物信息學中個層次的分析技術匯總
    生物信息學(Bioinformatics)是研究生物信息的採集、處理、存儲、傳播,分析和解釋等各方面的學科,也是隨著生命科學和計算機科學的迅速發展,生命科學和計算機科學相結合形成的一門新學科。它通過綜合利用生物學,計算機科學和信息技術揭示大量而複雜的生物數據所賦有的生物學奧秘。
  • 人的認知四個層次
    人的認知四層次:1.不知不知:不知道自己不知道。2.知己不知:知道自己不知道。3.知己自知:知道自己知道。3.不知己知,不知道自己知道。
  • 大數據信息分析的方法與工具
    那麼大數據給我們帶來了什麼好處呢?大數據最大的好處在於能夠讓我們從這些數據中分析出很多智能的、深入的、有價值的信息。因此,信息分析以事物、現象、數據、信息之間存在的因果關係或相關關係為基礎。   信息分析方法主要源於邏輯學方法、系統分析方法、圖書情報學方法(如文獻計量學方法、引文分析法)、社會學方法、統計學方法、數學方法等,一般分為哲學方法、一般方法、具體方法三個層次,具體分析方法通常又分為定性方法、定量方法和半定量方法三大類。
  • CDA LEVEL I 數據分析認證考試模擬題庫(三)
    、在因子分析中,為了幫助解釋因子,我們可以使用( )A.因子得分B.因子負載C.因子旋轉D.主成分分析13、層次聚類中,聚類的變量類型是( )>3、本科以下學歷,需從事數據分析相關工作2年以上。>3、本科以下學歷,需從事數據分析相關工作2年以上。
  • 決定一個人層次的四個維度,對照下自己身上有幾個?
    面對身邊的同事,對方層次的高低,在自己心裡一般都是不了解的,很多人總是憑藉自己的感覺去判斷對方,甚至是只看對方的外表,因此有很多的職場人,在現實中很容易上當受受騙,下面小編為大家分享四個判斷同事,層次高不高的維度,來供大家參考下,有需要的朋友們一起與小編來看看吧!
  • 諾獎得主帶你走進頂級經濟學研究的四個層次
    不過研究發展到這一步,Wilson和Milgrom也只是完成了拙文《預測諾獎主題:貧富差距和房價波動都比想像的可怕》裡提到頂級經濟學研究的三個層次,分別是:第一層是發現了一個非常重要,但其他人都還沒有意識到的數據或理論結果。
  • 數據分析實踐入門(四):數據運算
    作者 | CDA數據分析師進行到這一步就可以開始正式的烹飪了。前面我們列舉了不同緯度的分析指標,這一章我們主要看看這些指標都是怎麼計算出來的。三、匯總運算講到的算術運算和比較運算都是在列與列之間進行的,運算結果是有多少行的值就會返回多少個結果,而匯總運算是將數據進行匯總返回一個匯總以後的結果值。1、 count非空值計數非空值計數就是計算某一個區域中非空(單元格)數值的個數。在Excel中 counta ( ) 函數用於計算某個區域中非空單元格的個數。
  • 20個最好的網站數據實時分析工具
    這是我們為大家提供的一篇關於介紹20個最好的網站數據實時分析工具的文章,接下來就讓我們一起來了解一下吧!1.Clicky與Google Analytics這種龐大的分析系統相比,Clicky相對比較簡易,它在控制面板上描供了一系列統計數據,包括最近三天的訪問量、最高的20個連結來源及最高20個關鍵字,雖說數據種類不多,但可直觀的反映出當前站點的訪問情況,而且UI也比較簡潔清新。
  • 深入淺出:如何從0開始學習大數據挖掘分析?
    最近有很多人諮詢,想學習大數據,但不知道怎麼入手,從哪裡開始學習,需要學習哪些東西?對於一個初學者,學習大數據挖掘分析的思路邏輯是什麼?本文就梳理了如何從0開始學習大數據挖掘分析,學習的步驟思路,可以給大家一個學習的建議。
  • 山東發布社會發展綜合水平評價 17市分為四層次
    山東省發展改革委4月1日首次發布對全省17個市社會發展綜合水平的評價報告。此舉標誌著山東省初步建立社會發展水平綜合評價制度。    結果顯示,山東省17個市處於四個層次。威海、煙臺、淄博、青島4市為社會發展高水平地區,處於第一層次;濰坊、濟南、萊蕪、東營4市為社會發展較高水平地區,處於第二層次;泰安、濱州、濟寧、臨沂4市是社會發展中等水平地區,處於第三層次;棗莊、日照、德州、聊城、菏澤5市是社會發展較低水平地區,處於第四層次。
  • 數據分析常規分析思路及圖表類型解讀
    大數據是一種從各種類型的數據中快速獲取有效且有價值的信息的技術。 在大數據領域,當今已經出現了大量新的且易於操作的技術。 有效的工具。 毋庸置疑,大數據市場是一座待挖掘的金礦。隨著數據使用量的增長,將有更多的人通過數據來尋求專業問題的答案。