一篇超詳細的數據分析工作指南

2021-02-13 數據分析1480

   通過數據,可以發現許多深層的問題,從而優化產品決策。那麼,怎麼才能做好一次好的數據分析工作呢?本文詳細闡述了數據分析的前置工作,將由兩個方面詮釋作者對數據分析準備工作的理解。

首先,「數據指標定義」和「數據收集」這兩個東西本身有關係嗎?——有的。數據指標的定義決定了數據收集的範圍和目的,而數據收集的維度要和數據指標息息相關。數據指標定義了你數據分析目的(數據分析往往是為了提升某個數據指標或降低某個數據指標,發現潛藏問題、尋找潛藏機會),而數據收集則給數據分析提供了基礎。



我們來理解一下這句話,數據指標對於產品而言就是說什麼數據能衡量你們業務的好壞?什麼數據對於你們產品是十分重要的?比如用戶數、訂單數、銷售額、瀏覽數。數據指標可能有一個或多個沒有固定約束,依據業務需求定義。如果你們的產品業務較為簡單,一個業務指標足以說明問題,定義一個足以。數據收集:用戶行為所產生的結果都值得被收集,但是他的主要目的是以業務為導向收集體現業務情況的數據。數據收集是一項很主觀的行為,收集的粒度和收集頻率都與產品特性有關,在本文中將介紹數據收集的方法(由業務出發和由功能使用情況出發)。介紹了他們的定義,那麼在具體項目中他們應該如何制定?


1. 確認模塊或產品特性:確認與模塊特性相關的關鍵指標
市面上的產品或功能基本能用以下幾個模塊進行劃分,大家在使用時可進行相似歸類,套用這個模版。


常用指標:瀏覽數、瀏覽時長、內容互動情況(彈幕、評論、點讚)Tips:做競品分析的時候,可用同目的的功能放在一起對比指標數據。如你們平臺的內容模塊每天大約新增100篇文章、有30人閱讀、平均文章的評論量為30條。對手每天大約新增500篇文章、有30人閱讀、平均文章的評論量為2條。說明在內容創造或內容更新頻率上,對手遠高於我們平臺;但是在用戶粘性或者用戶對內容的認可度上,我們更高。因此,我們需要提高平臺的內容創造能力和內容的打開率。2. 確認核心業務:確認體現核心業務健康程度的指標使用場景:業務簡單、單一,或制定綜合指標時可適用。其實上面的指標定義方法可以涵蓋大多部分使用場景,但是如果你是為你們平臺制定一個總指標的時候,那就需要用核心業務確認總指標。


平臺靠用戶瀏覽廣告進行盈利,核心業務賣廣告,體現核心業務健康情況的關鍵指標為平臺流量

平臺靠售賣商品進行盈利,體現核心業務健康情況的關鍵指標為GMV總銷售額

平臺靠售賣會員進行盈利,體現核心業務健康情況的關鍵指標為會員用戶量

這種方法確認的指標較為籠統,可作為公司公用指標進行使用,各個部門根據該指標進行拆分。這種定義數據指標的適用場景較少,大家可以主要學習第一種確認數據指標的方法。



數據收集主要是需要開發同學來進行埋點,我們需要定義埋在哪裡。定義數據埋點我梳理了有以下兩種方法:一種基於業務流程,一種基於功能被使用的情況,根據業務需求選擇即可。Tips:收集前要和開發說清楚是基於用戶還是事件,看不懂這句話下面有解釋。這種埋點方式可以發現用戶前後的兩個環節是否有巨大斷層,或者遠低或遠高於行業水平,從而優化各個環節的轉化率(其實就是漏鬥)。


頁面層級清晰有明確的業務流程,每個頁面有明確的業務目標(下單、支付)。Tips:做漏鬥的時候,記住用戶行為一定是有連貫性的、有順序的、有時間限制的,基於用戶還是事件要想清楚。先說一下為什麼有時間限制,用戶在半年前瀏覽了平臺的3篇文章,半年後他在平臺通過一篇文章購買了商品。用戶本次購買商品很大機率與半年前瀏覽內容無關,所以漏鬥需將行為設置時間限制(設置時間限制可以讓開發同學打一個小標籤,在時間範圍內進行了某種行為的用戶才會被統計在漏鬥內)。例子如上圖,中間就是根據業務流程梳理的需要統計的頁面。左邊是根據事件進行埋點得到的數據,右邊為真實用戶數據(去重後),就是告訴一下大家基於用戶/事件得到的數據是不同的。當然事件和用戶可以都進行統計,這樣可以算出其他的一些數據,比如用戶平均瀏覽多少個商品、平均瀏覽多少個分類、購買成功頁面有多少用戶進行分享。功能模塊拆解,你們也可以理解為對對應數據指標的細化。以社交模塊為例,直接通過腦圖的方式進行說明,這種埋點方式可以體現功能模塊的健康程度。

Tips:收集數據時如數據有明顯的周期性則以該周期作為單位進行收集和比較。

如某應用周末用戶活躍度明顯上升,則建議以周為單位進行收集。與往期數據對比時,建議同比上一周的數據或本周六的數據同比上周六的數據,這樣可減少數據之間的幹擾性。本篇文章主要介紹兩種定義數據指標的方法和兩種進行數據埋點的方法,將筆者最近工作中用到的方法總結給各位,希望能夠和大家一起探討。


相關焦點

  • 數據分析新手指南
    今天,小編給大家帶來了一份學習指南,通過一篇文章,幫助大家快速了解如何進行數據分析。以及如何利用SPSSAU管理和分析你的數據,以提高數據分析的效率。目錄1.分析數據(1)明確研究問題到了正式分析這一步,首先要明確研究重點,規劃分析思路最為重要,尤其是面對多份數據,分析結果一多就很容易搞混。
  • R數據分析:tableone包的詳細使用介紹
    這個數據集大概長這樣:現在我想要看看整個數據集的描述性分析,那麼我就可以:CreateTableOne(data = pbc)輸出如下:描述數據的導出其實你大可以直接在你的CONSOLE中進行結果的複製粘貼,但是我還要給你寫寫如何導出描述表格,還不快快關注我。運行下面的代碼後你就可以看到描述的結果全在你的工作目錄中了。
  • 《企業經營數據分析》給傳統企業管理者的數據分析指南
    >給傳統企業管理者的數據分析指南——做管理,必須懂數據分析「大數據之重要都已經成為了社會共識,而在這個浪潮中,傳統企業似乎成為了「落後分子」。我不知道我的企業有什麼數據,從哪裡去找?我怎樣才能把數據變成對公司和工作有用的價值,從哪裡入手?」這些問題很基礎,同時也非常重要。萬丈高樓平地起,傳統企業想要建起自己的數據體系搭上智能快車,必須要從地基開始,否則就真應了那句話了——基礎不牢,地動山搖。
  • 大數據裝逼指南:如何用30分鐘寫出一篇大數據分析文章
    每次一有熱點事件,就會出來一大坨《大數據解析XX》《大數據還原XX真相》《XX到底如何,大數據告訴你》…我都沒眼看了。因為這種文章技術含量很低,30分鐘一篇無腦擼。大數據裝逼,分三步。比如我們可以寫:1、楚喬傳能否超越一代經典羋月傳,大數據告訴你真相2、大數據面前,楚喬傳被羋月傳秒成渣3、大數據解讀:趙麗穎最火?孫儷:呵呵4、……好,接下來,就是歡樂的截圖大作戰大數據裝逼的奧義在於兩點,一是數據圖得多,不多怎麼能叫大數據?
  • 超詳細的謝菲爾德大學申請條件及費用指南
    接下來就為大家帶來超詳細的謝菲爾德大學申請條件及費用指南。 超詳細的謝菲爾德大學申請條件及費用指南 謝菲爾德大學費用情況 1、本科學費:
  • spss數據分析-差異性分析[超級詳細]
    1.2卡方檢驗-交叉表第二種的卡方檢驗的原始假設為不同學歷的人,在不同工作單位類型的人數是沒有顯著性差異的,是用來做兩個分類變量的差異性分析。通過上表分析可以看出,皮爾遜卡方的漸進顯著性水平為0.551,遠遠大於0.05,所以說明在不同工作單位類型的人數是沒有顯著性差異的。
  • 零基礎入門R語言數據分析指南
    這裡推薦一個網站,code school的Try R 課程,非常基礎,從最基本的語句的賦值到最後的數據框的基本操作,手把手一步一步的教你,然後對你輸入的語句,網頁會給出判斷,如果寫錯了,還有很詳細的解釋。網頁全部是英文的,英語過了四級的童鞋應該可以應付了。R的入門書籍,比較好的是Learning R , 中文名是《學習 R》。
  • 超詳細的布裡斯託大學申請條件及費用指南
    接下來就為大家帶來超詳細的布裡斯託大學申請條件及費用指南。985高校80,211高校82,雙非85 布裡斯託大學費用情況 本科費用 本科學費:會計與金融/古代史/人類學和考古學/經典研究/經典/犯罪學/經濟學/教育學/歷史/歷史/管理/哲學——18100英鎊/年、航空航天工程/生物化學/生物科學/生物醫學科學/細胞和分析醫學
  • 超詳細的聖安德魯斯大學申請條件及費用指南
    接下來就為大家帶來超詳細的聖安德魯斯大學申請條件及費用指南。  專業條件:申請醫學專業需要具有英國總理事會認可的醫學學歷資格  其他條件:據立思辰留學雲介紹,個別專業要求具備相關的專業背景和工作條件
  • 超詳細 ElementUI 源碼分析 —— Select(模板篇)
    今天詳細分析 Select 源碼,在看到源碼足足有九百行時,我整個人都是懵的,這是迄今為止讀的最多的一篇源碼,大概瀏覽了之後發現它裡面有很多很多的知識點,光導入的模塊就有 16 個,裡面包含著各種組件、混入以及工具函數,所以鑑於本文篇幅有限,我打算分兩部分來寫,分別為:「模板篇」和「方法篇
  • 想寫一篇專業的 Case report?先看看指南怎麼說
    大家多少聽過其他類型文章的指南,如針對臨床試驗的 CONSORT 指南,針對系統綜述和薈萃分析論文 PRISMA 指南,以及遺傳關聯性研究論文的 STREGA 指南等。而病例報告的指南為 CARE。該指南名稱的來源是 case 和 report 這兩個詞的前兩個字母。
  • 日本留學:東京大學·情報理工專業 超詳細考學指南
    今天,東學君給大家整理了一份超詳細的東京大學情報理工專業考學指南,涵蓋了各個研究方向,想考情報理工專業的同學趕緊收藏起來吧!情報理工學系研究科由於內容較多,本期我們先著重介紹情報理工學系研究科。數理情報學主要研究內容:數理信息,數理工學,數理建模,操作分析,最優化,數理計劃法,概率統計分析,數值解析,數學,算法,離散構造,幾何數理,信息編碼的數理,複雜系統的數理,生物信息的數理,編程數理,數理金融等專業考試內容:
  • SPSS超詳細教程:主成分分析
    此外,檢驗主成分分析數據結構的方法還有以下三種:用Kaiser-Meyer-Olkin (KMO)檢驗對數據的總體分析,KMO檢驗對各變量的單獨分析以及Bartlett's 檢驗 (Bartlett's test of sphericity)。接下來,我們將對這三種方法進行逐一介紹。
  • Python數據分析利器:matplotlib超詳細基礎介紹!!!
    ,會讓你的數據分析等工作錦上添花,讓人印(升)象(職)深(加)刻(薪)。matplotlib是python優秀的數據可視化庫,python數據分析必備利器,本文專門為你整理了matplotlib詳細使用方法,來學習吧!--- 以下是正文 ---數據可視化非常重要,因為錯誤或不充分的數據表示方法可能會毀掉原本很出色的數據分析工作。
  • 電子客票關於學生票的超詳細指南在此!
    電子客票關於學生票的超詳細指南在此!● 學生證(含優惠卡)每學年4次購票優惠不是自動刷新的,學生每學年購票優惠資質錄入工作由學生所在院校相關部門負責。綜上,購票乘車前的準備工作順序為:所在院校給學生證(含優惠卡)錄入優惠資質→學生攜帶身份證、學生證(含優惠卡)到車站窗口或自助售取票機核驗資質No.2哪些情況會導致核驗不成功● 學生證登記乘車區間與學生火車票優惠卡乘車區間不符。
  • 心理學(社會學)數據量化分析平臺指南,數據分析從未如此簡單!
    開門送福:後臺回復關鍵詞 心理學 ,即刻奉上心理學數據量化分析平臺指南詳解及軟體資源~由於插件太優秀,唯恐對其各應用環節產生誤解,就花費三日(學業太忙·_·)備下了這30頁的操作講義,建議各位童鞋先行收藏,以便後期應用時略做參照。
  • 《城市:天際線》創意工坊mod超詳細安裝指南
    有不少小夥伴還不清楚在該遊戲中安裝mod的方法,那麼可以參考一下「軒轅天之痕」的這篇《城市:天際線》mod超詳細安裝指南。《城市:天際線》mod超詳細安裝指南:以正體中文舉例:如下圖,請打開STEAM遊戲庫中,這遊戲的頁面,並且找到「瀏覽工作坊」這個按鈕並且點下去。之後應該會跳到這個頁面,再找到「Mod」這個標籤並且點下去。
  • 魔獸世界wcl怎麼用 小白wcl全翻譯中文超詳細使用指南
    相信不少玩魔獸世界的玩家都聽說過WCL數據分析網站,可以分析整個公會攻略boss的詳細數據,能幫助公會團隊有巨大的提升,但是由於很多是英文還有一些設計不好的地方,導致上手比較難,下面就來為大家分享一下wcl最新超詳細使用指南。
  • 超詳細的諾森比亞大學申請條件及費用指南
    接下來,南昌留學雲小編整理的超詳細的諾森比亞大學申請條件及費用指南帶給大家,以供參考!有相關工作的工作經驗的人是有一定優勢的。
  • 七問七答,一文解讀《金融數據安全 數據安全分級指南》
    《指南》給出了金融數據安全分級的目標、原則和範圍,以及數據安全定級的要素、規則和定級過程。《指南》不僅適用於金融業機構開展電子數據安全分級工作,亦為第三方評估機構等單位開展數據安全檢查與評估工作提供參考。Q1:金融業機構必須開展數據分類分級工作嗎?