什麼才是打開「數據分析」的正確姿勢?

2020-12-05 人人都是產品經理

―― BEGIN ――

之前大家聊了一次數據建設,於是就有讀者問做好數據分析應該用什麼姿勢,那就來聊個10塊錢的吧。

一、基本原則

做數據分析工作,一定要遵循一定的原則。

這些原則,我簡單列了列,屬於亮哥比較看重的,但是不一定是通用的。

讓我們先來看數據分析的流程。

亮哥認為,數據分析應該遵循下面這個流程:

也就是說: 數據分析,需要從問題中來,回到問題中去。

拆解一下其實,數據分析主要要有五個步驟:

問問題、找對象、選數據、做分析、再驗證

1. 問問題:數據分析必須要有明確目的

數據分析在啟動時,一定要有非常明確的目的。

這種目的,可能伴隨一次或多次目標明確的測試動作。

譬如說,原先的商品落地頁的購買轉化率比較低,需要使用新的落地頁,以提升流量進入後的購買轉化率。

這個時候問的問題,應該有3個:

當前的商品落地頁是值得進行優化的嗎?

商品落地頁的優化是可行的嗎?

能夠優化到什麼程度?

你會發現,這個時候,其實原先的一個目的(想辦法提升商品落地頁的購買轉化率),就變成了3個問題,而這3個問題,接下來就要指導整個數據分析的過程。

2. 找對象:明確分析的可行性和分析的範圍

對於上面的例子來說,其實是要對著三個問題來進行1by1的解決,需要去弄清楚對象。

問題1:當前的商品落地頁是值得進行優化的嗎?

這個問題的對象其實不是商品落地頁,而是商品落地頁的來源渠道的流量情況和流量到來後在商品落地頁的行為模式。

因為,如果流量本身進入的就少,可能樣本本身就不具備去測試驗證的可能性,反而需要我們先去提升流量分發的能力。

問題2:商品落地頁的優化是可行的嗎?

這個問題的對象既可以是新的落地頁,也可以是老的落地頁,只要能夠通過數據證明,對落地頁的調整是否會影響購物轉化率,那麼就可以得到結論。

問題3:能夠優化到什麼程度?

這個問題其實現在是回答不了的,要回答這個問題很明顯,首先有一個前提,就是商品落地頁的調整,對於改進購買轉化率來說,是具備可行性的。

這樣你就可以把對象識別出來。

3. 選數據:從已明確對象身上去挖掘相關聯的數據

選數據這件事兒,其實後半段不難,但前半段不太容易做。

涉及到選擇時間跨度,對象數據的維度等。

一句話,要有邏輯性。

4. 做分析:客觀中立,從數據中洞察

分析這件事情,其實就是講究,從數據中自然推導出結論,講究客觀中立。

不能帶著結論去湊數據,也不能一臉懵比不要知道數據想要和你談什麼。

5. 再驗證:帶著數據告訴你的結論,反過來去看待最初的問題

我和小朋友說的是,數據要能夠帶來:

結論

假設

行動項

也就是說,一次數據分析,應該能夠幫助你先認識到問題在現階段的狀況(結論),能夠幫助你提出下階段的可能性(假設),能夠幫助你梳理接下來要著手做的事情(行動項)。

二、如何建立數據提取的邏輯

邏輯這件事情,非常重要。

重要到何種程度呢?

我見過剛開始做數據分析的小同學的分析報告,基本就是,堆一堆數據,然後說道說道,來了個結論,完。

我就問,為什麼要取這些數據?這些數據之間有關聯關係嗎?是什麼樣的關係?

前兩天,我的好朋友也是知乎大V的三水哥,寫了個以毒攻毒去反駁三峽帶來的負面影響的專欄文章,很值得一看。看了你就知道,有時候煞有介事堆砌的數據,其實根本就不存在因果關係。

那麼,你花了幾天時間去取了各種數據之後,堆疊出來的不過就是個你認為是正確的結論而已,這並沒有價值。

建立數據提取的邏輯,首先是要訓練自己的邏輯思維能力。

比較輕又有點小變態的訓練方法是這樣的:

隨便拎起一個現象,就開始去做「找關係」的訓練。

譬如,拿到一杯咖啡,你就可以開始訓練了:

這杯咖啡是美式、拿鐵還是其他什麼類型的飲料?

美式和拿鐵之間的差別就是拿鐵是咖啡裡加了奶,美式是咖啡裡加水,可是為什麼7-11用機器做一杯美式所花費的時間會大於做一杯拿鐵所花費的時間,甚至是雙倍的時間?

多出來的時間究竟是哪一個環節影響導致的?

……

諸如此類。

然後,你要去和業務走得很近,要能夠理解業務場景。

舉個例子:停車場。

如果我問你,對於車,什麼樣的場景是最高頻的?

我相信,至少50%的人會告訴我,停車、加油還有維修保養,尤其以停車、加油為主,甚至會有人說,停車是最高頻的,因為車子只要開出去,就會停下來,而停下來就需要有停車的地方。

但實際上,我們所討論的停車,是一個違高頻場景,因為,假設車主是上班族,那麼基本上在工作日,他是沒有臨時停車需求的,對於公共停車場是不存在熱烈的需求的。

因為,家裡和公司,都有相對固定的停車位。

但是,如果你不是車主,或者你離停車這種業務線很遠,你要做數據分析的時候,你會有看起來很有sense但實際上完全錯誤的假設和邏輯。

所以,光有日常訓練還不夠,還要充分去理解業務,了解業務。

三、數據分析其實只要三頁紙

這個真的不是開玩笑,當然,因為分析工作的深淺不同、所需數據量不同,其實三頁紙也可以替換成三個部分。

那麼,第一個部分就是,亮哥一再強調的: 分析的背景、目的、選擇的樣本量、參照物,以及希望得出的結論的假設。

譬如說,原先的商品落地頁上,用戶的購買轉化率不到0.01%,需要研究這種情況是否能夠得到改善。

由此我們選擇了2000個用戶,隨機分為兩組。A組看到新的商品落地頁,B組維持原有的商品落地頁;在30天的時間內,對比這兩個小組各1000個用戶的購買轉化率的變化。

參照對象分別是:

A組 VS B組在30天內的單人日均轉化率;

A\B組用戶在看到該頁面前後各30天的單人日均轉化率

假設商品落地頁的轉化率低是由於頁面設計不合理和頁面內容不滿意,經過對新版落地頁的調整,改善了頁面設計和頁面內容呈現的結果,希望通過本次數據分析,找到優化商品落地頁,提升購買轉化率的可能性。

第二個部分很簡單了,把取到的樣本、數據都列出來,進行參考對比,必要的數據解釋工作可以先備註好。

第三個部分就更簡單了,基於數據分析的結果,去反饋結論、提出假設與組織驗證,即可。

所以,實際上每個數據分析的報告,其實就應該是這三個部分就好。

四、理解結論、假設與行動項

最後的部分,來舉個例子,和大家說說結論、假設與行動項。

數據專員小王做了一份長達26頁的數據分析報告,這份報告是圍繞現有的內部渠道的運營質量進行的數據抽取和分析。

報告裡洋洋灑灑列出了內部已有的多個渠道,在半年多的時間裡這些渠道做了哪些內容投放,相關的展現率、點擊轉化率的統計。

然後,結束了。

於是小王的領導老毛就和小王聊天了:

「這是你的數據分析報告?你為什麼做這樣一個分析?」

「因為負責渠道的同事提出了需求,希望了解渠道這半年來的相關數據。」

「是要數據,還是要分析?」

「要數據,但是要協助分析。」

「如果要數據,你提供一張Excel表格就可以了,但如果要分析,這個PPT是不合格的。」

「哪裡不合格?我為了這個報告加了3天班……渠道那邊說挺好的……」小王很委屈。

「或許他們覺得你幫他們做了數據美化工作,而且他們自己對數據分析的目的性想得不夠多,所以才覺得挺好的,但在我這裡,是不過關的。」老毛詳細給小王解釋:

「你看,你列出了這麼多渠道的半年數據,拿其中一個渠道來說,我問你幾個問題:

1. 這半年來,通過A渠道,投放了36次,這36次針對的對象、內容有什麼樣的差別?對誰投放什麼內容,在什麼時間點投放的效果是最好的?反之,什麼時候以什麼形式,對什麼人投放什麼內容效果最差?你的結論在哪裡?

2. 如果你已經從數據中總結出了,在某個時間對某類人群通過某個形式投放的某一類內容的效果很好,那麼,請問,這個渠道是不是只能在這個時間對這類人群用這種形式投放這類內容有效果,能不能在其他時間對其他人群換一種形式去投放不同內容,也能帶來效果?你提出的假設是什麼?

3. 如果你已經提出了假設,你建議渠道那邊的同事接下來應該做什麼事情?是做一系列的測試回收數據,還是去改善渠道質量,還是在以後投放之前對用戶選型和內容篩選先做一輪溝通?你建議的行動項是什麼?」

小王越聽壓力越大,但也慢慢明白了老毛說的「不合格」是什麼意思。

我們在做數據分析的時候,要始終有好奇心和責任心,通過一個小數據是可以洞察出很多問題的,而這些問題,不能僅僅限於提出,甚至是看到了但忽略的狀況,否則數 據分析就沒有價值,可以不做。

拿一個實際的例子來說。

企業A的商業模式是按年收取固定單價的會員費,那麼企業A的核心數據就是:付費會員率。

拆解這個率的時候,會有2個關聯指標:

會員首次付費比例

會員續費比例

如果在數據分析中,發現續費率較高,但首次付費比例低,首先得出的結論是:

企業A提供的會員服務具有一定的價值,但對會員服務的表述及刺激用戶成為付費會員的形式、文案、交易流程可能存在一定的缺陷。

接下來,去通過調取這些可能存在的缺陷點涉及的流程及數據去觀察,是不是在這些方面存在問題。

如果是,提出假設,通過行動去驗證。

所以,其實數據分析一旦啟動,就不是一個單次的行為,它更像是一次實驗的啟動器,通過啟動一個實驗,來調校不同的業務發展的狀態,尋找機會點,排除風險。

我希望大家都能有意識的去做結論、提出假設並制定行動項。

這也是為什麼我從來不單獨提「數據運營」概念的原因――因為每個運營人,只要你有涉及的業務模塊,你都應該具備「數據查詢」與「數據分析」的職責和主觀能動性。這才能讓你提高的更快。

說完收工。

―― END ――

相關焦點

  • 想要正確的跑步姿勢,你得繞過這 4 個大坑
    而因為錯誤的跑步姿勢受傷後,卻去抱怨「跑步」是個傷身的運動……這個鍋,跑步真的不想背。 如何擁有科學高效的跑步姿勢,首先,你需要先繞過下面這四個大坑。 一、用腳尖蹬地 很多剛開始跑步的人,想當然的以為,想要跑得更快,需要「狠踹」地面。 也就是所謂的「蹬地」。
  • 達瑟兒Darcelo「科普」幹細胞才是水光針的正確打開方式
    衰老,源自細胞的衰老隨著年齡的增長,肌膚細胞隨之老化凋零,產生的玻尿酸不足鎖水能力降低,面部皮下組織萎縮,膠原蛋白減少從而出現皺紋。剛出生的嬰兒每1萬顆細胞就有十幾顆幹細胞,老年人1000萬顆細胞才有1顆幹細胞。
  • 韓家煒在數據挖掘上開闢的「小路」是什麼
    >文章中還會多次遇到,這是這次演講內容的一張「地圖」,也是數據挖掘領域的一張「地圖」韓家煒認為要想將現有的無結構的 Big Data 變成有用的 Knowledge,首先要做的就是將數據結構化。報告結束後的提問環節,坐在下面的 Christos Faloutsos 舉手問道:「你做的這個 Network 很 powerful,但是你能否預測到我明年寫什麼文章?」韓回答道:「我連自己的都預測不到,更別提你的啦。」於是當時下面哄堂大笑。回去後韓家煒將這個笑話講給當時還在他手下讀博士的孫怡舟聽。孫怡舟很嚴肅地認為這不是一個簡單的笑話。
  • 「SNOG XX」:這才是「精品咖啡」的正確打開方式
    「SNOG XX」坐落於俊發·逸天峰,似乎只有這般品質的咖啡才能與其相匹配。   「我就只是純粹地想讓來到「SNOG XX」的客人喝到的咖啡於去義大利喝到的無異。」  ●  在咖啡豆上,「SNOG XX」選用的是義大利國寶級咖啡豆——illy。illy公司是全球第一家獲得ISO9001認證的咖啡公司,他們的每一顆咖啡豆都經過電子光譜儀的檢測,不容許有一點瑕疵。   在咖啡師和咖啡設備上,「SNOG XX」是相輔相成,彼此成就的。
  • R 語言之數據分析「Resampling」
    本節主要總結「數據分析」的「Resampling」重抽樣思想,並通過 R 語言實現。有一種東西叫作「傳統」,它在很多時候很有用,但會讓你思維固化,在新的環境下讓你出錯。在總結回歸分析和方差分析的時候 ④R語言之數據分析「初章」,我總是會在模型的建立之前提到「統計假設」,在模型建立之後進行「假設檢驗」,原因想必大家都能理解,就是因為這些「統計假設」是我們模型建立思想的基礎,是支撐我們模型正確性的「必要條件」。但是,不可否認的是,這些「必要條件」最終會成為我們「數據分析」的局限,讓我們對「不滿足條件的數據集」束手無策。
  • 左暉所說的「難而正確的事」到底是什麼?
    貝殼所倡導的「有尊嚴的服務者、更美好的居住」聽起來像是一句難以落地的口號,其創始人經常掛在嘴邊的「做難而正確的事」也並沒有向外界解釋清楚貝殼到底在做什麼。 在公眾看來,貝殼是一個找房 App,很多人熟悉它是從地鐵上黃軒代言的廣告開始的。「海量真房源,省心上貝殼」,這確實是一句概括了貝殼對於消費者的功能的廣告語。但貝殼及其背後的鏈家,對於當下房產交易市場所產生的意義遠不止於此。
  • 「競品分析」的理念、流程、方法、工具
    本文將對競品分析的「道、法、術、器」(即競品分析的理念、流程、方法、工具)做系統性介紹,可以為你解答以下關鍵問題:競品分析與市場分析有什麼區別?為什麼要做競品分析?2,競品分析與市場分析其實是有區別的。市場分析、競品分析、產品分析、產品體驗分析在「分析目的」、「產品數量」、「分析維度」三個方面都是有所區別的,是一個從宏觀到微觀的過程。
  • 數據分析模型:歸因分析
    本篇講述歸因分析在實際業務中的應用及實現方法,主要講解「渠道歸因」和「運營位歸因」的「單值傳遞歸因」、「多值記錄集合歸因」、「時序還原歸因」以及「路徑還原歸因」幾個方法。
  • 「行業研究專題」如何應用MECE原則來分析問題
    所以這條原則翻譯過來,可以是「相互獨立,完全窮盡」,也可以翻譯成「不重複,無遺漏」。講到這裡,你肯定會說,好,我知道MECE是什麼意思了。那具體怎麼用呢?接下來我們舉幾個例子來詳細闡述。02案例一:公司用戶研究組接到一個任務:分析公司的消費人群的特徵。在分析之前,要先對人群進行拆分,並擬定調研的方案。
  • Gartner預測2019年十大「數據和分析技術」趨勢:增強型分析成為...
    增強型數據分析,增強型數據管理,持續型智能,可解釋的 AI,數據結構,NLP/對話式分析,商業 AI 和 ML,區塊鏈和持久性內存伺服器共同構成了 Gartner 2019 年十大「數據和分析技術趨勢」。 最近兩天裡,2 月 18 日-19 日,在雪梨舉行的 Gartner 數據與分析峰會上,增強型數據分析和可解釋的人工智慧成為焦點。
  • 每周研究一個問題「22:宏觀角度看數據分析」
    最後,不斷循環,直到找到問題所在2.4.2 數據分析基本方法任何數據分析都是「細分,對比,溯源」這三種行為的不斷交叉。最常見的細分對比維度是時間,我們通過時間進行周月同比,發現數據異常後,再進行維度或流程上的細分,一步步拆解找到問題所在。
  • 數據分析能力的核心是思維
    大多數人錯誤地理解了數據分析,把數據分析能力提升的關鍵放在了方法和工具;對於業務人而言,數據分析的核心思路是,得到兩個變量之間的「量化關係」,用以解釋現象;數據分析的步驟,感知問題、提出假說、選擇表徵、收集數據、分析驗證;提出假說和選擇表徵是很多業務人數據分析做不下去的原因。
  • 「研究」到底說了什麼?
    前些天,看到關於這個話題的討論,本想寫點兒什麼。還沒動筆,就被「丁香醫生」約了一篇審稿,剛好是關於這件事兒的。說實話,這篇文章寫得真是不錯,非常客觀。於是,懶惰的我,乾脆去管原作者要來原文轉載,就省得自己再吭哧吭哧爬格子了……感謝原作雲無心老師及其公眾號【松鼠雲無心】的授權。
  • 這些空姐的「小動作」背後有什麼特殊的原因和意義?
    普通旅客都能在機艙內穩穩地穿梭自如,而對客艙環境如此熟悉的她們,為什麼卻還要牢牢地「扶著」行李架呢? 其實空乘在過道裡來回走是在進行「巡艙」和細微服務,比如提醒系安全帶,看到看書看報的旅客幫忙打開閱讀燈,幫怕冷的旅客關閉風口等。 首先,邊走邊摸下行李架主要是為了隨時確認所有行李艙是否關好,以免遇到空中有氣流顛簸時行李從行李艙掉下來。
  • 「硬舉」訓練分享:我如何在8周內,舉起自體重1.5倍的重量?
    對初學者來說,肌力訓練可能會令人心生畏懼—尤其是面對像「硬舉」這種陌生名詞的時候。不過「硬舉」不僅能幫助增肌減脂,而且能強化跑步功力!今年,我跑步遇到了瓶頸,通過幾周的「硬舉」強化後,10km的成績提升了11分鐘。此時「硬舉」的成績是能舉起自己體重的1.5倍。
  • 《原神》全新角色介紹-「刻晴:七星之玉衡」
    璃月,受巖王帝君「摩拉克斯」治理,享有長久的繁榮昌盛。源遠流長的歷史已證明,追隨帝君的腳步是正確的。然而,與一年才降臨一次的帝君不同,「璃月七星」才是密切注視著璃月的治理者。作為「人」的他們,並非都安於聽從「神」命,比如七星中的玉衡星,刻晴——  「帝君?哼,說句不好聽的,他真的什麼都懂嗎?」
  • 眾籌排行榜 | 貼上這個小貼片,讓你「直挺」一整天
    長期與久坐同行,是否內心都渴望能以「葛優癱」的姿勢辦公、生活?畢竟這個姿勢,太舒服太有魔力了.相信大家都會有這個念頭,但是這個坐姿對身體可並不好。眾所周知,不正確的坐姿不僅容易造成駝背不好看,長期以往頸椎、肩胛、腰椎的病變將接踵而至。所以養成良好的坐姿是我們每個人需要注意的。
  • 初識「數據分析」:用戶數據
    所以咱們這篇文章說一下,所有產品共同需要注意的幾個用戶數據指標:新增、日活/月活、留存。用戶數據(1):「新增用戶」數據指標什麼是「新增用戶」?任何一個產品不管設計的多麼的出色,它的本質都是一個工具和媒介,是需要有人去使用的,否則將沒有任何價值,所以「新增」是每個產品都繞不開的地方。
  • 不對,這才是正確的打開姿勢
    事實上,這三類父母的共同之處就是——如何正確地教給孩子英語,心中十分模糊。北外英語碩士,外語教學與研究出版社高級編輯,研究二語習得的蓋兆泉教授說,新生代父母培養英語牛娃需要準備四件武器:確立目標,用理論作指引,善用英語學習資源,合理規划行動路線。怎樣確定目標的方向?父母必須清楚,我希望孩子們達到什麼樣的英語水平?
  • 「正確使用」微波爐加熱食物,不怕輻射怕塑膠?
    根據世界衛生組織的說法,若正確使用微波爐,就不必擔心輻射,烹調出來的食物亦不會具「放射性」。反而真要關注的,也許是盛載微波食物的塑膠器皿。華盛頓州立大學食品工程系教授Juming Tang在英國廣播公司(BBC)的訪問解釋:「塑膠的內部具有聚合物來使其柔軟而有彈性,它們在較低的溫度下會融化;如果溫度超過攝氏100度,則有機會在微波加熱過程中釋出。」在2011年的一項研究,研究人員購買400多個塑膠食物容器以作測試,發現大多數都會釋出擾亂荷爾蒙的化學物質。