數據分析前的準備及如何為我們帶來長期價值?

2021-01-07 人人都是產品經理

數據分析在如今的網際網路公司中很常見,但是很少有人思考分析數據前要做哪些準備,以及數據分析是如何帶來長期價值的?本文將從三個方面展開分析,對數據分析感興趣的童鞋不要錯過。

一、數據分析前的準備

數據分析前的準備過程,在我看來比實際的分析更為重要。

假設目標是錯的,我們就不應該執行。而目標不同,分析類型和分析內容也不同,同時執行多個方向,很容易使自己陷入混亂。

1. 定義目標,辨別指標

數據分析,能幫助我們了解業務運行狀況,並從中發現問題、優化問題。其次,還能夠幫助洞察下一個增長點。

但數據分析的意義,往往在數據產生之前。我們應圍繞產品目標,進行產品設計以及運營策劃。如果最開始的目標及指標設置錯誤,後續的工作將難以為繼。

目標是結果,而指標是對結果分拆的具體要求,是對目標的衡量。

假設我們的目標是提升年度成交金額,那衡量這個目標的方法是什麼呢?

根據衡量的方法我們才能定向的設置調整產品設計及運營策略。如果缺少可衡量目標的單位和方法,目標會難以達成。

而圍繞目標設置數據的採集方案,可以大大節省數據過濾和清洗的時間。

甚至於在明確指標後再最開始就設置好分析模型,通過監測模型中的數據情況更及時的發現問題,做出更高質、高效的決策。

2. 辨別指標的目的

辨別了目標和指標,下一步則是運用結構化思維進行拆解、延伸。

在拆解之前,需要對自己提問:拆解出的指標目的是什麼?根據目的我們才能有傾向性的分析。

根據指標目的,可以分為結果指標、過程指標以及觀察指標。

結果指標用于衡量目標,過程指標用於體現如何完成。觀察指標則指的受影響指標,其是否會受到自變量(結果指標)的影響,導致上升或下降。

在上圖中,基於成交訂單數,設置過程指標為訂單平均金額及商品分布能幫助我們了解完成的方式。

而觀察指標的設置,是為了跳出框架思考。

上圖的用戶付費率,可以監測成交訂單數上升,是否帶動用戶付費率的上升,從而判斷是局部還是整體上升;而成交深度及ARPU/LTV則可以幫助我們考察下一個增長點是什麼。

在設置結果指標時,除了核心指標,還應輔以制衡性指標,它的目的是希望核心指標完成的更為健康。

核心指標和制衡性指標所延展的過程、觀察指標是不同的。

3. 確認分析類型

完成了目標和指標的設置,接下來是對每個指標進行細化分析,分析類型包含:描述性分析、預測性分析和規範性分析。類型不同,作用也不同。

1)描述性分析

表現形式:數據報表。

數據報表能夠幫助我們描述事件發展的情況,但很難解釋某種結果發生的原因和未來可能的趨勢。

它更偏向結果性的描述,此前的結果對此後是不具備太多參考意義的。

2)預測性分析

表現形式:用戶相似度及物品相似度計算、用戶購買飽和度、用戶成交影響因子。

預測性分析可以理解為對結果和變量的關係進行預測的過程,包含相似度、相關性分析、回歸分析等。

相似度多用於推薦算法,通過計算用戶的相似度和商品相似度從而推薦給用戶。而相關分析用於預測變量的關聯性,如用戶的成交會受什麼因素影響。

3)實證性分析及規範性分析

表現形式:A/B實驗。

實證性分析,指是什麼,偏向於客觀;規範性分析指應當做什麼,偏向於主觀。

在實際使用過程,上述的4種分析類型常常會被混合使用,混合使用時應明確不同類型我們應採取的分析維度。

數據分析是有順承關係的,先採集事實,再根據事實或者預測,提出我們的假設。逐步灰度地驗證假設,最終才輸出我們的結論。

不能將主觀猜測強加於事實之上,已經發生的結果並不一定是未來的結果。

二、數據分析如何帶來長期價值

學習了方法,做好了準備,終於進入了分析的環節。

筆者此前面向的數據分析,常常是「一錘子買賣」,花了很大的力氣採集數據卻沒有了下文。

為了使有用功更多,下文將從用戶和收益2個維度分享數據如何為我們沉澱長期價值。

1. 了解我們的用戶

這一步是為了讓我們知道完成指標的用戶是誰,常常以產品的會員體系作為切入點。會員體系越清晰,分析效果越好。

本節將以電商產品為例,和各位分享如何基於用戶的延伸分析。

1)基礎信息

基礎信息,指用戶本身的屬性。

身份特徵,可以從自然屬性、社會屬性向下細分,包含用戶的性別、年齡、職業、教育等。
渠道屬性,指用戶的註冊時間、註冊平臺、註冊來源等。

2)決策類型

決策類型,主要分為決策周期、品類偏好、促銷偏好、對象偏好,這是用戶分析中常常被忽略的一方面。

決策周期中的首次訪問,指的首次觸及該商品的時間。結合次數、時長以及成交時間,從而了解用戶的決策周期。

品類偏好,結合品牌和歷史成交單數,能夠幫助我們獲悉品牌、價格綜合對用戶的影響。

而成交品類、商品、單數則是幫助我們理解其品類購買深度及路徑,用於進行關聯推薦和評判用戶的價值。

促銷偏好,結合品類和折扣金額了解用戶的敏感度,能更好的提高其轉化率。對象偏好,同樣是了解購買深度及路徑,不過維度不同。

在用戶層面的分析,此前接觸的一些朋友都非常熱衷於使用RFM模型,在使用過程中也應「因地制宜」。

3)購買路徑

品類深度、對象深度是影響決策類型的因子,當它們在購買路徑時則聚焦於次序。

根據次序,制定運營的發力點,再遵循用戶的購買路徑制定轉化路徑。

在用戶分布相對穩定的前提下,應順從用戶的購買規律而非傾力於另一條主線。

一專多強的前提是專,只有聚焦優勢品類或主題建立了優勢,才能為其他的方向供應炮彈。

4)增長觀察

前面解決的問題是:他是誰,買什麼以及怎麼買。最後一點,則是增長觀察。

購買路徑聚焦於次序,增長觀察聚焦於深度。購買的次序是運營的主線,購買的深度用於精細化運營。

了解用戶在品類和對象的購買深度,再輔以ARPU與LTV的比對,從用戶的剩餘潛力尋找平臺增長點的方式。

2. 建立你的用戶模型

了解用戶的下一步,是建立用戶模型。

在一次交流會上,前輩阿翹對我提問:「你所負責的產品,用戶畫像是怎麼樣的?」

當時我把平臺用戶的地域、年齡、性別等分布介紹了一番。緊接著他提問:「根據這樣的畫像你能夠做什麼呢?」

再後來,我才學會了把數據聚合成特徵,把特徵集合成模型。

基於對用戶的認識建立模型,以上一小節的決策模型為例。

將決策類型、品類偏好、對象偏好、促銷偏好4個因子的關聯,並輔以用戶的基礎信息進行組合。

如:「精打細算、專注大牌、疼愛孩子的母親」。

這樣一來冰冷的數據也被賦予了情感化的表達,無論是產品設計、互動設計、產品運營都會變得容易的多。

建立起用戶模型,才能夠更好地進行情感化設計、精細化運營。

3. 分析與收益相關的行為

收益,常用成交或ROI進行衡量。那我們怎麼判斷與收益相關的行為呢?有關程度又有多高?

判斷相關性及其程度時,使用的方法是:相關性分析。

相關性分析主要用於:

判斷兩個或多個變量之間的統計學關聯;如果存在關聯,進一步分析關聯強度和方向。

根據數據的類型不同,所採取分析方法不同。

關於收益及影響收益的行為,二者都屬於無序分類變量,此類數據的分析方法是卡方校驗。

卡方檢驗,用於統計樣本的實際觀測值與理論推斷值之間的偏離程度,如果卡方值越大,實際觀測值與理論推斷值偏差程度越大。

反之,二者偏差越小;若兩個值完全相等時,卡方值就為0,表明理論值完全符合。

在實際分析時,會先進行假設,並通過計算判定其假設成立的概率從而反推其不成立的概率。

以判定關注與成交行為是否有關為例,介紹卡方校驗。

1)提出假設

假設:關注與成交無關。

2)計算實際觀測數據及理論推測數據

將關注及成交的相關數據進行統計,可得出下表:

根據表格,可計算出綜合的成交率等於58.3%。

假設關注與成交行為無關,成交率應不隨關注行為變化而變化,或數據抖動較小。

將觀測的成交率代入原表,並得出理論推斷值。

完成了這一步,就可以進行卡方檢驗的計算了。

3)卡方校驗計算

繼續代入公式:

當我們計算出卡方值時,可以初步判定由於卡方值較大,實際觀測值與理論推斷值差異較為明顯,原假設關注與成交無關成立的可能性是比較小的。

4)計算自由度及P值

而到了判定可能性具體的程度,則是根據P值(用於判斷判定假設檢驗結果)進行校驗,P值越小,原假設關注與成交無關的概率也越小。

由於其自由度等於1,結合卡方值再查詢卡方分布表可得P<0.01,所以原假設成立的可能也越小,即關注與成交有關的概率非常大。

在實際使用時,同樣的也須兼顧樣本和觀測時間周期,樣本包含準確性和數量,觀測時間周期則用於分辨其抖動性。這2者較為基礎也就不過多描述了。

相關性分析,用於代表相關程度,只能說明有關但並不能說明因果性。

對變量之間的依賴關係進行定量關係及因果關係的研究,我們還會使用回歸分析進行計算。但由於計算方式並非本文的重心,在此也不過多的贅述了。

本小節,也有較多的概念概念並未在本文提及,此部分將附在文末。

三、小結

個人認為數學方法是非常重要的領域知識,很多時候不是不會數據分析,而是不知道使用什麼方法分析。因為不曾見過,所以也未曾往陌生的方向思考。

遇到這樣的問題時,先運用逆向思維確認分析目標,其次再進行結構化的拆解,再逐層學習分析時應該使用的方法。

若時間寬裕,還是建議閱讀統計學相關的書籍。耐下性子閱讀,工具書的收益會比大部分同領域的文章都大。

參考資料:

1、相關性分析

https://zhuanlan.zhihu.com/p/94070722

2、數據的類型

https://blog.csdn.net/weixin_34203832/article/details/88687669

3、統計學——卡方檢驗和卡方分布

https://blog.csdn.net/snowdroptulip/article/details/78770088

4、自由度計算

https://www.cnblogs.com/mahailuo/p/10932026.html

5、什麼是P值

https://baike.baidu.com/item/P%E5%80%BC/7083622?fr=aladdin

6、什麼是A/B測試

https://www.zhihu.com/question/20045543

7、回歸分析

https://www.jianshu.com/p/bbe0c702b5ad

#專欄作家#

WISE,微信公眾號:Becomewiser,人人都是產品經理專欄作家。騰訊產品經理,專注於精細化運營、用戶數據體系建設等領域。

本文原創發布於人人都是產品經理 ,未經許可,禁止轉載

題圖來自Pexels,基於 CC0 協議

相關焦點

  • 數據加速企業數位化轉型,CIO如何最大化數據分析的價值?
    近年來,國內產業數位化升級進程不斷加快,以物聯網建設、5G網絡、大數據、人工智慧為代表的新基建全面發力,數字經濟已成為推動經濟持續穩定增長的關鍵動能,這其中數據作為核心元素的價值也越來越凸顯。
  • 數據科學課應該如何開展,數據競賽平臺帶來的啟示
    隨著數據科學與人工智慧相關理論的快速發展,傳統行業若沒有借用數據科學方法,僅在自己的專業領域深耕,已經無法高效解決快速變化的學科研究與應用中面臨的一些新問題。在數據智能時代,如何利用人類有限的算法來處理日益增長的數據,如何幫助社會實現「數據商業化」、創造數據產生的衍生價值,已經成為眾多領域亟待解決的問題。
  • 如何為大數據項目做好準備:成功制定戰略的6個關鍵要素
    如果沒有做好準備,那麼項目失敗的可能性就更大。人們在準備大數據項目時需要要考慮一樣事項。如果企業沒有為獲得最佳性能而預先準備數據,那將不會更好地為那些消耗數據的用戶提供服務。實際上,不良的數據準備是導致大數據項目失敗的主要原因,而管理此類項目的人負擔不起,只是出於這個原因,對於企業來說,擁有大數據準備策略和方法並如實執行是至關重要的。
  • 長安福特楊嵩:堅持「長期主義」為企業和經銷商帶來價值
    長期主義者的堅持回望過去幾年,長安福特達到過巔峰,也經歷過低谷。加入長安福特一年多後,楊嵩坦率地以企業經歷的波折為例,講述了他對汽車行業乃至經營領域的觀察。楊嵩表示:「當遇到銷量或利潤壓力時,企業一般會採取兩種行為。
  • 產品面試前,我為自己準備了一萬字答案(上篇)
    作者總結了一些產品經理面試常見問題以及應對的方法、答案,希望可以為求職產品的各位帶來一些幫助。最近一妹妹正值研二找實習之際,還沒開始面試就開始每天自問自答式的準備面試答案,這不一周給自己寫了萬字的面試答案,而且還在繼續……今天特受妹紙託付發布出來,基本是根據自己的經驗總結,希望大家共同指導、建議。
  • 如何發掘社交媒體數據的真正價值?
    彭博社報導稱,社交用戶的觀點和行為往往不一致,社交媒體數據的分析方式並沒有人們想像的那麼簡單直接。今年4月,美國在線旅遊服務網站PricelineGroup執行長達倫·休斯頓(DarrenHuston)曾表示,Priceline在Facebook和Twitter平臺上投入了「無數廣告費」,但社交平臺沒有帶來任何效果。「我們在它們那裡沒有發現任何東西。」他說道。對此,Facebook和Twitter均為發表評論。
  • 2021年如何穿越周期,踐行長期投資價值
    1月7日,以「穿越周期,共話未來」為主題的騰訊產業加速器年度思享會在深圳召開。本次思享會以長期主義為價值牽引,探索宏觀經濟下各產業發展、互聯共建的新生態。其中,中國價值投資的踐行者,東方港灣董事長但斌發表了以「穿越時間的河流——2021年中國經濟發展的機遇和挑戰」為主題的分享,針對疫情下中國經濟長期發展態勢、中國歷史「非正式制度」對經濟社會發展變化的影響、以及價值投資哲學思考等話題提出了見解。
  • Web網站分析:保證數據與業務的聯繫和價值 | 網際網路數據資訊網-199...
    如果你在獲取數據前沒有經過縝密的思考,那麼在分析數據時就只能碰運氣了。重新審視獲得數據的過程,保證數據從一開始就與業務有緊密的聯繫。對於我來說,最大的煩惱莫過於無法通過數據解決問題,獲得洞察。 雖然網站分析的方法有很多種,細分分析,對比分析,趨勢分析,轉化分析等等。但所有這些分析方法或者模型僅僅都只是手段,沒有任何一種方法保證你一定能從數據中發現問題獲得洞察。即使是被譽為網站分析殺手鐧的細分也是一樣。這時,我們就像在數據和洞察間繞圈子。
  • 數據分析前沿的觀點
    例如,與會者漸漸意識到這樣的可能性——利用不斷膨脹的外部數據(有時稱為開放數據)並將其與現有的專有數據結合起來以改善模型和業務成果。對衝基金最早開始利用大量新近獲得的政府數據,它將這些信息與股價走勢相關聯,從而發現各種短期的投資機會。做長期投資的公司需要為開放的數據制定不同的規則,但鮮有與會者懷疑此舉的價值。 2.
  • 舟山股權價值及未來收益數據綜合分析報價-價格
    舟山股權價值及未來收益數據綜合分析報價-價格,在項目開始前必須提交完整的報告。該報告是一個重要的基礎,選擇項目,令人信服的財政支持,(a)向項目贊助者提供的技術援助;根據其內容,項目論證報告應該是對數據的綜合分析。該項目的成本,風險控制和未來的穩定利益評估。示範可以由專業諮詢公司,如,正如企業諮詢有限公司所做的那樣。
  • 如何使用SimilarWeb分析網站數據(最新版免費教程)
    OK,接著我們就來看一下SimilarWeb到底是如何分析網站數據的吧 2、如何使用SimilarWeb分析數據 一、網頁版SimilarWeb使用方法 首先,輸入網址,訪問https://www.similarweb.com/。進入網站後,輸入需要分析的網址(溫馨小提示:註冊過後,分析的數據會更全面喲。)
  • 微型數據轉換器如何通過更小尺寸為您帶來更多價值
    與此同時,隨著對數據需求的增加,則需要監視更多的傳感器。本文將討論如何顯著減少PCB佔用空間,增加通道密度以及最大限度地發揮其他組件和功能與TI微型數據轉換器高度集成的優勢,從而以更小的尺寸創造更多的價值。第一個優點:PCB佔用空間更小和封裝技術的進步使得電子元件變得越來越小。
  • 專訪百奧智匯王泱洲:我們的獨有優勢是大數據及分析平臺
    數據顯示,單細胞分析市場預計將從 2019 年的 21 億美元增長到 2025 年的 56 億美元,複合增長率為 17.8%。根據 GENReports 報告顯示,關於單細胞分析的文章發表在過去幾年也有著爆發性增長。
  • 大數據的七大核心具體價值
    事實上,大數據已經開始並將繼續影響我們的生活,接下來讓我們共同探索大數據的核心價值吧!當然這是需要藉助於一些具體的應用模式和場景才能得到集中體現的。《大數據時代》一書作者維克託認為大數據時代有三大轉變:「第一,我們可以分析更多的數據,有時候甚至可以處理和某個特別現象相關的所有數據,而不是依賴於隨機採樣。更高的精確性可使我們發現更多的細節。
  • 為什麼比特幣擁有長期價值?
    以目前銀行系統中的電子化貨幣為例,雙方交易通過銀行進行,銀行以自身信用作為抵押為交易背書,這就是一個在中心化系統中實現交易的流程,但是如果去中心化,雙方如何相信貨幣從一方轉移到了另一方。  因此從我們的分析,比特幣肯定存在價值,未來的價值幾何很難說,取決於未來區塊鏈技術的發展和其應用程度。我們會在下一篇報告中介紹區塊鏈技術的最新進展以及目前眾多數字貨幣中比較有代表性的幣種及其特性。  比特幣的未來-技術路線出現爭議  提到比特幣的未來就不得不說一下比特幣分叉的問題。這是關於比特幣技術路線的一個核心問題。
  • 數據的驗證價值:如何利用數據驗證你的想法及假設?
    移動端最有價值的數據集中在對行為事件的統計上。UV用戶數:與網站相似,APP中定義為啟動應用的人數。數據分析的目的我們首先應該探討數據為何目的使用。數據的使用價值遠大於數據本身,多數情況,當我們試圖進行數據分析的時候,關注的是「能否獲得更多收入」或者「能否提供更大價值」。目的決定視角。
  • 以赫本為例,談談童年創傷會給我們帶來什麼樣的影響及如何應對
    童年的創傷到底會給我們帶來什麼樣的影響?我們到底應該如何治癒這種創傷?以奧黛麗·赫本為例,談談我的幾點思考前言:在上個世紀五六十年代,奧黛麗·赫本可以說改變了世人所公認的對於女性的時尚定義。在文章的第三部分,我也會以赫本為例聯繫現實,進一步分析如何更好的分析自己的童年創傷,以及我們自己應該如何走出童年的創傷。
  • 數據分析師如何晉升詳細資料分析
    有同學問:陳老師,滿網際網路都是「如何從0到1學數據分析」,可我想知道,如果再晉升的話,比如去到月薪3w,5w,需要什麼樣的知識與能力儲備? 這個話題,很容易變成高薪的數據分析師們的曬命貼。問題是,如果一個同學真的科班出身,985碩士、畢業進大公司、領導賞識、同事配合、每次跳槽都踩中風口,他也不需要問這種問題了。
  • 聚焦HCP——抓住被忽視的數據價值
    ,如何高效處理紛繁複雜的數據集和數據類型,是每家企業都在思考的問題,尤其是當非結構化數據變成了企業內部未經開發的「重要價值」。「企業存儲著大量的數據,但並沒有有效手段把數據價值挖掘出來,所以我們需要數據的提煉。數據的存儲、提煉非常重要,更重要的是要有一個安全可靠的『煉油廠』即存儲設備,不要被黑客或意外事情所影響。」Hitachi Vantara中國區首席技術官吳衛平說。      IDC預測,到2025年全球數據總量將達到175ZB。在企業組織的存儲系統中,非結構化數據佔據了數據總量的80%-90%。
  • 梅斯醫訪談:價值為馬,數據為鞭,打造網際網路醫學第一專業平臺
    如何實現網際網路醫學內容運營的模式升級?傳統 to C 內容如何高效實現 to B 的商業轉化?專業內容運營的速度、溫度和深度如何踐行?今日梅斯醫學旗下網站生物谷訪談梅斯醫學首席醫學創新官黃強 David Huang,希望給大家帶來不一樣的觀點。