本文由作者Wise Wong於社區發布
數據分析的下限,取決於邏輯歸納。與其說提高分析質量,不如說提升邏輯歸納能力。
邏輯歸納,需要擁有良好的邏輯思維,並結合領域知識形成該領域的分析方法。而領域方法,進一步歸納則能夠成為通用了方法論。
關於數據分析,本文將從邏輯思維和分析方法2個角度進行解讀,其中分析方法會介紹數據分析前的準備以及數據如何為我們創造長期價值。
1
數據分析應有的邏輯思維
邏輯思維,是在認識事物的過程中藉助概念、判斷、推理等思維形式反映客觀現實的理性認識過程。藉助邏輯思維,能夠確立執行方向,減少方向的偏移度以及分析的誤差。
原始的數據並沒有太多的價值,它是已經發生的事實或者結果。從中發掘價值則是數據分析的目的。
在數據分析中,其過程是與邏輯歸納相近的,過程如下:
提出問題分析問題提出假設驗證假設輸出結論
只有具備了良好邏輯思維,才能更好的幫助我們數據分析。
認識邏輯,先從邏輯論證的三要素開始,如下圖所示:
在訓練自己邏輯思維時,首先要保證信息的完整性,其次才是討論準確性。如果陳述和提問不夠清晰,後續論證是沒有意義的。
初步了解了邏輯,接下來將與各位分享4種思維方式以及其運用方法,分別是目標、結構化、推理、逆向思維。
01 目標思維
目標思維,作用是明確目標的定義及完整性,校準執行的方向。
從邏輯論證的要素來看,目標只是一個論點,而判斷論點是否有效、正確,則需要細究其論據和論證方式。
將目標映射至三要素並進行結構化拆解,會變成我們熟悉的需求4要素,再次延伸又會變成5W2H法。
熟練運用目標思維,不僅能幫助我們分析問題,還能運用於生活的許多方面。
在陳述問題時所使用的KWIC方法,其實也是邏輯要素的延伸:
1)K(KEY):核心觀點
2)W(Widen):擴展核心觀點包含的內容
3)I(Illustrate):舉例說明佐證觀點
4)C(Conclude):總結
信息越全面,溝通的成本越低,後續的論證質量才能更高。
02 結構化思維
目標思維強調的是方向,結構化思維強調的是拆解和延伸。
在上一節中目標的拆解和延伸使用的就是結構化的思維,它能夠幫助我們將無序、散亂的信息進行聚焦、歸納、分類。
2.1 問題樹
問題樹,是大家較為熟悉的方法,也是我們常使用的「腦圖」。它是一種以樹狀圖形來分析存在的問題及其相互關係的方法,也是邏輯樹的一種類型。
在邏輯樹中,每一層都是下一層的總結概括,同樹幹內的延伸範圍相同,不同樹幹的延伸範圍相互獨立。
在使用問題樹時將一個已知問題當成樹幹,然後根據相關問題增加樹幹或樹枝,它能夠幫助我們更全面的找到相關項。
設置第一條樹幹時有兩種方式,自上而下以及自下而上。
自上而下其實是以終為始,通過最終的目標進行拆解;自下而上則常見於頭腦風暴,當缺少拆解思路時,我們可以將信息完全羅列,並對其進行歸類逐層向上聚合。
在拆解時,我們應注意樹幹間的平衡,假設某個樹幹上的樹枝過多或過長,其上層的拆解維度可能是不正確的。
2.2 公式法及過程法
公式法,是問題樹的一種延伸。
公式在橫向表示時,我們也稱為金字塔原理。
在邏輯樹的使用場景下,公式法不太關注細分場景以及整體漏鬥。在進行細化分析時結合場景、操作流程,對公式進行進一步的細化。
在結合過程法時,須注意的點是完全窮舉。
舉個例子:在活動中分析成交時,會使用訪問人數、點擊購買按鈕人數、成交人數去分析漏鬥。但漏鬥數據往往是不完整的,這會影響推斷的準確性。
結合場景、操作流程並輸出公式進行數據分析,會比漏鬥更為直觀。
以下載app後用戶的註冊流程為例,通過上圖,可以拆解出以下公式:
a、app註冊人數=手機號註冊人數+微信註冊人數
b、微信註冊人數=進入註冊頁面人數+瀏覽其他頁面引流進入人數-進入註冊頁面人數*跳失率-登錄人數-點擊手機號登錄註冊人數
c、手機號註冊人數=進入註冊頁面人數+瀏覽其他頁面引流進入人數-進入註冊頁面人數*跳失率-登錄人數-點擊微信登錄註冊人數-進入手機號登錄頁面人數*跳失率-輸入手機號未獲取驗證碼人數-獲取驗證碼未輸入人數-輸入驗證碼未登錄人數
公式羅列清楚後,代入數據就能夠了解是哪個數據和我們的預期不同,然後再根據數據優化我們的交互。
2.3 二分法及矩陣法
這兩種結構化方式,其實不太適合用於數據分析,但能夠幫助我們梳理思路便於全局思考。
二分法不適用於數據分析的原因是,世界不是非黑即白的,它很難將某個數據指標的值枚舉完畢。
而矩陣法所呈現的是結果數據,難以細化。
以時間管理中的四象限法為例:
四個象限能夠很好的用於任務分類,關於「重要」和「緊急」的程度,我們也可以使用坐標軸的值進行標記,但如果要細究哪個元素影響了」重要「和」緊急「的值,矩陣法就難以承載了。
03 推理思維
確認論點,結構化論據,下一步是論證。在論證中運用推理思維能夠幫助我們迅速找到問題的異同點,從而發現它們的規律。
推理主要使用的方法是歸納、演繹、類比法,而在推理過程中還貫穿著對因果的辯證。
3.1 歸納法
歸納法,指從特殊(部分樣本)到一般(全量樣本)的過程,通俗的說是從個別的經驗歸納出普遍規律的方法。它更偏感性思維,其推理方式不夠嚴謹,常用於開拓思路。
在產品工作中我們會遇見許多使用歸納法的情景,如:「很多用戶都需要這個功能,所以我們應該儘快實現。」
通過歸納法拆解後如下圖所示:
這實質上是以偏概全的方法,一旦有一個用戶不滿足這個前提,這個結論就無法成立。
這裡並不是說如果有用戶不需要這個功能需求就不承接了,而是要增加更多的衡量維度,如樣本數量、樣本佔比、投入產出比等。
在輸出結論之前需要判斷樣本是否足夠有代表性,判斷是必然事件還是隨機事件。
這也是為什麼數據分析需要長時間的收集樣本並觀察數據,樣本量太小會使其代表性不足,觀察周期太短會被數據的波動所迷惑,很容易讓我們做出錯誤的判斷。
3.2 演繹法
演繹法則與歸納法相反,是從既有經證實的普遍性結論,推導出個別性結論的一種方法,常見的表現形式是邏輯三段論。
邏輯三段論的格式為:大前提、小前提、結論。
假設大前提為真,小前提為真,那結論一定為真。演繹法追求的是前後一致,不自相矛盾,但大部分人都倒在了第一步,即大前提本身是不成立的。
不成立的原因是,大前提並非經證實的普遍性結論,而是通過歸納法輸出的結論。要避開歸納法的陷阱,我們則需要對其因果進行辯證。
3.3 因果關係分析法
因果辯證,同時適用於演繹和歸納法,它們都是由因及果的過程。
近期網際網路保險的營銷活動由於監管原因,無法使用現金及優惠券獎品促進成交,一定程度上減少了活動的數量。
我們試著拆解出可能的因果關係:
拆解完畢後先不進行辯證,而是先對因果關係進行枚舉:
枚舉完畢後,辯證時提問3個問題:
1)原因是否真實?
2)結果是否真實?
3)這個原因一定會引起這個結果嗎?是否有其他的原因?
在上述的案例中假設原因和結果都為真,套入第3點做出以下提問:
1)使用現金及優惠券獎品,一定會使成交效果更好嗎,是否有其他的方式?
2)不使用這2種獎品,活動一定不能做嗎,是否有其他的獎品?
3)活動沒法做,一定不能促進成交嗎,是否有其他的方式?
看到這裡,我們會發現這些原因只是結果的必要不充分條件。
在推理中,論證完畢也不應蓋棺定論。
我們應先對結論提出假設,並設計實驗或採取其他的手段驗證假設,最終驗證後的結果才是真正的結論。
04 逆向思維法
」反過來想,總是反過來想。「— — 查理·芒格
逆向思維,同時具有聚焦和發散兩種作用。
聚焦,是以終為始,問題樹中的「自上而下」拆解是其表現形式之一。
發散,是因為從正向思考變為逆向思考,思考習慣的改變能夠開拓我們的思路,並幫助我們補全邏輯。
在數據分析中,我們能夠怎麼使用逆向思維呢?
個人總結的逆向方法如下:
1)主賓反轉
正向:用戶購買商品數量提升了,為什麼?
逆向:商品被用戶購買的數量提升了,為什麼?
從用戶出發並沒有錯誤,從商品出發能幫助我們補全分析的維度。
2)謂語反轉
正向:活躍度降低了,分析用戶進入活動入口
逆向:活躍度降低了,分析用戶的跳出原因
同樣是活躍度降低,」進入「這個詞會從入口出發,分析其流量情況。從」跳出「出發,則會從交互、設計層面出發分析。
3)次序反轉
正向:引導用戶成交,捐款後獲得獎品
逆向:給予用戶獎品後,引導用戶成交
這裡的逆向主要是為了開拓思路,並不是說要直接給予用戶獎品。在開拓思路後進一步延伸,方案可以調整為,給予用戶部分獎品,成交後再給予另一部分。
小結
校正方向,使用目標思維;分解問題和提出假設,使用結構化思維;邏輯推理用於論證,而逆向思維則用於補全我們的邏輯。
良好的邏輯思維,結合領域知識能夠幫助我們快速形成不同領域的方法,並解決問題。
2
數據分析的方法
01 數據分析前的準備
數據分析前的準備過程,在我看來比實際的分析更為重要。
假設目標是錯的,我們就不應該執行。而目標不同,分析類型和分析內容也不同,同時執行多個方向,很容易使自己陷入混亂。
1.1 定義目標,辨別指標
數據分析,能幫助我們了解業務運行狀況,並從中發現問題、優化問題。其次,還能夠幫助洞察下一個增長點。
但數據分析的意義,往往在數據產生之前。我們應圍繞產品目標,進行產品設計以及運營策劃。如果最開始的目標及指標設置錯誤,後續的工作將難以為繼。
目標是結果,而指標是對結果分拆的具體要求,是對目標的衡量。
假設我們的目標是提升年度成交金額,那衡量這個目標的方法是什麼呢?
根據衡量的方法我們才能定向的設置調整產品設計及運營策略。如果缺少可衡量目標的單位和方法,目標會難以達成。
而圍繞目標設置數據的採集方案,可以大大節省數據過濾和清洗的時間。
甚至於在明確指標後再最開始就設置好分析模型,通過監測模型中的數據情況更及時的發現問題,做出更高質、高效的決策。
1.2 辨別指標的目的
辨別了目標和指標,下一步則是運用結構化思維進行拆解、延伸。
在拆解之前,需要對自己提問:拆解出的指標目的是什麼?根據目的我們才能有傾向性的分析。
根據指標目的,可以分為結果指標、過程指標以及觀察指標。
結果指標用于衡量目標,過程指標用於體現如何完成。觀察指標則指的受影響指標,其是否會受到自變量(結果指標)的影響,導致上升或下降。
在上圖中,基於成交訂單數,設置過程指標為訂單平均金額及商品分布能幫助我們了解完成的方式。
而觀察指標的設置,是為了跳出框架思考。
上圖的用戶付費率,可以監測成交訂單數上升,是否帶動用戶付費率的上升,從而判斷是局部還是整體上升;而成交深度及ARPU/LTV則可以幫助我們考察下一個增長點是什麼。
在設置結果指標時,除了核心指標,還應輔以制衡性指標,它的目的是希望核心指標完成的更為健康。
核心指標和制衡性指標所延展的過程、觀察指標是不同的。
1.3 確認分析類型
完成了目標和指標的設置,接下來是對每個指標進行細化分析,分析類型包含:描述性分析、預測性分析和規範性分析。類型不同,作用也不同。
1)描述性分析
表現形式:數據報表
數據報表能夠幫助我們描述事件發展的情況,但很難解釋某種結果發生的原因和未來可能的趨勢。
它更偏向結果性的描述,此前的結果對此後是不具備太多參考意義的。
2)預測性分析
表現形式:用戶相似度及物品相似度計算、用戶購買飽和度、用戶成交影響因子
預測性分析可以理解為對結果和變量的關係進行預測的過程,包含相似度、相關性分析、回歸分析等。
相似度多用於推薦算法,通過計算用戶的相似度和商品相似度從而推薦給用戶。而相關分析用於預測變量的關聯性,如用戶的成交會受什麼因素影響。
3)實證性分析及規範性分析
表現形式:A/B實驗
實證性分析,指是什麼,偏向於客觀;規範性分析指應當做什麼,偏向於主觀。
在實際使用過程,上述的4種分析類型常常會被混合使用,混合使用時應明確不同類型我們應採取的分析維度。
數據分析是有順承關係的,先採集事實,再根據事實或者預測,提出我們的假設。逐步灰度地驗證假設,最終才輸出我們的結論。
不能將主觀猜測強加於事實之上,已經發生的結果並不一定是未來的結果
02 數據分析如何帶來長期價值
學習了方法,做好了準備,終於進入了分析的環節。
筆者此前面向的數據分析,常常是「一錘子買賣」,花了很大的力氣採集數據卻沒有了下文。
為了使有用功更多,下文將從用戶和收益2個維度分享數據如何為我們沉澱長期價值。
2.1 了解我們的用戶
這一步是為了讓我們知道完成指標的用戶是誰,常常以產品的會員體系作為切入點。會員體系越清晰,分析效果越好。
本節將以電商產品為例,和各位分享如何基於用戶的延伸分析。
1)基礎信息
基礎信息,指用戶本身的屬性。
身份特徵,可以從自然屬性、社會屬性向下細分,包含用戶的性別、年齡、職業、教育等。
渠道屬性,指用戶的註冊時間、註冊平臺、註冊來源等。
2)決策類型
決策類型,主要分為決策周期、品類偏好、促銷偏好、對象偏好,這是用戶分析中常常被忽略的一方面。
決策周期中的首次訪問,指的首次觸及該商品的時間。結合次數、時長以及成交時間,從而了解用戶的決策周期。
品類偏好,結合品牌和歷史成交單數,能夠幫助我們獲悉品牌、價格綜合對用戶的影響。