數據分析模型:歸因分析

2021-01-17 人人都是產品經理

本篇講述歸因分析在實際業務中的應用及實現方法,主要講解「渠道歸因」和「運營位歸因」的「單值傳遞歸因」、「多值記錄集合歸因」、「時序還原歸因」以及「路徑還原歸因」幾個方法。

01 了解歸因分析

隨著網際網路技術和業務的發展,廣告投放相關的業務也隨之興起。那麼廣告投放的效果評估也就隨之而來。

首先,廣告的投放一般都是收費模式,所以選中的渠道商的好壞直接和自己的利益掛鈎。於是,「歸因分析」便最早應用在了廣告投放行業。(歸因分析能最先應用在廣告行業還有一個原因,就是廣告的目標是單一的。比如:無論多少個渠道商,最後推的都是同一款 App;但是若將在產品內部的運營位進行歸因,就需要考慮這個廣告位和商品是否有關係。)

舉個例子:一款 App,投放了三個推廣渠道,最後 App 通過某個渠道商完成了下載。此時,我們需要對這三個渠道商對本次下載的貢獻能力進行一個評估。這時,就用到了歸因分析。

02 渠道歸因(站外歸因)

渠道歸因是目前市面上比較廣泛的歸因應用場景。

圖中舉例說明了一個渠道歸因的大致流程和思路:用戶分別瀏覽了「Youtube」「Google」和「Facebook」後下載了 App,通過歸因分析來計算三個廣告的貢獻。

點擊放大圖片查看

03 運營位歸因(站內歸因)

隨著渠道歸因的普及,從業人員逐漸認可了歸因的計算方法和功勞的分配方案,雖然模型的不同會導致計算結果存在一定偏差,但是這些都在可接受的範圍內。

後來,隨著產品的複雜化、公司部門的事業部、業務線的劃分。產品內部的運營位逐漸被廣告化,於是運營位的歸因需求逐漸被暴露出來。

接下來,我們來說一下運營位歸因的演進歷史。

1. 傳遞式單值歸因

傳遞式單值歸因是歸因分析由渠道轉向運營位時,採用的簡單轉化方案。當然這個方案,至今還在被一些公司沿用。該方案的優勢:邏輯清晰、實現簡單;劣勢是:無法匹配稍微複雜的運營場景。

圖中舉例說明了一個傳遞式單值歸因的大致流程和思路,由於技術的原因,在記錄廣告時,使用的是替換的策略——即每次只記錄前一個廣告,當出現新的廣告則替換前一個廣告名稱,直到成單轉化,記錄在訂單上。

用戶分別瀏覽了「廣告 A」「廣告 B」和「廣告 C」後購買了「商品 C」,通過記錄最近一次廣告運營位,來進行歸因,計算運營位的貢獻。

點擊放大圖片查看

在網際網路初期,人們的業務模式都比較簡單、使用流程也很單一,使用前篇講解的「單值傳遞歸因」完全夠用。

但是某一天,人們發現自己 App ,已經不再是簡簡單單的「廣告 → 商品 →購買」路徑,又多出來了很多其他的路徑。比如:「搜索 → 商品 → 購買」、「推薦 → 商品 → 購買」或者「推送 → 商品 → 購買」,甚至是「紅包 → 商品 → 購買」時,我們會發現,原來的那套邏輯,有一些過時了。

解決問題的辦法也很簡單,就是將原來的一個值,變為記錄多個值。那麼,我們就來推演一下後續每個版本的歸因分析的實現的思路和計算方法。

2. 場景

我們假設一個場景,接下來三個模型的演繹都使用該場景進行還原。

首先,用戶來到了一款電商類 App,打開首頁,看到的是頂欄「搜索」「頭部廣告」腰部的「推薦商品」,其中「頭部廣告」是一個主廣告,點擊進去分為兩個「分會場 A」「分會場 B」的子廣告,「推薦商品」動態計算,展示您最可能購買的商品。

接下來,一個用戶開始使用我們的 App,行為如下:

進入首頁,先行搜索,在列表頁看到了商品 A,瀏覽了商品 A 的詳情,覺得不錯,但是並未購買;從詳情頁返回到首頁,看到頭部廣告,點擊進入到主會場頁面;在主會場頁面,看到分會場 A 和分會場 B,點擊進入分會場 A,再次看到商品 A,點擊再次查看商品 A 詳情;頁面返回到主會場頁面,進入分會場 B,在分會場 B 中瀏覽了商品 B 的商品詳情;直接退出到了首頁,發現推薦位在推薦商品 A,進入再次查看商品 A 的詳細信息;看到了推薦的評語,下定決心,購買了商品 A。

最終,我們想看每個運營位,對用戶購買商品 A 這個決策帶來的貢獻。

3. 多值記錄集合歸因

由於業務變得複雜、來源增多,那麼最簡單的方式,就是由原來單值的記錄形式變為多值。

再解決額外引入的幾個問題,分別是:

為了避免無窮無盡的記錄廣告,以及將不屬於這個商品的廣告記錄在這次購買中,需要引入一個重置的機制,比較簡單的重置就是:App 冷啟動、訪問回首頁和發生後支付就進行重置。記錄下了廣告的集合併完成了數據的採集,後期需要再進行邏輯的運算,來給每個廣告位分配功勞。

4. 時序還原歸因

在我們看了多值集合歸因的推演之後,可以很明顯的發現其中的問題:重置機制實在是太坑了,回到一次首頁之後,全部的努力就白費了。

那麼,有沒有更好的辦法來解決這個問題呢?

實際上,我們從根本上來思考這個事情,我們想探索的是「廣告」和「成單」之間的關係,那麼這層關係是依靠什麼進行關聯的呢?很簡單,是依賴這個商品關聯。

那麼,我們再將這個邏輯抽象一層的話,這整個行為中最為緊密的關鍵節點是什麼?

——我認為是:點了廣告,所以讓你看到了這個商品,因為看到了這個商品,所以你才產生衝動購買了這個商品;那麼轉化為抽象的描述就是:廣告 → 曝光 → 轉化

那麼,新的問題來了,我如何去探索這個關係呢?

別忘了,人的行為發生是有先後順序的,於是我們嘗試通過時間序列來還原用戶當時的場景,再根據曝光→轉化,來跳過一些和轉化無關的廣告位。(演繹圖需從購買商品為起點看起)

5. 路徑還原歸因

從上面的時序還原的歸因模型中,可以看到:已經可以比較好的解決問題了。但是,距離完美,還是差那麼一步。就是類似於「主從廣告」這種廣告結構時,不能很好的進行還原,兩個有關聯的廣告相鄰時,也不能很好的進行關係的計算。

解決辦法也是有的,我們需要再引入一個維度:時間的維度可以表明事情的發生順序,再引入路徑的維度,就可以更加準確的還原事情的流向。

像「頭部部廣告 → 廣告 A → 廣告 B → 廣告 A」的這種情景,通過路徑可以還原出一個樹形結構,即「頭部廣告廣告 A 廣告 B 父節點」,自然幾個廣告的關係也就出來了。(演繹圖需從購買商品為起點看起)

04 總結

本文章幫大家梳理了一下歸因分析的一些思想,類似於歸因分析這種和業務貼合特別緊密的分析模型,是會隨著業務形態的變化而逐漸優化和改變的。

目前大部分的歸因分析都在應用「單值」或「集合」的形式進行記錄,極少數使用「時序還原」的形式,因為這個計算量太大了,而且需要引入一些標準化的埋點才可以做。當然,「路徑還原」就更少了,因為他是在「時序還原」的基礎上又提升了一檔難度,需要再額外記錄頁面的前項地址,來進行路徑的還原。

最後,希望大家可以在了解了歸因分析的前世今生和未來後,可以了解的是結合自身業務情況進行數據的推導和演繹的能力,而不是將一個模型一成不變的進行套用。

 

作者:宋宋,神策數據產品經理。

本文由@請叫我宋宋 原創發布於人人都是產品經理,未經許可,禁止轉載。

題圖來自Unsplash, 基於CC0協議。

收藏已收藏 | {{ postmeta.bookmark }} 點讚已贊 | {{ postmeta.postlike }}

相關焦點

  • 4個方面解析:歸因分析模型
    在數據時代,廣告的投放效果評估往往會產生很多的問題。而歸因分析(Attribution Analysis)要解決的問題就是廣告效果的產生,其功勞應該如何合理的分配給哪些渠道。一、什麼是歸因分析?另外由於大部分追蹤的cookie存活期只有30-90天(淘寶廣告的計算周期最長只有15天),對於顧客的行為路徑、周期比較長的場景,在做歸因分析的時候可能就會發生數據的丟失,而對於末次互動模型,這個數據跟蹤周期就不是那麼特別重要了。弊端:這種模型的弊端也是比較明顯,比如客戶是從收藏夾進入商品詳情頁然後形成了成交的,按照末次歸因模型就會把100%的功勞都歸功於收藏夾(直接流量)。
  • 如何搭建數據歸因模型?
    編輯導讀:歸因分析,究其本質是對不同渠道的投放進行評估,給出一個為什麼要這麼做的理由。業務模式的不同,所搭建的歸因模型也不同,所以數據分析師需要根據實際的業務情況來構建模型。本文作者依據工作實踐的所思所想,結合案例等分享了數據歸因模型搭建的關鍵步驟和思考,供大家一同參考和學習。要深度分析問題原因,不能只統計數字,流於表面!
  • 神策數據:《十大數據分析模型詳解》白皮書上線!
    今日,神策數據推出數據分析模型系列白皮書之《十大數據分析模型詳解》,基於多維事件模型,總結歸納十大數據分析模型,內附多種分析模型的實際應用場景案例!本白皮書由神策數據諮詢中心負責人徐美玲、宗海英、翟國帥等神策數據團隊成員共同完成。以下內容節選自該白皮書2017年,神策數據曾推出——八大數據分析模型,詳細解釋了各種分析模型的定義、適用範圍、分析思路、使用方法等等,一經推出,好評如潮。
  • 數據驅動歸因的幾個算法
    數據驅動歸因,英文是Data-Driven Attribution,簡稱DDA,或數據驅動歸因模型,英文是Data-Driven Attribution Models,簡稱DDAM,也叫算法歸因。自Google 宣布即將推出歸因模型以來,廣告主對新的數據驅動模型表現出很大興趣。
  • 場景解析+計算邏輯 | 如何利用歸因分析量化目標貢獻佔比?
    綜上,歸因分析幫助運營人員全面診斷首頁坑位,快速定位優化點。其實還可以針對不同的優化點進行深度下鑽分析,查看每一個優化點對應的細分表現,例如查看不同的「大專題活動」,通過帶來的貢獻收入進行「大專題活動」的優化等。二、歸因分析背後的計算原理及演繹神策歸因分析背後的計算邏輯是如何的?本部分將從歸因分析模型參數配置、歸因分析模型的計算原理演繹兩個方面來介紹。
  • 跨境電商獨立站營銷歸因:分析消費者路徑提升轉化率
    6.算法歸因此模型通常稱為自定義歸因。當有足夠的可用數據時,您可以允許機器學習來確定哪些接觸點在客戶的旅程中應獲得最多的功勞。從理論上講,這是最好的模型,但是它依賴於足夠的歷史數據來進行機器學習,以在不同的接觸點之間分配權重。
  • SEM推廣數據分析之帳戶歸因
    今天分享的主題是SEM推廣優化過程中帳戶的數據問題歸因。我的觀點是,學習SEM推廣,必備的技能就是數據分析,分析就是分析出現的問題,找出原因,再作出對應的調整,使推廣收穫最大化的效益。本篇內容依然適用於初學SEM的小白同學,是整理的學習筆記和個人觀點。如果有大神看到覺得我的理解不正確或者很片面的話,歡迎留言多加指導,在此謝過。
  • 偷偷掌握這些歸因模型技巧,不要讓同行知道
    我們先用三種歸因模型來簡單分析下: 1、最終點擊歸因 這是Google使用的默認歸因模型,它會顯示用戶在完成轉化前進行的最後一次互動。在上述例子裡,就是付費搜索廣告。
  • 什麼是數據分析的漏鬥模型?
    漏鬥模型,不僅僅是一個模型,更是一種可以普遍適用的方法論,或者說是一種思維方式。本文主要談談漏鬥模型的本質、漏鬥模型案例分析以及如何繪製漏鬥模型。漏鬥模型關於漏鬥模型,我認為本質是分解和量化。為什麼這麼說,這裡以營銷漏鬥模型舉慄。
  • 常見的大數據分析模型有哪些
    提到數據分析,肯定要提到數據分析模型,在進行數據分析之前,先搭建數據分析模型,根據模型中的內容,具體細分到不同的數據指標進行細化分析,最終得到想要的分析結果或結論。
  • 數據分析方法:RFM模型
    編輯導語:RFM是很傳統的數據分析模型,幾乎所有文章都會提到它,然而市面上流傳的各種亂用、錯用也非常多;本文作者對RMF做出了詳細的分析,我們一起來了解一下。上一篇講了【用戶畫像高大上,但90%的人都做失敗了】以後,很多同學表示想看RFM,今天它來了。
  • 每周研究一個問題「22:宏觀角度看數據分析」
    常用的長漏鬥有渠道歸因模型,AARRR,用戶生命周期漏鬥等等。短漏鬥是有明確的目的,時間短,如訂單轉化漏鬥和註冊漏鬥。在軌跡分析裡,桑基圖是一種常用的方式。常見於各頁面的流轉關係,電商中各品類的轉移關係等等。日誌分析,則通過直接瀏覽用戶前後端日誌,來分析用戶的每一個動作。
  • 數據分析必會的六大實用模型
    對於剛剛接觸數據分析的人來說,經常會有這樣的困惑和疑問:數據分析究竟難不難?難的話難在哪?為什麼有時候作分析不知道從何下手,只能眉毛鬍子一把抓?其實就連我這種已經在數據分析行業浸淫十幾年的老油條,有時候做起分析來也會手忙腳亂,根本原因就在於沒有抓住數據分析的本質,我們是為了用大量數據去分析、解釋和預測基於數據的事實,你首先要明白自己做數據分析的目的是什麼,是為了描述事件分析?還是為了預測?又或者是做規範性分析?
  • 大數據分析模型有哪幾種類型
    今天中琛魔方主要為大家講解在做大數據可視化時,有哪些常見得到數據分析模型。   數據模型可以從兩個角度來區分:數據和業務。   一、數據模型   統計數據視角的實體模型通常指的是統計分析或大數據挖掘、深度學習、人工智慧技術等種類的實體模型,這些模型是從科學研究視角去往界定的。
  • 微信數據分析和微信傳播模型
    什麼是微信數據分析呢? 試想一下,如果是你,會怎麼向你的領導、向你的下屬,進行數據分析呢?是像描述天氣一樣「昨天陰天,今天天氣挺好,風和日麗的,明天預報多雲」,還是用其他的方式?大多數人所為的數據分析就像剛才描述天氣一樣,那不是分析,而是描述數據。 數 據分析需要從來源、行為、流失等方面進行分析。
  • DOT模型助力大數據分析軟體開發
    本次大會以「海量數據掘寶」為主題,吸引了來自世界各地的一千餘名關注Hadoop的專家、開發者和使用者。【點擊查看IT168視頻直播專題】  本次大會上,美國俄亥俄州立大學計算機科學與工程系系主任張曉東老師介紹了用於開發大數據分析軟體的DOT開發模型,IT168記者就此進行採訪。
  • 如何用線性回歸模型做數據分析?
    編輯導語:在日常工作中,很多時候都會用到數據分析的方法,線性回歸模型看起來非常簡單,但實際上它的十分重要;本文作者分享了關於如何用線性回歸模型做數據分析的方法,我們一起來學習一下。
  • 數據分析經典模型——樸素貝葉斯
    編輯導語:做過數據分析的人,想必對貝葉斯模型都不會陌生。貝葉斯預測模型是運用貝葉斯統計進行的一種預測,不同於一般的統計方法,其不僅利用模型信息和數據信息,而且充分利用先驗信息。通過實證分析的方法,將貝葉斯預測模型與普通回歸預測模型的預測結果進行比較,結果表明貝葉斯預測模型具有明顯的優越性。
  • 怎樣用數據分析方法應用KANO模型?
    本文從數據分析的角度,重新解讀如何應用kano模型。因此問卷法得到的信息往往是不準確的,而真實的用戶行為數據卻不會說謊。所以用數據來反應用戶的行為將會更為準確,我們完全可以嘗試通過用戶行為數據進行kano模型的分析。
  • 判斷客戶價值的3個數據分析模型!
    本文將來談談常用的幾個衡量客戶價值的數據分析模型,以及它們的應用場景。這在用戶運營、市場營銷、客戶管理等領域常常會用到。一、使用帕累託模型判斷哪些是我們最重要的客戶帕累託原則,又稱二八原則,是關於效率與分配的判斷方法。帕累託法則是指在任何大系統中,約80%的結果是由該系統中約20%的變量產生的。應用在企業中,就是80%的利潤來自於20%的項目或重要客戶。