用戶流失分析的兩大誤區:「辛普森悖論」和「倖存者偏差」

2021-01-10 遊戲陀螺

遊戲公司為了解用戶的喜好,並提供他們想要的內容,需要經常對用戶的行為進行分析。不過,韓國用戶分析AI服務商在一次演講中表示,由於遊戲開發者們會認為「這是我製作的遊戲,所以我比誰都了解這個遊戲」,所以在分析用戶行為時,常常會產生兩個錯誤——「辛普森悖論」和「倖存者偏差」。

因為,即使是在同一款遊戲中,既有比其他人更重視遊戲內排名的用戶,也有比起競爭、認為用包裝角色更有價值的用戶,情況多樣。因此,詳細的數據分析是很重要的。

第一個錯誤「辛普森悖論」:在某個條件下的兩組數據,分別討論時都會滿足某種性質,可是一旦合併考慮,卻可能導致相反的結論。

假設有一款名字為A的遊戲,為把握遊戲A今後的發展方向,分析留存率圖表是非常重要的事情。但在這裡,如果只分析下圖中兩類用戶的流失曲線,就很容易發生辛普森悖論。

如下圖,隨著時間的推移,兩類用戶在慢慢流失,呈現出了不同的曲線。如果只根據這兩類玩家的流失數據制定對策,就會顯得缺乏針對性。

因為,如果按照消費習慣對用戶進行細分,可以看出每個分類下用戶的流失曲線都有著明顯的差異。因此,如果開發者能更全面一些,對用戶進行更細化的劃分,可以更容易地了解不同類型的用戶不喜歡什麼,以及為防止流失應該採取什麼方法。

第二個錯誤是「倖存者偏差」:經過某種篩選而產生的結果,但沒有意識到篩選的過程,因此忽略了被篩選掉的關鍵信息,進而得出錯誤的結論。

最具代表性的案例就是二戰時,安全返回的戰鬥機的機翼和機尾處有很多彈痕,英美軍方決定哪裡彈痕多就加固哪裡。然而,一個統計學家力排眾議,指出應該注意彈痕少的部位,因為要把在戰鬥中未能存活下來的飛機也包含在內。

分析遊戲時也很容易產生「倖存者偏差」的錯誤。很多人認為「把水平一般高的用戶喜歡使用的角色推薦給新手是不是更好」,但實際上並不全是這樣。因為,他們收集遊戲上線第一天流失玩家的資料,以及遊戲上線一段時間後流失的「水平一般高的玩家」的資料,對比後發現,這兩類玩家對角色的取向顯示出了完全相反的結果。

因此,分析用戶數據,尤其是留存玩家的數據時,不僅要從時間的角度,還要從其他角度分析留存玩家的取向和流失玩家的取向,以對遊戲進行更好的調整。

相關焦點

  • 數據分析必須警惕的坑:辛普森悖論
    辛普森悖論為英國統計學家E.H.辛普森於1951年提出的悖論,即在某個條件下的兩組數據,分別討論時都會滿足某種性質,可是一旦合併考慮,卻可能導致相反的結論。近些年來,隨著大數據行業的蓬勃發展,「Data-Driven(數據驅動)」受到越來越多企業的追捧。越來越多場景的數據採集、越來越成熟的分析模型、越來越強大的分析效率,這些無疑都是精細用戶行為分析、優化決策體系的智舉。然而在數據背後,隱藏著一些似是而非的謬誤,比如「辛普森悖論」,作為數據分析人員必須警惕。
  • 辛普森悖論與「人生的第三條路」
    概 述 有新聞說美國iPhone用戶忠誠度沒Android高,但該國iPhone的佔有率卻是在上漲。 兩個數據都是「真實」,原因何在? 辛普森悖論揭示了數據會說謊的秘密。 本文最後少不了來一碗實用主義的雞湯,扯了一下「懷才不遇」的統計學原理,和逆向運用辛普森悖論的人生第三條路。
  • 數據分析之辛普森悖論
    也正是因為在分析業務數據的時候,總是用到分組對比的方法,所以我們一不小心就可能會陷入統計學的陷阱 -- 辛普森悖論。實際案例分享我們先來看工作中一個實際的例子,相信做電商的朋友都非常清楚一個指標:1分鐘響應率,指的是買家諮詢了貨品問題,賣家能否在1分鐘內及時響應。
  • 醫療服務質量評價中的「倖存者偏差」分析
    可見,醫療服務質量的評價由患者說了算,但患者在評價過程中,往往常常容易出現「倖存者」偏差現象,如苯酚治癒了新冠肺炎感染患者、細胞療法治療了白血病、抓中藥生兒子等。這種醫療服務質量評價的結論是偏頗的,需要進行理性分析和科學批判,方能撥開迷霧見真相。
  • 數據分析必須要避開的坑:讓人懷疑人生的七大悖論
    但是在實際分析中,我們很可能會因為沒有避開數理統計中常見的「坑」,造成我們最終分析結果與實際偏差很大, 我主要總結了三個方面:錯把數理關係當成因果關係不同變量之間會存在悖論數據統計有偏差一、不要把數據統計關係當成因果關係我們先看三個例子:1、彩票悖論首先根據假設檢驗,如果原假設概率非常小,就可以拒絕原假設。
  • 辛普森悖論,是很多人懷才不遇的重要原因
    一個有趣的矛盾是,一旦我們下意識接受數據很重要,就必然陷入辛普森悖論製造的陷阱中。最終使我們錯誤判斷別人的能力,或者使自己的能力被別人錯誤判斷,導致懷才不遇。辛普森悖論辛普森悖論簡單來說,就是當你把數據拆開看的時候,細節和整體趨勢會有完全不同的結論。
  • 論文速遞-新冠死亡率的辛普森悖論,因果推斷的一個例子
    1)問題引入上圖是中國和義大利的新冠死亡率,圖中每個年齡段,中國的都大於義大利,但義大利的總死亡率卻比中國更高,這在統計學中被稱為辛普森悖論,指在某個條件下的兩組數據,分別討論時都會滿足某種性質,可是一旦合併考慮,卻可能導致相反的結論。對此,直接的解釋是,由於義大利的老齡化程度更高,所以總死亡率更高上圖是義大利和中國的人口比例對比。
  • C羅和梅西誰的足球踢得更好?帶你了解辛普森悖論
    相信很多人對世界盃都不陌生,就算沒看過也應該聽說過,那你知道和世界盃有關的統計學當中的一個悖論嗎?這個悖論叫做辛普森悖論,這個錯誤在工作生活中很常見,總容易犯錯,那我們就來看一看究竟應該如何透過現象看本質呢?
  • 倖存者偏差:你看到的真相,也許是真相的背面
    倖存者偏差,是指當取得資訊的渠道,僅來自於倖存者時(因為死人不會說話),此資訊可能會存在與實際情況不同的偏差。這個問題來自二戰,在二戰期間人們發現倖存的轟炸機中,機翼中彈的數量很多,而機身中彈的卻很少。因此人們認為我們應該加固飛機的機翼。
  • 倖存者偏差:實現成功不是複製成功者,而是學習失敗者
    英國著名魔術師和催眠師德倫·布朗在一個紀錄片中,展示了一個心理騙局。方法很簡單,首先,獲得一張數量足夠大的聯繫人列表,給列表上的每個人發電子郵件說,你有能力預測到賽馬的結果,並且你會向他們證明這一點。這種片面的心理表現就是倖存者偏差。倖存者偏差(urvivorship bias),另譯為「生存者偏差 」,是一種認知偏差。其邏輯謬誤表現為過分關注於目前人或物「倖存了某些經歷」然而往往忽略了不在視界內或無法倖存這些事件的人或物。
  • 【隨筆】倖存者偏差的幾個例子以及我們如何應對
    倖存者偏差是一種很常見的環境偏差,具體原理這裡不再贅述,參考之前的一篇文章:倖存者偏差,這裡只是例舉最近自己遇到的幾個例子,以及提供一種可能的解決方法;例子 1:找工作的例子看到一篇文章:說下現在的職場大環境,看完之後,感覺公眾號作者還是迎合大眾的需求,面向大眾而寫作的。
  • 看似高大上的「倖存者偏差」是啥?人類頂級數學家打臉美軍
    倖存者偏差,原文是"survivorship bias",這個典故,出自二戰時期美軍對戰鬥機的防禦能力的研究。  天才瓦爾德  提出這個概念的學者叫瓦爾德?亞伯拉罕 (Wald ábrahám),他出生在奧匈帝國的克勞森堡,是一個猶太人。
  • 如何利用「倖存者偏差」現象當股神?
    倖存者偏差這個詞兒,很多人都聽說過。但把這個現象運用到場子裡,尤其是運用在股評和財經自媒體圈子裡,其手法和訣竅並不是誰都清楚的。今天我就來講一講。 毫無疑問,說到財經自媒體,各大平臺,各種公眾號上,最火爆的主要是兩類:女博主和赤裸裸地談個股的。
  • 數據,圖表和謊言,辛普森悖論每一個都會提供一些有用的
    涉及分析和理解數字的學科被稱為統計學。小說家赫伯特·喬治·威爾斯(1866—1946)預測,"未來,高效的公民有必要擁有統計學的思維,作為其讀寫的能力"。確實,統計數據在今天隨處可見。你在讀報紙、看電視或上網時,不可能不看到一些統計術語和數字。受數據影響幾年前,我在一家主流報紙上讀到這樣一則新聞:超速不會導致事故。
  • 【BBC News精讀】倖存者偏差:別隨便喝下成功學的毒雞湯
    簡而言之,倖存者偏差指的是我們做結論只是基於那些倖存者,即那些表現突出的人,機器或者企業,而沒有全面考慮所有因素包括那些和倖存者相似但是沒能成功的因素。 3. The most famous example of survivorship bias dates back to World War Two.
  • 你真的懂「倖存者偏差」這個詞嗎?
    這個故事被後人用一個詞語概括——倖存者偏差。    它指的是當取得資訊的渠道,僅來自於倖存者時(因為死人不會說話),此資訊可能會存在與實際情況不同的偏差。    倖存者偏差,是由優勝劣汰之後自然選擇出的一個道理:死人不會說話。
  • 高考作文之「倖存者偏差」:曾被日本大加運用,不過吃了大虧
    中國的高考,被形象的形容為「千軍萬馬擠獨木橋」,可見高考的難度之大、影響之深。而今年高考的作文題目也很讓人意外,不過,平時就喜歡武器裝備的男生可能會有一點佔便宜的感覺。估計大部分的考生根本枚研究過這個沃德教授,更沒有聽說過這個統計學問題——畢竟統計學是要在上大學之後才系統性學習的。而且這還不僅僅是個統計學問題,這是統計學中著名的「倖存者偏差」問題。
  • 很多人不知道的是,有一種失敗叫「倖存者偏差」!
    很多人似乎都會覺得,做銷售很賺錢,那些買房子買保險的提成不要太好,但是我也見過那些一個月沒有業績每個月只拿死工資的失敗者,每個月收入2兩三千的人比比皆是,那些所謂的月入過萬也只不過是「倖存者偏差」而已。
  • 倖存者偏差:有時候過程比結果更重要!
    你看不到的往往才是最致命的 倖存者偏差,又譯存活者偏差,是一種常見的邏輯謬誤,意思是只能看到經過某種篩選而產生的結果,
  • 「倖存者偏差」的大坑了解一下
    別信這種幻覺既然母語國家的人那麼能「糾錯」,我們何不對自己好一點,別那麼「處女座」,追求表述的精準和優雅了呢?如果這樣想,我們就陷入了一個叫做「倖存者偏差(survivorship bias)」的邏輯誤區。