用戶流失分析的兩大誤區:「辛普森悖論」和「倖存者偏差」

2020-12-19 遊戲陀螺

遊戲公司為了解用戶的喜好,並提供他們想要的內容,需要經常對用戶的行為進行分析。不過,韓國用戶分析AI服務商在一次演講中表示,由於遊戲開發者們會認為「這是我製作的遊戲,所以我比誰都了解這個遊戲」,所以在分析用戶行為時,常常會產生兩個錯誤——「辛普森悖論」和「倖存者偏差」。

因為,即使是在同一款遊戲中,既有比其他人更重視遊戲內排名的用戶,也有比起競爭、認為用包裝角色更有價值的用戶,情況多樣。因此,詳細的數據分析是很重要的。

第一個錯誤「辛普森悖論」:在某個條件下的兩組數據,分別討論時都會滿足某種性質,可是一旦合併考慮,卻可能導致相反的結論。

假設有一款名字為A的遊戲,為把握遊戲A今後的發展方向,分析留存率圖表是非常重要的事情。但在這裡,如果只分析下圖中兩類用戶的流失曲線,就很容易發生辛普森悖論。

如下圖,隨著時間的推移,兩類用戶在慢慢流失,呈現出了不同的曲線。如果只根據這兩類玩家的流失數據制定對策,就會顯得缺乏針對性。

因為,如果按照消費習慣對用戶進行細分,可以看出每個分類下用戶的流失曲線都有著明顯的差異。因此,如果開發者能更全面一些,對用戶進行更細化的劃分,可以更容易地了解不同類型的用戶不喜歡什麼,以及為防止流失應該採取什麼方法。

第二個錯誤是「倖存者偏差」:經過某種篩選而產生的結果,但沒有意識到篩選的過程,因此忽略了被篩選掉的關鍵信息,進而得出錯誤的結論。

最具代表性的案例就是二戰時,安全返回的戰鬥機的機翼和機尾處有很多彈痕,英美軍方決定哪裡彈痕多就加固哪裡。然而,一個統計學家力排眾議,指出應該注意彈痕少的部位,因為要把在戰鬥中未能存活下來的飛機也包含在內。

分析遊戲時也很容易產生「倖存者偏差」的錯誤。很多人認為「把水平一般高的用戶喜歡使用的角色推薦給新手是不是更好」,但實際上並不全是這樣。因為,他們收集遊戲上線第一天流失玩家的資料,以及遊戲上線一段時間後流失的「水平一般高的玩家」的資料,對比後發現,這兩類玩家對角色的取向顯示出了完全相反的結果。

因此,分析用戶數據,尤其是留存玩家的數據時,不僅要從時間的角度,還要從其他角度分析留存玩家的取向和流失玩家的取向,以對遊戲進行更好的調整。

相關焦點

  • 數據分析之辛普森悖論
    也正是因為在分析業務數據的時候,總是用到分組對比的方法,所以我們一不小心就可能會陷入統計學的陷阱 -- 辛普森悖論。實際案例分享我們先來看工作中一個實際的例子,相信做電商的朋友都非常清楚一個指標:1分鐘響應率,指的是買家諮詢了貨品問題,賣家能否在1分鐘內及時響應。
  • 從大廠數據分析面試題了解「辛普森悖論」
    一般來說,30歲以上的用戶,經濟實力更強,購買轉化率應該更高,所以,這裡只用「年齡」來做客戶區分,顯示是片面了,我們接下來再來看這組數據:我們把每個年齡段的客戶再按性別拆分,這樣就構成了4個維度的數據:從這組數據我們可以看到,30歲以上,無論是男性還是女性,都要比30歲以下的轉化率更高,但是為什麼合在一起,結論就是相反的了呢?
  • 學會七大悖論,不管財稅還是各大行業讓你的數據分析不踩坑
    統計學界,我總結了七個悖論數理統計學是數據分析的基礎理論,我們之前所有為數據分析所做的工作,比如梳理指標、篩選數據、可視化等等,都是為了我們能夠更好地找到數據之間的關係,利用統計學原理對這些關係進行界定和聯繫。
  • 論文速遞-新冠死亡率的辛普森悖論,因果推斷的一個例子
    1)問題引入上圖是中國和義大利的新冠死亡率,圖中每個年齡段,中國的都大於義大利,但義大利的總死亡率卻比中國更高,這在統計學中被稱為辛普森悖論,指在某個條件下的兩組數據,分別討論時都會滿足某種性質,可是一旦合併考慮,卻可能導致相反的結論。對此,直接的解釋是,由於義大利的老齡化程度更高,所以總死亡率更高上圖是義大利和中國的人口比例對比。
  • 從「倖存者偏差」看法輪功的「法身保護」
    也許有些人會問,倖存者偏差也許僅僅存在於理論中,和現實有什麼關係?其實在日常生活中,我們在不經意中會受到倖存者偏差的影響。類似的言論包括:「某某行業很不錯啊,我朋友賺了不少錢,其他創業者也很成功。」
  • 死人不會說話,看不見的彈痕才最致命,趣說倖存者偏差模型
    因為「死人不會說話」,後來,強大的網絡傳播告訴我們,準確的立意是「倖存者偏差」模型。那到底什麼是倖存者偏差呢?所謂「倖存者偏差」模型就是指當取得資訊的渠道僅來自倖存者時,這樣的資訊可能會存在與實際情況不同的偏差,而產生思維分析模型。
  • 如何利用「倖存者偏差」現象當股神?
    倖存者偏差這個詞兒,很多人都聽說過。但把這個現象運用到場子裡,尤其是運用在股評和財經自媒體圈子裡,其手法和訣竅並不是誰都清楚的。今天我就來講一講。 毫無疑問,說到財經自媒體,各大平臺,各種公眾號上,最火爆的主要是兩類:女博主和赤裸裸地談個股的。
  • 航空愛好者才會寫的高考作文:倖存者偏差與統計學邏輯謬誤
    圖片來源:wikipedia.org海軍分析中心的工作人員認為,飛機的彈孔大多集中在機翼和尾部,於是他們建議將這些受損最嚴重的地方加固。統計學家亞伯拉罕·沃爾德(Abraham Wald)卻得出一個跟直覺相反的結論。通過計算,他發現參與調查的都是在戰鬥中倖存下來的飛機,它們並未遭受致命的襲擊。
  • 針對用戶流失,如何做好預警和召回機制
    分析用戶行為特徵 在定義好流失用戶後,我們可以通過數據分析用戶的產品使用行為,鎖定一批用戶,觀察其在後續業務使用方面的持續沉默天數,滾動考察用戶持續沉默環比,著手構建建模分析樣本,洞察所有流失用戶的數據尋找一些共性行為特徵。
  • 數據,圖表和謊言,辛普森悖論每一個都會提供一些有用的
    涉及分析和理解數字的學科被稱為統計學。小說家赫伯特·喬治·威爾斯(1866—1946)預測,"未來,高效的公民有必要擁有統計學的思維,作為其讀寫的能力"。確實,統計數據在今天隨處可見。你在讀報紙、看電視或上網時,不可能不看到一些統計術語和數字。受數據影響幾年前,我在一家主流報紙上讀到這樣一則新聞:超速不會導致事故。
  • 《科洛弗悖論》中的兩大悖論,你看懂了嗎?
    哈嘍大家好,我是你們專注於不專業的電影解說小麥~之前小麥也跟大家聊過J·J·艾布拉姆斯的《科洛弗》系列的前兩部,《科洛弗檔案》和《科洛弗道10號》,也給大家補充了一些電影以外的相關信息,那麼今天小麥就和大家聊一聊這個系列的第三部《科洛弗悖論》吧~
  • 《辛普森一家:枯竭》發布 EA利潤大增
    對於《辛普森一家:枯竭》(The Simpsons:Tapped Out,中文版名為《辛普森一家之Springfield》),所有人都知道兩件事。
  • 機器學習中的忒修斯之船:那些「愚弄」專家的著名悖論
    事實上,悖論充斥了數學和統計學領域。為了使用幾個著名的例子,傳奇數學家和哲學家羅素提出了一個悖論,突出了集合論中一些最強大想法的矛盾,該理論由有史以來最偉大的數學家之一格奧爾格·康託爾提出。本質上,羅素悖論質疑的是「所有不包含自己的列表的列表」。這個悖論是在自然集合論中產生的,因為它考慮到了所有不屬於自己集合的集合。
  • 存在這3個誤區,導致鮮味流失
    存在這3個誤區,導致鮮味流失又到了吃螃蟹的季節,這個季節的公螃蟹特別好吃,特別肥美,而且價格又便宜。很多人從8月份開始就嘴饞螃蟹了,最常吃的螃蟹,一種是淡水的大閘蟹,還有一種是海水的梭子蟹。這段時間,舟山地區的梭子蟹大量上市了,價格在二三十元一斤左右,總體來說不算很貴,相比秋冬季節的母蟹,算是很便宜了。
  • 普羅米修斯:對異形的倖存者偏差,使愚蠢的人類本末倒置
    異形  首先,異形並不像很多人想像的那麼強大。  從研發歷程和具體功效來看,工程師的黑水實際包含兩代:第一代黑水大約在億萬年之前就已經研發成功。一名工程師在地球上喝下黑水,通過對身體細胞的重組,給地球帶來了生命。從而使工程師擁有了像上帝一樣,創造生命的能力。  可能是第一次創造生命,也可能是出於對「神」這一新角色的責任和好奇,這次實驗充滿很濃鬱的宗教儀式感。
  • 解讀手錶的逼格,當心逼格認知偏差雙刃劍,帶你走出手錶逼格誤區
    逼格,文明一點的詞彙好像叫品位,Class,逼格包括:品牌、價值(功能+做工)和修養。健全的逼格認知應該包括前面所有內容而且比較均衡。如果只認其中一項,比如,只認識品牌,就屬於認知偏差。認知偏差比較普遍。心理學研究表明,人在判斷的時候,頭腦中有三個部分在起作用:理性、貪婪和恐懼。
  • 【法律小課堂】辛普森殺妻案法律分析(下)
    今天接著上一期的法律小課堂繼續為大家從法律的視角分析辛普森殺妻案。陪審團的成員由來自社會的各階層的人士組成,他們在審判之前會被集中起來,呆在與外界隔離的環境中,防止外界的輿論造成他們心裡失去應有的公正平衡。
  • 那些講故事的倖存者
    馬雲、巴菲特和賈伯斯只是少而又少的倖存者。但是,怎麼解釋倖存者是他們,而不是別人呢?每個人都想成為他們那樣的成功者,於是就從他們待人接物、為人處世的每一個小細節開始研究。事實上這正是 「倖存者偏差」,意思是,我們都傾向於在倖存者的身上尋找到一些特質,來說服自己,他們的成功絕非偶然,不然就沒辦法解釋,「倖存者怎麼就不能是我」這個問題。
  • 同花順APP 產品分析(上):市場及用戶分析
    宏觀市場:股市人人都是產品經理作者「寧缺一十三」在其公開文章《同花順APP產品分析:如何優化基礎功能以及社區模塊》中,主要基於MobData研究院和易觀千帆的統計數據,對同花順APP的市場邊界和空間進行了詳細的分析,得出了令人信服的分析結論。