遊戲公司為了解用戶的喜好,並提供他們想要的內容,需要經常對用戶的行為進行分析。不過,韓國用戶分析AI服務商在一次演講中表示,由於遊戲開發者們會認為「這是我製作的遊戲,所以我比誰都了解這個遊戲」,所以在分析用戶行為時,常常會產生兩個錯誤——「辛普森悖論」和「倖存者偏差」。
因為,即使是在同一款遊戲中,既有比其他人更重視遊戲內排名的用戶,也有比起競爭、認為用包裝角色更有價值的用戶,情況多樣。因此,詳細的數據分析是很重要的。
第一個錯誤「辛普森悖論」:在某個條件下的兩組數據,分別討論時都會滿足某種性質,可是一旦合併考慮,卻可能導致相反的結論。
假設有一款名字為A的遊戲,為把握遊戲A今後的發展方向,分析留存率圖表是非常重要的事情。但在這裡,如果只分析下圖中兩類用戶的流失曲線,就很容易發生辛普森悖論。
如下圖,隨著時間的推移,兩類用戶在慢慢流失,呈現出了不同的曲線。如果只根據這兩類玩家的流失數據制定對策,就會顯得缺乏針對性。
因為,如果按照消費習慣對用戶進行細分,可以看出每個分類下用戶的流失曲線都有著明顯的差異。因此,如果開發者能更全面一些,對用戶進行更細化的劃分,可以更容易地了解不同類型的用戶不喜歡什麼,以及為防止流失應該採取什麼方法。
第二個錯誤是「倖存者偏差」:經過某種篩選而產生的結果,但沒有意識到篩選的過程,因此忽略了被篩選掉的關鍵信息,進而得出錯誤的結論。
最具代表性的案例就是二戰時,安全返回的戰鬥機的機翼和機尾處有很多彈痕,英美軍方決定哪裡彈痕多就加固哪裡。然而,一個統計學家力排眾議,指出應該注意彈痕少的部位,因為要把在戰鬥中未能存活下來的飛機也包含在內。
分析遊戲時也很容易產生「倖存者偏差」的錯誤。很多人認為「把水平一般高的用戶喜歡使用的角色推薦給新手是不是更好」,但實際上並不全是這樣。因為,他們收集遊戲上線第一天流失玩家的資料,以及遊戲上線一段時間後流失的「水平一般高的玩家」的資料,對比後發現,這兩類玩家對角色的取向顯示出了完全相反的結果。
因此,分析用戶數據,尤其是留存玩家的數據時,不僅要從時間的角度,還要從其他角度分析留存玩家的取向和流失玩家的取向,以對遊戲進行更好的調整。