實案分析:如何用一道多選題給用戶畫像?

2020-12-11 人人都是產品經理

本例僅僅是基於調研目的靈活處理的一個例子,適合短平快的項目;如果需要系統了解用戶,深入挖掘用戶需求,更大的樣本量和更紮實的定性研究依然是必不可少的。

現代商業離不開對用戶的理解,任何業務的決策者都不會希望在認識用戶上存在盲區,因此在用研的日常工作中,「做一個用戶畫像」是經常收到的需求。但同樣的需求背後,往往對應著不同的目標和問題,搞清楚了解用戶能幫助業務方解決什麼問題,才能更有效地制定研究方案。大而全的數據平臺,不一定可以和粒度很細的調研目標精確匹配;傳統市場調研或設計調研的方法又會增加周期和成本,不適合短平快的項目。那麼是否可以使用簡單的測量-統計方法,較敏捷地得到一個需求方期望的「用戶畫像」呢?本文來分享這樣一個案例。

(一)背景-為什麼想做一個「用戶畫像」

在接手話題版塊改版方向調研的過程中,其中一項調研目標比較有意思:運營同學發現,網易新聞客戶端話題版塊中,一些女性相關話題活躍度格外高,這與對目標用戶的預期有一些偏差。依照大家的印象,新聞客戶端中壯年男性比例偏高,典型用戶是一個體制內老劉的形象-時政、社會、歷史、軍事版塊的重度讀者-因此在話題運營上也更偏向了此類內容。然而偶爾為之的母嬰、情感類的話題,無論從參與熱度還是質量來考量,效果都不錯。運營同學陷入思考之中,懷疑話題版塊活躍著一些假的網易新聞用戶。

那麼話題社區的活躍用戶真的與客戶端整體不同嗎?運營同學由此提出了調研需求,希望了解話題活躍用戶的「性別、年齡、婚姻狀況。。」等等的一攬子人口學變量描述,簡言之-「做一個話題版塊的用戶畫像」。

不管如何做,先梳理一下需求,把目標拆解成回答以下兩個問題:

  1. 網易新聞客戶端的用戶可以分為哪幾類?
  2. 這幾類用戶中,哪些是話題版塊可以發力的核心用戶?

(二)以什麼標準區分用戶-一個簡單的題目設計

大家可能注意到,需求方在提需求的時候,順帶提了一下自己對用戶區分維度的界定「性別、年齡、婚姻狀況。。」。誠然,人口學變量用來區分用戶很經典,但並不適用於所有研究目標,比如在本例中的效果就未必好。原因有二。首先,人口學變量並不直接能落地到業務,還需要基於業務理解進行二次推演,不夠直觀;而好的分類標準應該能直接與現有資源結合來指導業務;二是完全無預設的情況下,事前很難確定各個人口學變量的影響權重,那麼如果需要進行探索性分析,需要在問題中納入足夠多的變量。這樣短短問卷難以承載,也會讓分析頭緒無端變多。

所以研究用了另一個解決方案,直接用內容偏好特徵來區分用戶。這樣做的好處是,作為內容分發平臺,直接以內容偏好為標籤的用戶畫像天然具有可落地的屬性,而不必再通過人口學特徵去推斷。另外,對內容的需求偏好往往反映了一個人當前的綜合狀態-社會經濟地位、文化傾向、人口學特徵-可以預期是一個很有效的探測點。

相關的問題設計很簡單,只是在問卷結尾處加一道內容偏好的多選,備選項參考了主流新聞app的版塊分類。

您平時使用網易新聞客戶端時,喜歡看哪些內容?(多選)

  • 科技網際網路、數碼IT
  • 體育賽事、運動健身
  • 財經金融、投資理財
  • 時事要聞
  • 母嬰親子
  • 情感兩性
  • 時尚美妝
  • 娛樂明星
  • 動物萌圖
  • 遊戲動漫、二次元
  • 影視音樂、攝影旅行
  • 健康醫療、營養養生
  • 社會民生、房產資訊
  • 汽車知識
  • 國際政治局勢
  • 歷史掌故、軍事動態
  • 神跟貼、幽默段子
  • 星座命理
  • 其他(請註明)

這裡有個問題簡單說明一下-為什麼要把選項切到這麼碎,而不加以合併。這種處理方式實際是基於以下兩點考慮。

  1. 希望基於用戶認知形成分類-當然可以根據對業務的理解,對選項內容進行合併和抽象,但預設的歸類方式與用戶會採用的未必吻合。如果希望降低預設對用戶選擇的影響,完全通過用戶反應情況來建立項目間的關聯,那不妨呈現具體細緻的選項。這好比景觀規劃時,直接在行人足跡最深的地方鋪路。
  2. 準確性和易答性-抽象度越高的描述,包含的信息越多,不同人腦中的典型代表差異會越大,也越可能包括的矛盾案例。回答「是不是喜歡狗」時,更有可能陷入「我有點喜歡松獅但是又有點討厭泰迪到底選不選喜歡呢」的糾結中,而問「是不是喜歡泰迪」就會更加容易回答。另外,抽象度高的選項,往往需要詳細描述並給出具體例子,進一步增加閱讀難度;而答題者處理短而多的選項時,未必需要比長而少的選項花費更多認知資源。

因此,問題選項呈現採用了具體細分的列舉,而細分項的合併化簡,則將在問卷回收後,根據用戶的實際反應來處理。

(三)讓分析過程更簡明-數據降維

問卷投出去一段時間後,樣本池漸漸上漲,內容偏好的數據餅圖五彩斑斕地分布起來。這時就發現問卷選項細碎的不方便之處-同時考慮18個選項遠遠超出了人類工作記憶的負荷,讓分析過程頗有些尾大不掉。當然這是意料之中的。如前所述,之所以把選項粒度做得很小,是希望通過用戶的實際選擇模式來找到相關聯的內容。因此,首先要使用一下因子分析的方法,把數據進行濃縮。

岔開幾句簡單說說因子分析的用途。所謂因子分析,是處理多變量數據的一種常用的預處理方法,使用場景是當實際用於測量的變量較多且相關時,可以將比較瑣碎繁多的變量,用幾個易於解釋的因子表達出來,從而更清晰地展示數據的結構和規律。拿這個項目來說,我們得到的多選題數據是用多重二分法表示的-每一個選項作為一個單獨變量-題目反應數據共包括18個變量(如下圖)。顯然這些變量之間是存在相關關係的,存在歸納的可能,這正符合因子分析的使用場景。

因子分析使用SPSS完成,操作過程略去不表,分類結果如下圖所示,將18個選項濃縮為5類因子。根據每個選項在各因子上的載荷(也就是原始選項和因子之間的相關係數),可以看出該因子大概代表了哪一類內容。為了便於理解,分別給它們起了一個比較直觀的名字。如下圖所示。

5個因子作為新的變量保存下來(如下圖,注意保留下來的變量已經標準化為Z分數),留作後續進行用戶聚類的依據。每個用戶對某個因子分數越高,就意味著對該因子對應內容的偏好程度更強。例如第2個用戶,就明顯是「女性生活」因子相關內容的重度瀏覽者。

(四)為用戶打內容偏好標籤-聚類分析

完成了數據化簡,接下來根據用戶在五個內容偏哈因子上的得分,對用戶進行聚類分析。由於因子本身為Z分數,不用再進行標準化處理,直接分析即可。

這裡再岔開幾句簡單說說聚類分析的原理。聚類算法的原理是通過計算各個案例點在變量空間中的距離遠近(SPSS中計算距離的方法有30多種,大多數情況只選擇默認設置的歐式距離就好),來把它們分簇處理的。變量空間名字聽起來挺厲害,其實就是把n個變量當作n個坐標軸,參照三個維度構成三維「空間」的說法,將n個變量的情境稱為n維空間。每個case在這n個變量上的取值,構成了一個n維坐標,根據坐標可以計算case間的距離,根據距離遠近形成不同的分類簇。例如,上圖表格中每一行都是一個五維坐標向量,描述了該行對應用戶在「內容偏好空間」的位置,不同用戶位置間的距離越近,就越可能被歸為一類。

聚類分析仍使用SPSS完成,結果如下表所示。表格中數字代表每類用戶對特定內容的偏好程度,數字越大偏好程度越高。根據幾類用戶的內容偏好模式分別起一個鮮明易記的名字,例如,給更偏好「女性生活」與「宅文化」內容的用戶打上「時尚麗人」的標籤。

現在每一位樣本中的用戶都有了一個內容偏好標籤,這個標籤也保存為一個新的變量(如下圖),留待與其它題目進行交叉分析。

 

首先就可以用內容標籤與人口學變量來交叉分析一下,驗證一下偏好某類內容的用戶是否具有比較特殊的人口學屬性。結果如下圖所示(具體數據略)。可以看到,儘管由於樣本中男性比例偏大造成一些bias,相對趨勢的比較還是驗證了很多印象:例如「時尚麗人」中年輕女性的比例顯著偏高,「財經科技控」高學歷高收入比例顯著高等等。

納入與人口學變量的交叉分析結果,最終得到的用戶分類如下表所示。從樣本佔比推斷,「隨意用戶」和「時政歷史迷」最有可能是客戶端主流人群,這與業務經驗得到的印象是一致的。

(五)哪類用戶是話題版塊的核心用戶

現在關鍵的問題來了,畫像的幾類人群,哪類是話題版塊的核心用戶、需要重點發力運營呢?

首先看看活躍用戶中各類用戶的佔比(活躍度根據問卷中覺知情況和使用頻次的問題答案來判斷)。由下圖可以看到,活躍用戶的類別分布和整體差異並不大-「隨意用戶」和「時政歷史迷」佔了最大的部分。這也符合預期,畢竟話題版塊的流量從客戶端整體滲透過來,各類用戶體量上不應該有太大的差異

那麼哪種用戶的增量潛力比較大呢?這個問題反過來看比較清晰-我們可以這樣假設,如果某類人群中活躍用戶比例越大,滿意度越高,那麼這類用戶更可能是話題版塊的目標用戶。

首先將活躍度與內容偏好進行交叉分析。可以看到,「時尚麗人」中話題使用活躍者佔比最高(42%),無覺知者佔比則最低(29%)-年輕女性用戶看起來天然對話題討論很敏感。

再看一下滿意度的差異。年輕女性用戶對話題社區各方面的滿意度都高於其他用戶,她們在話題社區玩得更開心。

所以,給出結論&建議-年輕女性用戶雖然在話題版塊的體量不大,但她們的活躍度和滿意度更高,討論質量更好,對促進話題社區良性發展有很大幫助,可以從相關內容版塊進行重點引流。而反過來,如果話題社區這種形式對「時尚麗人」獨具吸引力,也可以將話題版塊與時尚、母嬰、情感等垂直頻道打通,通過話題運營進行流量反哺。

最後,本例僅僅是基於調研目的靈活處理的一個例子,適合短平快的項目;如果需要系統了解用戶,深入挖掘用戶需求,更大的樣本量和更紮實的定性研究依然是必不可少的。不過在日常工作中,有意識地以經濟敏捷的方式擴展關於用戶的基礎知識,也不失為一種很好的積累沉澱吧。

(本案例數據和結論僅作為例子展示,不涉及真實情況)

 

作者:驢爺

來源:公眾號:ME網易移動設計

版權:人人都是產品經理遵循行業規範,任何轉載的稿件都會明確標註作者和來源,若標註有誤,請聯繫主編QQ:419297645

相關焦點

  • SPSSAU實用教程:多選題的錄入及分析
    無論是在市場調查還是學術研究的問卷設計中,都常會使用到多選題來收集信息。但怎樣對多選題進行錄入、分析,有很多人還並不清楚,本文就以SPSSAU為例,來闡述一下如何錄入分析多選題。多選題的錄入多選題,又被稱為多重響應,在一個多選題中,被訪者可以選擇一個選項,也可以選擇兩個或多個選項。這樣一來就產生了一個問題,就是無法僅用一個變量來直接編碼分析。在專業的數據分析軟體中要求每一個變量只能佔據一列位置。
  • 多選題如何進行卡方分析
    問卷中如果有多選題,很可能會涉及多選題與其他題目的交叉分析,具體如何進行分析呢,下面就用一個簡單的案例進行說明。無論是多選題、單選題、量表題之間的交叉,本質都是研究差異關係。差異關係差異研究主要包括方差分析、t檢驗和卡方檢驗。如果是定類和定類,此時應該使用卡方分析;如果是定類和定量,此時應該使用方差或者t檢驗。多選題也屬於定類數據,分析時類似於單選題,通常是研究兩個分類數據之間的關係,即使用卡方分析。
  • 多選題怎樣深入分析?
    在進行問卷研究時,為了更全面地了解研究內容與研究對象,經常會在問卷中加入多選題。但大多數人使用的方法僅限於頻數分析,這使得多選題中很多有價值的信息,得不到深入的分析與研究。本文就來討論如何有效分析多選題。1.
  • 問卷調查中多選題如何分析?
    如今進入數據時代,為了解消費者需求、購買慾望以及政府部門為了對某一經濟指標進行分析,需要對某地區某經濟指標進行深入調查;其中通常會有幾個多選題項。但是,面對這種選擇多個問題的題目,如何分析?本文將對這個問題做一些簡單介紹。
  • 用戶畫像,該怎麼分析?
    很多人一聽到類似「流失用戶畫像分析」一類相對具體的分析題目,就開始無限拆解數據。分性別,年齡,地域,設備,註冊時間,來源渠道,購買金額……拆了幾十個維度看流失率。最後,只看到有的維度差5%,有的差10%,當然沒有最後結論啦,越看越糊塗。以上問題,都是太過糾結於用戶畫像四個字,忽視了分析兩個字導致的。用戶畫像作為一個基礎數據體系,本身並沒有分析功能。
  • 問卷多選題到底該怎麼分析?
    在進行問卷研究時,為了更全面地了解研究內容與研究對象,經常會在問卷中加入多選題。但就目前來看多數人在分析多選題時,方法僅限於頻數分析,這容易使問卷中很多有價值的信息得不到深入的分析與研究。那麼,該怎麼做,才能讓多選題真正發揮其價值呢?
  • 周志松:什麼是用戶畫像,如何構建用戶畫像?
    用戶畫像,又稱人群畫像,實際是數據和文字,而不是圖片,根據一系列真實目標用戶的數據建立的模型。這些數據主要是指用戶的基本信息,如:性別,年齡,性格,愛好,職業等,另外,還包括一些習慣,比如上網時間,上網行為,操作方式,購物習慣等。
  • 新高考:為什麼要做多選題?
    一是,我們的考生在數學上做多選題的歷史,幾乎沒有過。曾幾何時,數學還有多選題?數學題的答案不就應該是唯一的嗎?這樣的觀念一直在我們考生的思想中根深蒂固,因此,我們首先要適應這種變化,怎樣才能適應變化,那只有通過自己大量的去做題、去做多選題才能夠摸清其脈絡,而不是聽別人說多選題怎麼怎麼樣,多選題應該如何如何,怎樣怎樣做多選題,聽別人概括性的說,毫無意義,只有自己去親身實踐,才是最有效的感知途徑。二是,多選題有單選題和多選題不可比的優勢和好處。
  • 如何進行精準化的用戶畫像?
    它根據用戶在網際網路留下的種種數據,主動或被動地收集,然後儘可能全面細緻地抽出一個用戶的信息全貌,從而幫助解決如何把數據轉化為商業價值的問題。比如:猜用戶是男是女,哪裡人,工資多少,有沒有談戀愛,喜歡什麼,準備剁手購物嗎?
  • [乾貨]如何構建用戶畫像
    一、什麼是用戶畫像?男,31歲,已婚,收入1萬以上,愛美食,團購達人,喜歡紅酒配香菸。這樣一串描述即為用戶畫像的典型案例。如果用一句話來描述,即:用戶信息標籤化。如果用一幅圖來展現,即:三、如何構建用戶畫像一個標籤通常是人為規定的高度精煉的特徵標識,如年齡段標籤:25~35歲,地域標籤:北京,標籤呈現出兩個重要特徵:語義化,人能很方便地理解每個標籤含義。這也使得用戶畫像模型具備實際意義。能夠較好的滿足業務需求。如,判斷用戶偏好。
  • 用戶畫像如何讓教育營銷如虎添翼?
    前言對於品牌來說,用戶始終是他們長期追求的對象,伴隨著大數據應用的討論、創新,個性化技術成為了一個重要落地點。用戶畫像越來越被企業所重視。用戶畫像到底是什麼?品牌如何通過用戶畫像,越來越了解用戶,最終得到用戶的青睞?
  • 用戶畫像報告怎麼寫才有用?
    今天繼續分享如何寫數據分析報告。之前2期舉的例子都是監控數據,監控數據是連續觀測,會很明顯的看到曲線變動。於是很多同學便問:「靜態數據的報告該咋寫」。尤其以用戶畫像報告為甚。很多時候業務提了需求:看看我們的用戶畫像。結果寫出來報告被批:我都知道了,你寫這有啥意義。到底咋弄?今天系統分享一下。
  • 品客數據是如何進行用戶畫像的
    所以,對顧客進行畫像,然後分類管理成為必然的事情.但是,如何才能精準地實現顧客畫像呢?為什麼我們記錄了顧客的生日、三圍、款式偏好、色彩偏好,還是無法做到對顧客精準溝通?無法做到在合適的時機、以合適的內容,吸引顧客進店復購呢?為什麼我們發送的信息,顧客毫無反應,甚至打擾了顧客呢?品客數據根據多年的分析,對顧客畫像系統進行了深度的開發。
  • 雅思聽力技巧之多選題難點分析
    以下是新東方給大家分享的雅思聽力技巧之多選題難點分析,希望能為大家的雅思備考提供幫助,更多雅思備考內容歡迎大家隨時關注新東方網。   一般多選題分為5選2和7選3兩種,極偶爾會有7選2這樣的情況,2個或3個答案相互獨立,且答案順序不影響評分,即這2個或者3個答案並非算做同1題,不過,也極偶爾會出現2個或者3個選項只算1題的情況。在雅思聽力評分中,3題的正確率就可以有0.5分的影響了,所以多選題也是我們每題必爭的。下面對雅思聽力多選題的解題難點和對策做詳細的分析。
  • 二建《法規》多選題如何巧得分?關鍵在這七個核心步驟
    在這個臨考衝刺階段,掌握答題方法顯得十分重要,今天建工社微課程來為大家講解二建法規科目多選題如何答題!二建法規科目多選題如何答題?>多選題共20道,每題2分共40分。只要多選題能再拿到20分以上,加起來60分就有了。因此通過考試的關鍵是多選題。那麼,這20分如何拿?做多選題的最優策略是什麼?
  • 別再說不會分析多選題了!這6種方法解決你的煩惱!
    在進行問卷研究時,很多時候都會使用到多選題,多選題很容易理解,而且很多場合時都需要使用多選題進行數據收集。但當進行分析時會遇見一種尷尬,即只能做最簡單的頻數,計算個數或者計算下簡單的百分比,使得分析比較簡單,更談不上『高大上』。
  • 如何做B2B營銷用戶畫像(Buyer Persona)?
    上一篇中我們講了做營銷為什麼需要用戶畫像營銷為什麼要做用戶畫像(Buyer Persona)?,以及如何使用。這一篇我們詳細分享下如何製作?營銷用戶畫像可以通過調研,問卷以及採訪你的現有客戶,潛在用戶甚至是你目標客戶的合作方。
  • 一道80%的考生都會漏選的GRE閱讀多選題!
    今天的閱讀乾貨將給大家帶來 Passage 38 的一道多選題【最近一次出現在20190702澳大利亞雪梨考場中】在此也歡迎各位考過試的寶寶及時向我們回憶機經,為自己後續申請攢人品的同時,也造福後面考試的寶寶。
  • 新高考首張數學模擬卷出爐:新增4道多選題!選考題刪除
    (1)選擇題出現多選題(2)填空題繼續考查一題兩空(3)解答題刪除選考題,增加必考題。注意想要試卷的同學家長可以關注我後進主頁私信:「試卷」即可免費領取是的,瓜很多,以下是具體分析,一起來看。本次模考選擇題仍為12道,但由原來12道單選變為8道單選和4道多選,整體選擇題的分值未變,仍為每道題5分,共60分,其中多選題每題全部選對的得5分,部分選對的得3分,有選錯的得0分;分析:多選題不易得滿分,但容易得分,變相增強了對知識全面性的考查。
  • 考考:支持多選題的問答工具
    本周新功能:多選題、解析優化、英文換行用戶可以在創建題目的時候設定多個正確選項啦~批量錄入也支持此功能哦~——會員專屬·多選題解析變為點擊上拉即可大面積顯示的樣式,一目十行不是問題——通用功能·答案解析面對英語題的專用功能,題幹中可隨時換行,便於分清對話人物——通用功能·英文換行