本次調研的目的在於發現「今日頭條」推薦文章模塊中未達理想態的case,並從多維度多方面分析背後的原因,以及進一步給出解決方案與優化建議。
策略產品已經是一門體系較為完善的學科,想學習的小夥伴可以通過搜尋引擎查找相關課程。本系列文章不講方法論,只分享親手分析的案例。著重展示具體思路,希望可以為大家帶來啟發。
調研時間:2018.11
調研對象:今日頭條>推薦文章模塊
調研方式:抽樣分析
調研目標:發現未達理想態case;分析原因,制定解決方案
如果用形式化的方式去描述實際上是擬合一個用戶對內容滿意度的函數,這個函數需要輸入三個維度的變量。
用戶興趣特徵最直觀的是基於點擊的內容標籤,內容標籤有相關的數據處理策略
1)相同文章消重
2)相似主題消重
熱點事件只需要幾篇文章覆蓋到整個事件就可以了。
內容聚合平臺的核心功能是高效地為用戶分發內容,促使用戶觀看更多內容,在平臺逗留更長時間,並與內容作者及其他用戶進行社交互動。
聚合平臺向用戶分發內容的方式可以分為平臺主動推送和用戶主動尋找。
主動推送方式主要是智能推薦引擎。
用戶尋找主要是通過以下幾點實現:
推薦模塊的業務需求是通過合理篩選並展示內容或作者信息,方便用戶快速找到這些內容。
今日頭條用戶畫像:
從年齡、城市分布來看,18-30歲人群佔到近86%,二線城市及以下佔近73%。18-23歲主要是大學階段,24-30歲則多是職場執行層,同時又處在競爭相對不那麼激烈的小城市,他們都有一個共同的特點——閒。
閒就需要娛樂,頭條在一定程度上補充了這部分需求,同時又提供大量的新聞資訊,滿足用戶獲得信息的需求。
用戶需要一種高效的手段來快速找到自己喜歡看的內容。除了平臺智能推薦引擎、菜單導航、搜索欄、關注頁以外,用戶還可以通過推薦模塊快速找到優質內容。
在【科技】頻道中,用戶瀏覽完一篇文章後,推薦用戶在當前最感興趣的或者與這個內容最相似的一個內容。
「用戶瀏覽完一篇文章」的影響因素:用戶畫像、首頁推薦策略。
「在推薦模塊快速高效的找到感興趣內容」的場景:
在拆解指標時,只考慮不受其他策略影響的情況,否則沒辦法準確定位問題。因此在抽樣調研過程中,我們都假設用戶看完了樣本文章並滑動到了推薦文章模塊。
(1)點擊率
推薦模塊第一條>40%、第二條>20%(基於sense的決策,通過實際數據分析調整)
(2)滿意度
通過用戶行為指標量化得分
(3)多樣性
滿意度&多樣性在無數據時的衡量方案:
根據之前調研時得到的數據,內容數據(視頻播放量、點讚數、評論數、轉發量、相關搜索、是否原創等)、作者數據(發布帳號、簡介、是否認證、認證信息、粉絲數、發布數、獲贊數)並沒有直觀的展示出其與推薦內容及排序的關係。本次調研中此類欄位,對應上文核心指標中的用戶滿意度,簡化成對應得分。
內容質量:通過可獲取的內容信息、作者信息、用戶與內容、作者互動的數據,佐證內容質量。
內容&作者標籤/主題:內容標籤的層級是相對的,通過系統定義標籤與自定義標籤對比,層級關係如【體育】>【足球】>【中國足球】。
每個內容都應最少定義出相同或不同層級的3個標籤。
暫定推薦模塊中,前2條內容主要負責內容相關,內容質量要求適當放低;後3條內容負責內容多樣。
內容相關:推薦模塊第一條內容相關分>5,第二條內容相關分>3;內容質量分>3
內容多樣:內容質量分>5,內容相關分≤3
(4)覆蓋
推薦模塊覆蓋率達到80%(基於sense的決策,通過實際數據分析調整)
(5)消重
在推薦模塊的5個內容中,沒有重複內容(「重複內容」和「相似內容」通過內容識別機制量化定義)
(6)時效
推薦內容的發布時間與推送時間間隔不超過其對應的時間節點
a.用戶持續使用時長
根據公開數據,今日頭條用戶平均使用時長為76分鐘左右。在超過用戶習慣的瀏覽時長後,用戶的跳出是基於規律和習慣,並不能代表對推薦內容不感興趣。
理想態中定義的【科技】只是平臺內容中的一個頻道,通常用戶不會每次只瀏覽一個頻道的內容。因此在單一頻道中對用戶平均使用時長的預估還要減少。暫定30分鐘,用戶持續使用超過30分鐘後,跳出行為不在分析範圍內。
b.使用過程中被打斷
用戶在使用過程中出現斷網、網絡信號差、鎖屏、殺死進程、低電量關機、接入電話等客觀情況時,會打斷用戶的瀏覽行為,並不代表用戶主觀上對瀏覽內容的好惡,因此此類情況同樣不在分析範圍內。
c.推薦內容為視頻
部分推薦文章中包含視頻內容
分析平臺【科技】頻道下,推薦模塊的推薦策略,通過調研及分析找到現有推薦策略存在的問題,給出優化方案。
【科技】頻道中的15篇文章,記錄各自對應的推薦內容。
模擬用戶瀏覽場景,按FEED流降序抽取樣本。
局限性:由流程圖可以看出頁面跳轉邏輯,在推薦內容是文章時,點擊返回直接跳轉回首頁,每次跳轉頁面都會刷新,推薦模塊內容均會產生變化,因此無法獲取第一次進入樣本詳情頁中推薦模塊的全部內容信息。(搜索無法確認發布帳號)
用戶標籤:深圳、男
用戶行為:瀏覽【健康】【科技】類文章較多,少量【娛樂】【歷史】類文章;多次重複瀏覽相同內容。平均停留時間小於30S。
抽樣環境:周日15:00~周一1:00,iPone6SP
未達理想態
(1)內容質量低
很多雞湯文都會掛著馬雲等科技大佬的旗號吸引用戶點擊,用戶對內容的興趣不是基於科技相關話題,而是人物的社會標籤、財富等因素。標題黨、震驚體的標題雖然措辭程度有所收斂,但是如果把內容質量的標準稍微上升一些,但是有很大一部分的內容無法通過審核。
不同用戶對內容的感知也是不同,但是如果用戶覺得看到的內容質量低,但是又沒辦法通過瀏覽過的低質量內容找到高質量內容,用戶會選擇跳出平臺。
(2)內容相關性差&內容多樣性差&標籤缺失
【內容相關性差】和【內容多樣性差】主要有4點原因
(3)覆蓋率低
部分文章下沒有推薦內容,尤其是在FEED流頂部新刷出來的內容。有可能是沒有及時為文章定義標籤。
(4)消重
某種程度上和【標籤缺失】是互斥的問題,在本次抽樣中未定位到。完善內容標籤後,需要重點關注。
(5)時效
本次抽樣未定位到。本次因為瀏覽行為的影響,抽樣中段推薦了大量科技側重商業方向的內容,該類內容不受時效性影響。理想態的定義是90天,如果縮短到60天則會有部分內容觸發時效。
不同的頻道、不同層級的標籤都要精細化設置對應的時效限制。
a.樣本文章內容標籤&內容分發
樣本文章與頻道定位不符,導致推薦的【相關內容】偏離頻道定位
b.推薦模型
在抽樣時,發現推薦模塊中相同的內容刷新後會調整排序
在推薦模塊有明確的策略定位時,建議區分出【相關內容】和【多樣內容】模塊,推薦模型分別推薦,各自的內容在其對應模塊中調整排序。推薦模塊整體消重。
推薦文章和推薦視頻混合在推薦模塊呈現,信息層級上給用戶的感知是一致的。但是在推薦文章頁點擊返回直接跳回了FEED流,在推薦視頻頁點擊返回是按路徑返回到當前文章詳情頁。雖然提升了當前文章的點擊量等數據,但是虛漲的數據同樣對算法造成了幹擾。
交互邏輯如此設計的原因分析:
(1)頭條對於內容模塊的定位以及對用戶瀏覽路徑的引導
不需要用戶喜歡全部5個推薦內容,只要有一個吸引用戶點擊即可;瀏覽結束後返回首頁,使最成熟的首頁推薦引擎作用最大化。但是這無法解釋為何視頻和文章的跳轉邏輯不同。
(2)實時推薦的顆粒度,不要太敏感,給用戶反應的時間
根據用戶實時行為(或實時綜合其他相似用戶行為)豐富用戶畫像,提升推薦準確性,刷新出推薦權重更高的內容。
但是對於用戶來說,如果在點擊推薦模塊其中一個內容時,已經看到了5個推薦內容的標題,如果用戶對多個內容感興趣,就會打斷用戶的瀏覽體驗,影響用戶的安全感。
項目收益大、項目成本大,優先級高。
屬於緊急問題,是建立良好內容生態最關鍵的一環,要建立完善合理的審核制度,使平臺中的內容質量得到保障,維護在用戶心中的良好形象,防止被政策打壓。
項目短期收益小,長期收益大,項目成本由策略的逐漸完善而從大到小,優先級高。
7個問題中,有4個問題與內容分類有關,而且完善策略是一個長期持續的過程,所以要重視並努力壓縮這個過程。
項目短期收益小,長期收益大,項目成本由策略的逐漸完善而從大到小,優先級中。
7個問題中,有5個問題與內容分發有關,而且完善策略是一個長期持續的過程,所以要重視並努力壓縮這個過程。但是內容分發不僅僅是內容因素決定,更要考慮用戶行為與環境等因素。因此在對內容相關性的調研上,並不能對內容分發策略做出特別準確的評判,因此優先級中。
項目短期收益大,長期收益大,項目成本由策略的逐漸完善而從大到小,優先級高。
可快速解決覆蓋率低的問題,解決這個基礎問題後,使推薦模塊得到更多的曝光和數據收集,是完善內容推薦模塊的重要基礎。
項目短期收益小,長期收益中,項目成本中,優先級低。
需要【完善內容標籤】這個前置條件。
無法預估,優先級低。
內容運營會涉及到一些犧牲部分用戶體驗達成商業目標的行為,需要跨部門協商後確定具體計劃。
《今日頭條算法原理(全文)》
《短視頻聚合平臺功能對比分析:熱門、推薦功能模塊》
本文由 @紫原新之助 原創發布於人人都是產品經理。未經許可,禁止轉載。
題圖來自Unsplash,基於CC0協議