本文是《數據分析中,文本分析遠比數值型分析重要!》的下篇,以一個實際案例來聊聊文本分析在實際運營中如何落地。行為脈絡如下:先簡要講述文本分析的分支—情緒分析的基本原理,然後以亞馬遜的Kindle Voyage的用戶評論作為「情緒分析」的實操分析,最後羅列了幾個實用的文本分析工具,以期對大家有所幫助。
在大數據時代還未來臨前,企業一般根據自身積累的歷史數據,以及一線運營人員的主觀經驗來猜測用戶接下來的反應,以此作為制定後續營銷、運營方案的依據。
然而,在這個VUCA時代(寶潔公司營運長Robert McDonald借用一個軍事術語來描述這一新的商業世界格局,即volatility,易變性;uncertainty,不確定性;complexity,複雜性;ambiguity,模糊性),商業場景的變化速度和複雜程度今非昔比,用戶的喜好也容易受外界「場景」的影響,就如「孩子的臉」和「六月的天」一樣善變,先前積累的經驗往往不足以作為企業下一階段進行市場謀劃和運營的依據。
VUCA時代的特徵
根據《數據運營|數據分析中,文本分析遠比數值型分析重要!(上)》的分析,我們可知,大數據文本分析正是應對上述困局的一劑良方。
接下來,我們將從理論到實踐,聊聊文本分析是如何應用在商業實踐中的。
藉助基於大數據的文本分析,我們可以對用戶行為和想法進行科學分析,使用戶洞察由原來的主觀「猜測」轉變為以數據為驅動的精準預測。在新產品上市前,或者是小規模投放市場後,在社交媒體上對粉絲和潛在用戶的言論進行收集,對其進行文本分析,知道他們喜歡產品的哪些方面,對哪些方面不太滿意,以及他們對產品的其他期望,從而敏捷、快速、準確的對用戶的反饋做出積極的回應。
由此可見,有文本分析介入的產品運營流程被「重構」了,如下圖所示。
有文本分析參與的運營分析邏輯流程
其中,對用戶言論進行文本分析的「精髓」在於對提煉出的文本數據的所表達出的「情緒」的解讀,也就是用戶言論的情緒分析。
在理解文本分析語境下的「情緒分析」前,我們先看看它的一般含義。
先說「情緒」。「情緒」這個詞,在心理學中的一般含義是:對一系列主觀認知經驗的通稱,是多種感覺、思想和行為綜合產生的心理和生理狀態。我們日常中最普遍的情緒就是喜、怒、憂、思、悲、恐、驚,也就是中醫中所說的「七情」。
那麼,「情緒分析」就是有效且準確的識別這些具體的情緒,根據得到的結果,進一步對產生於自身或者他人的情緒採取合理的應對措施(如疏導自身消極情緒、理解他人的反常行為等)。
與此類似,基於大數據文本數據的「情緒分析」,也被業界稱為「觀點挖掘」,它利用多樣化、海量的社會化媒體做客服,藉助數量龐大的社交網絡平衡語料和新聞平衡語料的機器學習模型,對所獲取文本中的情感傾向和評價對象進行提取,使運營者更全面、更深入地了解用戶的「心聲」,掌握用戶對於產品的喜好程度,及用戶視角下的產品優缺點。
值得注意的是,基於大數據文本的情緒分析在於深度分析評論的意義(評論的是事物的哪些方面)以及附帶的情緒傾向(是「褒」是「貶」,還是「中立」),而不是評論本身在說的文字。
下面,筆者將以基於亞馬遜上Kindle Voyage商品評論的文本數據為例,來聊聊文本數據的情緒分析在商業實踐中的運用。
現在,筆者以亞馬遜官網2014年9月份在其平臺上發售的Kindle Voyage電子書閱讀器珍藏限量為例,對其商品評論區的用戶評論進行基於文本數據的「情緒分析」,看看我們能從中得到哪些有價值的insight,以便優化我們的運營工作。
亞馬遜官網上Kindle Voyage電子書閱讀器的商品詳情頁
亞馬遜Kindle Voyage電子書閱讀器珍藏限量版評論區
筆者將從以下5個方面,即用戶聚焦點分析、用戶反饋趨勢分析、用戶情緒分析、用戶反饋分析,以及各地域用戶評級分布及情緒分析,對Kindle Voyage亞馬遜商品評論區的4659條用戶留言/評論進行文本分析。
對Kindle Voyage用戶評論進行文本分析的幾大模塊
大數據文本分析中的「典型意見」是指,將用戶的意見進行單據級別的語義聚合,將內涵相近但表述有差異的意見/看法聚合在一起,抽取出其中典型的用戶反饋/意見,在短時間內迅速梳理出用戶對於產品所關注的話題。
用戶評論的典型意見分析
從上圖可以看出,通過對這些用戶留言的典型意見進行分析,再結合Kindle Voyage的商品詳情描述,我們可以了解到用戶對於Kindle Voyage的評價主要集中在以下7個方面:
關於用戶對這些話題的具體評價和情緒感受,我們需要做進一步的分析。
用戶反饋趨勢分析曲線展現了文本數據量在時間上的分布情況,可以從宏觀上掌握上述8個話題所對應評論(量)的發展走勢,以便做好及時跟進,發掘出其中有價值的言論。
下圖中,從下至上,依次是話題1到話題8的評論數量隨時間變化的增減趨勢。其中,評論量的大小以圖形面積的大小來呈現。
用戶評論量隨時間軸的變化趨勢
可以看到,這些話題的發布數量的增減走勢基本相同,且在2015-3-1達到評論高峰,2016-1-25達到小高峰,這兩個時間點的前後數天的購買人數激增。然而在2016-4-24這一天商品評論區的總體評論量驟然減少,對於這幾個異常點,運營人員可以調出對於日期的銷售記錄、商品維護日誌等資料找出原因,以便對症下藥,做好後續的運營工作。
這部分包含2個模塊,即用戶評價和情緒分析,二者存在一定的正相關關係,也就是說,用戶評價較高,相應的情緒偏正面,反正亦然。
(1)用戶評價分析
用戶評論星級分布表
用戶評價星級佔比圖
從上面2個圖可知,超過63%的用戶對於Kindle Voyage的產品性能是非常滿意的,給出了5顆星的評價;次之的四顆星評價佔到19.15%的比重,以上二者比重之和超過80%,可知Kindle Voyage總體的市場反饋非常不錯。
(2)用戶總體情緒傾向分析
用戶的總體情感偏向
用戶的情感度分布
上圖是用戶對於Kindle Voyage總體情感的儀錶盤,是根據用戶對於Kindle Voyage的文字評論進行情緒傾向分析得出的,能反映消費者對於Kindle Voyage總體態度是肯定還是否定。該儀錶盤分為3個大的方向,即負面情緒、中性情緒和正面情緒,其中暗含的用戶態度就是對產品不滿意、產品一般和產品很不錯。
從上面2個圖可以看出,購買者對於Kindle Voyage以中性評論為主,情感正面值為1.06,總體情感偏向於正面,說明大家對Kindle Voyage的真實看法與評價星級總體傾向是一致的,沒有言不由衷。
上面的是全體用戶對於Kindle Voyage的總體情緒傾向,但在很多時候,我們想要知道哪些用戶的「發聲」在這些評論中更具代表性。這就需要分析引擎在語義層面上對每個用戶進行重要性排名,從中發掘出有「話語權重」較大的「意見領袖」。
更進一步,我們要對其中單個用戶的情緒態度、評價和所關注的產品方面進行分析,這就涉及到以單個用戶為主體的情緒傾向分析了。
以下2個圖分別關注的是意見領袖(用戶)情緒分析總覽和單個意見領袖(用戶)的詳細情緒分析。從中我們可以看到評論用戶的名稱、評論的數量、情緒是屬性及相應的情緒數值。
用戶(意見領袖)情緒分析總覽
如果我們想對某個重要用戶的情緒進行詳細分析,我們可以點開這個用戶的詳細資料,進行深入的分析。如下圖所示:
單個意見領袖(用戶)的詳細情緒分析
從上圖中我們可以了解到為什麼該用戶對Kindle Voyage持正面態度(正面情緒用紅色顯示)了—下面的正面關鍵詞雲顯示出該用戶對Kindle Voyage的手感、屏幕顯示和做工質量很滿意。此外,在「焦點概覽」裡,我們可以了解到類似的評論有8條,在哪個時間節點達到峰值。
在進行上述分析後,我們還需要進一步讀懂評論區的全體用戶對Kindle Voyage的反饋,知道用戶喜歡它的哪些方面,對哪些方面還不是太滿意,以及這些(不)滿意的方面的程度如何,這是「情緒分析」中的重中之重。
所以,我們需要進行下一步分析——用戶反饋分析。
這部分的原理是,從眾多用戶評論中提取出跟產品屬性相關且有代表性的關鍵詞,並進行相似文本聚類,然後給出相應權重,最後匹配相應的情緒屬性和情緒值。最終的結果使得運營者擁有了用戶視角,知曉產品有哪些地方表現尚可,哪些地方反映平平,而哪些地方是需要進行改進和完善的。
下圖是用戶對於Kindle Voyage使用後的評論中提取並聚類的關鍵詞雲,其中文字大小代表該詞的權重(重要程度和詞頻),字體顏色表明該詞的情緒偏向(紅色是正面評價,灰色是中性評價,藍色是負面評價)。
用戶的對於Kindle Voyage評論的主要關注點
根據關鍵詞及其重要程度排名,筆者找到了用戶滿意的幾個方面:
另一方面,運營方也要及時了解用戶的負向反饋,針對性地改進服務質量。
還好,在這裡只出現了「壓敏按鍵」這些負面詞彙,點開「壓敏按鍵」一詞,看到用戶的詳細吐槽……「壓敏按鍵在按下的時候出現下陷情形……」雖然這樣的反饋不多,但仍要引起高度警惕,具體排查是產品本身的設計問題,還是極個別的產品質量問題,並將此反饋傳遞給相關負責部門。
將用戶的反饋數據和評分同步到地圖上,通過形成的數據地圖可以直觀的看到各地對於Kindle Voyage的評價和情緒度,從而對整體的用戶反饋情況進行監控,重點「關照」其中的用戶差評「重災區」。
此處選取的是Kindle Voyage在江蘇省各市的用戶反饋數據,反映出該地區Kindle Voyage用戶對於產品的評價及情緒傾向性。
其中,數值代表評分高低,顏色反映情緒值,綠色代表良好,藍色是一般,紅色代表處於警報狀態,需要重點關注,排查問題發生的具體原因。
江蘇省各市Kindle Voyage用戶的評分及情緒度分布
這裡可以看到,徐州市、連雲港市等城市的用戶反饋良好,反映在評分較高,且顏色為綠色。然而,淮安市、鎮江市和南京市的Kindle Voyage用戶卻非常不滿意,評分較低且情緒度處於紅色警報狀態,需要引起客戶體驗部門的高度重要,做好用戶情緒疏導和公關工作。
從上面的實例中,我們可以體會到大數據文本分析對於產品、設計、營銷和運營的巨大價值,它的重要性不亞於傳統的結構性數據分析。用正確的方式閱讀這些海量的文本數據,我們就可以直接讀懂用戶的想法,獲得強有力的決策支持,從而使產品研發、營銷推廣和日常運營更貼近消費者需求,最終在用戶心中形成良好的品牌形象。
蘇格蘭折耳喵,微信公眾號:Social Listening與文本挖掘,人人都是產品經理專欄作家。數據PM一隻,擅長數據分析和可視化表達,熱衷於用數據發現洞察,指導實踐。
本文原創發布於人人都是產品經理。未經許可,禁止轉載。