本文的文字及圖片來源於網絡,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯繫我們以作處理。
今天教大家用Python分析《沉默的真相》的17萬條彈幕。距離上一部國產良心劇《隱秘的角落》刷屏還不到2個月,「禿頭梗」、「爬山梗」還讓人記憶猶新。緊接著又一部爆款國產劇來了,那就是最近口碑炸裂的《沉默的真相》。
同樣是來自愛奇藝針對懸疑短劇的「迷霧劇場」,《沉默的真相》根據紫金陳的小說《長夜難明》改編,講述了檢察官江陽曆經多年,付出無數代價查清案件真相的故事。
開播當天《沉默的真相》在豆瓣開分8.8分,隨著劇集的播出,該劇口碑勢不可擋,一路走高,播出六集後,豆瓣評分衝到了9.2分,成功超越了它的前浪《隱秘的角落》。要知道,這種高開高走的趨勢,在國產劇裡是非常罕見的。
許多網友在最初刷劇時根本不信自己會哭,結果看到大結局才發現,這也太好哭了吧,看到主角江陽的捨命燃燈,真的讓人哭出蘭州拉麵…
那麼這部《沉默的真相》到底為什麼口碑能高開暴走?憑什麼成為年度壓軸國劇? 今天我們就用Python來帶你解讀。
上一部被稱為年度爆款國劇的還是《隱秘的角落》,改編自紫金陳的推理小說--《壞小孩》,《隱秘的角落》一經播出就帶著"小白船","爬山梗","禿頭梗"熱鬧了一整個夏天。
在豆瓣已有78萬餘人進行評分,最終收官8.9分,是非常驚豔的成績。
誰知僅過去2個月,又一部懸疑劇《沉默的角落》憑藉著逆天的口碑火了!同樣改編自作者紫金陳的小說《長夜難明》,一開播豆瓣就達到8.8分。隨著播出分數越來越高,如今已有20萬餘人評分,高達9.2分,已經超過了前浪《隱秘的角落》。
豆瓣總體評分分析
進一步分析觀眾評分,我們發現:
92.8%的觀眾給出了五星滿分,這口碑在國產劇中已經達到標杆的水準。
豆瓣短評詞雲
然後我們再看到豆瓣的短評詞雲。
我們可以看到,觀眾在短評中討論最多的就是主角"江陽",他的堅定和執著真可謂可歌可泣。"演員的演技","劇情",對"原著"的還原度,都得到了廣泛的認可與好評。
那麼刷劇時,大家都在說些什麼呢?接下來我們用Python分析了《沉默的真相》前10集的視頻彈幕,共計173226條。
前十集彈幕走勢圖
從圖中可以看到,看劇時大家都特別愛發彈幕,前十集中:彈幕數量最多分別是第9集,第3集和第10集,最多一集彈幕數為18903條,彈幕最少的是第六集,彈幕數為15561條。
接著我們再看看劇中主要角色的彈幕詞云:
江陽彈幕詞雲
由白宇飾演的江陽,原本年輕有為,但是為了探求真相堅持正義,付出了自己的生命。像"正義"、"厲害"、"演技"等都在詞雲中頻頻出現。
李靜彈幕詞雲
關於譚卓飾演的李靜,在刷劇時很多人都會聯想到她在《延禧攻略》中高貴妃的角色。無論是從「高貴妃」到《我不是藥神》中的劉思慧,還是這次的李靜,譚卓的演技都讓人有目共睹。
嚴良彈幕詞雲
從最初官宣影帝廖凡,就有不少觀眾表示衝著廖凡也得看《沉默的真相》,果不其然,劇集一播出,粉絲就誇他是「免檢產品」,妥妥的~
張超彈幕詞雲
飾演張超的寧理老師是迷霧劇場的老朋友了,之前在《無罪之證》中他演的社會"豐田哥"人狠話不多,"反向抽菸"實在是太深入人心了。從《無證之罪》到《隱秘的角落》,再到《沉默的真相》,嚴良都換了三個人了,真是流水的嚴良,鐵打的李豐田。
我們使用Python獲取並分析愛奇藝《沉默的真相》前十集的彈幕數據,整個數據分析的流程分為以下三個部分:
1. 數據獲取
關於愛奇藝的彈幕數據獲取程序之前文章中已經做過闡述。
2. 數據讀入和預處理
首先導入所需包,其中pandas用於數據讀入和數據處理,os用於文件操作,jieba用於中文分詞,pyecharts和stylecolud用於數據可視化。
將爬取的數據存放在data文件夾下,使用os操作獲取需要讀取的csv文件列表並循環讀入文件。
彈幕數量一共有173226條,預覽一下數據:
3. 數據可視化
——分集的彈幕數
代碼解說:
彈幕角色-江陽 詞雲圖
以下文章來源於csdn,作者 CDA·數據分析師
轉載地址
https://blog.csdn.net/fei347795790?t=1