Python分析《演員請就位2》豆瓣評論,我找到了它上熱搜的原因

2021-01-16 快學Python

前言

最近有部綜藝——《演員請就位》第二季,三天兩頭一個熱搜,真是無比熱鬧,因為那句「郭敬明導演你看我的演技能值一個S卡」的調侃,我就入了這檔綜藝的坑,你別說這綜藝槽點還挺多,特別是五位導師,他們的戲比演員的精彩多了。《演員請就位》目前為止已經播出了兩季,第一季在豆瓣為6.8分,共有4萬餘人評分,第二季目前評分低於第一季,評分僅6.2分。本文通過爬取《演員請就位》第二季豆瓣短評(好評、中評和差評皆有抽樣),進行可視化分析和情感分析,完整代碼後臺回復「演員請就位」即可免費獲取。

可視化分析導演比演員討論的更多

通過對所有評論進行詞雲圖繪製,我們發現導演提及次數超過演員,這不是演員養成類綜藝嗎?導演的料居然比演員還多。另外,我們還可以看出大家對這部綜藝褒貶不一,演技喜歡等好評詞佔據一定比例,同時給出噁心垃圾等差評詞的觀眾也不乏少數。

差評佔比超半數

從評論分類來看,差評佔比55%,中評佔比21%,好評佔比24%。更多的觀眾對《演員2》不敏感,主要源自看過《演員1》所帶來的高期待與現實的落差較大,另外,郭敬明對何昶希發S卡行為也招致了不少罵名。

大多數觀眾在半夜發評論

從評論時間分布來看,晚上10點至12點評論人數佔比27.89%。

好評難以獲贊

5星好評僅獲得觀眾828個贊,反而1星差評獲得了3776個點讚。

郭敬明被提及次數最多

從觀眾詞雲中提取《演員請就位2》的主要人物,我們發現郭敬明被觀眾提及次數最多,達319次。另外,李誠儒由於其犀利的點評廣受觀眾的熱議,金句味同嚼蠟,味如雞肋,如此乏味一度刷爆網絡,提及次數甚至高於趙薇導演。

情感分值0.4左右,且凌晨達到峰值

不久之前,百度正式發布情感預訓練模型 SKEP (Sentiment Knowledge Enhanced Pre-training for Sentiment Analysis)。通過利用情感知識增強預訓練模型,SKEP 在 14 項中英情感分析典型任務上全面超越 SOTA。本次運用該模型對所有《演員請就位2》評論進行打分,我們發現一天內觀眾情感分值在0.4分上下波動,僅在凌晨5點左右達到一個較高的積極傾向。

技術實現數據獲取

以下給出核心代碼:

def get_page_info(start_num,type):
    url="https://movie.douban.com/subject/"+ movie_id +"/comments?percent_type="+type+"&start="+str(start_num)+"&limit=20&status=P&sort=new_score&comments_only=1&ck=myI8"
    print(url)
    header = {
    "Accept":"application/json, text/plain, */*",
    "Accept-Language":"zh-CN,zh;q=0.9",
    "Connection":"keep-alive",
    "Host":"movie.douban.com",
    "User-Agent":'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.116 Safari/537.36',
    "Cookie":'ll="118217"; bid=RljS46FQccw; __yadk_uid=GlresR4DtEXMJYz7UEJiEiW1jZGdHxV1; __gads=ID=4369b0a5596d1a14:T=1582470136:S=ALNI_MYu_5GhYfBddurehU-ZyUkLIHkXmw; viewed="34838905"; _vwo_uuid_v2=D57B8780A6D0B07688BCF1679FC9CC7CE|f58c953da6640ed67cf0c62ed4f1a076; douban-fav-remind=1; __utmv=30149280.21954; dbcl2="219542653:qAjjgVFgfE0"; ck=phh8; ap_v=0,6.0; push_noty_num=0; push_doumail_num=0; __utma=30149280.949109129.1582468791.1602402156.1605346877.20; __utmc=30149280; __utmz=30149280.1605346877.20.14.utmcsr=accounts.douban.com|utmccn=(referral)|utmcmd=referral|utmcct=/passport/setting; __utmb=30149280.2.10.1605346877; _pk_ref.100001.4cf6=%5B%22%22%2C%22%22%2C1605346877%2C%22https%3A%2F%2Fwww.douban.com%2F%22%5D; _pk_ses.100001.4cf6=*; __utma=223695111.777887215.1582468791.1602402156.1605346877.16; __utmb=223695111.0.10.1605346877; __utmc=223695111; __utmz=223695111.1605346877.16.11.utmcsr=douban.com|utmccn=(referral)|utmcmd=referral|utmcct=/; _pk_id.100001.4cf6=fff8ec9a5e905564.1582468791.16.1605347953.1602402156.'
    }
    response=requests.get(url,headers=header)
    req_parser = BeautifulSoup(response.content.decode('unicode_escape'),features="html.parser")
    comments = req_parser.find_all('div',class_="comment-item")

if __name__ =="__main__":
    movie_id = input("請輸入電影id:")
    comments_list=[]
    times=25
    n=1
    types=['h','m','l']
    for i in range(times):
        print(i)
        start_num=i*20
        for j in range(3):
            comments = get_page_info(start_num,type=types[j])

數據清洗導入數據
import pandas as pd
df = pd.read_csv("/菜J學Python/豆瓣/35163988.csv")
df = df[['user_name','comment_voted','comment_voted','movie_star','comment_time','comment']]
df.head(10)


欄位類型轉換
df['comment_time'] = pd.to_datetime(df['comment_time'])
df["comment"] = df["comment"].astype('str')

機械壓縮去重
#定義機械壓縮函數
def yasuo(st):
    for i in range(1,int(len(st)/2)+1):
        for j in range(len(st)):
            if st[j:j+i] == st[j+i:j+2*i]:
                k = j + i
                while st[k:k+i] == st[k+i:k+2*i] and k<len(st):   
                    k = k + i
                st = st[:j] + st[k:]    
    return st
yasuo(st="菜J學Python真的真的真的很菜很菜")

#應用壓縮函數
df["comment"] = df["comment"].apply(yasuo)

情感分析
#pip3 install paddlepaddle -i https://mirror.baidu.com/pypi/simple
import paddlehub as hub
#這裡使用了百度開源的成熟NLP模型來預測情感傾向
senta = hub.Module(name="senta_bilstm")
texts = df['comment'].tolist()
input_data = {'text':texts}
res = senta.sentiment_classify(data=input_data)
df['pos_p'] = [x['positive_probs'] for x in res]

數據可視化
df['comment'] = df['comment'].astype('str')
# 定義分詞函數
def get_cut_words(content_series):
    # 讀入停用詞表
    stop_words = [] 
    with open("./stop_words.txt", 'r', encoding='utf-8') as f:
        lines = f.readlines()
        for line in lines:
            stop_words.append(line.strip())

    # 添加關鍵詞
    my_words = ['', '']  
    for i in my_words:
        jieba.add_word(i) 
    # 自定義停用詞
    my_stop_words = ['節目', '中國','一部']   
    stop_words.extend(my_stop_words)               
    # 分詞
    word_num = jieba.lcut(content_series.str.cat(sep='。'), cut_all=False)
    # 條件篩選
    word_num_selected = [i for i in word_num if i not in stop_words and len(i)>=2]
    return word_num_selected
# 繪製詞雲圖
text1 = get_cut_words(content_series=df['comment'])
stylecloud.gen_stylecloud(text=' '.join(text1), max_words=200,
                          collocations=False,
                          font_path='字酷堂清楷體.ttf',
                          icon_name='fas fa-video',
                          size=653,
                          #palette='matplotlib.Inferno_9',
                          output_name='./演員2詞雲圖.png')
Image(filename='./演員2詞雲圖.png') 

聲明

1.本數據分析只做學習研究之用途,提供的結論僅供參考;2.作者對影視行業了解有限,相關描述可能存在不當之處,請勿上綱上線。

相關焦點

  • 《演員請就位2》說出了真相:最好的演員要有流量又要有演技
    作者 | 謝維平在一堆熱搜中,《演員請就位2》收官了。
  • 《演員請就位》豆瓣評分跌至5.8,歸根到底,番位不當是主要原因
    文/嗯哼哼崩恰恰娛樂《演員請就位》豆瓣評分跌至5.8,歸根到底,番位不當是主要原因《演員請就位》從開播時的人才濟濟,到決賽前的人才凋零,豆瓣評分跌至5.8番位選擇不當是主要原因。一番陳凱歌,本該扛起口碑和熱度,結果卻成為拖後腿的那個。首先是審美驟降,從第一季力推演技小生牛駿峰,到現在硬捧愛豆陳宥維,判若兩人。去年的牛駿峰是童星出身,雖然年輕,但是演技好,是個戲痴。
  • 《演員請就位2》:第一次見這麼「拽」的「啃老」演員
    每周六晚更新《演員請就位2》時,都很精彩。這不,熱搜連上好幾個。好比,陳凱歌不服《無極》差評,文化人開腔,懟李誠儒思想閉塞,雖一句話不帶髒,但又字字戳人心窩子。好比,爾冬陞見機誠邀李誠儒一起看《小時代》,費心助力老一輩接軌新時代。
  • 《演員請就位2》的「S」卡到底是什麼意思?
    原創 判官 北戴河桃罐頭廠電影修士會最近一個月熱度最大的娛樂事件,只屬於《演員請就位2》這檔綜藝節目,還是連續劇形式,由其延伸出來的話題,可以繞地球半圈。《演員請就位2》的賽制和第一季相比有了很大不同,他們先是請了40位演員,根據業內知名製片人的市場初評級,將他們分為S、A、B三個等級。這40位演員也不一一介紹了,主要給大家說說8張S卡最先花落誰家,他們分別是:婁藝瀟、施柏宇、陳宥維、張月、任敏、黃璐、楊志剛、胡杏兒。
  • 《演員請就位2》演員馬蘇再次翻紅,憑藉東九母親一角成功出圈!
    感謝您的閱讀,如果覺得本篇文章對你來說有幫助的話,別忘了點讚、評論、轉發和收藏哦 《演員請就位》這檔節目把很多演員都成功送上了熱搜,比方說張大大,何昶希,陳宥維等人,他們上熱搜都有一個共同特點,那就是演技遭全網群嘲,而因演技出彩成功出圈的演員也有不少,比方說胡杏兒,馬蘇,辣目洋子等人,今天就和大家聊聊網友備受爭議的幾名演員
  • 《演員請就位2》導演有幾張s卡 演員請就位2第一賽段幾張s卡是實至...
    《演員請就位2》導演有幾張s卡 演員請就位2第一賽段幾張s卡是實至名歸的?(2) 2020-11-09 13:59:34 小 大 用微信掃描二維碼
  • 演員請就位2:馬蘇哭訴無戲可拍輸給流量,遭網友回懟另有它因
    近日,《演員請就位2》也要來了,從官宣陣容上來看,比第一季做了一些調整,先是主持人由沙溢變成了大鵬,而導演組依然保留了第一季的陳凱歌、郭敬明、趙薇,而李少紅導演因為時間的原因不能參加,爾冬陞導演補位。同時,馬蘇還上傳了一段自己在《演員請就位2》先導片裡的採訪片段《角》馬蘇篇——在時代中流浪。視頻中馬蘇被主持人問道:為什麼入行這麼多年拍了這麼多戲,總是讓人記不住角色,比較經典的可能就是《心花路放》和《擺渡人》。馬蘇認為造成這種情況的原因,一方面自己的選角出現了很大的問題,另一方面有運氣不好的成分在裡面,感覺自己的機遇永遠差一步。
  • 《演員請就位》大鵬強調不認識曹駿,被罵:勢利眼,捧高踩低!
    最新一期的《演員請就位》又帶著話題走來了,不出意料播出後節目中的嘉賓以及導演就多次登上熱搜,可以說《演員請就位2》播出後已經成為熱搜上的常客了。不過在最新一期節目播出後,演員曹駿的名字也久違的進入到了觀眾的視野中。想必提到曹駿,80後,90後的小夥伴已經對他十分熟悉了。
  • 花3個小時看完《演員請就位》,我突然有點可憐郭敬明!
    而最近,郭敬明再次進入我的視野,大概就是前幾天新出來的一檔綜藝節目《演員請就位》,三個小時的綜藝節目看完,我卻第一次有點可憐郭敬明了。以上是前言!!!為什麼我會覺得郭敬明有點可憐呢?第一個:和其他三個導演坐一塊兒,他本就弱了幾分。
  • 李成儒退出《演員請就位》:為什麼只有他敢說真話?
    文|胖李一一(富書專欄作者)最近,李成儒在採訪中透露退出《演員請就位2》。從《演員請就位》第一期,到如今的第二期,李成儒耿直辛辣的點評,圈粉無數,如今要退出,不少網友們表示遺憾。李成儒在採訪中說:「只要還坐在點評席,當遇到看不下去的表演,就必須要說,因為對影視的熱愛,就不允許你們胡來。」
  • 《演員請就位》導演終極作品影院超前點映 李少紅明道等亮相分享...
    「以喜劇演員出身,卻憑藉在郭敬明導演的作品《AI》中亮眼表現讓觀眾記憶深刻的金靖,參與《演員請就位》讓金靖感觸頗深,「我覺得這個節目對於我這樣的平凡女孩來說,站在這裡感覺一切就像是一場夢此外,明道也在現場就熱搜」明道看陳凱歌的眼神」做出回應,「我很喜歡聽陳凱歌導演講話,我在演戲時候有一個習慣,我會把觀察到的導演的一些習慣和細節,儘量的放到我的腦袋裡。」
  • 《演員請就位》:張大大:爾冬陞對我說,說我是一個小偷,到位!
    《演員請就位》第二季開播,第一期就上了好幾個熱搜,比如,趙薇說#現在所有的女演員都很難出頭#,#爾冬陞導演太敢說了#,「爾冬陞說張大大眼神像個小偷」……還有什麼「拔絲吻」,也是解鎖新名詞了!這一季,比起看演員們尷尬的表演,我更喜歡聽四位導演的點評,特別是爾冬陞導演一針見血的犀利的點評!
  • 彭小苒《演員請就位》:很幸運能夠從實踐中成長
    導演選角綜藝節目《演員請就位》終極演員入圍名單已於上周五晚正式產生,新人演員彭小苒遺憾落敗,止步十二強。節目播出後,彭小苒微博走心發文回顧節目拍攝歷程,並同時為晉級演員加油打氣。據悉,彭小苒等節目選手還將於明晚重新回歸舞臺,助威終極就位盛典。
  • 復出有望,《演員請就位2》不提供機會,中央電視臺轉身邀請他
    不過,長大後的曹駿卻能您呢個繼承小時候的榮耀和夢想,他幾乎成了演藝圈和流量圈最底層的甚至有些搖搖欲墜的演員,而《寶蓮燈》這個代表作幾乎貫穿了他整個演藝生涯,而待遇和機會也都曹駿漸行漸遠,他似乎被網友和娛樂圈掩埋在過去的記憶裡。而現在他即使復出時評價和口碑都不錯,但是還是沒贏過別的流量一張面容姣好的臉。
  • 《演員請就位2》演員官宣,馬蘇扮演埃及豔后,王智扮演東方不敗
    #演員請就位演員官宣#我們看到許多演員參與了《演員請就位》第二季的錄製,比如之前參加過《乘風破浪的姐姐》的王智來到節目,她說唱歌跳舞是我的最愛,演戲是我的生活,回到演員工作需要乘風破浪,我喜歡電影,演戲是我畢生的功課,他最後說我是演員王智,我已經就位了。
  • 豆瓣只有7.5,但「《阿拉丁》拍續集」卻登上了熱搜第1,憑什麼?
    今天這期內容我將會給各位介紹這一眾10億美金票房中的一部,它的名為《阿拉丁》,不過很可惜它目前在豆瓣的評分也僅有7.5而已,遠遠稱不上神作,也遑論有生之年必看。不過有意思的是,這部作品卻在最近因為「續集」計劃的公布,而被網友用行動(搜索關鍵字)推上了國內某搜尋引擎熱點排名的「第1」---一邊是豆瓣相對平庸的評分,一邊則是如此靚麗的熱搜成績。
  • 本季《演員請就位》S卡為何讓節目和導師飽受爭議?黃渤一語道出真相!
    如今《演員請就位》第二季也開播過半了,這一季節目雖然說開創了S、A、B三個等級評價制度,但正因為這樣的設置門檻,讓本季節目和導師飽受爭議,在節目剛開播三期的時候便給出了大部分S卡,你要說給了那些確實有演技獲得觀眾認可的也行,但正因為給的不是這些,而是給像何昶希、陳宥維、張月這樣毫無演技可言的流量鮮肉,一時間對這檔節目和導師更是吐槽和罵聲一片
  • 《我就是演員3》陣容瓜!瞧了網曝演員名單後:又是愛豆請就位?
    《演員請就位》第二季現在正在播出,很多觀眾應該都有看節目了吧。對於喜歡看演員們飆演技的小夥伴來說,這樣的節目追起來那很過癮了呀!而現在呢,其實除了《演員請就位》這個演技比拼類的節目外,浙江臺的《我就是演員3》也即將要來襲了,據悉,現在浙江臺就已經在籌備節目了,應該在不久之後這個節目就能與大家見面了,到時喜歡看這一類綜藝的小夥伴們就又可以追起來了。
  • 《演員請就位》中薇薇的真名叫什麼,身份背景令人驚訝
    在最近爆火的綜藝《演員請就位》中,有一個女孩的表現讓大家也對她格外關注,她更是一路披荊斬棘走到了直播盛典,她就是李少紅站隊的「面霸」薇薇。很多人第一次認識薇薇,是在電視劇《都挺好》中那個一身傲氣的少年蘇明玉。
  • 《演員請就位2》9強誕生夜名單並不意外,爾冬陞犀利回懟郭敬明
    在近期的綜藝節目中《演員請就位》第二季依舊是大家關注的焦點,作為一檔演員競技類綜藝強大的嘉賓陣容和導演陣容,每一期都會讓觀眾感受到不一樣的精彩,隨著賽程的不斷推進,在最新一期的節目中迎來了9強總決賽誕生。