Python分析《演員請就位2》豆瓣評論,我找到了它上熱搜的原因

2021-01-16 快學Python

前言

最近有部綜藝——《演員請就位》第二季，三天兩頭一個熱搜，真是無比熱鬧，因為那句「郭敬明導演你看我的演技能值一個S卡」的調侃，我就入了這檔綜藝的坑，你別說這綜藝槽點還挺多，特別是五位導師，他們的戲比演員的精彩多了。《演員請就位》目前為止已經播出了兩季，第一季在豆瓣為6.8分，共有4萬餘人評分，第二季目前評分低於第一季，評分僅6.2分。本文通過爬取《演員請就位》第二季豆瓣短評（好評、中評和差評皆有抽樣），進行可視化分析和情感分析，完整代碼後臺回復「演員請就位」即可免費獲取。

可視化分析導演比演員討論的更多

通過對所有評論進行詞雲圖繪製，我們發現導演提及次數超過演員，這不是演員養成類綜藝嗎？導演的料居然比演員還多。另外，我們還可以看出大家對這部綜藝褒貶不一，演技、喜歡等好評詞佔據一定比例，同時給出噁心、垃圾等差評詞的觀眾也不乏少數。

差評佔比超半數

從評論分類來看，差評佔比55%，中評佔比21%，好評佔比24%。更多的觀眾對《演員2》不敏感，主要源自看過《演員1》所帶來的高期待與現實的落差較大，另外，郭敬明對何昶希發S卡行為也招致了不少罵名。

大多數觀眾在半夜發評論

從評論時間分布來看，晚上10點至12點評論人數佔比27.89%。

好評難以獲贊

5星好評僅獲得觀眾828個贊，反而1星差評獲得了3776個點讚。

郭敬明被提及次數最多

從觀眾詞雲中提取《演員請就位2》的主要人物，我們發現郭敬明被觀眾提及次數最多，達319次。另外，李誠儒由於其犀利的點評廣受觀眾的熱議，金句味同嚼蠟，味如雞肋，如此乏味一度刷爆網絡，提及次數甚至高於趙薇導演。

情感分值0.4左右，且凌晨達到峰值

不久之前，百度正式發布情感預訓練模型 SKEP (Sentiment Knowledge Enhanced Pre-training for Sentiment Analysis)。通過利用情感知識增強預訓練模型，SKEP 在 14 項中英情感分析典型任務上全面超越 SOTA。本次運用該模型對所有《演員請就位2》評論進行打分，我們發現一天內觀眾情感分值在0.4分上下波動，僅在凌晨5點左右達到一個較高的積極傾向。

技術實現數據獲取

以下給出核心代碼：

def get_page_info(start_num,type):
    url="https://movie.douban.com/subject/"+ movie_id +"/comments?percent_type="+type+"&start="+str(start_num)+"&limit=20&status=P&sort=new_score&comments_only=1&ck=myI8"
    print(url)
    header = {
    "Accept":"application/json, text/plain, */*",
    "Accept-Language":"zh-CN,zh;q=0.9",
    "Connection":"keep-alive",
    "Host":"movie.douban.com",
    "User-Agent":'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.116 Safari/537.36',
    "Cookie":'ll="118217"; bid=RljS46FQccw; __yadk_uid=GlresR4DtEXMJYz7UEJiEiW1jZGdHxV1; __gads=ID=4369b0a5596d1a14:T=1582470136:S=ALNI_MYu_5GhYfBddurehU-ZyUkLIHkXmw; viewed="34838905"; _vwo_uuid_v2=D57B8780A6D0B07688BCF1679FC9CC7CE|f58c953da6640ed67cf0c62ed4f1a076; douban-fav-remind=1; __utmv=30149280.21954; dbcl2="219542653:qAjjgVFgfE0"; ck=phh8; ap_v=0,6.0; push_noty_num=0; push_doumail_num=0; __utma=30149280.949109129.1582468791.1602402156.1605346877.20; __utmc=30149280; __utmz=30149280.1605346877.20.14.utmcsr=accounts.douban.com|utmccn=(referral)|utmcmd=referral|utmcct=/passport/setting; __utmb=30149280.2.10.1605346877; _pk_ref.100001.4cf6=%5B%22%22%2C%22%22%2C1605346877%2C%22https%3A%2F%2Fwww.douban.com%2F%22%5D; _pk_ses.100001.4cf6=*; __utma=223695111.777887215.1582468791.1602402156.1605346877.16; __utmb=223695111.0.10.1605346877; __utmc=223695111; __utmz=223695111.1605346877.16.11.utmcsr=douban.com|utmccn=(referral)|utmcmd=referral|utmcct=/; _pk_id.100001.4cf6=fff8ec9a5e905564.1582468791.16.1605347953.1602402156.'
    }
    response=requests.get(url,headers=header)
    req_parser = BeautifulSoup(response.content.decode('unicode_escape'),features="html.parser")
    comments = req_parser.find_all('div',class_="comment-item")

if __name__ =="__main__":
    movie_id = input("請輸入電影id：")
    comments_list=[]
    times=25
    n=1
    types=['h','m','l']
    for i in range(times):
        print(i)
        start_num=i*20
        for j in range(3):
            comments = get_page_info(start_num,type=types[j])
數據清洗導入數據import pandas as pd
df = pd.read_csv("/菜J學Python/豆瓣/35163988.csv")
df = df[['user_name','comment_voted','comment_voted','movie_star','comment_time','comment']]
df.head(10)

欄位類型轉換df['comment_time'] = pd.to_datetime(df['comment_time'])
df["comment"] = df["comment"].astype('str')
機械壓縮去重#定義機械壓縮函數
def yasuo(st):
    for i in range(1,int(len(st)/2)+1):
        for j in range(len(st)):
            if st[j:j+i] == st[j+i:j+2*i]:
                k = j + i
                while st[k:k+i] == st[k+i:k+2*i] and k<len(st):   
                    k = k + i
                st = st[:j] + st[k:]    
    return st
yasuo(st="菜J學Python真的真的真的很菜很菜")
#應用壓縮函數
df["comment"] = df["comment"].apply(yasuo)
情感分析#pip3 install paddlepaddle -i https://mirror.baidu.com/pypi/simple
import paddlehub as hub
#這裡使用了百度開源的成熟NLP模型來預測情感傾向
senta = hub.Module(name="senta_bilstm")
texts = df['comment'].tolist()
input_data = {'text':texts}
res = senta.sentiment_classify(data=input_data)
df['pos_p'] = [x['positive_probs'] for x in res]
數據可視化df['comment'] = df['comment'].astype('str')
# 定義分詞函數
def get_cut_words(content_series):
    # 讀入停用詞表
    stop_words = [] 
    with open("./stop_words.txt", 'r', encoding='utf-8') as f:
        lines = f.readlines()
        for line in lines:
            stop_words.append(line.strip())

    # 添加關鍵詞
    my_words = ['', '']  
    for i in my_words:
        jieba.add_word(i) 
    # 自定義停用詞
    my_stop_words = ['節目', '中國','一部']   
    stop_words.extend(my_stop_words)               
    # 分詞
    word_num = jieba.lcut(content_series.str.cat(sep='。'), cut_all=False)
    # 條件篩選
    word_num_selected = [i for i in word_num if i not in stop_words and len(i)>=2]
    return word_num_selected
# 繪製詞雲圖
text1 = get_cut_words(content_series=df['comment'])
stylecloud.gen_stylecloud(text=' '.join(text1), max_words=200,
                          collocations=False,
                          font_path='字酷堂清楷體.ttf',
                          icon_name='fas fa-video',
                          size=653,
                          #palette='matplotlib.Inferno_9',
                          output_name='./演員2詞雲圖.png')
Image(filename='./演員2詞雲圖.png') 
聲明
1.本數據分析只做學習研究之用途，提供的結論僅供參考；2.作者對影視行業了解有限，相關描述可能存在不當之處，請勿上綱上線。

相關焦點

《演員請就位2》說出了真相:最好的演員要有流量又要有演技

作者 | 謝維平在一堆熱搜中，《演員請就位2》收官了。
《演員請就位》豆瓣評分跌至5.8,歸根到底,番位不當是主要原因

文/嗯哼哼崩恰恰娛樂《演員請就位》豆瓣評分跌至5.8，歸根到底，番位不當是主要原因《演員請就位》從開播時的人才濟濟，到決賽前的人才凋零，豆瓣評分跌至5.8番位選擇不當是主要原因。一番陳凱歌，本該扛起口碑和熱度，結果卻成為拖後腿的那個。首先是審美驟降，從第一季力推演技小生牛駿峰，到現在硬捧愛豆陳宥維，判若兩人。去年的牛駿峰是童星出身，雖然年輕，但是演技好，是個戲痴。
《演員請就位2》:第一次見這麼「拽」的「啃老」演員

每周六晚更新《演員請就位2》時，都很精彩。這不，熱搜連上好幾個。好比，陳凱歌不服《無極》差評，文化人開腔，懟李誠儒思想閉塞，雖一句話不帶髒，但又字字戳人心窩子。好比，爾冬陞見機誠邀李誠儒一起看《小時代》，費心助力老一輩接軌新時代。
《演員請就位2》的「S」卡到底是什麼意思?

原創判官北戴河桃罐頭廠電影修士會最近一個月熱度最大的娛樂事件，只屬於《演員請就位2》這檔綜藝節目，還是連續劇形式，由其延伸出來的話題，可以繞地球半圈。《演員請就位2》的賽制和第一季相比有了很大不同，他們先是請了40位演員，根據業內知名製片人的市場初評級，將他們分為S、A、B三個等級。這40位演員也不一一介紹了，主要給大家說說8張S卡最先花落誰家，他們分別是：婁藝瀟、施柏宇、陳宥維、張月、任敏、黃璐、楊志剛、胡杏兒。
《演員請就位2》演員馬蘇再次翻紅,憑藉東九母親一角成功出圈!

感謝您的閱讀，如果覺得本篇文章對你來說有幫助的話，別忘了點讚、評論、轉發和收藏哦《演員請就位》這檔節目把很多演員都成功送上了熱搜，比方說張大大，何昶希，陳宥維等人，他們上熱搜都有一個共同特點，那就是演技遭全網群嘲，而因演技出彩成功出圈的演員也有不少，比方說胡杏兒，馬蘇，辣目洋子等人，今天就和大家聊聊網友備受爭議的幾名演員
《演員請就位2》導演有幾張s卡演員請就位2第一賽段幾張s卡是實至...

《演員請就位2》導演有幾張s卡演員請就位2第一賽段幾張s卡是實至名歸的？(2) 2020-11-09 13:59:34 小大用微信掃描二維碼
演員請就位2:馬蘇哭訴無戲可拍輸給流量,遭網友回懟另有它因

近日，《演員請就位2》也要來了，從官宣陣容上來看，比第一季做了一些調整，先是主持人由沙溢變成了大鵬，而導演組依然保留了第一季的陳凱歌、郭敬明、趙薇，而李少紅導演因為時間的原因不能參加，爾冬陞導演補位。同時，馬蘇還上傳了一段自己在《演員請就位2》先導片裡的採訪片段《角》馬蘇篇——在時代中流浪。視頻中馬蘇被主持人問道：為什麼入行這麼多年拍了這麼多戲，總是讓人記不住角色，比較經典的可能就是《心花路放》和《擺渡人》。馬蘇認為造成這種情況的原因，一方面自己的選角出現了很大的問題，另一方面有運氣不好的成分在裡面，感覺自己的機遇永遠差一步。
《演員請就位》大鵬強調不認識曹駿,被罵:勢利眼,捧高踩低!

最新一期的《演員請就位》又帶著話題走來了，不出意料播出後節目中的嘉賓以及導演就多次登上熱搜，可以說《演員請就位2》播出後已經成為熱搜上的常客了。不過在最新一期節目播出後，演員曹駿的名字也久違的進入到了觀眾的視野中。想必提到曹駿，80後，90後的小夥伴已經對他十分熟悉了。
花3個小時看完《演員請就位》,我突然有點可憐郭敬明!

而最近，郭敬明再次進入我的視野，大概就是前幾天新出來的一檔綜藝節目《演員請就位》，三個小時的綜藝節目看完，我卻第一次有點可憐郭敬明了。以上是前言！！！為什麼我會覺得郭敬明有點可憐呢？第一個：和其他三個導演坐一塊兒，他本就弱了幾分。
李成儒退出《演員請就位》:為什麼只有他敢說真話?

文｜胖李一一（富書專欄作者）最近，李成儒在採訪中透露退出《演員請就位2》。從《演員請就位》第一期，到如今的第二期，李成儒耿直辛辣的點評，圈粉無數，如今要退出，不少網友們表示遺憾。李成儒在採訪中說：「只要還坐在點評席，當遇到看不下去的表演，就必須要說，因為對影視的熱愛，就不允許你們胡來。」
《演員請就位》導演終極作品影院超前點映李少紅明道等亮相分享...

「以喜劇演員出身,卻憑藉在郭敬明導演的作品《AI》中亮眼表現讓觀眾記憶深刻的金靖,參與《演員請就位》讓金靖感觸頗深,「我覺得這個節目對於我這樣的平凡女孩來說,站在這裡感覺一切就像是一場夢此外,明道也在現場就熱搜」明道看陳凱歌的眼神」做出回應,「我很喜歡聽陳凱歌導演講話,我在演戲時候有一個習慣,我會把觀察到的導演的一些習慣和細節,儘量的放到我的腦袋裡。」
《演員請就位》:張大大:爾冬陞對我說,說我是一個小偷,到位!

《演員請就位》第二季開播，第一期就上了好幾個熱搜，比如，趙薇說#現在所有的女演員都很難出頭#，#爾冬陞導演太敢說了#，「爾冬陞說張大大眼神像個小偷」……還有什麼「拔絲吻」，也是解鎖新名詞了！這一季，比起看演員們尷尬的表演，我更喜歡聽四位導演的點評，特別是爾冬陞導演一針見血的犀利的點評！
彭小苒《演員請就位》:很幸運能夠從實踐中成長

導演選角綜藝節目《演員請就位》終極演員入圍名單已於上周五晚正式產生，新人演員彭小苒遺憾落敗，止步十二強。節目播出後，彭小苒微博走心發文回顧節目拍攝歷程，並同時為晉級演員加油打氣。據悉，彭小苒等節目選手還將於明晚重新回歸舞臺，助威終極就位盛典。
復出有望,《演員請就位2》不提供機會,中央電視臺轉身邀請他

不過，長大後的曹駿卻能您呢個繼承小時候的榮耀和夢想，他幾乎成了演藝圈和流量圈最底層的甚至有些搖搖欲墜的演員，而《寶蓮燈》這個代表作幾乎貫穿了他整個演藝生涯，而待遇和機會也都曹駿漸行漸遠，他似乎被網友和娛樂圈掩埋在過去的記憶裡。而現在他即使復出時評價和口碑都不錯，但是還是沒贏過別的流量一張面容姣好的臉。
《演員請就位2》演員官宣,馬蘇扮演埃及豔后,王智扮演東方不敗

#演員請就位演員官宣#我們看到許多演員參與了《演員請就位》第二季的錄製，比如之前參加過《乘風破浪的姐姐》的王智來到節目，她說唱歌跳舞是我的最愛，演戲是我的生活，回到演員工作需要乘風破浪，我喜歡電影，演戲是我畢生的功課，他最後說我是演員王智，我已經就位了。
豆瓣只有7.5,但「《阿拉丁》拍續集」卻登上了熱搜第1,憑什麼?

今天這期內容我將會給各位介紹這一眾10億美金票房中的一部，它的名為《阿拉丁》，不過很可惜它目前在豆瓣的評分也僅有7.5而已，遠遠稱不上神作，也遑論有生之年必看。不過有意思的是，這部作品卻在最近因為「續集」計劃的公布，而被網友用行動（搜索關鍵字）推上了國內某搜尋引擎熱點排名的「第1」---一邊是豆瓣相對平庸的評分，一邊則是如此靚麗的熱搜成績。
本季《演員請就位》S卡為何讓節目和導師飽受爭議?黃渤一語道出真相!

如今《演員請就位》第二季也開播過半了，這一季節目雖然說開創了S、A、B三個等級評價制度，但正因為這樣的設置門檻，讓本季節目和導師飽受爭議，在節目剛開播三期的時候便給出了大部分S卡，你要說給了那些確實有演技獲得觀眾認可的也行，但正因為給的不是這些，而是給像何昶希、陳宥維、張月這樣毫無演技可言的流量鮮肉，一時間對這檔節目和導師更是吐槽和罵聲一片
《我就是演員3》陣容瓜!瞧了網曝演員名單後:又是愛豆請就位?

《演員請就位》第二季現在正在播出，很多觀眾應該都有看節目了吧。對於喜歡看演員們飆演技的小夥伴來說，這樣的節目追起來那很過癮了呀！而現在呢，其實除了《演員請就位》這個演技比拼類的節目外，浙江臺的《我就是演員3》也即將要來襲了，據悉，現在浙江臺就已經在籌備節目了，應該在不久之後這個節目就能與大家見面了，到時喜歡看這一類綜藝的小夥伴們就又可以追起來了。
《演員請就位》中薇薇的真名叫什麼,身份背景令人驚訝

在最近爆火的綜藝《演員請就位》中，有一個女孩的表現讓大家也對她格外關注，她更是一路披荊斬棘走到了直播盛典，她就是李少紅站隊的「面霸」薇薇。很多人第一次認識薇薇，是在電視劇《都挺好》中那個一身傲氣的少年蘇明玉。
《演員請就位2》9強誕生夜名單並不意外,爾冬陞犀利回懟郭敬明

在近期的綜藝節目中《演員請就位》第二季依舊是大家關注的焦點，作為一檔演員競技類綜藝強大的嘉賓陣容和導演陣容，每一期都會讓觀眾感受到不一樣的精彩，隨著賽程的不斷推進，在最新一期的節目中迎來了9強總決賽誕生。

Python分析《演員請就位2》豆瓣評論,我找到了它上熱搜的原因

相關焦點

《演員請就位2》說出了真相:最好的演員要有流量又要有演技

《演員請就位》豆瓣評分跌至5.8,歸根到底,番位不當是主要原因

《演員請就位2》:第一次見這麼「拽」的「啃老」演員

《演員請就位2》的「S」卡到底是什麼意思?

《演員請就位2》演員馬蘇再次翻紅,憑藉東九母親一角成功出圈!

《演員請就位2》導演有幾張s卡 演員請就位2第一賽段幾張s卡是實至...

演員請就位2:馬蘇哭訴無戲可拍輸給流量,遭網友回懟另有它因

《演員請就位》大鵬強調不認識曹駿,被罵:勢利眼,捧高踩低!

花3個小時看完《演員請就位》,我突然有點可憐郭敬明!

李成儒退出《演員請就位》:為什麼只有他敢說真話?

《演員請就位》導演終極作品影院超前點映 李少紅明道等亮相分享...

《演員請就位》:張大大:爾冬陞對我說,說我是一個小偷,到位!

彭小苒《演員請就位》:很幸運能夠從實踐中成長

復出有望,《演員請就位2》不提供機會,中央電視臺轉身邀請他

《演員請就位2》演員官宣,馬蘇扮演埃及豔后,王智扮演東方不敗

豆瓣只有7.5,但「《阿拉丁》拍續集」卻登上了熱搜第1,憑什麼?

本季《演員請就位》S卡為何讓節目和導師飽受爭議?黃渤一語道出真相!

《我就是演員3》陣容瓜!瞧了網曝演員名單後:又是愛豆請就位?

《演員請就位》中薇薇的真名叫什麼,身份背景令人驚訝

《演員請就位2》9強誕生夜名單並不意外,爾冬陞犀利回懟郭敬明

《演員請就位2》導演有幾張s卡演員請就位2第一賽段幾張s卡是實至...

《演員請就位》導演終極作品影院超前點映李少紅明道等亮相分享...