要說近期最紅的一部電影,非《我不是藥神》莫屬。網上滿是讚譽之詞,上映5天,票房已經飆到15億。
《我不是藥神》甚至成為豆瓣上多年來僅有的六部9.0評分以上的華語電影之一。
豆瓣9.0以上的電影基本可以「封神」了,數據顯示,多數觀眾都為這部影片打了5星滿分!
這也讓容妹忍不住去影院一睹究竟。
電影前半截喜劇,後半段人性,總有幾個片段、幾句臺詞戳人淚點。
徐崢飾演的程勇,本是中年屌絲的代言人:一頭油膩凌亂的頭髮,開著一家成人用品店勉強維持生計,前妻帶著兒子要出國,老爸身體不適需要高昂手術費。神秘男子呂受益的出現,不僅讓他賺得盆滿缽滿,更拯救了大量白血病人,當然,走私特效藥也將自己送進了大牢。
哎呀,容妹這一激動就把電影給劇透了,不過還沒看過的小夥伴還是去電影院感受一下吧,現實、諷刺、情感、理智、才華、智慧、技巧、真誠……生活每一幕現實總能觸動人心。畢竟沒有人能保證自己一輩子不生病,因病致窮的悲劇每天都在上演。
沒有小鮮肉的流量加持,憑現實題材就能帶來口碑。藝術皆源於生活,每年國內湧現不少藝術佳作,偏偏只有這部能傲冠群雄,成為豆瓣9.0評分的神作?這不,有大神爬取了豆瓣上的短評,利用詞雲總結處於這部佳片究竟神在何處?
01、爬取《我不是藥神》熱門短評
首先我們要找到豆瓣電影《我不是藥神》的頁面
1.驗證登錄cookie
2.uesr_agent
3.用戶的訪問頻率
同時在循環抓取的時候最好加上sleep
抓取《我不是藥神》短評內容和時間代碼如下:
02、簡單對數據做下統計
03、對用戶觀看後的評論做情感分析
這裡面用了numpy, sonwnlp, matplotlib 三個庫,具體實現如下:
當值大於 0.5 時代表句子的情感極性偏向積極,當分值小於 0.5 時,情感極性偏向消極,當然越偏向兩邊,情緒越偏激。從上圖情感分析來看,積極的情緒已經遠遠超過消極的情緒,還是受到大家的好評。
04、雲圖


從詞雲上來看,出現中國、故事、沒有、徐崢,煽情,現實、導演、真實等詞。
通過豆瓣熱門短評的情感和詞雲分析,《我不是藥神》是一部不錯的現實劇,劇情犀利、深刻啟迪、煽情感動、強烈共鳴。
欣賞佳片的同時,用Python技術爬取一下評論,感覺自己的觀影逼格都得到了提升。朋友圈中,大家都在刷評論,而我,反手就是一個Python!
想要零基礎學Python,容妹為你提供一個好機會!
關注容大教育IT培訓機構百家號,免費獲取學習資源