《花木蘭》得分太低?如何預測一部電影的IMDb評分? | Mixlab跨學科課程

2021-01-22 無界社區mixlab


劉亦菲版的《花木蘭》被指太爛甚至有外國網友認為,這是迪斯尼拍的世界級爛片 在國外最權威的評分機構IMDb中有88%的人打了



網際網路電影資料庫


IMDb創辦於1990年,是一個關於電影演員、電影、電視節目、電視藝人、電子遊戲和電影製作小組的在線資料庫。IMDb評分代表了一部電影的水平,是評判一部電影到底值不值得觀看的重要指標。



那麼,如何預測一部電影IMDb評分?有哪些因素是影響IMDb評分的呢?本系列將使用機器學習來完成這一研究課題。



機器學習實驗課

本系列由4課組成

第3課 到底模型學了什麼?通過SHAP-Xgboost預測房價;第4課 洞察影響IMDb評分的原因、電影IMDb評分預測。


程式語言是python,開發環境使用jupyter notebook。涉及的相關庫:

科學計算的基礎軟體包

pandas

sklearn

xgboost

catboost

shap

python繪圖庫,與numpy一起用

可有效替代MatLab

seaborn 

基於matplotlib的圖形可視化python包

opencv

paddlehub

便捷獲取PaddlePaddle生態下的預訓練模型

完成一鍵預測

線性回歸-最簡單的理解世界的方式

通過最簡單的線性回歸,同學們可以熟悉機器學習開發流程,包括數據集、數據預處理、訓練模型、評估模型、使用模型進行預測。然後,結合經典的糖尿病患者數據集,介紹了探索數據集、數據可視化的方法。

二分類為例-理解模型的優缺點

以二分類問題為例,嘗試各種模型的使用,理解各種模型的優缺點,重點掌握樹模型:決策樹、隨機森林、梯度提升的使用。

到底模型學了什麼?

以波士頓房價預測為例,重點練習seaborn探索數據集的各種圖表,掌握分析數據集的思路;然後練習xgboost的使用,掌握訓練、保存、加載以及如何使用模型;最後,介紹了SHAP值,通過SHAP值來了解模型學習到的特徵分布。是一個python庫,基於Shapley值的方法,使用合作博弈論來解釋機器學習模型學習輸入、輸出。Shapley值由Shapley在1953年創造,主要思想是根據玩家對總支出的貢獻來為玩家分配支出的方法,玩家根據貢獻值在聯盟中進行合作並從這種合作中獲得一定的收益。

在波士頓房價的預測中,我們可以知道模型認為,人口狀況和住宅的房間數量是影響房價的關鍵因素。

針對每個預測的房價結果,還可以給出到底是因為什麼因素所得出的結論。比如下圖所示,房價16.6高於基礎報價14.14是由CRIM(犯罪率)和LSTAT(人口狀況)的情況所增加的。表達為數學公式可以為:f(x)=base_value+shape_values.sum()

洞察IMDb評分及評分預測

使用kaggle上的IMDb的電影數據集,通過深度學習識別電影海報的人臉數量,作為特徵補充到數據集,然後把IMDb的評分作為目標值,訓練一個基於catboost的回歸模型,並通過shap值研究高分的決定特徵是哪些。

年份雖然是主要的決定因素,但與評分的關係比較複雜;

海報中是否出現人物也是一個關鍵的因素;

喜劇、愛情、戰爭、犯罪劇普遍具有較高的評分;

動作、歷史、科幻具有較低的評分。

探索可能性

由於為了課程演示方便,僅從海報中提取了人臉數量,下一步可以拓展更多的特徵,比如海報中的內容、海報的主要色調、構圖形式、明暗等設計特徵,重點挖掘哪些設計特徵可能影響評分;當然,決定IMDb分數高低的因素肯定不止海報設計的好壞,還有電影本身的劇情,針對這個可以通過評論來挖掘劇情的特徵;另外,還有演員、導演等特徵。特徵越多,是不是代表著越能挖掘到影響IMDb評分的決定因素,以及是否可以預測得越準,有一定的可能性。但需要我們進一步通過實驗來進行探索。

課程思考

為課程提供交流群,提供技術助教、導師等為同學們答疑;覆蓋了大部分的技術點(python庫),深入在梯度提升這一機器學習算法;

《SHOW ME NOCODE》 



助教(小哥哥)

MixLab    上海     北京     深圳     廣州

Long-press QR code to transfer me a reward

贊後➕好友

As required by Apple's new policy, the Reward feature has been disabled on Weixin for iOS. You can still reward an Official Account by transferring money via QR code.

相關焦點

  • 《花木蘭》疑似被惡意評分,IMDB竟只有1.9分
    由於《花木蘭》受制於對動畫的改編,整部片子雖有一些高光時刻,但反派有些弱,動作戲不連貫,導致它有些平庸。不過,電影優美的畫面,史詩級的攝影鏡頭,仍然不可否認《花木蘭》是一部動畫改編的史詩巨製。首映後,大部分觀眾都評價很高,稱讚道:「迪士尼的《花木蘭》不僅視覺效果令人驚嘆,而且絕對神奇。」
  • 剛首映禮的《花木蘭》imdb 評分被打到 1.9,發生了什麼?
    就像木蘭歸來,迎接她的不是家人,而是鋪天蓋地的冷箭——來自隱匿於同胞中的蛆蟲。1.9分,這個分數太低了。還沒看到真實的作品,但是看過預告片後,個人感覺還不至於這麼差,先不說演技,就劉亦菲的顏值就能換回不少評分(說劉亦菲不符合歐美審美的歇一歇,美就是美,醜就是醜,就算天塌下來了,她也是好看!)
  • 迪士尼版「花木蘭」尚未上映,豆瓣評分暴跌,網絡電影跟風不斷!
    最近在逛視頻平臺的時候,小編又發現了一部講述「花木蘭」從軍故事的影片「無雙花木蘭!」算上上一部的「花木蘭之大漠營救」這已經是小編,最近一段時間,第二次見到與花木蘭有關的影片了。然而迪士尼翻拍的電影,「花木蘭」仍需要等到9月11日才會上映,但是下面發生的事情,十分的令小編,感到疑惑!那就是這部「無雙花木蘭」的豆瓣評分,竟然達到了4.7分!雖然從網友們給出的評論來看,「無雙花木蘭」依舊是那麼的不盡如人意,有網友甚至評價,後半段堪稱神劇!
  • 迪士尼版《花木蘭》豆瓣評分低至4.8,電影中哪些是你無法接受的
    今天給大家介紹一部由劉亦菲,甄子丹,李連杰,鞏俐等出演,妮基·卡羅導演的迪士尼電影《花木蘭》,這部電影未上映便受到觀眾們的一致期待,但是上映後觀眾吐槽不斷,豆瓣評分低至4.8。迪士尼版《花木蘭》被吐槽的原因有很多,作為家喻戶曉的巾幗英雄,這部電影由於摻雜了太多的西方元素而毀掉了這個經典的故事,花木蘭的故事流傳了上千年,為父從軍,巾幗英雄,除了家國情懷更是在舊時代提出了男女平等的核心,迪士尼版的《花木蘭》添加了很多元素卻沒有更好的體現出這個故事的核心主題。
  • 《花木蘭》幾經波折終定檔,然而這部電影26年卻未能上映
    《花木蘭》終於定檔了!據迪士尼確認,它將於9月11日在國內上映。當消息傳出後,不少的網友們都表示為此感到歡喜和期待。這部投資了2億美元,集齊了甄子丹、李連杰、劉亦菲、鞏俐等著名影星的大製作電影《花木蘭》能給我們帶來什麼樣的驚喜呢?
  • 迪士尼動畫片改編的電影《花木蘭》惹爭議,網友:還原歷史更重要
    劉亦菲、甄子丹、鞏俐、李連杰主演的電影《花木蘭》豆瓣評分出了5.9分,和昨天爛番茄上影評人評分的新鮮度達80%、MTC69分,分數大相逕庭國內評價好 的 指出這是一部工整流暢的商業片,評價差的覺得這部電影違和感滿滿,水土不服,不倫不類
  • 劉亦菲主演的《花木蘭》在國外上映,豆瓣評分5.9
    近日,由劉亦菲、甄子丹主演,鞏俐、李連杰友情出演的迪士尼公司出品的電影《花木蘭》,在外國上映。國內影院要等到9月11日才上映,但是電影在國外上映之後,豆瓣上已經有近9000人評了分,目前是5.9分,已經是迪士尼系列電影的低分了。
  • 《花木蘭》一部美國製造的中國英雄電影!名存實亡的女性英雄
    花木蘭,作為中國傳統文化中的一個典型代表,如今從動畫到電影,似乎都被迪士尼承包,這不得不說是一件讓人羞恥的事情,在更早一點之前中國翻拍的《花木蘭》還要說是在09年時期。馬楚成拍攝,趙薇參演的《花木蘭》,但是這部電影其實票房不佳,因為花木蘭最核心的內核是替父從軍,但是這部花木蘭卻更多地把故事線放在了男女感情中。作為一直以來靠著一千零一夜中的各種公主來掙錢的迪士尼,在98年拍攝了《花木蘭》的動畫,如今更是直接拿出來拍攝成了電影,有時候都會讓人分不清,這到底是文化輸出,還是文化輸入。
  • 《花木蘭》是1998年動畫電影《花木蘭》的真人版翻拍
    《花木蘭》是1998年動畫電影《花木蘭》的真人版翻拍。據報導,這是因為該電影公司已經為該片投入了大量廣告,初步估計,廣告宣傳可能會幫助該片在國內首周末票房達到8500萬美元。《花木蘭》是華特迪士尼影業出品的真人劇情片,由妮基·卡羅執導,劉亦菲和甄子丹主演,尤其是鞏俐和李連杰。據Deadline網站報導,《花木蘭》的票房追蹤數據已經出爐,北美票房有望在三天內達到8500萬美元。
  • 《信條》和《花木蘭》「開戰」,冠軍「鹿死誰手」?丨9月電影前瞻
    那麼在此之前,9月的票房表現會是如何呢?眾所周知,今年的檔期屬性不同於以往。受到疫情影響,新片方面,8月僅有《八佰》以及「七夕特供片」作為支撐。而進入9月,儘管有《信條》《花木蘭》《阿凡達》三部大製作陸續定檔,但是由於期間無假日以及高校執行封閉式管理,總票房依然有待於觀察。當然,即便是過渡月份,9月的票房數據同樣重要。
  • ...花木蘭》口碑崩塌 真人電影連年不佳 | 迪士尼的至暗時刻
    《花木蘭》對中國市場而言,當然有著特殊性,但反觀迪士尼真人電影10年來在中國的表現,只能說不盡如人意。據每日經濟新聞記者統計,10年來,迪士尼至少有12部真人電影在中國上映,票房共計47.38億元,加起來只勉強超過一部《復仇者聯盟4:終局之戰》的中國票房。
  • 《花木蘭》影評:劉亦菲表演存在爭議
    評論共識寫得比較中肯:「《花木蘭》本可以更深入地講述經典故事,但真人版《花木蘭》是視覺上的奇蹟,是動畫版《花木蘭》的激動人心的升級。」  影片在Metacritic獲得69分,計入42個專業評價。  總體來說,《花木蘭》初始口碑和《信條》差不多。
  • 《花木蘭》豆瓣評分跌至4.8口碑崩塌:劉亦菲發英文長文感謝主創團隊
    《花木蘭》是由迪士尼出品,妮基·卡羅執導,劉亦菲、甄子丹領銜主演,鞏俐、李連杰特別出演的真人版劇情電影。《花木蘭》在中國內地定檔9月11日,原聲中文配音也將在內地影院進行首秀。9月4日,該片通過迪士尼旗下流媒體Disney+付費播放。
  • 「花木蘭」國慶檔「橫空出世」,下一部爆款動畫電影?
    沒錯,這是動畫電影《木蘭:橫空出世》所塑造的「女俠」木蘭。作為國產首部花木蘭題材的動畫電影,也是全球首部以三維動畫形式展現「木蘭」形象的作品,《木蘭:橫空出世》自項目啟動之初便引發大量網友關注,宣布定檔10月1日之後,更是讓觀眾們期待不已,貓眼超13萬的想看人數無疑是其人氣的佐證。
  • 劉亦菲主演的迪士尼大電影《花木蘭》近日在美國真是風光無限
    劉亦菲主演的《花木蘭》電影獲得了北美第26屆「評論家選擇獎」,「首屆評論家選擇超級獎最佳動作電影提名」,主演劉亦菲獲「最佳動作電影女演員」提名。之後劉亦菲開始轉戰大熒幕,可「神仙姐姐」好運沒有延續到電影上。劉亦菲出道以來一共拍攝了20部電影,絕大部分都是爛片,雖然裡面不乏票房上億的作品,可幾乎找不到一部口碑佳作,豆瓣評分基本都在6分以下。
  • 《花木蘭》提名「評論家選擇超級獎」這跟我打5分沒關係
    美國廣播電影影評協會是北美地區規模最大影評組織,由美國與加拿大近二百家電臺、電視臺聯合創辦,投票人幾乎匯聚了全北美所有的重要評論家和電影記者,同時對奧斯卡獲獎作品的預測非常準確。中美審美觀不一致真人版《花木蘭》電影作為一部改編自動畫的作品,有著動畫作為基礎藍圖,只要按照動畫的劇本走一般都不會差到哪裡去,但是導演似乎對真人版電影作了不少改變,首先是角色的改動,刪減了木須龍和新增了反派女巫。
  • 花木蘭電影什麼時候上映 好萊塢英文版《花木蘭》竟不能國內上映?
    花木蘭電影什麼時候上映 好萊塢英文版《花木蘭》竟不能國內上映?時間:2020-02-25 22:40   來源:今日頭條   責任編輯:毛青青 川北在線核心提示:原標題:花木蘭電影什麼時候上映 好萊塢英文版《花木蘭》竟不能國內上映?
  • 迪士尼經典動畫花木蘭,翻拍真人電影,BBC稱:2020不容錯過佳作
    2020年,備受矚目的電影《花木蘭》將帶來迪士尼的第一位中國公主。相信《木蘭辭》的詞句還在很多人的腦海迴響,一晃便已是流年飛逝,1998年上映的迪士尼的經典動畫電影花木蘭,作為不少80、90後的童年回憶,或許也沒有幾人再記得哪部動畫。
  • 劉亦菲版《花木蘭》評分僅4.9,幾處明顯硬傷,註定是部失敗作品
    最近,看了劉亦菲主演的《花木蘭》,原本對此期望值很高,結果,卻非常失望。看了眼豆瓣評分,大多數網友和我感受相同,給了4.9的超低評分,是目前所有《花木蘭》影視劇的最低評分。可惜了神仙姐姐劉亦菲想藉此翻身,卻弄巧成拙,成了眾嘲之地。
  • 電影評分哪家強?豆瓣IMDB爛番茄大比拼
    當越來越多人依賴電影評分來選擇觀影時,評分網站的公正性、準確性就顯得至關重要。在國外,電影評分最權威的無疑是IDMB和爛番茄。IMDB全稱Internet Movie Database(網際網路電影資料庫),是一個關於電影演員、電影、電視節目、電視明星和電影製作的在線資料庫。