美國用戶如何給電影評分:計算公式 + 過濾機制

2021-01-10 IT之家

最近幾天,中文網際網路上最專業的影評網站「豆瓣電影」成為了電影界激烈討論的對象。一篇來自廣電總局官辦的《中國電影報》的文章,稱豆瓣電影以及其他社交平臺上「個別大V、公眾號為博眼球、圈粉絲、流量變現等目的,發布惡意的、不負責任的言論,嚴重破壞了中國電影的生態環境。」

這件事還真是挺有點活久見的。在美國,如果有這樣的批評來自無論民間還是官方,那簡直是要笑掉大牙了——從來沒聽說過一兩篇影評,一兩家網站就能糟蹋了一國電影生態環境的。

在美國,也有這麼幾個和豆瓣類似,跟電影有關,主流網民經常訪問的網站:專業存儲電影信息兼職打分的IMDb(Internet Movie Database網際網路電影資料庫)、創立快二十年幾經易手的爛番茄(Rotten Tomatoes)、專業網絡購票副業打分的「美國版貓眼」Fandango,以及專門聚合書籍和視聽出版產品批評意見的Metacritic。

隨著網際網路和社交網站的快速普及,這幾個網站也形成了獨特的電影打分機制,雖然各不相同,但還都挺受電影市場片方、觀眾和專業批評人士的信任。這也讓它們在國內甚至國際上成為了具有公信力的電影評分網站。

它們是怎樣工作的呢?

IMDb

現在市面上有一個比較流行的IMDb加權分計算公式,大概長這個樣子:

v =投票人數,實際上是經常投票的人數,也即IMDb活躍用戶投票數

m =進入IMDb Top 250榜單所需的最小票數

R =該電影的平均分(分數相加除以人數)

C = IMDb資料庫所有電影的平均分

這是一個在統計學上公認比較科學的貝葉斯算法實例。但需要明確的是,這個公式只是IMDb維護Top 250電影榜單所使用的,並不是每一部新電影打分都採用這個方法。

平常,IMDb的用戶可以用1-10顆星來為一部電影打分,最後IMDb會計算出一個加權平均星數作為得分。用最近上映的星戰外傳電影《俠盜一號》舉例,在IMDb上的得分是8.2。目前《俠盜一號》在Top 250榜單裡排名205,也就是說我們可以確定它的得分是用上面那個公式計算得到得了。

但是,為了維護評分的公正,這個日常評分的計算公式仍然是個不能公開的秘密——可知的是,結果依然是加權分,採用了算術平均數(Arithmetic mean)的計算方法,但由於算數平均數容易受到極端數據的影響,IMDb也設計了一些過濾機制。

很明顯,IMDb得分是一個普通觀眾打分的結果。就像美國總統大選有全民投票(popular vote)和選舉人票(electoral vote)一樣,IMDb在全面和公正的同時,也想要追求專業,體現一下電影人的意見。於是在上圖的「Ratings」後面,還有一個百分制的「Metascore」。

這第二個得分又是怎麼來的呢?這就要提到Metascore的來源Metacritic了。

Metacritic

Metacritic是一個出版物專業批評聚合網站,成立於1999年。最早從書評起家,現在的Metacritic的批評對象已經涵蓋了音樂專輯、電影、電視劇、電子遊戲等視聽出版物。注意,重點在於「專業」二字。

要體現專業,首先,Metacritic為電影打出的Metascore是從主流媒體和專業影評機構的影評人那裡聚合而來的,這是它和IMDb評分最主要的不同。這些影評人和他們供職的機構,大多在影評方面具有公信力,比如《衛報》、《紐約時報》、《滾石》、《好萊塢記者》,《時代周刊》和NPR等這樣的大報和電臺,都是能參與Metascore計算的專業影評來源。

但不是每個機構和影評人都會自己給出一個準確的分數。實際上Metacritic是這樣做的:來源有分數就用來源分數;來源有星數就大概換算成百分制的分數;如果來源的影評只有文字沒有評分,他們就自己找人去閱讀影評,然後根據讀完的感受自己給一個分,然後再用這個分拿去計算……

雖然這樣計算出的Metascore,看上去不是特別能夠準確和真實地體現批評家的感受,但至少這十幾年過來Metacritic沒怎麼被質疑過。儘管如此,Metacritic在Metascore之外也還是設立了一個Userscore——不會展現在一部電影的頁面上,但用戶投票的工具會直接放在Metascore的下方,給用戶一種投了票就能影響得分的錯覺(詳見下圖)。

Metascore採用百分制,Userscore打分採用十分制。還是用《俠盜一號》舉例,現在的Metascore是65,整合了51個專業來源;Userscore是7.7,基於1489個用戶打分。

爛番茄

爛番茄創立於1998年,一直致力於提供具有公信力的電影打分。其創始人派屈克·李曾經在Pingwest品玩的SYNC 2016科技大會上介紹過爛番茄的極盛時的風光和設立的機制。這麼來看,爛番茄也算是影評界的不老松。

爛番茄沒有評分!必須明確爛番茄採用的評價系統叫做Tomatometer,一般翻譯成「新鮮度」。一部電影的新鮮度,同樣是由專業的影評意見所決定的。在爛番茄上影評人不打分,也不給星,只能給出Fresh(一個新鮮番茄)和Rotten(一個爛番茄)兩種標記,分別代表推薦和不推薦。

如果超過60%的影評人推薦一部電影,電影的新鮮度就會整體為Fresh,旁邊有一個百分比顯示新鮮度,也即具體多大比例的影評人推薦;如果超過75%的影評人推薦,像《俠盜一號》一樣,新鮮度就會變成「Certified Fresh」;但如果給Fresh的影評人低於60%,電影就只能得到那一坨綠色的爛番茄了。

和Metacritic一樣,爛番茄也需要確保用戶的意見能夠得到體現,於是又設定了一個Audience Score(觀眾分數)。這個觀眾分數採集來源是觀眾打星,但最後體現出來的所有打出3星半以上的用戶比例。

用打好評的影評人/用戶佔總影評人/用戶人數的比例,而不是一個簡單的數值來評價一部電影,是爛番茄和其他影評網站在本質上的最大區別。它突出的是人群對一部電影持有的主流觀點,而不是用一個無法讓每個評價者都感同身受的數值。

這個設定讓爛番茄獲得了相當高的信譽,但也不是所有粉絲都能接受的了。比如今年的美國大廠爛片代表作《自殺小隊》的粉絲,就被糊了一臉只有26%新鮮度的爛番茄。結果這些粉絲以爛番茄敵視DC擴展宇宙電影的罪名,在網上發起集體籤名,要求爛番茄關站謝罪……

Fandango

2000年成立的Fandango(原名Tickemaker),可以被理解為美國版貓眼。它慢慢統一了美國混亂的網絡票務市場,現在最主要的功能就是網上買電影票,查座位情況,以及查看影評等等。

Fandango對粉絲、用戶的地位和意見非常重視,在影評機制上得到了體現。Fandango的電影評價完全採用粉絲打分作為依據。在該網站上,超過17000名粉絲給《俠盜一號》打出了4星半的評價。

Fandango的評分計算方式看上去並不複雜,應該沒有什麼加權和過濾機制。這也導致了該網站上3星以下電影的數量比爛番茄、Metacritic和IMDb要少得多。幸好Fandango加上了比較專業和嚴苛的爛番茄新鮮度,以及專業的家庭電影評價機構意見(上圖右上角),來中和什麼爛片都能咽得下去的粉絲打分。比如星爵克裡斯·普拉特和大表姐珍妮佛·勞倫斯主演的《太空旅客》,粉絲打了4分,卻得到了一顆只有31%新鮮度的爛番茄,也被負責任的專業機構

所以你看,資深人士從電影的藝術和學術的角度進行的專業批判,和普通觀眾以獲得的感官愉悅和心理滿足程度給出的打分,就是這樣在網際網路上和平共處的。

幸運的是,美國商業電影市場經過了一百年的發展已經格外成熟,無論是創作、製作、院線、影評還是周邊開發,都已經走在一條相當專業化的道路上,不太可能像這幾天的中國電影界一樣,發生如此嚴重的爭吵。在美國,佳片會收到它應得的票房和好評作為獎賞,爛片就算進了電影院也不可能躲得開差評——無論在報紙、電臺還是網際網路上。在美國,對電影的批評,也是言論自由保護的一部分。

相關焦點

  • 貓眼電影「專業評分」重新上線,首次全面闡釋貓眼評分規則
    這些專業評委來自權威影評人、資深媒體人、電影學者組成。  Q:電影的得分是如何得出(國內在映)?  A:國內在映電影的得分是由真實購票觀影用戶一人一票投出的分數計算得出。購票用戶在觀看電影後,根據他自身對電影的認知給出的影片評分,貓眼平臺再針對有效可信用戶給出的分數計算出影片的最終得分。  Q:為什麼有些電影在上映後過了很久都沒出現分數?  A:電影的評分是根據有效購票用戶計算得出的。
  • SIGIR2020 | 內容感知的神經哈希協同過濾方法
    在冷啟動設置下,如何將內容特徵映射到哈希碼中,這樣一種方式極大地限制了哈希碼在冷啟動設置下的泛化能力。因此,作者基於這兩個模型的不足,提出了NeuHash-CF模型。用戶物品評分解碼:旨在重構原始用戶物品評分
  • 通過層次分析法(AHP),建立電商用戶綜合評分模型
    用戶綜合評分模型建立1.從短期和中長期兩個角度考慮用戶綜合評分模型現實場景:一個用戶經常光顧你的網站,有時只是來看看,有時候順便買點東西,在計算這個用戶的價值的時候,應該怎麼做?是看TA最近一次購買行為,還是考慮用戶在整個時間段內的表現?老祖宗早就告訴我們了,「日久見人心」。
  • 詳解豆瓣、IMDB、貓淘、爛番茄各大平臺電影評分的差異
    畢竟特別好的電影和特別差的電影數量有限,用戶也很容易判斷,關鍵是多如牛毛的那些中間作品,如何通過評分給到用戶更加有價值的參考,這就非常關鍵了。 不過這裡還是要再次強調,也就是那16字箴言——汝之蜜糖,彼之砒霜,多岐為貴,不取苟同。
  • #數據挖掘##高階統計#「距離計算」(基因晶片數據挖掘基本概念)
    原標題:#數據挖掘##高階統計#「距離計算」(基因晶片數據挖掘基本概念) 餘弦相似度 這裡我將奉上最後一個公式:餘弦相似度。它在文本挖掘中應用得較多,在協同過濾中也會使用到。為了演示如何使用該公式,我們換一個示例。
  • 數據建模:個人信用分是如何計算出來的?
    無論是金融、網際網路企業亦或運營商,都在基於多年積累的大數據搭建個人徵信評分體系,不僅用於自身,也在提供給其他徵信機構做為個人信用評估標準。那麼,個人的信用分到底是如何計算出來的呢?筆者相信不同的信用分有不同的計算方法,無論是FICO評分、芝麻信用亦或其它信用分,這些評分既可以很簡單,也可以很複雜,使用的建模方法各不同,但也總是會遵循一些基本的原則,這裡筆者就信用分計算的一些關鍵技術作簡要介紹,希望於你有益。
  • 詳解豆瓣、IMDB、貓淘、爛番茄、時光網各大平臺電影評分的差異
    畢竟特別好的電影和特別差的電影數量有限,用戶也很容易判斷,關鍵是多如牛毛的那些中間作品,如何通過評分給到用戶更加有價值的參考,這就非常關鍵了。不過這裡還是要再次強調,也就是那16字箴言——汝之蜜糖,彼之砒霜,多岐為貴,不取苟同。
  • 1.空氣過濾器面積如何計算?
    空氣過濾器如何計算過濾面積?首先我們來看一個計算公式,下面會為大家講解:空氣過濾面積計算公式:A=L/(3600*v)公式注釋:過濾面積=風量/(3600*風速)過濾面積=風量m/s / (3600秒 * 風速m/s)
  • 體脂率計算公式如何計算
    其實不論是減肥還是增肥,最好的身材是要根據個人的體脂率去進行計算,很多人不清楚自己的體質率是多少,也不知道體脂率計算公式是如何的。 每個人對自己身材的形容幾乎是以胖和瘦來區別,當發現自己胖了,那麼就努力讓自己減肥,如果發現自己瘦了,那麼就可以增加飲食攝入量進行增肥。
  • 豆瓣發布2014年度電影榜 《星際穿越》為評分最高外語電影
    豆瓣最近發布了2014年度電影榜單。不同於觀察者網此前製作的「2014年十大爭議電影」榜單,以及其他各大電影機構的盤點,豆瓣此次製作的榜單排行綜合了其用戶評分、收藏以及「想看」人數等數據。隨著豆瓣的「活躍」用戶數量越來越少,水軍刷榜的可能性不高,因此,我們姑且相信這確實是一份中國電影市場審美的純粹寫照。
  • 《流浪地球》打分事件,豆瓣電影開始老齡化了嗎
    豆瓣評分機制不足和漏洞即使如豆瓣公告所說,此次《流浪地球》評分事件並非大規模的水軍事件,但從結果來看,也對豆瓣評分的公信力產生了很難逆轉的公眾印象。在豆瓣既有的打分機制下,這些問題很難避免,是用戶與社區氛圍、平臺機制共同作用的結果。這些不足在網際網路流量產業尚未成熟的遠古時期並不會產生嚴重影響。但現如今到了2019年,在線票務、在線宣發已經成為絕對主流,用戶獨立審美水平上升的情況下,豆瓣評分的公信力就漸漸無法匹配其高知名度了,反而呈現出了一種「老態」。
  • 《流浪地球》打分事件,豆瓣電影開始老齡化了嗎?
    豆瓣評分機制不足和漏洞即使如豆瓣公告所說,此次《流浪地球》評分事件並非大規模的水軍事件,但從結果來看,也對豆瓣評分的公信力產生了很難逆轉的公眾印象。在豆瓣既有的打分機制下,這些問題很難避免,是用戶與社區氛圍、平臺機制共同作用的結果。這些不足在網際網路流量產業尚未成熟的遠古時期並不會產生嚴重影響。但現如今到了2019年,在線票務、在線宣發已經成為絕對主流,用戶獨立審美水平上升的情況下,豆瓣評分的公信力就漸漸無法匹配其高知名度了,反而呈現出了一種「老態」。多平臺崛起豆瓣評分如何再定義自己的價值?
  • 送貨單軟體如何自定義計算公式?
    信管飛RMS(進銷存管理軟體)、信管飛送貨單軟體、信管飛倉庫管理軟體等開單默認是根據單價*數量自動計算得出金額,如有其他的數據計算需求,軟體也支持自定義計算公式,本篇文章以送貨單軟體為例介紹一下如何自定義計算公式?
  • 如何計算房價?城市合理房價「計算公式」
    如何計算房價?城市合理房價「計算公式」 房天下綜合整理   2013-02-05 14:28 [摘要] 有關「專家」3月25日在分析中國房地產市場時說
  • 第五講 | DRGs指標計算公式大公開
    排除病例數 = 住院天數大於60天 + 住院費用小於5元未入組病歷數 = 未入MDC病例數 + QY病例數  入組率計算公式如下:入組率 = 入組病歷數/(病例總數-排除病例數)*1002、診斷相關組數
  • 《流浪地球》評分異常?豆瓣回應
    2月12日,針對電影《流浪地球》評分異常,出現「五星短評改一星」的傳聞,豆瓣表示,並不存在「高贊好評被收買改為差評」的情況。據其工程師統計,目前《流浪地球》的前500個熱評(高贊評論),僅有4位用戶有過跨分數(非相鄰分數)修改評分的行為:2人由三星修改為一星;1人由一星修改為三星;1人由二星修改為五星;另外,昨天有一位用戶將《流浪地球》的四星打分改成一星,後來該用戶刪除了評分。截至2月12日中午,《流浪地球》累計票房已接近24億。不過伴隨票房的走高,其豆瓣電影評分卻出現下滑。
  • 《原神》攻擊力及傷害計算機制分析
    《原神》中傷害是由多個數據計算得出的,那麼傷害機制是如何計算的,怎麼樣能夠將自己的傷害最大化,想要深入了解的玩家請看下面「sedll」分享的《原神》攻擊力及傷害計算機制分析,希望能夠幫助大家。
  • 變分自編碼器如何淘汰經典的推薦系統
    這個數據集包含了來自電影推薦服務MovieLens的2000多萬個評分。下面是dataframe的示例:該數據集列出了138000個用戶和27000多部電影。經過清洗和過濾(我們只接受正面評價),我們有:13.6萬用戶2萬部電影1000萬次互動99.64%稀疏度我們還可以從下面的直方圖中看到,大多數電影的收視率都在5000以下…而且大多數用戶評價不超過