豆瓣的電影評分靠譜嗎?——一點數據分析的視角
豆瓣的電影評分靠譜嗎?同樣一部片子為什麼在豆瓣和IMDB上的評分差距會如此之大呢?讓我們從數據分析的視角來探個究竟。
轉自 數據冰山
不知道有沒有同學看過白日夢想家這部電影?之前看了這部片子,但覺得並不好看,8.3應該是有些偏高了。看了IMDB,評分也只有7.3 ,並不像豆瓣這樣高(下圖),似乎國內外評價差別還挺大的。
而且,在爛番茄上還能看到截然相反的短評,有的人覺得這是導演「令人滿意的答卷」,有的卻說這部電影"令人失望(disappointing)" (下圖)
另一方面,豆瓣上同樣8.3分的電影,比如國王的演講、她,我都覺得挺好看的,IMDB也都達到了8分的水平。於是就想問,豆瓣電影的評分是否可靠?會不會存在一些國內外評價差異比較大的電影?
數據概況
對Movieinsider2008-2014國外上映的電影的榜單(北美為主)做了抓取,拿到豆瓣和IMDB的評分, 總共2000+部,包含了很多我們耳熟能詳的電影 ,比如蝙蝠俠黑暗騎士、星際穿越、觸不可及等等(下圖)。不過這次我們不做一般性的電影分析,所以這裡就先略過啦
豆瓣和IMDB的整體比較
2.1 整體分布比較
做出兩者評分的的頻數直方圖如下:
可以發現:
(1)豆瓣和IMDB的整體分布相似,大致呈正態分布,說明使用的數據量基本足夠。
(2)豆瓣的高分區偏高,在8-10分的電影比IMDB多許多。
接下來,選取豆瓣和IMDB評分人數同時大於5000的電影進行比較 ,盡量保證評分具有參考性,不會因為打分的人太少,而使分數不客觀。
2.2 分數比較
用X-Y散點圖比較會較為直觀,橫坐標是豆瓣評分,縱坐標是IMDB評分,並做出兩者的回歸線和1:1直線(下圖)。這裡,回歸線代表IMDB和豆瓣評分的大致關係。1:1線以上,為豆瓣評價低於IMDB的;1:1線以下,為豆瓣評價高於IMDB的。
散點圖為互動式的,地址:
http://lab.wentu.io/movie/wentu_movie_study.htm
可以發現:
(1)豆瓣和IMDB的評分高度相關。從回歸線可以看出,兩者評分高度相關,一個評分高,另一個也會高。也就是說,儘管電影評分是非常個人化的事情,每個人對電影的評價會有所差別,但是放到豆瓣和IMDB的大用戶量下,評分的大眾性很強,國外和國內是很接近的。
(2)存在一個低分區。從圖中可以看出,確實有一些電影豆瓣評分偏高,圖中已經標出,集中在[4, 6分]區間
然而,不可忽略的是,豆瓣和IMDB的打分機制是不同的 ——
- IMDB: 10星制
- 豆瓣: 5星制
當面對10分滿分的時候,碰到一部好電影,我們很難直接給出10分的滿分,給8分就很高了。而在豆瓣上,面對5分的滿分時,給4、5分都是很容易做到的。
因此,豆瓣的8.5+有可能和IMDB上的7.5+是對等的,兩者的分數並不能像上面這樣簡單的相比,怎麼辦?
2.3 分位數(排名)比較
為了減小評分機制的影響,我們比較分位數(下圖),即將電影按照分數排名,最高為100%,最低為0%,重新繪圖如下。陰影部分為排名差值小於20%的區域,落在這個區域內的電影,可以認為豆瓣和IMDB的評價差異較小。可以發現:
互動式圖表地址:
http://lab.wentu.io/movie/wentu_movie_study.htm
可以發現:
(1) 兩者評分依然高度相關, 回歸線的變化在10%以內。也就是說,兩者實際很接近,豆瓣的評分還是挺靠譜的。像最開始提到的白日夢想家,排名分別為89%和80%, 差別存在但是並不大。
(2) 儘管從回歸線來看,兩者接近,但有不少電影分布在陰影兩側,存在不少評價差異大的電影。比如美食祈禱戀愛、賽車總動員,里約大冒險等電影(下圖),這是我們感興趣的東西,下面我們具體分析。
深入分析
3.1 電影類別的影響
像上面說的,發現美食祈禱戀愛、賽車總動員、里約大冒險的評價差異挺大。那麼,有沒有可能因為豆瓣上的用戶比較文藝、小清新,所以對於愛情、動畫類的電影,評價比較高?
互動式圖表地址:
http://lab.wentu.io/movie/wentu_movie_study.htm
我們將電影按類別分析,如上圖。可以發現劇情、動作、愛情等等的差別其實都不大,但很明顯,動畫類電影的回歸線較1:1線整體向右偏移了不少。這裡,我們可以計算每個類別的豆瓣和IMDB的平均差距 (下圖),可以發現動畫類電影平均排名高了10%,豆瓣和IMDB的評價確實有較大差異。
3.2 國家的影響
我們也可以看一看國產電影和國外電影的差距(下圖)。不過,由於在海外上映的中國電影很少,這個時候的回歸線已經失去了意義,這裡我們只討論電影個體。可以發現中國電影的分散程度,較英法德日等國家要大得多。
(1) 文化差異可能是一個很大的影響因素
可以看到新少林寺、赤壁IMDB的評分比豆瓣高不少,而讓子彈飛、一代宗師IMDB的評價卻比豆瓣要低不少(下圖)。這是一個很有意思的現象,畢竟,在國內很少會有人說赤壁比讓子彈飛好看,一代宗師也比新少林寺出名多了。
互動式圖表地址:
http://lab.wentu.io/movie/wentu_movie_study.htm
這可能是文化差異的原因。對於外國觀眾,由於東方文化的異域魅力,所以分數會有加成(比如新少林寺);但同樣,由於文化隔閡,一些國外觀眾不理解的電影(比如讓子彈飛、一代宗師),也不會給出特別高的分數。類似的現象,也出現在以前的英雄、十面埋伏等電影中。
當然,不單單是外界對國內的電影理解有差異,我們對國外的電影評價也有不同。比如007天幕殺機,我們由於文化背景的不同,也很難給出同樣高的評價(下圖)。
(2) 好電影始終會有好分數
說了這麼多評價差異大的電影,很容易誤以為咱們的電影評價差異都很大。其實像金陵十三釵、葉問、投名狀等電影,雖然國內外的評價差別稍大,但在兩者的排名中,始終都是好電影(下圖)。也就是說,好電影,始終會有好分數。
評價差異最大的電影是什麼
最後,留一個小小的競猜環節。賈斯汀·比伯:永不言敗(Justin Bieber: Never Say Never, 上圖)豆瓣的評分是6.3, 請猜一下,這部粉絲電影的IMDB的評分是多少呢?IMDB鏈接
這不由得讓我想到了郭敬明同學的小時代,看來國內外網友,在這點上還是挺類似的,嘿嘿
結論
(1) 豆瓣和IMDB評分的分布很接近。在弱化產品評分機制的影響後,兩者差別很小。
(2) 對於動畫類電影,豆瓣評分確實有相對IMDB偏高的現象
(3)對於國內的電影,國內外評價確實有差別,文化差異可能是主要的原因,但總體也是好片較好,差片較差。
最後,歡迎大家在評論里各抒己見~
可視化支持:wentu.io
本文涉及的互動式圖表:
http://lab.wentu.io/movie/wentu_movie_study.htm
代碼:
https://github.com/cqcn1991/movie-compare
※《新上海灘》後李密、黃曉明再度合作 翻拍TVB經典老劇《萬水千山總是情》獻禮香港回歸20周年
※閱文的IP進行時
※趙薇首次自曝身價:56億家產,去年凈賺12億港元;如何在A股再次施展精妙財技
※從這部星際戀情,看國產劇突圍戰
※北京文化發布年報預報利潤增長23倍,「一橫一豎」全產業鏈業務發力
TAG:三聲 |
※豆瓣評分前十的韓國電影大盤點!你看過幾部?
※與電影《全面啟動》場景一模一樣的咖啡桌,細節部分好過分
※電影《金剛狼》豆瓣評分居然這麼高!
※豆瓣評分8.4,這部電影每一幀都是淚點!
※嘆為觀止!這九部評分最高的科技電影,你看過幾部?
※這兩個電影評分網站,可不是中國的豆瓣和時光網
※最令人惋惜的漫威電影角色盤點(一)
※演員和本尊傻傻分不清!5組百分百複製的電影主角
※揭露人性醜惡的電影,第四豆瓣評分高,第一太意外!
※零差評電影《你的名字》,你看了嗎?
※分享一下你看過的監獄主題電影?
※影向標:這大概是年度評價最懸殊的一部電影了
※這些在電影院看過的最離譜美食,「分分鐘逼死你」!
※電影片分級是一個標準
※全球最高分恐怖電影,看完那叫一個爽!
※笑點低:一個字毀一部電影
※森局對這四部熱映電影的評價,每一句都值得劃重點
※分享一句你最喜歡的電影對白
※另一個角度看《千與千尋》!電影分鏡頭動畫