當前位置:
首頁 > 科技 > 豆瓣的電影評分靠譜嗎?——一點數據分析的視角

豆瓣的電影評分靠譜嗎?——一點數據分析的視角

豆瓣的電影評分靠譜嗎?同樣一部片子為什麼在豆瓣和IMDB上的評分差距會如此之大呢?讓我們從數據分析的視角來探個究竟。


轉自 數據冰山


不知道有沒有同學看過白日夢想家這部電影?之前看了這部片子,但覺得並不好看,8.3應該是有些偏高了。看了IMDB,評分也只有7.3 ,並不像豆瓣這樣高(下圖),似乎國內外評價差別還挺大的。

豆瓣的電影評分靠譜嗎?——一點數據分析的視角



而且,在爛番茄上還能看到截然相反的短評,有的人覺得這是導演「令人滿意的答卷」,有的卻說這部電影"令人失望(disappointing)" (下圖)

豆瓣的電影評分靠譜嗎?——一點數據分析的視角


另一方面,豆瓣上同樣8.3分的電影,比如國王的演講、她,我都覺得挺好看的,IMDB也都達到了8分的水平。於是就想問,豆瓣電影的評分是否可靠?會不會存在一些國內外評價差異比較大的電影?


數據概況


Movieinsider2008-2014國外上映的電影的榜單(北美為主)做了抓取,拿到豆瓣和IMDB的評分, 總共2000+部,包含了很多我們耳熟能詳的電影 ,比如蝙蝠俠黑暗騎士、星際穿越、觸不可及等等(下圖)。不過這次我們不做一般性的電影分析,所以這裡就先略過啦

豆瓣的電影評分靠譜嗎?——一點數據分析的視角


豆瓣和IMDB的整體比較


2.1 整體分布比較


做出兩者評分的的頻數直方圖如下:

豆瓣的電影評分靠譜嗎?——一點數據分析的視角


可以發現:


(1)豆瓣和IMDB的整體分布相似,大致呈正態分布,說明使用的數據量基本足夠。


(2)豆瓣的高分區偏高,在8-10分的電影比IMDB多許多。

接下來,選取豆瓣和IMDB評分人數同時大於5000的電影進行比較 ,盡量保證評分具有參考性,不會因為打分的人太少,而使分數不客觀。


2.2 分數比較


用X-Y散點圖比較會較為直觀,橫坐標是豆瓣評分,縱坐標是IMDB評分,並做出兩者的回歸線和1:1直線(下圖)。這裡,回歸線代表IMDB和豆瓣評分的大致關係。1:1線以上,為豆瓣評價低於IMDB的;1:1線以下,為豆瓣評價高於IMDB的。

豆瓣的電影評分靠譜嗎?——一點數據分析的視角



散點圖為互動式的,地址:


http://lab.wentu.io/movie/wentu_movie_study.htm


可以發現:


(1)豆瓣和IMDB的評分高度相關。從回歸線可以看出,兩者評分高度相關,一個評分高,另一個也會高。也就是說,儘管電影評分是非常個人化的事情,每個人對電影的評價會有所差別,但是放到豆瓣和IMDB的大用戶量下,評分的大眾性很強,國外和國內是很接近的。


(2)存在一個低分區。從圖中可以看出,確實有一些電影豆瓣評分偏高,圖中已經標出,集中在[4, 6分]區間


然而,不可忽略的是,豆瓣和IMDB的打分機制是不同的 ——


- IMDB: 10星制


- 豆瓣: 5星制


當面對10分滿分的時候,碰到一部好電影,我們很難直接給出10分的滿分,給8分就很高了。而在豆瓣上,面對5分的滿分時,給4、5分都是很容易做到的。


因此,豆瓣的8.5+有可能和IMDB上的7.5+是對等的,兩者的分數並不能像上面這樣簡單的相比,怎麼辦?


2.3 分位數(排名)比較


為了減小評分機制的影響,我們比較分位數(下圖),即將電影按照分數排名,最高為100%,最低為0%,重新繪圖如下。陰影部分為排名差值小於20%的區域,落在這個區域內的電影,可以認為豆瓣和IMDB的評價差異較小。可以發現:

豆瓣的電影評分靠譜嗎?——一點數據分析的視角



互動式圖表地址:


http://lab.wentu.io/movie/wentu_movie_study.htm


可以發現:


(1) 兩者評分依然高度相關, 回歸線的變化在10%以內。也就是說,兩者實際很接近,豆瓣的評分還是挺靠譜的。像最開始提到的白日夢想家,排名分別為89%和80%, 差別存在但是並不大。


(2) 儘管從回歸線來看,兩者接近,但有不少電影分布在陰影兩側,存在不少評價差異大的電影。比如美食祈禱戀愛、賽車總動員,里約大冒險等電影(下圖),這是我們感興趣的東西,下面我們具體分析。

豆瓣的電影評分靠譜嗎?——一點數據分析的視角



深入分析


3.1 電影類別的影響


像上面說的,發現美食祈禱戀愛、賽車總動員、里約大冒險的評價差異挺大。那麼,有沒有可能因為豆瓣上的用戶比較文藝、小清新,所以對於愛情、動畫類的電影,評價比較高?

豆瓣的電影評分靠譜嗎?——一點數據分析的視角



互動式圖表地址:


http://lab.wentu.io/movie/wentu_movie_study.htm


我們將電影按類別分析,如上圖。可以發現劇情、動作、愛情等等的差別其實都不大,但很明顯,動畫類電影的回歸線較1:1線整體向右偏移了不少。這裡,我們可以計算每個類別的豆瓣和IMDB的平均差距 (下圖),可以發現動畫類電影平均排名高了10%,豆瓣和IMDB的評價確實有較大差異。

豆瓣的電影評分靠譜嗎?——一點數據分析的視角



3.2 國家的影響


我們也可以看一看國產電影和國外電影的差距(下圖)。不過,由於在海外上映的中國電影很少,這個時候的回歸線已經失去了意義,這裡我們只討論電影個體。可以發現中國電影的分散程度,較英法德日等國家要大得多。

豆瓣的電影評分靠譜嗎?——一點數據分析的視角



(1) 文化差異可能是一個很大的影響因素


可以看到新少林寺、赤壁IMDB的評分比豆瓣高不少,而讓子彈飛、一代宗師IMDB的評價卻比豆瓣要低不少(下圖)。這是一個很有意思的現象,畢竟,在國內很少會有人說赤壁比讓子彈飛好看,一代宗師也比新少林寺出名多了。

豆瓣的電影評分靠譜嗎?——一點數據分析的視角



互動式圖表地址:


http://lab.wentu.io/movie/wentu_movie_study.htm


這可能是文化差異的原因。對於外國觀眾,由於東方文化的異域魅力,所以分數會有加成(比如新少林寺);但同樣,由於文化隔閡,一些國外觀眾不理解的電影(比如讓子彈飛、一代宗師),也不會給出特別高的分數。類似的現象,也出現在以前的英雄、十面埋伏等電影中。


當然,不單單是外界對國內的電影理解有差異,我們對國外的電影評價也有不同。比如007天幕殺機,我們由於文化背景的不同,也很難給出同樣高的評價(下圖)。

豆瓣的電影評分靠譜嗎?——一點數據分析的視角



(2) 好電影始終會有好分數


說了這麼多評價差異大的電影,很容易誤以為咱們的電影評價差異都很大。其實像金陵十三釵、葉問、投名狀等電影,雖然國內外的評價差別稍大,但在兩者的排名中,始終都是好電影(下圖)。也就是說,好電影,始終會有好分數。

豆瓣的電影評分靠譜嗎?——一點數據分析的視角



評價差異最大的電影是什麼

豆瓣的電影評分靠譜嗎?——一點數據分析的視角



最後,留一個小小的競猜環節。賈斯汀·比伯:永不言敗(Justin Bieber: Never Say Never, 上圖)豆瓣的評分是6.3, 請猜一下,這部粉絲電影的IMDB的評分是多少呢?IMDB鏈接


這不由得讓我想到了郭敬明同學的小時代,看來國內外網友,在這點上還是挺類似的,嘿嘿


結論


(1) 豆瓣和IMDB評分的分布很接近。在弱化產品評分機制的影響後,兩者差別很小。


(2) 對於動畫類電影,豆瓣評分確實有相對IMDB偏高的現象


(3)對於國內的電影,國內外評價確實有差別,文化差異可能是主要的原因,但總體也是好片較好,差片較差。


最後,歡迎大家在評論里各抒己見~


可視化支持:wentu.io


本文涉及的互動式圖表:


http://lab.wentu.io/movie/wentu_movie_study.htm


代碼:


https://github.com/cqcn1991/movie-compare

您的贊是小編持續努力的最大動力,動動手指贊一下吧!


本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 三聲 的精彩文章:

《新上海灘》後李密、黃曉明再度合作 翻拍TVB經典老劇《萬水千山總是情》獻禮香港回歸20周年
閱文的IP進行時
趙薇首次自曝身價:56億家產,去年凈賺12億港元;如何在A股再次施展精妙財技
從這部星際戀情,看國產劇突圍戰
北京文化發布年報預報利潤增長23倍,「一橫一豎」全產業鏈業務發力

TAG:三聲 |

您可能感興趣

豆瓣評分前十的韓國電影大盤點!你看過幾部?
與電影《全面啟動》場景一模一樣的咖啡桌,細節部分好過分
電影《金剛狼》豆瓣評分居然這麼高!
豆瓣評分8.4,這部電影每一幀都是淚點!
嘆為觀止!這九部評分最高的科技電影,你看過幾部?
這兩個電影評分網站,可不是中國的豆瓣和時光網
最令人惋惜的漫威電影角色盤點(一)
演員和本尊傻傻分不清!5組百分百複製的電影主角
揭露人性醜惡的電影,第四豆瓣評分高,第一太意外!
零差評電影《你的名字》,你看了嗎?
分享一下你看過的監獄主題電影?
影向標:這大概是年度評價最懸殊的一部電影了
這些在電影院看過的最離譜美食,「分分鐘逼死你」!
電影片分級是一個標準
全球最高分恐怖電影,看完那叫一個爽!
笑點低:一個字毀一部電影
森局對這四部熱映電影的評價,每一句都值得劃重點
分享一句你最喜歡的電影對白
另一個角度看《千與千尋》!電影分鏡頭動畫